Humise või vilista — Google tuvastab meloodia sekunditega

Humise või vilista — Google tuvastab meloodia sekunditega

Karl Tamm Karl Tamm . Kommentaarid

4 Minutit

Mõni meloodia jääb pähe kinni nagu lint teekausi põhjas. Tead seda tunnet — noodijupp tiksub peas, sõnu pole, aga see on seal. Mida teha? Lihtne vastus: humise seda ja lase telefonil otsida. Google teatas uuest võimalusest, mis lubab leida laulu üksnes humise, vilistuse või laulu meloodia põhjal: ilma sõnade või esitaja teadmata.

Kas see on tõesti nii lihtne? Jah. Ava mobiilis Google’i äpp või otsinguvälja mikrofoni ikoon, vali „Mis see laul on?“ (inglise keeles või vastav käsk) ning laula või humise 10–15 sekundit. Samamoodi töötab ka Google Assistant: „Hey Google, what’s this song?“ ja alusta humisemist. Funktsioon on hetkel saadaval Androidis rohkem kui 20 keeles ning iOS-i versioonis inglise keeles, kuid keelte nimekiri laieneb aja jooksul.

Kuidas masin seda teeb?

Võtke hetk ja mõelge: mis eristab ühte laulu teisest? Meloodia. See on nagu laulu DNA — korduv musternida, mis jääb meelde. Google kasutab masinõpet, et muuta helisignaal numbriliseks järjestuseks, mis peegeldab just seda meloodiat. Sõnad, instrumentaalne saade, esitaja kõla — kõik need kõrvalised detailid filtreeritakse välja. Jääb puhas toonide ja intervallide jada: akustiline sõrmejälg.

Tehniliselt võtab süsteem teie salvestatud hummimise ja teisendab selle muusikalisse kujusse, kasutades sagedusanalüüsi ja meloodiliste tunnuste väljapakkumist. Seejärel võrreldakse tulemust suurte andmekogumitega, mis sisaldavad nii stuudioaluseid salvestusi kui ka inimeste lauldud või vilistatud variante. Otsing töötab reaalajas ja pakub tõenäolisi vasteid, mille hulgast saate valida sobivaima, avada lauluinfo, vaadata muusikavideoid või kuulata lugu oma lemmikmuusikaäpis.

Taust ja tehnoloogiline areng

See teenus rajab juba varem tehtud tööle. Näiteks Pixel 2 telefonide Now Playing funktsioon kasutas sügavaid närvivõrke, et madalvõimsusega tuvastada taustamuusikat. Aastate jooksul on sama põhitehnoloogiat viidud edasi SoundSearchi ja suurte muusikakataloogide suunas. Nüüd on astutud järgmine samm: tuvastada lugu ilma selle originaalteksti või stuudioheli abita — lihtsalt hummides.

Miks see on huvitav ka teadusvaatepunktist? Sest see on praktiline näide signaalitöötlusest ja mustrituvastusest, mida kasutatakse ka teistes valdkondades — näiteks astronoomias signaalide eristamiseks taustamüra seest või biomeditsiinis südamerütmi mustrite leidmiseks. Sama põhimõte: oluline informatsioon peitub signaali struktuuris, mitte alati selle pinnal olevates detaile.

Kas täiuslik intonatsioon on vajalik? Ei ole. Mudelid on treenitud erinevate inimeste esitustega — nad taluvad kõlaerinevusi ja isegi valesid noote. Peamine on jätta piisavalt selge meloodiline jada, et algoritm leiaks vasteid.

Expert Insight

"Selline süsteem ei ole ainult mugav tarbijatele — see on ka huvitav tehnoloogiline laboratoorium," ütleb fiktiivne muusikatehnoloogia uurija dr Mari Eelmaa. "Me õpime paremini mõistma, kuidas inimmõistus kodeerib meloodiaid ja kuidas seda kodeeringut masinlikult esitada. See omakorda aitab arendada robusset muusikatöötlust ning täiustada signaalituvastust teiste teaduslike rakenduste jaoks."

Dr Eelmaa rõhutab, et edusammud on eelkõige masinõppe ja suurte treeningandmete kombinatsioon. "Kui treeningandmestik hõlmab erinevaid hääli, keeli ja esitusi, muutub süsteem vastupidavamaks ja täpsemaks," lisab ta.

Järgmised sammud võivad hõlmata paremat kohalike keelte toetust, reaalajas töötluse optimeerimist ja suurendatud privaatsustagatisi. Tehnoloogia potentsiaal ulatub kaugemale muusikast: kõlamustrite kodeerimise ja võrdlemise meetodid võivad aidata näiteks kultuuripärandi analüüsis või akustilistes uuringutes.

Järgmisel korral, kui meloodia kummitama jääb, ei pea te interneti foorumeid läbi kammima. Silmad kinni, suhu õhk sisse ja humise — tehnoloogia teeb ülejäänu. Ja mis oleks parem eesmärk argipäeva pisikesele võlule kui kiiresti leitud vastus?

"Mind on alati paelunud tehnoloogia, mis muudab meie igapäevaelu lihtsamaks ja põnevamaks. Kirjutamine Modemis on minu viis jagada seda uudishimu teistega."

Jäta kommentaar

Kommentaarid