Come funziona la funzione Hum to Search di Google

Sommario:

Come funziona la funzione Hum to Search di Google
Come funziona la funzione Hum to Search di Google
Anonim

Da asporto chiave

  • Google ha lanciato un nuovo strumento che consente agli utenti di cercare brani canticchiando, cantando o fischiettando.
  • Il nuovo strumento utilizza l'apprendimento automatico per abbinare una traccia canticchiata a un database di oltre mezzo milione di brani che viene continuamente aggiornato.
  • Gli utenti di Google chiedono quale brano viene riprodotto quasi 100 volte al mese.
Image
Image

Google ha lanciato una nuova funzione chiamata "Hum to Search" per risolvere un problema frustrante: avere una canzone bloccata nella tua testa e non riuscire a capire come si chiama.

L'idea di canticchiare per trovare una canzone sembra incredibilmente semplice, quindi perché Google ha lanciato questa funzione solo nel 2020? Bene, si scopre che identificare le canzoni in questo modo è in re altà piuttosto complicato, in parte perché le nostre versioni canticchiate tendono ad essere piuttosto diverse dalla traccia originale. In un recente post sul suo blog sull'intelligenza artificiale, Google spiega come ha utilizzato l'apprendimento automatico per risolvere questo problema e, in definitiva, aiutare le persone a trovare una canzone canticchiando, fischiettando o cantando la melodia anche quando la loro interpretazione non è accurata.

"Il nostro obiettivo per Hum to Search è aiutare le persone a identificare e trovare la musica che è rimasta nella loro testa", ha detto a Lifewire un portavoce di Google in un'e-mail.

Inizia a canticchiare

Gli utenti di Google chiedono quale brano viene riprodotto quasi 100 milioni di volte al mese, ha affermato Aparna Chennapragada, vicepresidente e direttore generale dello shopping dei consumatori di Google, in un video che introduce diverse nuove funzionalità di ricerca. Ora c'è un modo per scoprirlo.

La funzione "Hum to Search" è integrata nell'app mobile di Google, nel widget di ricerca di Google e nell'Assistente Google. Per accedervi tramite l'app, tocca l'icona del microfono e dì "Cos'è questa canzone?" Funziona anche la selezione del pulsante "Cerca un brano".

Per funzionare correttamente, la funzione richiede di canticchiare per almeno 10-15 secondi. Gli utenti Android possono canticchiare per trovare brani in più di 20 lingue, mentre solo i brani in inglese funzionano su iPhone. Lo strumento non è sempre in grado di identificare immediatamente una canzone, ma una volta che lo fa, i risultati sono abbastanza buoni.

"Più della metà delle canzoni di un ampio insieme di variabili (tono, altezza, volume, ecc.) sono riconosciute dai nostri algoritmi, ma ovviamente la precisione dipende dalla qualità del ronzio, dal tipo di la canzone e altro", ha detto il portavoce di Google a Lifewire in un'e-mail. "Ma una volta riconosciuto, circa quattro risposte su cinque sono corrette."

Questa non è la prima volta che il ronzio viene utilizzato in un'app di identificazione della musica, però. SoundHound offre una funzionalità simile, come notato da CNN Business, ed è disponibile anche su Android e iOS. Secondo il portavoce di Google, la nuova funzionalità non solleva alcun problema di privacy, né "cambia il modo in cui Google gestisce le interazioni basate sull'audio", hanno detto a Lifewire in un'e-mail.

Apprendimento automatico

Nonostante la semplicità del concetto, canticchiare una melodia per trovare la registrazione in studio è tecnicamente piuttosto difficile. Ci sono diverse ragioni per questo, spiega Christian Frank di Google Research in un post sul blog del 12 novembre. Prima di tutto, una versione canticchiata della canzone può differire notevolmente dalla registrazione effettiva, rendendo difficile l'abbinamento dei due. Quindi, mentre Shazam e una miriade di altre app esistono già per identificare quella canzone che ascolti in un ristorante o in un altro luogo pubblico, usare una melodia canticchiata come base per quella ricerca può essere più complicato.

"Con testi, voci di sottofondo e strumenti, l'audio di una registrazione musicale o in studio può essere molto diverso da una melodia canticchiata", scrive Frank."Per errore o per progetto, quando qualcuno canticchia la propria interpretazione di una canzone, spesso l' altezza, la tonalità, il tempo o il ritmo possono variare leggermente o addirittura in modo significativo."

Image
Image

Poiché le versioni canticchiate delle canzoni possono essere così diverse dalle originali, Frank nota che molti metodi passati richiedevano di abbinare il canticchiare di una persona con una versione della canzone che avesse solo una melodia, o una traccia che includeva il canticchiare. Ciò ha reso difficili i casi d'uso nel mondo reale, poiché i database con quei brani possono essere limitati e devono essere aggiornati manualmente.

Google spiega che per la funzione Hum to Search, utilizza modelli di apprendimento automatico per trasformare l'audio in una "sequenza basata su numeri" che rappresenta la melodia della canzone: ciò che dice può essere considerato come un'"impronta digitale."

Più facile da usare

L'uso dell'apprendimento automatico nella funzione Hum to Search di Google rende lo strumento molto più facile da usare nel mondo reale. Poiché Hum to Search abbina la melodia canticchiata del ricercatore con la canzone reale, lo strumento è in grado di lavorare con le nuove canzoni man mano che vengono rilasciate invece di un database che deve essere costantemente aggiornato con le versioni canticchiate di ciascuna traccia. Inoltre, non hai bisogno di un tono perfetto per usarlo.

"L'attuale sistema raggiunge un alto livello di precisione su un database di brani che contiene oltre mezzo milione di brani che aggiorniamo continuamente", ha affermato Google nel suo annuncio Hum to Search. "Questo corpus di canzoni ha ancora spazio per crescere per includere più melodie del mondo."

Consigliato: