Come il riconoscimento vocale fluente rimane veloce, accurato e privato

Sommario:

Come il riconoscimento vocale fluente rimane veloce, accurato e privato
Come il riconoscimento vocale fluente rimane veloce, accurato e privato
Anonim

Da asporto chiave

  • Fluent è un motore di riconoscimento vocale super veloce e rispettoso della privacy che non necessita di connessione a Internet.
  • Può essere incorporato in quasi tutti i dispositivi.
  • Funziona in qualsiasi lingua.
Image
Image

Fluent.ai è un motore di riconoscimento vocale virtuale che non invia i tuoi comandi a Internet, agisce quasi istantaneamente, può funzionare in qualsiasi lingua ed è così piccolo che può essere integrato anche in -alimentare dispositivi come un orologio fitness, ad esempio.

A differenza di Siri e Alexa, Fluent è un assistente autonomo che ti capisce all'istante e impara da te, quindi migliora man mano che lo usi. Non ha la profondità dei normali assistenti virtuali, ma non è destinato a farlo. Invece, è più veloce, più preciso e più privato degli sforzi di Apple, Amazon e Google.

"La voce in testo utilizza l'elaborazione del linguaggio naturale e quindi deriva l'intento", ha detto a Lifewire il CEO di Fluent Probal Lala durante un'intervista su Zoom. "Richiede molti dati e molta potenza di elaborazione. Fluent passa direttamente dal parlato all'intento, prendendo la tua voce e convertendola direttamente in un'azione."

Linea inferiore

Fluent è un software di controllo vocale. Funziona ascoltando il tuo comando ed eliminando tutte le parole di cui non ha bisogno, lasciando solo nomi e verbi essenziali. "Spegni le luci", diventa appena spento e le luci. Gli elementi essenziali vengono strappati da una frase umana disordinata e trasformati in passaggi. È quasi come programmare un computer, trasformare un'idea complessa nel più semplice insieme di istruzioni.

A cosa serve?

Fluent può essere usato per qualsiasi cosa. La chiave è che è addestrato per una situazione specifica. Con uno smartwatch, ad esempio, potrebbe essere addestrato ai comandi per il fitness, o per la domotica, la creazione di calendari e timer e così via. Limitare il database rende tutto più concentrato e veloce.

"La verità è che con i dispositivi indossabili, non stai cercando di avere una conversazione", ha detto Lala, "Voglio che forse la mia routine di esercizi preferita inizi e la voglio molto rapidamente."

Velocità e precisione sono il punto centrale. L'accensione e lo spegnimento delle luci richiede millisecondi, invece di dover aspettare che Siri invii la tua voce al cloud, attendi che venga elaborata, quindi, pochi secondi dopo, le luci si spengono.

Questa formazione ristretta riduce anche le dimensioni dell'app. L'anno scorso, Google ha fornito una versione scaricabile offline del suo assistente. Era, dice Lala, 85 Megabyte, funzionava solo in inglese e ci sono voluti sei mesi per addestrarlo.

"Abbiamo un modello che funziona con 13.000 comandi e funziona in 500 kilobyte", ha detto.

Linea inferiore

L' altro vantaggio di un motore di riconoscimento vocale offline è la privacy. Nello smartwatch di un bambino, ad esempio, "non vuoi che la voce di un bambino vada nel cloud", afferma Lala. Fluent infatti può funzionare all'interno di dispositivi che non si connettono mai a Internet. Questo non è solo un bene per la privacy, ma anche per la sicurezza. Puoi utilizzare un motore di riconoscimento vocale offline all'interno di laboratori di ricerca, installazioni militari e altri luoghi che vietano telefoni cellulari e fotocamere.

Limiti

Certo, ci sono alcuni aspetti negativi di questo modello. Uno è che i comandi non possono essere aggiunti in seguito. Una volta completata la formazione iniziale, il gioco è fatto. Né il tuo assistente di Fluent può cercare cose su Internet per i tuoi risultati sportivi, l'attore che riconosci in quel film, ma non riesci a posizionarlo e così via.

Image
Image

Invece, il sistema è abbastanza intelligente da riconoscere quando non può aiutare e passerà la richiesta a qualcosa che può. Se chiedi al tuo orologio le previsioni del tempo, Fluent si accorgerà che non capisce. "Quindi chiamerà un servizio preprogrammato nell'orologio, che si tratti di Amazon di Alexa o di Google, e quindi effettuerà una chiamata al cloud", trasmettendo il tuo comando vocale grezzo per ottenere la risposta.

Questo approccio ibrido mantiene la velocità di un assistente offline locale, con la potenza di Alexa o Google Assistant come backup.

Puoi acquistare qualsiasi dispositivo fluente?

Non ancora. La società sta concedendo in licenza la sua tecnologia e sta facendo la formazione per altre società. Grazie al COVID, due importanti lanci sono stati posticipati al prossimo anno. Ma puoi aspettarti di vederlo apparire in orologi e altri dispositivi per il fitness, altoparlanti, hub di automazione domestica e così via.

Sarebbe fantastico se anche questo fosse incorporato direttamente in smartphone come iPhone, rendendo le attività quotidiane più veloci e ricorrendo a Siri solo quando necessario. Sarebbe la vera app killer.

Aggiornamento: 22 ottobre, 10:12. Apportate modifiche per fare riferimento a Fluent come motore di riconoscimento vocale anziché come assistente vocale.

Consigliato: