Connettiti con noi

Hi-Tech

Microsoft crea il primo software di riconoscimento vocale quasi umano

Il tasso di errore è stato abbassato al 5,9%: lo stesso rilevato nei gruppi di controllo composti da essere umani

architecture-alternativo

Svolta storica per Microsoft: il team di ricercatori di Redmond ha sviluppato un algoritmo che abbassa al 5,9% il tasso di errore dei sistemi digitali di riconoscimento vocale. La percentuale è la più bassa mai ottenuta da una intelligenza artificiale, nonché pari a quella rilevata in un gruppo di persone umane. Per raggiungere questo obiettivo, Microsoft ha utilizzato reti neurali convoluzionali, che raggruppano parole simili tra loro, e il Lstm – Long short-term memory. La scoperta potrà portare sia al potenziamento dell’assistente digitale Cortana, sia al perfezionamento dei programmi di dettatura vocali. «Abbiamo raggiunto la parità con gli esseri umani», conferma lo Chief Speech Scientist di Microsoft, Xuedong Huang. «È un risultato storico». La strada per la perfezione è però ancora lunga.

I PROSSIMI STEP. In primo luogo, Microsoft deve testare il nuovo sistema di riconoscimento artificiale in situazioni reali, ossia in frangenti dove sono previsti rumori e disturbi sonori. Dopodiché bisogna lavorare per permettere alle macchine di individuare e riconoscere partecipanti aggiuntivi nella conversazione. Ma il reale orizzonte finale è la comprensione: un conto è riconoscere e tradurre in testo (pur corretto) i suoni registrati, un altro è arrivare a cogliere il significato delle parole trascritte.

Credits Images:

Cortana è l'assistente virtuale di Microsoft; prende il nome dall'A.I. del videogame Halo (nella foto)