Cerca nel blog

venerdì 6 aprile 2012

Dal cruscotto al frigorifero ecco il mondo degli oggetti parlanti

dal sito: www.repubblica.it

Si moltiplicano in ogni campo le macchine umanizzate: grazie a sofisticati programmi rispondono agli ordini. La grande attesa ora è per Apple. L'azienda di Cupertino sfornerà entro l'anno il "vocecomando" per la sua tv

 dal nostro inviato ANGELO AQUARO
NEW YORK - Quando beccherete vostra moglie a parlottare con la macchinetta del caffè non prendetela per matta: sta soltanto cercando di insegnarle a fare per bene la schiumina. Con le macchine - come per gli uomini - è sempre questione di adattamento: sbagliando s'impara. Vale anche per le macchine che parlano: dal computer al cruscotto dell'auto alla macchinetta appunto del caffè. Perché il segreto del riconoscimento vocale è l'affinamento: più ci parleremo, più ci capirà.

L'ultimo iPhone è il primo col riconoscimento vocale. Per ora funziona in inglese, spagnolo, francese e tedesco: e al diavolo l'italiano. Ma Siri, la segretaria virtuale dell'iPhone 4S, è solo il nome più noto di questa rivoluzione. Non serve avere l'ultimo modello per parlare con il vostro telefonino. La stessa azienda che ha partorito la segretaria virtuale ha piazzato nell'Apple Store una app sbandierata mica tanto: proprio per tacito accordo con la Mela che deve vendere gli ultimi iPhone. L'azienda si chiama Nuance Communications e l'applicazione Dragon Go! Dici: "Voglio il migliore ristorante indiano" e ti squaderna i migliori aprendoti il sito Yelp che raccoglie le segnalazioni della rete. Dici: "Voglio il migliore ristorante indiano del mio quartiere" e ti restringe la ricerca grazie al Gps del telefonino. Dici: "Vorrei prenotare un buon ristorante indiano" e ti porta pagine di OpenTable: il sito che ti permette di prenotare dal web senza alzare il telefono.

Nuance Communications è un'azienda di Burlington, Massachusettes, che fa affari per oltre un miliardo di dollari: la metà nella sanità. Forse perché famosi in tutto il mondo per la loro indecifrabile scrittura, proprio i medici sono stati i pionieri nell'utilizzo della dettatura meccanica: "leggono" una lastra ad alta voce e il computer registra. No, per ora la lastra non risponde: ma ci manca poco. Dice il New York Times che Nuance è nata da un'ispirazione che l'ex manager della Xeros, Paul Ricci, ha avuto nel 2000: il riconoscimento vocale avrebbe avuto presto lo straordinario effetto che hanno avuto l'invenzione del mouse e dell'interfaccia grafica dei computer. Paul Ricci nuovo Steve Jobs? Per la verità numerosi scienziati sostengono che l'evoluzione potrebbe essere anche più radicale: al punto da costringerci a una nuova selezione naturale. Gli uomini hanno incominciato a parlare tra di loro da meno di due milioni di anni. E solo da un secolo e mezzo hanno incominciato a parlare "alle" macchine e "dalle" macchine: con il fonografo di Thomas Edison e i suoi derivati. Ma che ne sarà più delle relazioni interpersonali quando useremo il telefonino non per "comunicare qualcosa a qualcuno" ma per "comunicare con lui"? Per non parlare di qualche problemino di privacy. Che fine fanno tutti i dati vocali che regaliamo ai computer?

La scienza e la tecnologia vanno naturalmente avanti. Anche Google ha un sistema simile: Google Activation Voice. E lo stesso fa Microsoft con Tell me. Il riconoscimento vocale è l'ultima speranza anche in fatto di sicurezza: se la password è associata alla nostra voce ci vorrebbe Zelig per entrarci nel computer. Anche per questo, dice a Repubblica il responsabile di Google Translate, Ashish Venugopal, la voce è la nuova frontiera del gigante del web. Gli esperimenti che il suo gruppo sta facendo su traduzioni e dialetti serviranno a irrobustire le capacità di interpretazione delle macchine. Già adesso Translate usa il riconoscimento vocale: e specializzarsi nei dialetti vorrà dire aiutare le macchine a capire - e a capirci - ancora meglio.
Perché il segreto di ogni riconoscimento vocale è proprio questo: più dati incameriamo, più voci dal mondo raccogliamo, più l'algoritmo sarà preciso. È la magia di ogni "talking machine": il software trasforma le parole in onde vocali e a quel punto cerca nel suo immenso archivio le parole che corrispondono a quelle onde. Ecco perché la ricerca è indissolubilmente legata alla raccolta dati. Gli uomini riconoscono le parole associando certi suoni a certi nomi che rappresentano certe cose: le macchine riconoscono le parole associando certi suoni ai suoni archiviati che rappresentano quelle parole.

La grande attesa ora è ancora una volta per Apple. La Mela dovrebbe sfornare Apple Tv entro l'anno e da Cupertino lasciano trapelare che sarà più che una svolta: perché dal telecomando passeremo a quello che potremmo chiamare vocecomando. Dici che film vuoi vedere e la tv te lo cerca in tutti i negozi virtuali al momento disponibili - da iTunes a Netflix. E la prossima sfida è già qui: rendere quella voce ancora più umana. L'ultimo regalo di Steve alla sua Mela è stato proprio il sesso di Siri. Gli stessi ingegneri che avevano programmato il software non sapevano se quella voce suonasse più maschia o femmina. "È una donna" sentenziò Jobs: e la macchina parlante fu. (03 aprile 2012)

Nessun commento:

Posta un commento