Dal cruscotto al frigorifero ecco il mondo degli oggetti parlanti
dal sito: www.repubblica.it
Si moltiplicano in ogni campo le macchine umanizzate: grazie
a sofisticati programmi rispondono agli ordini. La grande attesa ora è
per Apple. L'azienda di Cupertino sfornerà entro l'anno il "vocecomando"
per la sua tv
dal nostro inviato ANGELO AQUARO
NEW
YORK - Quando beccherete vostra moglie a parlottare con la macchinetta
del caffè non prendetela per matta: sta soltanto cercando di insegnarle a
fare per bene la schiumina. Con le macchine - come per gli uomini - è
sempre questione di adattamento: sbagliando s'impara. Vale anche per le
macchine che parlano: dal computer al cruscotto dell'auto alla
macchinetta appunto del caffè. Perché il segreto del riconoscimento
vocale è l'affinamento: più ci parleremo, più ci capirà.
L'ultimo
iPhone è il primo col riconoscimento vocale. Per ora funziona in
inglese, spagnolo, francese e tedesco: e al diavolo l'italiano. Ma Siri,
la segretaria virtuale dell'iPhone 4S, è solo il nome più noto di
questa rivoluzione. Non serve avere l'ultimo modello per parlare con il
vostro telefonino. La stessa azienda che ha partorito la segretaria
virtuale ha piazzato nell'Apple Store una app sbandierata mica tanto:
proprio per tacito accordo con la Mela che deve vendere gli ultimi
iPhone. L'azienda si chiama Nuance Communications e l'applicazione
Dragon Go! Dici: "Voglio il migliore ristorante indiano" e ti squaderna i
migliori aprendoti il sito Yelp che raccoglie le segnalazioni della
rete. Dici: "Voglio il migliore ristorante indiano del mio quartiere" e
ti restringe la ricerca grazie al Gps del telefonino. Dici: "Vorrei
prenotare un buon ristorante indiano" e ti porta pagine di OpenTable: il
sito che ti permette di prenotare dal web senza alzare il telefono.
Nuance
Communications è un'azienda di Burlington, Massachusettes, che fa
affari per oltre un miliardo di dollari: la metà nella sanità. Forse
perché famosi in tutto il mondo per la loro indecifrabile scrittura,
proprio i medici sono stati i pionieri nell'utilizzo della dettatura
meccanica: "leggono" una lastra ad alta voce e il computer registra. No,
per ora la lastra non risponde: ma ci manca poco. Dice il New York
Times che Nuance è nata da un'ispirazione che l'ex manager della Xeros,
Paul Ricci, ha avuto nel 2000: il riconoscimento vocale avrebbe avuto
presto lo straordinario effetto che hanno avuto l'invenzione del mouse e
dell'interfaccia grafica dei computer. Paul Ricci nuovo Steve Jobs? Per
la verità numerosi scienziati sostengono che l'evoluzione potrebbe
essere anche più radicale: al punto da costringerci a una nuova
selezione naturale. Gli uomini hanno incominciato a parlare tra di loro
da meno di due milioni di anni. E solo da un secolo e mezzo hanno
incominciato a parlare "alle" macchine e "dalle" macchine: con il
fonografo di Thomas Edison e i suoi derivati. Ma che ne sarà più delle
relazioni interpersonali quando useremo il telefonino non per
"comunicare qualcosa a qualcuno" ma per "comunicare con lui"? Per non
parlare di qualche problemino di privacy. Che fine fanno tutti i dati
vocali che regaliamo ai computer?
La scienza e la tecnologia
vanno naturalmente avanti. Anche Google ha un sistema simile: Google
Activation Voice. E lo stesso fa Microsoft con Tell me. Il
riconoscimento vocale è l'ultima speranza anche in fatto di sicurezza:
se la password è associata alla nostra voce ci vorrebbe Zelig per
entrarci nel computer. Anche per questo, dice a Repubblica il
responsabile di Google Translate, Ashish Venugopal, la voce è la nuova
frontiera del gigante del web. Gli esperimenti che il suo gruppo sta
facendo su traduzioni e dialetti serviranno a irrobustire le capacità di
interpretazione delle macchine. Già adesso Translate usa il
riconoscimento vocale: e specializzarsi nei dialetti vorrà dire aiutare
le macchine a capire - e a capirci - ancora meglio.
Perché il segreto
di ogni riconoscimento vocale è proprio questo: più dati incameriamo,
più voci dal mondo raccogliamo, più l'algoritmo sarà preciso. È la magia
di ogni "talking machine": il software trasforma le parole in onde
vocali e a quel punto cerca nel suo immenso archivio le parole che
corrispondono a quelle onde. Ecco perché la ricerca è indissolubilmente
legata alla raccolta dati. Gli uomini riconoscono le parole associando
certi suoni a certi nomi che rappresentano certe cose: le macchine
riconoscono le parole associando certi suoni ai suoni archiviati che
rappresentano quelle parole.
La grande attesa ora è ancora una
volta per Apple. La Mela dovrebbe sfornare Apple Tv entro l'anno e da
Cupertino lasciano trapelare che sarà più che una svolta: perché dal
telecomando passeremo a quello che potremmo chiamare vocecomando. Dici
che film vuoi vedere e la tv te lo cerca in tutti i negozi virtuali al
momento disponibili - da iTunes a Netflix. E la prossima sfida è già
qui: rendere quella voce ancora più umana. L'ultimo regalo di Steve alla
sua Mela è stato proprio il sesso di Siri. Gli stessi ingegneri che
avevano programmato il software non sapevano se quella voce suonasse più
maschia o femmina. "È una donna" sentenziò Jobs: e la macchina parlante
fu.
(03 aprile 2012)
Nessun commento:
Posta un commento