Con chi scambio la voce?
“Pronto! Con chi chiacchiero?”. Macchine parlanti e capaci di comprenderci sono sempre stati un sogno dell’umanità e sono state più volte rappresentate nei romanzi ispirati al futuro, eppure oggi non è raro imbattersi per la strada in una signora trafelata che discute animatamente con un’altra voce femminile provieniente dal suo smartphone, arrivando addirittura, nei casi più gravi, a definirla la sua migliore amica.
Ebbene sì, scambiare la voce con un computer oggi è alla portata di tutti, anche se molti ancora non sfruttano appieno queste possibilità. La conversazione rilassata tra umani con tutto il corredo sensoriale che ne deriva, incluso il bicchiere di whisky, può essere esperienza estremamente più soddisfacente, tuttavia sorprende quanto si sia spinta in avanti la ricerca negli ultimi quarant’anni per far sì che anche il dialogo con una macchina diventi sempre più personalizzato ed agganciato alla relazione in corso.
Procediamo con ordine ad esaminare i contesti in cui i computer svolgono funzioni umane come parlare ed ascoltare, arrivando addirittura a sostenere una vera e propria conversazione.
Text-to-speech
“Dal testo scritto al discorso parlato” significa che un computer può leggere una serie di parole scritte in una specifica lingua e ripeterle a voce attraverso il suo altoparlante. Provare per credere? Se state leggendo queste note su un dispositivo mobile come un tablet o uno smartphone, selezionate questo capitolo dall’inizio e nel menù scegliete “leggi”. Assicuratevi che il volume non sia a zero e mettetevi in ascolto: sarete stupiti dall’intonazione della voce, dalle pause al momento giusto e da un risultato molto meno metallico di quanto forse vi aspettavate.
Sono passati quasi quarant’anni dai primi esperimenti condotti dagli studiosi per insegnare a parlare agli allora monumentali calcolatori. Pensate che a quei tempi l’Italia era all’avanguardia in questo tipo di ricerca e nei laboratori CSELT di Torino riuscirono a far cantare “Fra Martino campanaro” ad un computer, esperimento di cui si conserva ancora una registrazione in vinile. Consultando l’archivio storico di Telecom Italia all’indirizzo http://archiviostorico.telecomitalia.com/italia-al-telefono-oltre/1978-permettete-che-mi-presenti-sono-calcolatore-cselt potrete ascoltare la voce del calcolatore nel 1978.Confrontatela con quella delle signorine del vostro navigatore ed apprezzate la differenza.
A che cosa può servire un computer capace di leggere? Tanto per cominciare, pensate a tutto il mondo degli annunci nelle stazioni e mezzi pubblici, alle istruzioni che arrivano da un navigatore satellitare, oggetto ormai comune sulle nostre automobili ed onnipresente sui nostri smartphone, per non parlare poi dell’immenso mondo delle applicazioni mediche. Pensate poi di avere un indebolimento anche solo temporaneo della vista, magari un romanzo da finire, magari delle comunicazioni delle quali prendere atto: certo un computer non potrà mai sostituirsi a Roberto Benigni che recita la Divina Commedia, ma, se c’è bisogno di conoscere all’istante il contenuto della mail del capo, può bastare eccome. Pensate poi a molte applicazioni in campo produttivo, dove, ad esempio, le istruzioni per l’uso di un macchinario possono essere recitate da un computer in precisi punti della lavorazione, oppure semplicemente a tutte le volte in cui ci troviamo ad ascoltare le direttive di una macchina senza volto, la stazione Telepass o l’emettitrice di biglietti per il bus, ad esempio.
Speech-to-text
“Dal parlato allo scritto” indica la possibilità di dettare parole ad un computer per poi ritrovarle scritte in maniera modificabile con un qualsiasi editore di testo. Questa funzione è ormai disponibile su molti comuni smartphone: quando state per scrivere un messaggio, oppure una nota o un promemoria, sulla tastiera compare l’icona di un microfono e, se la premete, si accenderà il microfono pronto ad ascoltarvi e trascrivere. Potete anche aggiungere virgole, punti e vari segni di punteggiatura per rendere lo scritto esattamente come volete.
Ricordate le vignette popolari un tempo in cui il grande boss sedeva nel suo ufficio megagalattico con la segretaria seduta sulle ginocchia e le dettava il contenuto delle proprie lettere? Ebbene oggi il tutto si risolve molto più facilmente, anche se con meno brivido e trasgressione. Scherzi a parte, dettare ad una macchina può essere utile in tutti i casi in cui non è possibile scrivere, ad esempio perché si sta camminando: mai incontrata una signora trafelata che dice al suo smartphone: “Sarò a casa tra dieci minuti, puoi buttare la pasta”?
Com’è la qualità del testo ottenuto dalla dettatura? Generalmente buona, ma spesso può essere corrotta se ci sono rumori di fondo, può riportare vocaboli sbagliati se incespicate nel discorso e farà sicuramente pasticci se utilizzate nomignoli o soprannomi. Infatti, la stesura del testo si basa su un vocabolario molto ricco, che comprende tutti i nomi propri di uso comune, ma ancora non conosce il vezzeggiativo che date al vostro cane o fidanzato.
Se utilizzate normalmente più lingue ed avete installato altrettante tastiere, dovrete fare bene attenzione di parlare nella stessa lingua della tastiera altrimenti i risultati possono essere comici. Tanto per fare un tentativo, provate a pronunciare: “Sarò a casa tra dieci minuti” mentre la tastiera è impostata sull’inglese. Noi abbiamo ottenuto: “Several guys at the beach movie”, che potrebbe essere destabilizzante per chi vi attende.
Assistente vocale
La famosa segretaria seduta sulle ginocchia era in grado non solo di trascrivere i messaggi del capo, ma anche di soddisfare molte sue richieste (non pensate male!) come: “Signorina, mi chiami subito il direttore dello stabilimento” oppure: “Per favore, mi segni un appuntamento con il dottor Rossi domattina non prima delle 10 e lo chiami per invitarlo” oppure ancora: “Mi raccomando, venerdì non mi prenda impegni dopo le 13 perché vado a giocare a golf”. Oggi le segretarie sono state sostituite da assistenti di direzione con professionalità ben più sofisticate oppure da figure dette pomposamente Office Manager, che devono occuparsi di mandare avanti interi uffici, però sono arrivate alla portata di tutti le assistenti vocali, pronte ad aiutarci quando non abbiamo la possibilità o la voglia di pigiare i tasti per organizzare la nostra vita. Siri, Google Now e Cortana sono le assistenti più famose. Siri in norvegese significa “bellissima donna che ti porta alla vittoria”, mentre Cortana è il nome di un’eroina dei videogiochi, a conferma del fatto che non è cambiato l’immaginario maschile sulle donne che si prendono cura della loro vita.
Che cosa fanno queste assistenti? Chiamano al telefono, segnano appuntamenti, fanno ricerche sul web, trovano ristoranti nelle vicinanze, guardano le previsioni meteo, possono perfino imparare le nostre relazioni familiari così non dobbiamo nemmeno pronunciare il nome quando chiediamo di chiamarci nostra sorella. La cosa sorprendente è che possiamo rivolgerci a loro come fossero persone perché comprendono il nostro linguaggio naturale e ci rispondono pure. Provate ad arrabbiarvi dicendo frasi poco cortesi e vedrete che cosa succede. Addirittura, se dite più volte la stessa frase, ad esempio: “Sono molto arrabbiata con te”, ogni volta otterrete risposte diverse, a dimostrazione del fatto che il ragionamento che sta dietro le risposte è molto più complesso di una semplice tabella.
C’e’ altro?
Oltre a tutti gli usi della voce appena visti, c’è la possibilità di registrare la propria voce e di inviarla come messaggio a qualcun altro. Questo è tecnicamente più semplice dell’interazione vocale, tuttavia ha implicazioni sui nostri comportamenti. Pensate, ad esempio, ad un amico o familiare lontano che può farci sentire la sua voce raccontandoci le sue esperienze anche se il fuso orario renderebbe molto difficile la comunicazione, oppure il voler far sentire il tono della propria voce per far trepidare di desiderio la persona amata o tremare di paura un figlio che ha combinato una marachella. Lasciamo agli psicologi la discussione sulle conseguenze nei comportamenti e ci limitiamo a constatare che non si riesce più a star soli come una volta, sempre inseguiti non solo da messaggi ma da vere e proprie presenze a volte piacevoli, a volte fin troppo invasive.
Un’ultima considerazione: usare la voce anziché la tastiera per dare comandi ad un computer può essere estremamente comodo quando si è in mobilità (pensate di dover fissare un appuntamento mentre siete alla guida dell’automobile), ma la voce può venire ascoltata da molte orecchie, quindi, prima di sfogarvi raccontando a Siri tutti gli affari vostri convinti che vi capirà (o almeno vi starà a sentire!) ricordate che potreste essere in mezzo agli altri, dove la discrezione non è mai troppa.