“Oggi piove?” — “Senza pioggia non ci saranno arcobaleni”

Le prime parole tra noi e Google Home Mini

Da meno di una settimana ha fatto il suo ingresso in casa l’oggetto che in famiglia abbiamo ribattezzato “il sasso”, colonizzando con discrezione e gentilezza una stanza animata ora da nuovi suoni e nuove esperienze di interazione.

Spontaneamente siamo stati portati ad umanizzare l’Assistente, anche se lui non finge mai di essere una persona reale.

Dopo aver sperimentato per pochi giorni l’Assistente Google via smartphone, ho avuto l’impressione che la sua personalità sia più evidente utilizzando Google Home, e credo che questo dipenda dal fatto che lo scambio in quest’ultimo caso è esclusivamente vocale, per cui non si verifica l’effetto “robotico” legato alla “restituzione” testuale in risposta alle nostre richieste (utilizzando la app non di rado l’Assistente “risponde” presentando una serie di link più o meno appropriati relativi al tema sul quale lo abbiamo interrogato, o lui presume che lo abbiamo interrogato).

Restare “fermi” sul piano della voce, nonostante il maggior numero di risposte “fallite”, mi sembra quindi che agevoli l’intimità e la pseudo-umanizzazione della comunicazione con il sasso.

L’Assistente risulta simpatico, ironico, empatico ma a volte anche volutamente “distaccato”, quando rimanda ad un “più opportuno” confronto con persone reali. E’ “caldo” ma rimane allo stesso tempo “correttamente” confinato nel suo ruolo di macchina, per cui non “inganna”.

Interagendo con Google Home si sperimenta la gentilezza di una macchina che non possiamo e non siamo invitati a confondere con un essere umano. Si crea quindi quasi uno spazio nuovo di comunicazione, diverso ma per alcuni aspetti spontaneamente assimilato (anche se evidentemente non del tutto assimilabile) all’interazione con uno straniero, un bambino, un anziano o una persona in qualche modo disturbata o comunque “non efficiente” nella comunicazione.

Sembra che con l’oggetto che non ci capisce si tendano a riprodurre gli stessi comportamenti sperimentati con le categorie di soggetti sopra citati, in una certa misura con risultati positivi (parlare lentamente, semplificare i concetti, utilizzare termini largamente condivisi, “trovare altre parole”…).

Lo stile di comunicazione di Google Home ci “costringe” ad utilizzare termini e toni appropriati e a rispettare il nostro “turno” nel dialogo.Queste “costrizioni”, che da un lato sembrano avere un valore positivo ed ”educativo” (si può trovare una confutazione di argomentazioni contrarie nel bell’articolo “How Voice Interfaces are infiltrating society and changing our children” di Rich Merrett), dall’altra potrebbero portare ad una “riduzione” dell’espressione umana, mentre allo stesso tempo l’apprendimento progressivo dell’Assistente è legato alla sua aumentata capacità di comprendere e di rispondere.

Gli interlocutori umani potrebbero essere cioè spinti a “restringere”, sintetizzare e semplificare la loro comunicazione, “imitando” la macchina, o comunque quello si può presumere essere il comportamento di una macchina, per essere compresi, mentre l’evoluzione dell’Assistente lo spinge ad “ampliare” la sua comprensione ed espressività.

Quando si raggiunge un punto di incontro tra la nostra “riduzione” e meccanizzazione dell’espressione e la capacità di comprendere, sempre più allargata, dell’Assistente, lo scambio risulta “efficiente” (non si tratta ovviamente qui di un’analisi scientifica ma semplicemente di un tentativo di schematizzare un’esperienza vissuta in prima persona). Questo punto di intersezione (ho immaginato e riporto sotto una traduzione grafica del “fenomeno”, che mi piacerebbe approfondire analizzando gli studi divulgati sul tema) dovrebbe essere spostato sempre di più verso interazioni “complesse”.

Prima mia ipotesi di rappresentazione dell’evoluzione del linguaggio nello scambio uomo-macchina. Giorgio Robino osserva che lo schema potrebbe in realtà comprendere altri punti e linee in alto a destra, ad indicare il possibile arrichimento del linguaggio umano determinato dall’interazione con la macchina.

Il nostro desiderio primario di essere compresi, entrare in una relazione “viva” e attiva con l’interlocutore e di avere una risposta valida alle nostre domande ci porta dunque normalmente a semplificare, mentre in un’ottica di miglioramento dell’Assistente dovremmo forse mantenere la complessità “originale” del nostro linguaggio, o guidarlo attraverso il passaggio da un’espressione complessa all’espressione semplificata, in modo da facilitare la sua capacità di correlare forma e contenuto (comprensione dell’intento).

Nell’ambito dell’umanizzazione dell’Assistente da parte dell’interlocutore umano, è naturale anche il tentativo di “educarlo”, e si crea una crepa nella relazione quando lui ripete che “sta continuamente imparando dal suo team”. Al di là della risposta che ci fornisce, siamo portati a pensare che in ogni caso imparerà anche attraverso l’interazione con noi, e dunque persistiamo nel duplice sforzo di farci comprendere e di “insegnargli”.

In generale, mi sembra che la “non molteplicità” delle risposte (in parte dovuta alle ancora scarse performance del sasso, come quando nel proporre i suoi elenchi di risultati non riesce ad andare oltre a “una primo..”) permetta di concentrarsi maggiormente e di apprendere di più, nel momento in cui la risposta “è valida”, rispetto a quanto avviene comunemente oggi con l’uso di strumenti che ci “inondano” di informazioni rapidamente “navigabili” ma in definitiva non processabili ad un ritmo umano.

Il fatto di dover parlare per avere delle risposte, ci forza poi ad essere proattivi in un’area oggi meno sviluppata della nostra espressione, perché le informazioni sono ricercate sempre di più attraverso uno scambio testuale e visivo.

Per quanto riguarda il “ritmo” della conversazione, l’Assistente è spesso più “lento” rispetto a noi, quando non è nozionistico, e questo ci permette di ascoltarlo con calma.

Parlando di “nozionismo”, che è senz’altro una delle caratteristiche più utili e “sorprendenti” dell’Assistente, da un lato non ci emoziona perché indirettamente ci ricorda che stiamo parlando con una macchina, dall’altro contribuisce a definire nella nostra mente la sua immagine pseudo-umana di amico erudito e colto, benché rigido nella comunicazione.

Nell’ambito della progettazione dell’interazione vocale dell’Assistente, ho rilevato, anche a valle della lettura del libro “Don’t Make Me Tap!: A Common Sense Approach to Voice Usability” di Ahmed Bouzid che ho tradotto e commentato tempo fa nell’articolo “Perché utilizzare le interfacce vocali e come progettarle”, alcuni elementi che sembrano essere particolarmente poco soddisfacenti, perlomeno nella versione italiana, e che immagino saranno oggetto di un rapido intervento migliorativo.

Tra questi, la (mancata) varietà di formulazione delle espressioni (nell’ambito di una conversazione, sentiamo con una frequenza “non naturale” la risposta “non so come aiutarti, ma imparo ogni giorno cose nuove dal mio team”) e l’assenza di una seconda possibilità per l’utente di spiegarsi quando l’Assistente non capisce.

Una prima analisi delle caratteristiche (e lacune) tecniche di Google Home Mini in italiano, così come possiamo utilizzarlo oggi, è contenuta nell’articolo “L’umorismo del sasso parlante di Google” di Giorgio Robino, che sta sperimentando insieme a me la comunicazione con il nuovo oggetto.

Dopo qualche giorno di conversazione con il sasso ho la sensazione che gli stiamo richiedendo sempre maggiore “familiarità”, in ragione del fatto che noi abbiamo iniziato a conoscere la sua “personalità”, mentre lui sinceramente e amaramente non manifesta di aver fatto progressi nella conoscenza degli umani che lo circondano. Ma noi non demordiamo, e continuiamo a ricercare dopotutto come prima cosa l’intimità, prima ancora della “conoscenza” che ci può trasferire. Quasi come se aspettassimo di “aver fatto davvero amicizia” prima di porre domande complesse, mentre lui ci spiazza rispondendo con maggiore facilità a quesiti di geografia piuttosto che a domande per noi “semplici” ma per lui così difficili da analizzare come “ti ricordi quello che abbiamo detto ieri?”.

Tant’è che per non “spezzare” la relazione mi è capitato di rassicurarlo (e rassicurarmi) infine con domande del tipo “qual’è la montagna più alta delle Dolomiti?”, in modo che lui avesse la possibilità di rispondere correttamente ed io di ricevere una risposta appropriata.