«Così le macchine decifreranno le lingue per noi»

«Così le macchine decifreranno le lingue per noi»
di Paolo Travisi
5 Minuti di Lettura
Lunedì 17 Maggio 2021, 09:43 - Ultimo aggiornamento: 10:49

Uno dei sogni degli scienziati che studiano e sviluppano l'intelligenza artificiale, è poter insegnare ai computer la comprensione del linguaggio umano. Renderebbe possibile il dialogo tra uomo e macchina, con implicazioni importanti nella robotica e nella traduzione automatica di testi. Questo è l'obiettivo che Roberto Navigli, docente d'informatica a La Sapienza di Roma, uno dei pionieri del settore, insegue da 20 anni.

Smart working, ecco l’app per restare in contatto con i colleghi

Il robot gira per casa e la pulizia è “fa da sé”

Tutto è iniziato con un'idea, BabelNet. Cos'è?
«Sono sempre stato un grande appassionato di opere enciclopediche e ho sempre pensato che per far capire ad una macchina cosa fosse scritto in un testo, dovesse capire i significati delle parole, come noi umani quando consultiamo dizionari o enciclopedie.

Con BabelNet, nel 2010, abbiamo creato un multidizionario multilingue, mettendo insieme diversi dizionari in formato elettronico, unificandoli in modo che anche le voci fossero omogenee in ogni lingua. Il lavoro dell'algoritmo è stato quello di aggregare tutte le informazioni semantiche di una data accezione di una parola in un unico concetto, che poi viene espresso in qualsiasi lingua. BabelNet è un dizionario per computer che rappresenta il linguaggio come una rete tra concetti, ma anche una piattaforma consultabile online».

Che tipo di input ha dato all'algoritmo per realizzare un lavoro che si basa su una mole enorme di dati, cioè di parole?
«Non abbiamo creato le definizioni e le traduzioni, ma le abbiamo aggregate. L'IA ha usato BabelNet come inventario, sfruttando la rete e l'apprendimento automatico del machine learning per collegare testi e concetti».

Un esempio?
«La parola piano in un dizionario può avere tre accezioni, in un altro cinque, dieci e così via. L'IA ha messo insieme in una sola voce quelle con lo stesso significato in lingue diverse, facendo un lavoro di collegamento. Il risultato è stato un unico dizionario, prima inesistente, che mette insieme il meglio di centinaia di dizionari e che contiene 20 milioni di voci in 500 lingue. Per dare un'idea di confronto, la versione in lingua inglese di Wikipedia contiene poco più di 6 milioni di articoli. BabelNet viene utilizzato oggi da più di 1.000 università in tutto il mondo».

L'idea alla base di BabelNet è confluita nel progetto MultiJedi a cui l'Europen Research Council ha assegnato un Grant per la ricerca. Qual è stato il passaggio successivo?
«Dopo aver sviluppato gli strumenti automatici per aggregare le voci dei dizionari, il passaggio è stato dare BabelNet in input ad un secondo algoritmo di IA per far comprendere alla macchina il significato di una parola inserita in un contesto. Questo progetto, finito nel 2016, mi ha portato al Parlamento Europeo in Lussemburgo, dove ha riscosso un grande interesse internazionale che mi ha spinto a fondare un'impresa, Babelscape, che oggi conta 25 dipendenti».

Con questo progetto che risultati ha raggiunto?
«Se dico sto suonando il piano oppure il piano del governo, la parola piano assume significati diversi nei due contesti. L'IA sfrutta le conoscenze acquisite con la rete semantica BabelNet, per associare il giusto significato alle parole in un preciso contesto. Abbiamo realizzato una tecnologia che permette ad un computer di scegliere il significato contestuale di una parola, un processo chiamato disambiguazione del senso delle parole. Per un umano, il contesto di una frase è chiaro, per un computer no. Possiamo dire che stiamo insegnando alle macchine la comprensione automatica, come quando un ragazzo a scuola legge un testo e gli viene chiesto cosa abbia realmente capito. Nel caso dello studente quei concetti restano nel suo cervello, mentre nel computer sono archiviati in memoria ed associabili a livello semantico».

Se sta insegnando la comprensione del linguaggio umano ad una macchina, in futuro sarà possibile il dialogo uomo-macchina?
«La macchina è sconnessa dalla realtà, perché manca di quell'insieme di input sensoriali propri dell'uomo che permettono di acquisire la conoscenza del mondo ed il formarsi del senso comune. Se dicessi ad una macchina buono il latte verde, bevilo, lo farebbe, perché carente di senso comune. Vedo ancora piuttosto lontana una conversazione realistica».

Qual è l'ostacolo maggiore?
«Il ragionamento che collega tante informazioni e ne inserisce di nuove sfruttando una conoscenza che l'uomo acquisisce nel tempo e che nelle macchine manca completamente. La disambiguazione a cui stiamo lavorando è l'anticamera del ragionamento automatico, perché se non riesco a distinguere il significato delle parole, come posso comprenderne le implicazioni e le interazioni con il mondo esterno?»

È in corso un altro progetto, Mousse, anche questo finanziato da ERC con un Grant. Sarà un'altra evoluzione nella comprensione del linguaggio umano?
«In questo progetto, che si chiuderà nel 2022, ci focalizziamo, non sulle singole parole, ma su un'intera frase per avvicinarci alla traduzione automatica. Se dico mangio la minestra col cucchiaio o col parmigiano, esprimo due concetti diversi con frasi solo apparentemente simili. È un progetto di IA ancora più sofisticato con cui la macchina deve saper comprendere le varie parti di un discorso indipendentemente dalla lingua in cui è scritto ed essere in grado di esternare il significato in una sorta di interlingua. Verso questo progetto c'è un grande interesse anche di importanti multinazionali del big tech».

Le tecnologie che sta sviluppando cosa cambieranno nel rapporto uomo-macchina?
«Immagino l'avvicinamento progressivo tra umano e computer, che già esiste e sarà potenziato da queste tecnologie, che renderanno le macchine sempre più umane. E poi l'eliminazione degli ostacoli linguistici. Se non parlo cinese non devo essere escluso dall'accesso alle informazioni in cinese. La lingua non sarà più un ostacolo».
 

© RIPRODUZIONE RISERVATA