Vai al contenuto

Oltre i confini dell’Intelligenza Artificiale, viaggio nei laboratori dove Waymo progetta i cervelli delle sue auto

Vedere un’auto che si aggira nei sobborghi di Phoenix, in Arizona, senza un guidatore, può essere allarmante, a meno che non si tratti di una “self-driving unit”, dotata di un cervello Waymo, l’unica azienda al mondo che ha prodotto auto senza autista in grado di girare sulle strade.

Un sofisticato sistema di reti neurali potenziato dal machine learning di cui si sa ancora molto poco. Almeno fino ad oggi, dato che finalmente Waymo ha iniziato a dare qualche dettaglio. L’azienda, grazie al vantaggio acquisito battendo sul tempo altri player, ad alcune acquisizioni portate a termine dalla consociata Google ed a uno straordinario team di ricercatori ed esperti di AI, ha creato la tecnologia più avanzata in questo campo.

Quanto si può essere artificialmente intelligenti?

Ormai chiunque può posizionare delle telecamere e dei sensori LIDAR su un’auto per definirla “autonoma”. Ma formare un auto a guidare se stessa come farebbe un umano, anzi, a guidare in modo più sicuro di quanto potrebbe fare una persona, è tutta un’altra cosa. Gli ingegneri di Waymo stanno creando modelli non solo per permettere ad un auto di riconoscere oggetti ed ostacoli su una strada ma stanno insegnando come il comportamento umano deve condizionare il modo in cui le auto dovrebbero muoversi. Stanno utilizzando il deep learning per interpretare, predire e rispondere a dati accumulati durante 6 milioni di miglia di guida sulle strade pubbliche e 5 miliardi di miglia guidate durante simulazioni.

In Waymo si studiano le interazioni dei pedoni e dei passeggeri con le proprie “self driving cars”. Addirittura si studiano le relazioni tra le stesse auto Waymo, sempre con lo scopo di renderle positive. Una sociologia decisamente futuristica tra macchina ed essere umano che deve essere ben bilanciata.

autodelfuturo

Da una parte, durante la guida,  non vogliamo che un robot sia troppo gentile e nemmeno che sia troppo autoritario. Se l’auto sta guidando a 80 all’ora in una strada statale con un traffico elevato e deve immettersi nella corsia di sinistra, sarà necessario attendere che un’altra auto crei lo spazio che permetta la manovra. Un’auto autonoma deve seguire il medesimo comportamento. In alcuni video comparsi su Twitter appare evidente che questo tipo di manovra rappresenti un problema per le auto Waymo ed il motivo è associato al fatto che non si tratta di una guida naturale. Una sfida che Waymo sta affrontando mettendo in campo tecnologie impressionanti.

In teoria queste auto dovrebbero salvarci la vita, ma di recente i risultati non sono stati incoraggianti. A marzo, una donna di 49 anni è stata travolta e uccisa da un auto “self-driving” di Uber mentre attraversava la strada. Qualche settimana dopo, il proprietario di una Tesla Model X è rimasto ucciso in un incidente mentre utilizzava l’auto-pilota. Alcune settimane fa una minivan Waymo è stato speronato da una Honda Sedan che stava zigzagando nel traffico.

Situazioni che hanno portato un generale scetticismo e che stanno facendo sorgere dei seri dubbi sia nell’opinione pubblica che nelle istituzioni.

Waymo è situata all’interno di X, il laboratorio di ricerca e sviluppo ad alto rischio che è a poche miglia dal Googleplex Campus

Waymo ormai è una realtà separata e gli ingegneri lavorano a fianco degli scienziati che si occupano di droni e i cosiddetti “Internet Balloons”.

L’azienda, che ha avuto modo di immagazzinare una enorme mole di dati, collabora attivamente con Fiat Chrysler e Jaguar Land Rover. Altre case automobilistiche stanno chiudendo accordi con Waymo, che ha progettato il lancio del primo Taxi senza guidatore in Arizona, previsto per fine anno.

I vantaggi di Waymo quando si parla di intelligenza artificiale sono significativi, ed il messaggio del suo AD John Krafcik è stato chiaro: “le auto Waymo possono vedere oltre, percepire e prendere decisioni più efficacemente e rapidamente di chiunque altro”.

La percezione è il dilemma centrale e richiede accorgimenti per garantire l’accuratezza di un rilevamento. Il deep learning, che è una forma di machine learning che utilizza molteplici strati di reti neurali per analizzare dati con diverse astrazioni, è una risorsa fondamentale per determinare un comportamento di guida.

Gli scienziati di Google Brain collaborano regolarmente con gli esperti di intelligenza artificiale di Waymo per migliorare l’accuratezza dei processi decisionali delle auto. Tra i risultati ottenuti c’è la ricerca sull’automated machine learning, in cui delle reti neurali istruiscono altre reti neurali. Anche se Waymo è un azienda autonoma, la sua aura di invulnerabilità è stata ottenuta anche grazie all’aiuto del fratellone più grande.

BMW auto a guida autonoma nel 2021: avviata la collaborazione con LiDAR InnovizL’intelligenza artificiale è una corsa all’oro e nemmeno Google riesce a trattenere i migliori cervelli, che talvolta fuggono per tentare la strada di mettersi in proprio, sapendo bene che la concorrenza si muove cercando di recuperare terreno a colpi di acquisizioni di piccole start-up. In effetti, se da una parte Waymo è acclamata da tutti come la realtà più avanzata, grazie al suo inizio pionieristico, è anche vero che ci sono buone possibilità che i concorrenti possano farsi sotto nonostante la presenza del centro di eccellenza di Google.

Non è sempre stato cosi, agli inizi del millennio, il settore era ancora debole. Si parlava ancora di pochi strati di reti neurali mentre oggi gli strati sono a centinaia.

Le cose sono cambiate con la gara conosciuta come IMAGENET COMPETITION, che ha avuto luogo nel 2009. Inizialmente si trattava di un poster dei ricercatori dell’Università di Princetown che si trasformò in un data-set di immagini con una gara per vedere who riusciva a creare un algoritmo che potesse identificare il maggior numero di immagini con il più basso tasso di errore. I data-set è passato da 10.000 immagini a 1.000 classi di immagini. Nel 2011 il tasso di errore era diventato il 25%, nel senso che almeno un’immagine era identificata in modo non corretto dagli algoritmi.

L’aiuto arrivò da un luogo inaspettato, la potenza delle graphics processing units (GPU) che si trovano solitamente nei video game. Ci si rese conto infatti che quei dispositivi potevano essere utilizzati per fare machine learning ed erano particolarmente adatte per gestire le reti neutali.

Poi nel 2012 Geoffrey Hinton, un data scientist esperto di AI, assieme a due studenti, scoprirono un nuovo modo di affrontare il problema: una rete neurale che poteva essere in grado di riconoscere immagini da oggetti comuni. Una scoperta che riuscì ad abbassare il tasso di errore della ImageNet competition dal 25% al 16%, e da li le cose mutarono forma!

La piccola società di Hinton venne immediatamente acquisita da Google e i due studenti vennero integrati nel team di Google Brain.

Una ricercatrice di Google, Anelia Angelova, fu la prima ad applicare queste tecniche di deep learning alle Google Car. Venne infatti creato un algoritmo che poteva insegnare ad un computer ad apprendere come riconoscere un pedone.

Inizialmente il sistema produceva molti errori, confondendo segnali di traffico, altre auto e pedoni. Inoltre si trattava di un calcolo troppo lento per poter avvenire in tempo reale ed il motivo era dovuto proprio all’intervento di catalogazione effettuato dagli umani.

Dopo aver corretto gli errori umani, era necessario risolvere il cruccio dell’istantaneità del riconoscimento delle immagini. Cosi il team di ricercatori decise di re-introdurre metodi di machine learning più tradizionali come gli alberi decisionali e i classificatori “a cascata”.

auto-guida-autonoma-google-intelligenza-artificialeLa questione che molti ex Google pongono riguarda una semplice domanda: “può bastare il vantaggio che Google si è conquistata partendo prima di chiunque altro?

Tesla ad esempio, ha il vantaggio di poter ottenere dati da una grande quantità di situazioni, dato che chi guida auto Tesla con hardware che gestisce la guida automatizzata sono sparsi ovunque nel mondo. Dal punto di vista della qualità dei dati, può in effetti essere che Tesla abbia un vantaggio competitivo e che presto anche a livello algoritmico possa chiudere il gap.

Sterling Anderson è stato il direttore della divisione “pilota automatico” in Tesla ed ha creato un’azienda denominata Aurora Innovation proprio insieme a Chris Urmson, ex capo della sezione “self driving car” di Google. Per Anderson il vantaggio competitivo di Waymo è meno rilevante che nel passato.  “Oggi qualunque azienda che si propone di entrare nel settore delle auto “self driving” parte dalle reti neurali e da un buon sistema di deep learning” – ha detto Anderson – “Proprio come un frutto ormai marcito, i dati che sono stati ottenuti nei primi anni di sviluppo sono ormai impossibile da “mangiare”. Un miglio guidato nel 2010 non rappresenta nulla rispetto ad un miglio guidato nel 2018”. Per Anderson i dati acquisiti nel passato sono stati certamente importanti per evolvere l’architettura e migliorare l’approccio alla loro comprensione. Ma dopo alcuni anni parlare di milioni di miglia guidate non ha più molto senso. Anche in Waymo gli ingegneri concordano. Guidare un auto “self driving” per milioni di miglia non porta dati rilevanti a meno che gli scenari differiscano e risultino realmente interessanti. La vera sfida è quella di generare dati in circostanze nuove come due auto senza guidatore che cercano di parcheggiare nello stesso posto o la reazione ad un inversione a U improvvisa in una strada trafficata.

Per non parlare del fatto che un robot può essere ingannato con immagini pensate per confondere un algoritmo o adesivi che applicati a un segnale di stop che possono portare il sistema di visione di una macchina a credere che si tratti di un limite a 50 all’ora. Queste eventualità sono assolutamente contemplate dagli ingegneri di Waymo, così come molte altre difficoltà che riguardano i rischi di hackeraggio o quelli legati ad infrazioni della privacy.

Qual è la differenza tra un cane ed un gatto?

Se si chiede a chiunque di riconoscere un gatto piuttosto che un cane in un immagine, la risposta sarà sicuramente attendibile. Ma non è cosi banale rispondere alla domanda “spiegami perché sei giunto alla conclusione che si tratti di un cane e non di un gatto”. In fondo entrambi hanno una coda e 4 zampe, gli orecchi possono avere una dimensione analoga…insomma, non è cosi scontato dare una risposta! Eppure è proprio questa la risposta che un sistema di deep learning dovrebbe cercare, piuttosto che permettere ad una telecamera di capire che il colore rosso significa “ferma” ed il colore verde significa “vai!” o di scovare un pedone con un gran numero di sensori.

Per far questo Waymo impiega essere umani che catalogano e istruiscono le reti neurali. Dopodichè i “data-sets” devono essere compressi per poter essere utilizzati nel mondo reale.

Un sistema Waymo può generare un’immagine di una strada riconoscendo persino la presenza di uno scoiattolo o di un uccello ma la vera sfida di Waymo è quella di comprendere anche le situazioni inusuali, come un muratore che sistema un guard-rail, un pedone travestito da cavallo o un tizio che sventola delle bandiere sul bordo della strada.

Eventi certamente rari, alcuni innocui ma altri meno. Sono proprio gli eventi rari che possono portare a incidenti. Un’auto senza guida può vedere un pedone che non attraversa la strada sulle strisce e agire di conseguenza ma può leggere una rara situazione in cui un pedone distratto cambia direzione all’improvviso cadendo in mezzo di strada?

Si è cosi ma sarebbero necessarie centinaia di milioni di dati per istruire il cervello dell’auto, e un essere umano impiegherebbe almeno 20 anni per raggiungere quota 100 milioni.

E’ evidente che Waymo, o qualunque altra azienda del settore, necessita di cambiare radicalmente l’infrastruttura che acquisisce ed elabora i proprio dati: una sorta di industrializzazione dell’Intelligenza Artificiale. Google sta cercando di utilizzare i propri potenti “data center”  per istruire le reti neurali. Impiegando sistemi hardware computerizzate in cloud, Google cerca di risolvere il problema mettendo a disposizione tutti i proprio potenti mezzi, persino GPU prodotte appositamente per migliorare la resa dei propri sistemi.

In conclusione, il futuro dell’Intelligenza Artificiale in Waymo non ha niente a che fare con la creazione di macchine senzienti. La ricerca riguarda piuttosto l’automatizzazione del machine learning. Ossia l’idea di dover mettere in piedi un sistema di AI machine learning che può creare un altro sistema di machine learning. Modelli di intelligenza artificiale che possano risolvere un problema che l’intelligenza artificiale stessa fronteggia. Un approccio che, ad esempio, permette ad una self driving car di guidare senza le linee che dividono o demarcano la strada, comunque in condizioni di incertezza e senza punti di riferimento. 

Se Waymo riuscirà a completare l’industrializzazione della propria attività di AI, allora un’auto senza guidatore potrà tranquillamente circolare all’interno di un centro cittadino di una grande metropoli.

Il futuro dell’Intelligenza Artificiale a Waymo

No non si tratta di auto senzienti. La ricerca riguarda piuttosto l’automatizzazione del machine learning, in cui il processo che permette di creare modelli cognitivi, viene industrializzato. Essenzialmente l’idea è che il machine learning stesso deve alimentare il machine learning istruendo nuovi modelli di intelligenza artificiale che servono a risolvere problemi sorti proprio attraverso l’intelligenza artificiale. Ad esempio, istruire la macchina per fare in modo che un’auto possa circolare in una strada priva di segnali, di linee che demarcano le corsie e i confini della strada, in una situazione di totale incertezza. Solo cosi un auto Waymo potrà essere utilizzata in un centro cittadino di una grande metropoli.

La strada è tracciata, non ci è dato sapere se sarà Waymo a raggiungere questo obiettivo per prima. Magari lo farà acquisendo qualche agile start-up lanciata da qualche suo ex dipendente particolarmente dotato!

Leggi anche: Disruptive technology: per l’innovazione dirompente servono diversità e capacità di collaborare