Poco tempo fa, mi sono imbattuto in una domanda che in realtà da tempo pi ponevo. Si parla tanto di intelliganza artificiale, capacità di calcolo e relative reti neurali e sistemi di autoapprendimento, ma non cisarà il rischio che tutto ciò possa saturarsi? Voglio dire. Immaginiamoci una particolare rete neurale che alimenta una chat che risponda a quesiti specifici legali, alla fine come sarà possibile che questa sorta di mega-capoccioni artificiali siano in qualche modo collegati tra loro? Non intendo da un punto di vista prettamente fisico, ma concettuale. Alla fine cioè sistemi evoluti che si occupano di argomenti diversi tra loro come possono auto-arricchirsi di informazioni? Bene la risposta l’ho trovata grazie ad una cosa stranissima che avviene in statistica.
La correlazione spuria
La correlazione spuria è un concetto statistico che si riferisce ad una relazione tra due variabili che in realtà non sono correlate tra loro, ma che sembrano esserlo (ade sempio confrontando due grafici che malgrado rappresentino informazioni diverse graficamente sono molto simili) a causa di una terza variabile che magari esiste, ma di cui non se ne conosce la presenza.
Could we ban the sale of ice creams to prevent violent crimes?
by in shittyaskscience
Un esempio di correlazione spuria è quello tra il consumo di gelato e la percentuale di arrestati per reati violenti. Questi due fenomeni sembrano essere correlati (vedi grafico sopra), ma in realtà non c’è nessuna relazione diretta tra di essi. La correlazione infatti esiste e viene creata da una terza variabile, la temperatura esterna. Infatti nella stagione estiva (e quindi con il caldo) aumenta il consumo di gelato e le temperature più elevate possono portare ad un aumento dei reati violenti. Quindi, la correlazione tra il consumo di gelato e l’arresto dei criminali non è reale, ma è il risultato della loro comune dipendenza dalla temperatura esterna.
Ok chiarito questo strano concetto, viene da se che un’intelligenza artificiale evoluta avrà come sua finalità quella di individuare una o piu’ variabili “invisibili” al fine di disegnare nuove correlazioni, che ad oggi a noi umani e ai tradizionali sistemi di data mining (sistemi di ricerca sui dati) sfuggono. Questo perchè non avendo una visione globale sui dati tendiamo a settorizzarli. Forse il vero potenziale per il nostro futuro d’IA è proprio questo. Non tanto saper rispondere bene se interrogata in una chat o altre diavolerie che poco impattano sulla nostra vita, ma avendo la capacità di scovare ciò che non riusciamo ad individuare malgrado tutte le conoscenze messe in campo. Immaginiamoci allora come potrebbe essere potente una tecnologia del genere per individuare nuove correlazioni in ambito scientifico, di come tutta la ricerca potenzialmente potrebbe essere sconvolta, smontando magari vecchi teoremi e aggiungendone di nuovi. O come potrebbe essere possibile sviluppare nuovi materiali se lo stesso algoritmo si faccesse girare nell’individuare variabili nascoste tra due o piu’ materiali a confronto. Insomma tanto per non farci mancare nulla, aggiungiamoci anche quest’altra chicca nel nostro carrello della conoscenza, che vaga nel grande magazzino della rete. Speriamo solo di non pagarne un prezzo troppo alto quando saremo alla casse!!! A buon intenditor poche parole.