Quando si parla di intelligenza artificiale nella ricerca scientifica, il dibattito si ferma quasi sempre a due poli: promesse enormi e rischi enormi.
Da un lato, l’AI promette di accelerare le scoperte. Dall’altro, si teme che produca scorciatoie intellettuali, automatismi opachi, generalizzazioni ingannevoli o perfino evidenze solo apparentemente plausibili. Sono timori legittimi. Ma per chi lavora con dati sperimentali c’è un punto meno discusso e forse ancora più importante: l’intelligenza artificiale può aiutarci a prendere finalmente sul serio la complessità del reale.
E non è un tema secondario. Anzi, sottovalutare la complessità è stato spesso uno dei grandi limiti della scienza. Un caso emblematico è quello della ricerca preclinica sul cancro. Quando Begley ed Ellis richiamarono l’attenzione sulla scarsa riproducibilità di molti risultati “promettenti”, il problema non riguardava soltanto errori, superficialità o cattive pratiche sperimentali. C’entrava anche un’altra questione: sistemi biologici estremamente complessi venivano trattati come se fossero lineari, stabili e facilmente generalizzabili. È qui che il discorso sull’AI andrebbe reso più preciso. Perché non esiste “l’AI” come oggetto unico. C’è un’AI generativa, che produce testi, immagini, codice e altri contenuti. Ed esiste un’AI analitica, che serve invece a riconoscere strutture nei dati, classificare, segmentare, contare, prevedere o mettere in evidenza relazioni non immediatamente visibili. In ambito scientifico la differenza è decisiva.
L’AI generativa può essere utile per riassumere letteratura, formulare ipotesi o simulare scenari. Ma è anche quella che suscita le paure più note: citazioni inventate, opacità, problemi di autorialità, rischio di simulare comprensione dove comprensione non c’è.
L’AI analitica pone domande diverse. Qui il problema non è tanto se “scrive” bene, ma se funziona davvero. Se è robusta e se regge fuori dal dataset su cui è stata addestrata. Cioè, se resta affidabile quando incontra il mondo reale.
Ed è proprio su questo punto che la questione diventa interessante. Molti ricercatori guardano ancora con più fiducia agli strumenti di analisi statistica tradizionali, come per esempio le analisi a componenti principali, perché sono più leggibili e più rassicuranti. Ma siamo sicuri che il metodo sia all’altezza dei dati che oggi produciamo? Perché i dati sperimentali contemporanei, sempre più spesso, non sono semplici. Sono massivi, rumorosi, multidimensionali, eterogenei. Mettono insieme scale diverse e soprattutto relazioni non lineari. Sono il prodotto di tecniche sempre più sofisticate, capaci di cogliere dettagli finissimi. In questo contesto, continuare a trattarli con strumenti riduttivi solo perché ci sono noti rischia di diventare una forma di semplificazione mascherata da rigore. È qui che l’AI mostra il suo valore più profondo. Non come sostituto del ricercatore. Non come oracolo. Ma come strumento capace di esplorare pattern latenti, strutture complesse e sottopopolazioni significative che un’analisi più tradizionale tende facilmente a schiacciare o a ignorare. Forse una parte della diffidenza verso l’AI nasce proprio da questo. Non tanto dal fatto che sia nuova, ma dal fatto che obbliga a mettere in discussione abitudini analitiche che abbiamo a lungo considerato neutre. E invece neutre non sono.
Io un’idea chiara ce l’ho: dobbiamo abbracciare subito e pienamente gli strumenti necessari per esplorare la complessità del mondo e adottare delle pratiche di gestione dei dati che supportino l’interoperabilità. Questa è una cultura della ricerca moderna, transdisciplinare e capace di far lavorare insieme competenze diverse: dall’esperto di AI al data manager, dallo spettroscopista al biologo. Altrimenti il rischio è evidente , costruire infrastrutture sempre più avanzate per generare dati straordinari, senza sviluppare altrettanto rapidamente gli strumenti culturali e metodologici necessari per interpretarli davvero.
