Tecnologie all’Avanguardia per l’Analisi dei Dati Scientifici: Il Caso di Studio di BioGene presentato al NASA GeneLab AWG Symposium 2024

Il NASA GeneLab AWG Symposium 2024, tenutosi online nei giorni 1-2 maggio 2024, ha rappresentato un’opportunità unica per approfondire le ricerche più avanzate condotte dai Gruppi di Lavoro sull’Analisi di GeneLab (AWG). L’evento ha sottolineato l’importanza di comprendere le dinamiche di adattamento del corpo umano all’ambiente spaziale, un elemento fondamentale per le future esplorazioni cosmiche.

Il Repository Open Science Data (OSDR)
Il Repository Open Science Data (OSDR), arricchito dai dati di GeneLab e dall’Ames Life Sciences Data Archive (ALSDA), è emerso come una risorsa essenziale per studiare gli effetti della microgravità, delle radiazioni e altri fattori spaziali sui processi vitali. Gli AWG, costituiti da esperti multidisciplinari nelle aree di piante, animali, microrganismi, multi-omics, ALSDA e intelligenza artificiale/apprendimento automatico (AI/ML), hanno fornito un feedback dettagliato sui dati dell’OSDR, enfatizzando l’importanza della collaborazione interdisciplinare e dell’accesso ai dati scientifici aperti.


L’intervento del Prof. Cristian Randieri
Il Prof. Cristian Randieri, docente e ricercatore presso l’Università eCampus, ha presentato uno studio intitolato “Leveraging Natural Language Processing to Analyze Experiment Cross-Relations: A Study Using GeneLab and ImmPort Repositories”. Questo approccio innovativo utilizza tecniche di Natural Language Processing (NLP) per estrarre e analizzare i dati sperimentali dai repository di GeneLab e ImmPort, evidenziando il valore delle tecnologie avanzate nella ricerca spaziale.


IMMPORT: Rivoluzione nella Ricerca Immunologica
IMMPORT (Immunology Database and Analysis Portal) è una piattaforma all’avanguardia che rivoluziona la ricerca nell’ambito dell’immunologia. Fondata sulla collaborazione tra vari istituti di ricerca e università, IMMPORT offre strumenti e risorse per esplorare, analizzare e condividere dati cruciali per lo studio del sistema immunitario umano.


Il Progetto BioGene

Durante il simposio, il Prof. Randieri ha presentato il progetto BioGene, sviluppato insieme al suo team di ricerca italiano. BioGene è suddiviso in due moduli principali: BioGene Hub e BioGene AI. Il BioGene Hub raccoglie e aggiorna continuamente i dati testuali dai repository NASA GeneLab e ImmPort, mentre BioGene AI estrae informazioni significative dagli esperimenti e dalle pubblicazioni scientifiche.


Processi e Tecniche Utilizzate
Il processo di elaborazione dei dati di BioGene comprende due fasi chiave: l’estrazione del contenuto e l’elaborazione dei dati. Le API vengono utilizzate per estrarre il testo dagli esperimenti, archiviato poi in un database NoSQL. Successivamente, vengono create strutture dati SQL contenenti le pubblicazioni scientifiche associate, estratte sia automaticamente che manualmente . L’implementazione di algoritmi NLP come BERT, SBERT, ChatGPT e LiAMA ha dimostrato efficacia nella generazione di risposte accurate a domande sugli esperimenti analizzati, pur sottolineando l’importanza della validazione umana per garantire l’affidabilità dei risultati.


Quali sono le Prospettive Future?
Il team di ricerca italiano composto da studenti ed ex studenti (Giovanni Masi e Andrea Perrotta “esperti AI”, Mattia Rosti “esperto in database”, Andrea Pollina “esperto IoT”, Giovanni Curcio, Antonella Di Stefano, Filippo Genuardi, Elisa Geraci, Giuseppe Giannopolo, Gabriele La Delfa, Maria Giovanna Ausilia Loggia e Roberta Zitarosa “tesisti”) prevede di integrare il sistema di inferenza BioGene AI nello strumento BioGene, utilizzando metodologie di ensemble per migliorare le risposte degli algoritmi NLP. Questo rappresenta un significativo passo avanti nell’applicazione del NLP alla ricerca scientifica, aprendo nuove prospettive per l’analisi dei dati sperimentali nel campo della biologia spaziale e oltre.

Il Prof. Randieri, attraverso questo studio, ha voluto comunicare un importante messaggio: la scienza è un bene comune e accessibile a tutti, a condizione che ci sia collaborazione tra coloro che detengono i dati e che li condividono per il bene di tutti. Sebbene comunemente si possa essere scettici riguardo alle tecnologie, come ad esempio l’Intelligenza Artificiale (AI), vista da molti come una minaccia a causa della sua rapida evoluzione, è importante riconoscere che è grazie a esse che oggi molti problemi sono stati risolti.

Come per ogni strumento, l’importanza della tecnologia risiede nel suo utilizzo: può essere tanto utile quanto dannosa se le sue potenzialità vengono sfruttate per fini non etici. Pertanto, è fondamentale che sia gli esperti del settore che coloro che ne usufruiscono lo facciano in modo responsabile e moderato, in modo da massimizzare i benefici e ridurre al minimo gli effetti negativi.

Autore: Alexandro Fiumara

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *