Big data Articoli

La ricerca in un mare di dati

Generare nuovi ipotesi da verificare con gli strumenti dell’ebm.

Eugenio Santoro

Laboratorio di Informatica medica, Irccs - Istituto di ricerche farmacologiche “Mario Negri”

By Novembre 2016Settembre 29th, 2020No Comments

I big data hanno assunto un ruolo sempre più centrale nella raccolta, elaborazione e interpretazione di dati. Partiamo da alcuni numeri: l’80% dei dati generati quotidianamente non è strutturato, cioè non proviene da archivi e database predefiniti e codificati ma piuttosto dal web, dai blog, dai social network e dai forum. C’è addirittura chi sostiene che nel 2020 tale tipologia di dati rappresenterà il 100%. A ciò occorre aggiungere il fatto che la diffusione di smartphone, wearable e, in generale, dell’internet of things sta producendo una quantità enorme di dati, anche in ambito sanitario. Si stima che ogni giorno, sommando a questi dati quelli provenienti dalle conversazioni su internet, si sfiori la cifra di 2,5 miliardi di miliardi di byte. La crescita è stata impetuosa soprattutto nel corso degli ultimi due anni, durante i quali è stato generato il 90% dei dati disponibili oggi nel mondo. Addirittura si stima che ogni persona, attraverso le proprie appendici elettroniche e le operazioni che compie nella quotidianità, contribuisca a produrre al minuto 1,7 megabyte di dati.

Non c’è dubbio che siano necessarie tecniche di analisi in grado di interpretare questa grossa mole di dati, così da poter attivare tutta una serie d’iniziative che in ambito sanitario potrebbe portare a un miglioramento dell’assistenza sanitaria, alla riduzione dei costi per l’erogazione dei servizi, alla fruizione di servizi che aiutino a supportare le decisioni cliniche, alla realizzazione di sistemi di sorveglianza delle malattie e di farmacovigilanza e, in generale, alla  gestione della salute pubblica.

In questa direzione vanno numerose iniziative intraprese nel corso degli ultimi anni, soprattutto da parte dei colossi dell’informatica, spesso in collaborazione con le multinazionali del farmaco. Alcune recenti iniziative vedono coinvolti diverse alleanze: Sanofi e Google Life Science (la divisione di Google che si occupa di sviluppare nuove tecnologie in ambito medico) per sviluppare nuovi strumenti che integrino i vari approcci terapeutici e di controllo nei pazienti con diabete di tipo 1 e di tipo 2; Medtronic e Samsung per il monitoraggio e l’analisi di dati ottenuti da nuovi strumenti di monitoraggio; Novo Nordisk e Ibm per migliorare la gestione dei pazienti diabetici.

“Disporre di più dati non significa necessariamente disporre di più conoscenza.”

Anche le società scientifiche negli Stati Uniti stanno entrando in questo settore, come dimostrano gli accordi tra l’American heart association e Google Life Science, e quelli tra la stessa associazione scientifica e l’Ibm Watson Health (la divisione di Ibm che gestisce il super calcolatore Watson in grado, attraverso tecniche di intelligenza artificiale e di cognitive computing, di analizzare elevati volumi di dati, di comprendere domande complesse poste in linguaggio naturale e di proporre risposte basate sulle evidenze scientifiche), al fine di individuare nuovi approcci sulle cause, sui trattamenti e sulla prevenzione delle malattie cardiovascolari. E c’è già chi, come il Memorial Sloan Kettering cancer center di New York, ha integrato queste soluzioni all’interno del percorso assistenziale dove Ibm Watson collabora con i gli oncologi di questa struttura per diagnosticare un tumore e identificare la cura migliore.

Dal punto di vista della ricerca clinica, l’impiego dei big data potrebbe aggiungere molto agli strumenti oggi impiegati. Per esempio, potrebbero essere utilizzati per analizzare in modo integrato i dati genomici, medico-sanitari, nutrizionali ed economico-sociale, con l’obiettivo di individuare possibili cure per diverse patologie (questo è proprio uno degli obiettivi di Human technopole elaborato dall’Istituto italiano di tecnologia). Oppure, semplicemente monitorando le conversazioni sui social media, possono essere usati per raccogliere ed elaborare dati legati alla frequenza dei sintomi di una malattia, agli effetti collaterali registrati dal paziente in seguito alla assunzione di un dato farmaco, o alla diffusione di specifiche malattie infettive. O ancora, elaborando i campi note di una cartella clinica elettronica, potrebbero aiutare a catturare in profondità dettagli che racchiudono informazioni di valore sulla salute del paziente.

Tutto ciò rappresenta un’alternativa agli strumenti oggi in uso per fare ricerca clinica? Non è detto che ciò sia vero. Concetti come la rappresentatività, la riproducibilità dei risultati, l’evidence based medicine sono piuttosto distanti dalle tecniche di big data che, sebbene lavorino su grandi mole di dati, possono contenere al loro interno delle distorsioni. Il loro impiego potrebbe invece risultare prezioso nel generare ipotesi che devono poi essere studiate e verificate attraverso gli strumenti (come le sperimentazioni cliniche controllate, gli studi osservazionali e quelli epidemiologici) della medicina basata sulle prove.

D’altra parte, disporre di più dati non significa necessariamente disporre di più conoscenza. La disponibilità di dati più complessi non dovrebbe farci dimenticare l’importanza che ha il programma di ricerca e l’interpretazione appropriata dei risultati.

Lascia un commento