• Background Image

    Algoritmi e dati biomedici

11 novembre 2016

Algoritmi e dati biomedici

Collegare i big data biomedici alla persona malataIntervista a Griffin M. Weber – [Leggi la versione in inglese]
Predire il futuroIntervista a Ziad Obermeyer – [Leggi la versione in inglese]

Collegare i big data biomedici alla persona malata

Ragionare sulle potenzialità dei dati significa guardare oltre il sistema sanitario e definire policy condivise

Intervista a Griffin M. Weber, Department of Biomedical informatics, Harvard Medical School, Boston, MA, Department of Medicine, Beth Israel deaconess Medical Center, Boston, MA

Nell’articolo “Finding the missing link for biomedical data” [1], da lei preparato insieme a Kenneth D. Mandl e Isaac S. Kohane, scriveva che “i big data diventano un elemento di cambiamento quando diversi dataset possono essere collegati a livello della singola persona”. Qual è la situazione negli Stati Uniti, a questo riguardo?

Negli Stati Uniti la sanità è molto frammentata e vede i pazienti trattati in molti ospedali e ambulatori diversi, con un passaggio frequente da un’assicurazione a un’altra. A causa delle preoccupazioni per la riservatezza, i dati sono deliberatamente mantenuti isolati in ciascuno di questi grandi contenitori e c’è una forte resistenza a creare un codice di identificazione personale che possa avere valore nazionale. Tutto ciò rende molto difficile integrare tutte le informazioni che riguardano una singola persona.

Quali opportunità offrono i big data alla ricerca sanitaria?

L’espressione “big data” può avere diversi significati nell’ambito della ricerca sanitaria. Nuove tecnologie informatiche, come gli strumenti di interrogazione e ricerca all’interno di diversi centri ospedalieri, stanno garantendo ai ricercatori l’accesso alle tradizionali informazioni sanitarie – come quelle contenute nelle cartelle cliniche elettroniche o nelle richieste amministrative di risarcimento – di decine di milioni di pazienti. In questo caso, laddove i big data si riferiscono alla numerosità dei malati, i ricercatori possono disporre di campioni sufficientemente vasti per notare piccole variazioni nella morbilità tra sottopopolazioni diverse per caratteristiche demografiche o geografiche, identificando effetti di geni o monitorando gli effetti indesiderati anche rari di alcuni medicinali.

Ragionare sui big data biomedici può anche significare guardare oltre il sistema sanitario, individuando altre fonti di dati che possano essere collegate alla salute dei cittadini. Per esempio, i modelli di acquisto nei negozi di alimentari possono implementare e migliorare dei pattern predittivi sulla prevalenza di obesità e diabete di tipo 2; i dispositivi wearable che tracciano l’esercizio fisico possono fornire indicazioni sull’azione dei farmaci per la riduzione dei livelli di colesterolo; la distanza tra l’abitazione del paziente dall’ospedale o dalla farmacia può influenzare l’utilizzo dei presidi di assistenza sanitaria e anche il costo; e gli amici su Facebook dei pazienti possono influenzare le scelte sugli stili di vita e l’aderenza alle terapie.

Nell’articolo pubblicato sul Jama, avete presentato un framework in cui convergono molte forme diverse di informazione sanitaria, comprese quelle che possono fornire dati provenienti da flussi esterni al sistema sanitario stesso, quali per esempio i social media…

Sì, e la prima sfida che ci si trova ad affrontare usando bene i big data biomedici è quella di identificare le potenziali fonti di informazioni riguardanti la salute e come determinare il valore che può essere ottenuto collegando le une con le altre. Per esempio, le cartelle cliniche elettroniche possono scendere più in profondità comprendendo appunti, note cliniche e immagini diagnostiche raccolte nel corso del percorso di cura del singolo paziente, mentre i dati amministrativi possono svilupparsi longitudinalmente con la sintesi delle codifiche di fatturazione lungo un ampio periodo della storia sanitaria di un malato. Social media, documentazione di acquisto con le carte di credito, record anagrafici e molti altri tipi di dati, nonostante siano caratterizzati da una qualità variabile, possono contribuire a determinare una visione olistica del paziente e, in particolare, a chiarire i fattori sociali e ambientali in grado di influenzare la salute. Comunque, non è necessario collegare tutti questi tipi diversi di dati. La chiave è nel selezionare quelli che possono rivelarsi più utili per rispondere al quesito di ricerca.

“La prima sfida che ci si trova ad affrontare usando bene i big data biomedici è identificare le potenziali fonti di informazioni riguardanti la salute e come determinare il valore che può essere ottenuto collegando le une con le altre.”

Bibliografia

[1] Weber GM, Mandl KD, Kohane IS. Finding the missing link for big biomedical data. Jama 2014;311:2479-80.

[Leggi la versione in inglese] – novembre 2016


Predire il futuro

Gli algoritmi aiuteranno il medico. Cambieranno il suo modo di lavorare. Soprattutto, i big data potranno rivelarsi una buona notizia per i malati

Intervista a Ziad Obermeyer, Assistant Professor of Emergency medicine, e Assistant Professor of Health care policy Harvard Medical School

“Sono gli algoritmi e non i dataset che dimostreranno di essere un agente di cambiamento”. Questa è la frase a effetto che apre l’articolo “Predicting the future: big data, machine learning, and clinical medicine, di Ziad Obermeyer e Ezekiel J. Emanuel, uscito sul New England of Medicine [1] a fine settembre 2016. La ragione della convinzione dei due autori è collegata all’importanza che avrà in futuro l’intelligenza computazionale (machine learning). Ne abbiamo parlato con uno dei due autori, Ziad Obermeyer, che studia da tempo gli algoritmi a supporto delle decisioni cliniche.

… Stiamo iniziando a intravedere un uso nuovo dei computer in medicina. Oggi, usiamo i computer per applicare delle regole: ci avvertono se proviamo a prescrivere la ciprofloxacina insieme al coumadin. Sono regole che già conosciamo e che talvolta semplicemente dimentichiamo, perché è notte fonda o perché è troppo presto al mattino oppure perché non sappiamo che quel paziente assume il coumadin.

In un futuro neanche troppo distante, degli algoritmi ci diranno del nostro paziente cose che non sappiamo: ci comunicheranno la probabilità che il malato possa morire avviando un determinato regime chemioterapico o ci avvertiranno del rischio di infarto miocardico di un altro paziente nei sette giorni successivi al momento della nostra interrogazione, sulla base della sua storia clinica. Sarà entusiasmante, non solo per la pratica clinica, ma anche come guida per nuovi modi di comprendere la salute e la malattia utilizzando dati molto complessi.

Perché ritenete che lasciar parlare i dati da soli possa essere problematico? Come possiamo affrontare un problema del genere?

Quando sviluppiamo un algoritmo, temiamo molto il fenomeno del cosiddetto overfitting (che si verifica quando il modello stesso ha troppi parametri relativi al numero di osservazioni, condizione che porta a sovrastimarne l’utilità, ndr). Possiamo predire molto bene un determinato esito sulla base di un dataset ma a causa di alcune bizzarrie nei dati possiamo scoprire che le conclusioni alle quali siamo arrivati non funzionano una volta che sono applicate al mondo reale. In molte delle gare per scienziati che vengono organizzate – ma non relative alla medicina – questo problema viene gestito rilasciando un set di dati a chi è in gara per lo sviluppo degli algoritmi e una volta che gli algoritmi finali sono uploadati vengono testati per la valutazione su un dataset completamente separato. Questo principio di separare i dati utili allo sviluppo del modello da quelli per la valutazione di quest’ultimo è estremamente importante, come sa già chi lavora alla produzione di algoritmi non basati sull’analisi computazionale.

La qualità dei dati è collegata alla loro quantità?

Ehm, probabilmente è inversamente proporzionale…

“Gli algoritmi sono semplicemente tanto affidabili quanto lo sono i dati su cui sono basati.” [2]

La correlazione non implica la causalità: è un bel problema in epidemiologia clinica. Dovremmo aspettarci una soluzione dal machine learning?

Ne dubito. Ci sono alcuni ricercatori che stanno svolgendo un lavoro molto interessante in questo ambito, utilizzando l’analisi computazionale per costruire dei metodi migliori di aggiustamento del rischio, propensity score e variabili strumentali, ma alla fine questi algoritmi trovano delle correlazioni, e questa è la loro forza. È improbabile che possano risolvere anche qualcuno dei problemi fondamentali della inferenza causale nei dataset sperimentali.

Quali sono le aree della medicina che lei e Ezekiel J. Emanuel ritenete possano essere davvero radicalmente cambiate dalla trasformazione del dato in conoscenza?

Certamente, questa trasformazione aiuterà il medico nella formulazione della prognosi: comprendere quando un paziente morirà o se un cancro metastatizzerà. Predire il futuro è qualcosa per cui questi algoritmi sono estremamente adatti.

Migliorerà anche l’accuratezza diagnostica: saranno suggeriti esami ad alto valore aggiunto e potrà ridursi la richiesta di test inutili. Questo però è più complicato, e dovremmo attendercelo in un futuro meno prossimo, perché persino il medico spesso non ha chiaro quale sia il “gold standard” da indicare alla macchina per farle apprendere come formulare la diagnosi corretta! E’ un aspetto che rende più difficile l’addestramento degli algoritmi.

Un punto collegato è che gli algoritmi sottrarranno molto lavoro ai radiologi e agli anatomopatologi, che lavorano su dati digitali… che potrebbero essere invece inviati a una macchina. E infine interpreteranno un flusso di dati dalla anestesiologia e dalla terapia intensiva.

Così, in 20 anni, i radiologi non esisteranno da nessuna parte del mondo nella forma attuale: dovranno adattarsi al cambiamento, un po’ come i lavoratori delle costruzioni che fanno oggi un lavoro del tutto differente da quello che compivano prima della meccanizzazione avvenuta cento anni fa. I cassieri in banca non maneggiano più contante ma devono essere capaci di eseguire transazioni molto più complesse di una volta. La tecnologia non sempre elimina il lavoro; talvolta lo cambia e coloro che devono adattarsi possono finire col diventare i veri vincitori.

Bibliografia

[1] Obermeyer Z, Emanuel EJ. Predicting the Future – Big Data, Machine Learning, and Clinical Medicine. N Engl J Med 2016;375:1216-9.
[2] Parikh RB, Obermeyer Z, Bates DW. Making Predictive Analytics a Routine Part of Patient Care. Harvard Business Review 2016; 21 aprile – Ultimo accesso 14 ottobre 2016.

[Leggi la versione in inglese] – novembre 2016

0 Comments

Leave A Comment

Lascia un commento

Iscriviti alla newsletter di Forward

Quando invii il modulo, controlla la tua inbox per confermare l'iscrizione

Pin It on Pinterest

Share This