
Vediamo come funzionano le tecnologie oggi maggiormente utilizzate in ambito sanitario, iniziando dal Machine Learning.
Nello scorso articolo (che trovate qui) ci eravamo chiesti quanto sia intelligente l’AI, se sia affidabile e obiettiva, ossia quanto possa essere davvero utile nei diversi ambiti d’uso che avevo menzionato. Per provare a dare qualche risposta a queste domande è necessario esaminare come funzionano le tecnologie oggi maggiormente utilizzate in ambito sanitario. Iniziamo dall’apprendimento automatico, traduzione in italiano dell’espressione Machine Learning.
Come avevo promesso, cercherò di spiegare queste tecnologie in modo semplice anche se, per raggiungere questo risultato, dovrà necessariamente semplificare alcuni concetti che sono più complessi. Non me ne vogliano gli esperti e mi scuso, sin da ora, se scriverò qualche imprecisione. I commenti, come sempre, sono i benvenuti, così la disponibilità a ospitare contributi di altri autori.
L’apprendimento automatico è una forma di Intelligenza Artificiale (IA) che permette ai sistemi informativi di imparare a svolgere compiti senza essere esplicitamente programmati a farlo. A differenza della programmazione tradizionale, in cui gli sviluppatori scrivono algoritmi per istruire i computer sui passi necessari per svolgere funzioni semplici, nel caso dell’apprendimento automatico si usano raccolte di dati campione per costruire modelli che operano previsioni o scelte basate sui dati che si vogliono analizzare. Esistono molti tipologie di apprendimento automatico tra cui l’approfondimento profondo o Deep Learning in cui i sistemi di IA imitano la struttura e il comportamento del cervello biologico mediante reti neurali artificiali.
Per realizzare un modello con l’apprendimento automatico servono dunque dei dati che devono essere esatti, pertinenti e rappresentativi della casistica che si vuole gestire. Maggiore è la quantità di dati per addestrare il modello, migliori potranno essere la sua efficacia e la sua accuratezza. Come in un campione statistico è importante che le casistiche siano ben distribuite e pesate, onde evitare di creare modelli che possano soffrire di “pregiudizi” o essere “condizionati” da aspetti come ad esempio l’età, il sesso, la razza e così via.
La disponibilità e la qualità dei dati sono l’aspetto più critico per questa forma di IA. Non è semplice disporre, anche per ragioni di privacy, di grandi quantità di dati per addestrare i modelli. In alcuni casi è possibile acquistare dei dataset per addestrare i modelli, ad esempio librerie di immagini radiologiche, ma non è sempre facile valutare la qualità di questi dati.
Esistono varie modalità di apprendimento automatico: supervisionato, non supervisionato e rinforzato.

Nel primo la macchina (Machine) impara (Learning) ad associare determinate caratteristiche a etichette, elaborando i dati contenuti nel dataset di addestramento che sono stati già etichettati da operatori umani. Nel nostro caso, ad esempio, un set di dati clinici in cui, ad ogni insieme di caratteristiche del paziente, segni e sintomi, parametri vitali, risultati di laboratorio, diagnosi pregresse, è associata la diagnosi eseguita da un medico. Mediante l’addestramento il sistema impara ad associare queste informazioni a una diagnosi, così da suggerire la diagnosi più probabile quanto sottoponiamo un caso con le informazioni previste. Questi algoritmi sono chiamati “classificatori” e vengono utilizzati, ad esempio, per formulare una diagnosi o indicare un rischio.
Più formalmente possiamo dire che questi metodi operano nel trovare una funzione che, a fronte di un set di dati X, forniscono una variabile di risposta y, ossia f(X) = Y. Se la risposta è categorica parliamo di “classificazione”, se invece è variabile parliamo di “regressione”. Quest’ultima si adopera per realizzare modelli predittivi che, in base ai dati di ingresso sono in grado di prevedere ad esempio la prognosi di un paziente e il numero di giorni di ricovero.
Nell’apprendimento non supervisionato si adoperano invece dati non etichettati. Attraverso l’addestramento si insegna al modello a dividere il dataset in gruppi o cluster sulla base di caratteristiche condivise. Questi modelli si utilizzano in sanità per profilare i pazienti secondo diversi criteri, ad esempio per patologia, intensità assistenziale, rischio clinico e così via. In genere è più facile reperire dataset non etichettati su cui, con affinamenti successivi, trovare il modello di clustering più idoneo alle proprie esigenze.
Esiste poi una terza modalità di apprendimento automatico definito rinforzato. In questo caso si addestra la macchina a svolgere un compito procedendo per tentativi ed errori. Ogni volta che la macchina commette un errore riceve una “punizione“, mentre quando lo svolge correttamente una “ricompensa“. Per approssimazioni successive il sistema impara a svolgere la sua funzione nel miglior modo possibile. È una modalità impiegata di norma in contesti dove si interagisce con l’ambiente circostante, ad esempio la robotica.
Per risolvere problemi complessi si utilizzano le reti neurali artificiali, modelli di apprendimento automatico basati su algoritmi che utilizzano delle strutture che somigliano al cervello umano, ossia reti di nodi interconnessi – neuroni – che sono organizzati in livelli multipli. I nodi di ogni livello ricevono, elaborano e inviano i dati a quello successivo fino a ottenere un risultato. Utilizzando i dati di addestramento i programmatori istruiscono il modello su come imparare a fornire i risultati previsti.

I livelli interni sono definiti livelli “nascosti” perché i dati contenuti non sono visibili agli utenti che interagiscono solo con quello di ingresso e di uscita. Le reti più complesse possono includere centinaia di livelli nascosti.
L’apprendimento automatico trova molte applicazioni in sanità. Tra queste:
- Formulare una diagnosi a partire da una serie informazioni
- Stimare il rischio di un paziente per un esito specifico, aiutando il medico a impostare terapie più efficaci
- Identificare i pazienti che potrebbero rispondere meglio a una determinata terapia, indirizzando il medico verso la migliore strategia di trattamento (medicina di precisione).
- Identificare nuovi predittori di rischio, migliorando l’accuratezza diagnostica rispetto ai metodi tradizionali.
- Nell’imaging dove, grazie alla capacità degli algoritmi di riconoscere pattern al di là della percezione umana, superano talvolta le prestazioni dei radiologi.
Ma quanto sono affidabili questi algoritmi? Possono essere utilizzati nella pratica clinica? E se sì, come? Ne parleremo nel prossimo articolo.
2 – Continua