2. Obiettivi
E se si trovasse un modo di
predire le crisi epilettiche
dallEEG?
E se si potesse usare anche
per scoprire i soggetti
epilettici anche se non
hanno mai avuto crisi?
Data mining ed
entropie!!!
Vedrai!!!
Certo, come no! LEEG 竪
solo un ammasso di dati
incomprensibili che ti da
informazioni solo quando 竪
troppo tardi!!!
Fantascienza!!! E poi son
tanti datisono 900000
record a seduta per paziente!
Li guarderai ad uno ad uno?
Datache? Entro cosa?
Mahson un po scettico.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
3. Lepilessia breve introduzione
Fasi epilettiche:
束Ictal損, che rappresenta lintervallo durante il quale avviene la crisi epilettica ;
束Perictal損, che rappresenta ci嘆 che precede e segue la crisi,
rispettivamente 束Preictal損 e 束postictal損;
束Interictal損, che rappresenta lintervallo fra una crisi e laltra.
Caratterizzazione tracciato EEG epilettico:
Durante le fasi di 束interictal損 e 束perictal損 il tracciato 竪 molto, almeno in
apparenza, a quello di un paziente sano;
Durante la fase di 束ictal損 il tracciato diventa molto irregolare
Tracciato dellelettrodo Fp1 di un paziente epilettico, evidenziate le crisi
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
4. La sorgente: il tracciato EEG
束Lelettroencefalogramma (EEG),竪 una misura del flusso di corrente extracellulare
che viene generato dalla somma delle attivit di un elevato numero di neuroni損
Perch辿 preferirlo ad altri esami:
Costituisce un esame semplice da seguire e poco invasivo
Fornisce diverse informazioni visibili ad occhio nudo
Largamente utilizzato nellanalisi delle dinamiche celebrali
Si ritiene che contenga delle informazioni celate utilizzabili a fini diagnostici
Problemi da affrontare:
Il segnale 竪 ricavato dalla sovrapposizione dei segnali dei vari strati
attraversati;
Presenta degli artefatti, per cui sono necessarie post-elaborazioni
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
5. Strumenti: Il data mining
束Con il termine data mining si intendono tutte quelle tecniche atte ad estrarre
informazioni nascoste da un insieme vasto di dati; tali informazioni non sono
occultate o criptate ma, semplicemente, non direttamente visibili allutente損
Tipi di mining:
Descrittivo, descrive e classifica i dati;
Predittivo, utilizza le informazioni ricavate dal mining descrittivo per cercare di
predire landamento futuro dei dati;
Perche servono?
La quantit di dati da analizzare 竪 notevole in quanto un EEG si compone dei segnali
di 21 elettrodi, una seduta dura 30 minuti e il segnale ha una freq. di 500Hz quindi
una sola seduta genera di un solo paziente genera 900000 record di almeno 21 campi
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
6. Strumenti: Il data mining
Classificazione:
Tecnica per classificare i dati in ingresso rispetto a delle classi predefinite (ovvero
raggruppamenti di oggetti con caratteristiche simili):
Utilizzabile solo quando si conoscono gi le classi del sistema, per questa ragione
viene chiamato 束supervised learning損;
Genera un modello dei dati da utilizzare per classificare i nuovi dati; tale modello
竪 spesso un albero decisionale con struttura IFELSE;
Necessita di un insieme di dati di apprendimento detto training set per generare
il modello;
Necessita di un insieme di dati detto test set per verificare il modello creato.
Algoritmo J48:
Si tratta di un decision tree;
Calcola ad ogni iterazione lattributo che maggiormente separa i dati, ne crea
quindi una diramazione; procede ricorsivamente sui rami creati;
Provvede ad eseguire il pruning dei dati.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
7. Strumenti: Il data mining
Clustering:
Tecnica per raggruppare i dati in ingresso in categorie, dette cluster, in base a
caratteristiche comuni, senza conoscere a priori le classi:
Utilizzato principalmente quando non si conoscono a priori le classi da creare;
Deve essere possibile calcolare la distanza fra due dati;
Un dato pu嘆 appartenere ad un solo cluster, a cui 竪 vicino, e deve essere distante
dagli altri;
Non deve essere rilevante lordine con cui vengono forniti i dati;
Le classi ricavate, con i relativi elementi, non hanno etichetta, bisogna
comprendere ci嘆 che lalgoritmo ha classificato.
Algoritmo Simple K-Means:
Dato il numero K di cluster inizialmente crea K cluster scegliendo a caso fra i dati
un elemento da assegnare a ciascuno che diventa temporaneamente il centro;
Per ogni dato calcola la sua distanza dal centro del cluster, lo assegna al pi湛
vicino e ne ricalcola il centro facendo una media fra i dati del cluster.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
8. Strumenti: Le entropie
Le entropie sono funzioni utilizzate per misurare il grado di disordine si un sistema; ne
esistono varie formulazioni fra cui la pi湛 nota 竪 Shannon; sono state provate an Tsallis,
Renyi, Permutation Entropy (al variare degli indici P e M).
Perche servono?
Dalle analisi effettuate in campo medico si 竪 visto che prima della crisi il cervello che
solitamente 竪 un sistema altamente caotico diventa pi湛 束ordinato損; come
meccanismo di sicurezza, per ripristinare il 束caos損 originale viene generata la crisi e
quindi uno strumento che calcola il livello di disordine 竪 sicuramente utile
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
9. Strumenti: WEKA
Tool opensource, liberamente utilizzabile, scritto in java, le classi e i metodi sono
realizzati in modo tale da essere facilmente integrati nel codice di altri software
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
10. EEG-entropie-mining
Lavoro svolto:
Caricamento dei dati da file su database;
Utilizzando WEKA: Classificazione fra crisi e stato normale (test mining);
Utilizzando pl/sql e i dati forniti: Estrazione dei 束precrisi損 dei vari pazienti;
Utilizzando pl/sql e i dati forniti: Estrazione degli intervalli fra le 束crisi損 dei vari
pazienti;
Utilizzando WEKA: Clustering dei vari 束precrisi損;
Utilizzando WEKA: Clustering dei vari intervalli fra le 束crisi損;
Utilizzando WEKA: Confronto sani / epilettici con Clustering a tre classi;
Software;
Test su altri EEG: Alzheimer.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
11. EEG-entropie-mining
Clustering segnale 束precrisi損 di tutti i campioni prima crisi
Estrazione del 束precrisi損 della prima crisi, preictal, e analisi con Clustering a due
classi su tutti i pazienti epilettici:
I valori calcolati sul campione N. 14 rispetto
alle entropie, in ordine:
P1M3,
P1M4,
P2M3,
P2M4
In rosso il segnale, in verde lesordio crisi, in blu il
segnale classificato in una categoria differente
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
12. EEG-entropie-mining
Clustering segnale 束precrisi損 di tutti i campioni crisi successive
Estrazione del 束precrisi損 delle crisi successive alla prima, interictal, e analisi con
Clustering a due classi su tutti i pazienti epilettici:
I valori calcolati sul campione N. 5 rispetto
alle entropie, in ordine:
P1M3,
P1M4,
P2M3,
P2M4
In rosso il segnale, in verde lesordio crisi, in blu il
segnale classificato in una categoria differente
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
13. Software
Motivazioni:
Fornire un punto di accesso alle tecniche di mining anche a personale non informatico;
Creare una rete di utenti in grado di condividere le analisi effettuate e di effettuarne
altre approfondendo e verificando i risultati ottenuti;
Estendere le ricerche anche ad altri ambiti (es. Alzheimer).
Caratteristiche:
Web Application con profilazione utente;
Procedure guidate (wizard) per agevolare linserimento dei dati, la commissione di
nuove analisi da effettuare, la creazione di grafici;
Scheduling delle attivit con avviso per e-mail del completamento per non
sovraccaricare il server (alcune elaborazioni richiedono ore);
Generazione grafici png e jpeg;
Integrazione delle tecniche di mining di WEKA.
Tecnologia:
Java + Framework Hibernate + jQuery + jFreeChart + WEKA lib;
Oracle + Tomcat.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
15. Conclusioni
Conclusioni sui dati elaborati:
Le potenzialit di questa combinazione Mining-Entropie sono evidenti;
Spesso 竪 stato possibile trovare un segnale prima della crisi interpretabile come
precrisi;
Tutti i pazienti vanno analizzati singolarmente per trovare lentropia e le
caratteristiche del segnale precrisi;
In tutti i casi 竪 stato possibile separare pazienti epilettici (senza crisi) da sani.
Possibili applicazioni:
Se i dati ricavati fossero confermati da un test set maggiore sarebbe possibile
diagnosticare la patologia epilettica anche in pazienti apparentemente sani;
Se i dati ricavati fossero confermati sarebbe possibile mettere a punto dei sistemi
in grado di rilevare la crisi prima che si verifichi ed intervenire per evitarla;
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining