際際滷

際際滷Share a Scribd company logo
Caratterizzazione Entropica di tracciati EEG
epilettici mediante tecniche di data mining
Ing. Claudio Camuto

1
Obiettivi
E se si trovasse un modo di
predire le crisi epilettiche
dallEEG?

E se si potesse usare anche
per scoprire i soggetti
epilettici anche se non
hanno mai avuto crisi?

Data mining ed
entropie!!!

Vedrai!!!

Certo, come no! LEEG 竪
solo un ammasso di dati
incomprensibili che ti da
informazioni solo quando 竪
troppo tardi!!!

Fantascienza!!! E poi son
tanti datisono 900000
record a seduta per paziente!
Li guarderai ad uno ad uno?

Datache? Entro cosa?
Mahson un po scettico.

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Lepilessia breve introduzione
Fasi epilettiche:
 束Ictal損, che rappresenta lintervallo durante il quale avviene la crisi epilettica ;
 束Perictal損, che rappresenta ci嘆 che precede e segue la crisi,
rispettivamente 束Preictal損 e 束postictal損;

 束Interictal損, che rappresenta lintervallo fra una crisi e laltra.

Caratterizzazione tracciato EEG epilettico:
 Durante le fasi di 束interictal損 e 束perictal損 il tracciato 竪 molto, almeno in
apparenza, a quello di un paziente sano;
 Durante la fase di 束ictal損 il tracciato diventa molto irregolare

Tracciato dellelettrodo Fp1 di un paziente epilettico, evidenziate le crisi

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
La sorgente: il tracciato EEG
束Lelettroencefalogramma (EEG),竪 una misura del flusso di corrente extracellulare
che viene generato dalla somma delle attivit di un elevato numero di neuroni損
Perch辿 preferirlo ad altri esami:
 Costituisce un esame semplice da seguire e poco invasivo
 Fornisce diverse informazioni visibili ad occhio nudo
 Largamente utilizzato nellanalisi delle dinamiche celebrali

 Si ritiene che contenga delle informazioni celate utilizzabili a fini diagnostici

Problemi da affrontare:
Il segnale 竪 ricavato dalla sovrapposizione dei segnali dei vari strati
attraversati;
Presenta degli artefatti, per cui sono necessarie post-elaborazioni
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Strumenti: Il data mining
束Con il termine data mining si intendono tutte quelle tecniche atte ad estrarre
informazioni nascoste da un insieme vasto di dati; tali informazioni non sono
occultate o criptate ma, semplicemente, non direttamente visibili allutente損
Tipi di mining:
 Descrittivo, descrive e classifica i dati;
 Predittivo, utilizza le informazioni ricavate dal mining descrittivo per cercare di
predire landamento futuro dei dati;

Perche servono?
La quantit di dati da analizzare 竪 notevole in quanto un EEG si compone dei segnali
di 21 elettrodi, una seduta dura 30 minuti e il segnale ha una freq. di 500Hz quindi
una sola seduta genera di un solo paziente genera 900000 record di almeno 21 campi

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Strumenti: Il data mining
Classificazione:
Tecnica per classificare i dati in ingresso rispetto a delle classi predefinite (ovvero
raggruppamenti di oggetti con caratteristiche simili):
 Utilizzabile solo quando si conoscono gi le classi del sistema, per questa ragione
viene chiamato 束supervised learning損;
 Genera un modello dei dati da utilizzare per classificare i nuovi dati; tale modello
竪 spesso un albero decisionale con struttura IFELSE;
 Necessita di un insieme di dati di apprendimento detto training set per generare
il modello;

 Necessita di un insieme di dati detto test set per verificare il modello creato.

Algoritmo J48:
 Si tratta di un decision tree;
 Calcola ad ogni iterazione lattributo che maggiormente separa i dati, ne crea
quindi una diramazione; procede ricorsivamente sui rami creati;
 Provvede ad eseguire il pruning dei dati.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Strumenti: Il data mining
Clustering:
Tecnica per raggruppare i dati in ingresso in categorie, dette cluster, in base a
caratteristiche comuni, senza conoscere a priori le classi:
 Utilizzato principalmente quando non si conoscono a priori le classi da creare;
 Deve essere possibile calcolare la distanza fra due dati;
 Un dato pu嘆 appartenere ad un solo cluster, a cui 竪 vicino, e deve essere distante
dagli altri;

 Non deve essere rilevante lordine con cui vengono forniti i dati;
 Le classi ricavate, con i relativi elementi, non hanno etichetta, bisogna
comprendere ci嘆 che lalgoritmo ha classificato.

Algoritmo Simple K-Means:
 Dato il numero K di cluster inizialmente crea K cluster scegliendo a caso fra i dati
un elemento da assegnare a ciascuno che diventa temporaneamente il centro;
 Per ogni dato calcola la sua distanza dal centro del cluster, lo assegna al pi湛
vicino e ne ricalcola il centro facendo una media fra i dati del cluster.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Strumenti: Le entropie
Le entropie sono funzioni utilizzate per misurare il grado di disordine si un sistema; ne
esistono varie formulazioni fra cui la pi湛 nota 竪 Shannon; sono state provate an Tsallis,
Renyi, Permutation Entropy (al variare degli indici P e M).

Perche servono?
Dalle analisi effettuate in campo medico si 竪 visto che prima della crisi il cervello che
solitamente 竪 un sistema altamente caotico diventa pi湛 束ordinato損; come
meccanismo di sicurezza, per ripristinare il 束caos損 originale viene generata la crisi e
quindi uno strumento che calcola il livello di disordine 竪 sicuramente utile

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Strumenti: WEKA
Tool opensource, liberamente utilizzabile, scritto in java, le classi e i metodi sono
realizzati in modo tale da essere facilmente integrati nel codice di altri software

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
EEG-entropie-mining
Lavoro svolto:
 Caricamento dei dati da file su database;
 Utilizzando WEKA: Classificazione fra crisi e stato normale (test mining);
 Utilizzando pl/sql e i dati forniti: Estrazione dei 束precrisi損 dei vari pazienti;
 Utilizzando pl/sql e i dati forniti: Estrazione degli intervalli fra le 束crisi損 dei vari
pazienti;
 Utilizzando WEKA: Clustering dei vari 束precrisi損;

 Utilizzando WEKA: Clustering dei vari intervalli fra le 束crisi損;
 Utilizzando WEKA: Confronto sani / epilettici con Clustering a tre classi;
 Software;
 Test su altri EEG: Alzheimer.

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
EEG-entropie-mining
Clustering segnale 束precrisi損 di tutti i campioni  prima crisi

Estrazione del 束precrisi損 della prima crisi, preictal, e analisi con Clustering a due
classi su tutti i pazienti epilettici:

I valori calcolati sul campione N. 14 rispetto
alle entropie, in ordine:
P1M3,

P1M4,
P2M3,
P2M4
In rosso il segnale, in verde lesordio crisi, in blu il
segnale classificato in una categoria differente

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
EEG-entropie-mining
Clustering segnale 束precrisi損 di tutti i campioni  crisi successive

Estrazione del 束precrisi損 delle crisi successive alla prima, interictal, e analisi con
Clustering a due classi su tutti i pazienti epilettici:

I valori calcolati sul campione N. 5 rispetto
alle entropie, in ordine:
P1M3,

P1M4,
P2M3,
P2M4
In rosso il segnale, in verde lesordio crisi, in blu il
segnale classificato in una categoria differente

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Software
Motivazioni:
 Fornire un punto di accesso alle tecniche di mining anche a personale non informatico;
 Creare una rete di utenti in grado di condividere le analisi effettuate e di effettuarne
altre approfondendo e verificando i risultati ottenuti;

 Estendere le ricerche anche ad altri ambiti (es. Alzheimer).

Caratteristiche:
 Web Application con profilazione utente;
 Procedure guidate (wizard) per agevolare linserimento dei dati, la commissione di
nuove analisi da effettuare, la creazione di grafici;
 Scheduling delle attivit con avviso per e-mail del completamento per non
sovraccaricare il server (alcune elaborazioni richiedono ore);
 Generazione grafici png e jpeg;
 Integrazione delle tecniche di mining di WEKA.

Tecnologia:

 Java + Framework Hibernate + jQuery + jFreeChart + WEKA lib;

 Oracle + Tomcat.
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Software

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Conclusioni
Conclusioni sui dati elaborati:
 Le potenzialit di questa combinazione Mining-Entropie sono evidenti;
 Spesso 竪 stato possibile trovare un segnale prima della crisi interpretabile come
precrisi;
 Tutti i pazienti vanno analizzati singolarmente per trovare lentropia e le
caratteristiche del segnale precrisi;
 In tutti i casi 竪 stato possibile separare pazienti epilettici (senza crisi) da sani.

Possibili applicazioni:
 Se i dati ricavati fossero confermati da un test set maggiore sarebbe possibile
diagnosticare la patologia epilettica anche in pazienti apparentemente sani;
 Se i dati ricavati fossero confermati sarebbe possibile mettere a punto dei sistemi
in grado di rilevare la crisi prima che si verifichi ed intervenire per evitarla;
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Grazie per la vostra
cortese attenzione

More Related Content

EEG - Datamining pres. 08-10-2013

  • 1. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining Ing. Claudio Camuto 1
  • 2. Obiettivi E se si trovasse un modo di predire le crisi epilettiche dallEEG? E se si potesse usare anche per scoprire i soggetti epilettici anche se non hanno mai avuto crisi? Data mining ed entropie!!! Vedrai!!! Certo, come no! LEEG 竪 solo un ammasso di dati incomprensibili che ti da informazioni solo quando 竪 troppo tardi!!! Fantascienza!!! E poi son tanti datisono 900000 record a seduta per paziente! Li guarderai ad uno ad uno? Datache? Entro cosa? Mahson un po scettico. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 3. Lepilessia breve introduzione Fasi epilettiche: 束Ictal損, che rappresenta lintervallo durante il quale avviene la crisi epilettica ; 束Perictal損, che rappresenta ci嘆 che precede e segue la crisi, rispettivamente 束Preictal損 e 束postictal損; 束Interictal損, che rappresenta lintervallo fra una crisi e laltra. Caratterizzazione tracciato EEG epilettico: Durante le fasi di 束interictal損 e 束perictal損 il tracciato 竪 molto, almeno in apparenza, a quello di un paziente sano; Durante la fase di 束ictal損 il tracciato diventa molto irregolare Tracciato dellelettrodo Fp1 di un paziente epilettico, evidenziate le crisi Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 4. La sorgente: il tracciato EEG 束Lelettroencefalogramma (EEG),竪 una misura del flusso di corrente extracellulare che viene generato dalla somma delle attivit di un elevato numero di neuroni損 Perch辿 preferirlo ad altri esami: Costituisce un esame semplice da seguire e poco invasivo Fornisce diverse informazioni visibili ad occhio nudo Largamente utilizzato nellanalisi delle dinamiche celebrali Si ritiene che contenga delle informazioni celate utilizzabili a fini diagnostici Problemi da affrontare: Il segnale 竪 ricavato dalla sovrapposizione dei segnali dei vari strati attraversati; Presenta degli artefatti, per cui sono necessarie post-elaborazioni Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 5. Strumenti: Il data mining 束Con il termine data mining si intendono tutte quelle tecniche atte ad estrarre informazioni nascoste da un insieme vasto di dati; tali informazioni non sono occultate o criptate ma, semplicemente, non direttamente visibili allutente損 Tipi di mining: Descrittivo, descrive e classifica i dati; Predittivo, utilizza le informazioni ricavate dal mining descrittivo per cercare di predire landamento futuro dei dati; Perche servono? La quantit di dati da analizzare 竪 notevole in quanto un EEG si compone dei segnali di 21 elettrodi, una seduta dura 30 minuti e il segnale ha una freq. di 500Hz quindi una sola seduta genera di un solo paziente genera 900000 record di almeno 21 campi Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 6. Strumenti: Il data mining Classificazione: Tecnica per classificare i dati in ingresso rispetto a delle classi predefinite (ovvero raggruppamenti di oggetti con caratteristiche simili): Utilizzabile solo quando si conoscono gi le classi del sistema, per questa ragione viene chiamato 束supervised learning損; Genera un modello dei dati da utilizzare per classificare i nuovi dati; tale modello 竪 spesso un albero decisionale con struttura IFELSE; Necessita di un insieme di dati di apprendimento detto training set per generare il modello; Necessita di un insieme di dati detto test set per verificare il modello creato. Algoritmo J48: Si tratta di un decision tree; Calcola ad ogni iterazione lattributo che maggiormente separa i dati, ne crea quindi una diramazione; procede ricorsivamente sui rami creati; Provvede ad eseguire il pruning dei dati. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 7. Strumenti: Il data mining Clustering: Tecnica per raggruppare i dati in ingresso in categorie, dette cluster, in base a caratteristiche comuni, senza conoscere a priori le classi: Utilizzato principalmente quando non si conoscono a priori le classi da creare; Deve essere possibile calcolare la distanza fra due dati; Un dato pu嘆 appartenere ad un solo cluster, a cui 竪 vicino, e deve essere distante dagli altri; Non deve essere rilevante lordine con cui vengono forniti i dati; Le classi ricavate, con i relativi elementi, non hanno etichetta, bisogna comprendere ci嘆 che lalgoritmo ha classificato. Algoritmo Simple K-Means: Dato il numero K di cluster inizialmente crea K cluster scegliendo a caso fra i dati un elemento da assegnare a ciascuno che diventa temporaneamente il centro; Per ogni dato calcola la sua distanza dal centro del cluster, lo assegna al pi湛 vicino e ne ricalcola il centro facendo una media fra i dati del cluster. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 8. Strumenti: Le entropie Le entropie sono funzioni utilizzate per misurare il grado di disordine si un sistema; ne esistono varie formulazioni fra cui la pi湛 nota 竪 Shannon; sono state provate an Tsallis, Renyi, Permutation Entropy (al variare degli indici P e M). Perche servono? Dalle analisi effettuate in campo medico si 竪 visto che prima della crisi il cervello che solitamente 竪 un sistema altamente caotico diventa pi湛 束ordinato損; come meccanismo di sicurezza, per ripristinare il 束caos損 originale viene generata la crisi e quindi uno strumento che calcola il livello di disordine 竪 sicuramente utile Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 9. Strumenti: WEKA Tool opensource, liberamente utilizzabile, scritto in java, le classi e i metodi sono realizzati in modo tale da essere facilmente integrati nel codice di altri software Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 10. EEG-entropie-mining Lavoro svolto: Caricamento dei dati da file su database; Utilizzando WEKA: Classificazione fra crisi e stato normale (test mining); Utilizzando pl/sql e i dati forniti: Estrazione dei 束precrisi損 dei vari pazienti; Utilizzando pl/sql e i dati forniti: Estrazione degli intervalli fra le 束crisi損 dei vari pazienti; Utilizzando WEKA: Clustering dei vari 束precrisi損; Utilizzando WEKA: Clustering dei vari intervalli fra le 束crisi損; Utilizzando WEKA: Confronto sani / epilettici con Clustering a tre classi; Software; Test su altri EEG: Alzheimer. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 11. EEG-entropie-mining Clustering segnale 束precrisi損 di tutti i campioni prima crisi Estrazione del 束precrisi損 della prima crisi, preictal, e analisi con Clustering a due classi su tutti i pazienti epilettici: I valori calcolati sul campione N. 14 rispetto alle entropie, in ordine: P1M3, P1M4, P2M3, P2M4 In rosso il segnale, in verde lesordio crisi, in blu il segnale classificato in una categoria differente Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 12. EEG-entropie-mining Clustering segnale 束precrisi損 di tutti i campioni crisi successive Estrazione del 束precrisi損 delle crisi successive alla prima, interictal, e analisi con Clustering a due classi su tutti i pazienti epilettici: I valori calcolati sul campione N. 5 rispetto alle entropie, in ordine: P1M3, P1M4, P2M3, P2M4 In rosso il segnale, in verde lesordio crisi, in blu il segnale classificato in una categoria differente Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 13. Software Motivazioni: Fornire un punto di accesso alle tecniche di mining anche a personale non informatico; Creare una rete di utenti in grado di condividere le analisi effettuate e di effettuarne altre approfondendo e verificando i risultati ottenuti; Estendere le ricerche anche ad altri ambiti (es. Alzheimer). Caratteristiche: Web Application con profilazione utente; Procedure guidate (wizard) per agevolare linserimento dei dati, la commissione di nuove analisi da effettuare, la creazione di grafici; Scheduling delle attivit con avviso per e-mail del completamento per non sovraccaricare il server (alcune elaborazioni richiedono ore); Generazione grafici png e jpeg; Integrazione delle tecniche di mining di WEKA. Tecnologia: Java + Framework Hibernate + jQuery + jFreeChart + WEKA lib; Oracle + Tomcat. Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 14. Software Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 15. Conclusioni Conclusioni sui dati elaborati: Le potenzialit di questa combinazione Mining-Entropie sono evidenti; Spesso 竪 stato possibile trovare un segnale prima della crisi interpretabile come precrisi; Tutti i pazienti vanno analizzati singolarmente per trovare lentropia e le caratteristiche del segnale precrisi; In tutti i casi 竪 stato possibile separare pazienti epilettici (senza crisi) da sani. Possibili applicazioni: Se i dati ricavati fossero confermati da un test set maggiore sarebbe possibile diagnosticare la patologia epilettica anche in pazienti apparentemente sani; Se i dati ricavati fossero confermati sarebbe possibile mettere a punto dei sistemi in grado di rilevare la crisi prima che si verifichi ed intervenire per evitarla; Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
  • 16. Grazie per la vostra cortese attenzione