Nuovi strumenti e strategie di analisi della ricerca genetica.
Speaker
Andrea Angius (CNR)
Feb 16 2011 - Collana di seminari per la valorizzazione dei risultati della ricerca al CRS4
Abstract
Vengono illustrati gli strumenti per l’identificazione, l’isolamento e la caratterizzazione delle varianti genetiche, dei geni e pathway metabolici, focalizzando l’attenzione su quelle patologie che presentano una forte componente genetica e un’elevata incidenza nella popolazione sarda.
20160219 F. Malvestiti - DAL CARIOTIPO AL NGS: COME STA CAMBIANDO LA DIAGNOSI...Roberto Scarafia
Ìý
PRIMO INCONTRO DI GENETICA ONCOLOGICA
Ruolo del dato genetico nel percorso diagnostico delle MDS
Anomalie cromosomiche nelle MDS
Dalla citogenetica convenzionale alla citogenetica molecolare
Mutazioni somatiche delle MDS e Patogenesi molecolare
Correlazione genotipo-fenotipo
Ruolo del dato genetico nel percorso diagnostico delle MDS: raccomandazioni ELN
Frequenza delle anomalie cromosomiche
1. The document compares genetic and linguistic diversity in Europe and finds some correlations between the two.
2. Structural features of languages may provide a better basis for comparison than vocabulary. Principal component analysis of genetic and linguistic data show some similarities in clustering.
3. Recent population mixing can account for some inconsistencies between the genetic and linguistic patterns. Overall, geography, genetics, and language are interrelated but influenced by separate evolutionary processes over long time periods.
1. The document discusses three main questions regarding human evolutionary genetics: the debate between hybridization models vs. the Southern dispersal route out of Africa, the coevolution of cultural and biological diversity, and challenges to the persistence of racial paradigms given genomic data.
2. Regarding the first question, the author notes several problems with hybridization hypotheses and presents evidence supporting an earlier dispersal of modern humans out of Africa via a Southern route, avoiding contact with Neanderthals.
3. For the second question, the author reviews evidence that increases in brain size did not necessarily correlate with genes associated with cognitive functions, and that cultural and linguistic changes likely evolved in parallel with biological changes.
4.
1. Genetica di popolazioni
Guido Barbujani
Dip. Scienze della Vita e Biotecnologie, Università di Ferrara g.barbujani@unife.it
2. Obiettivi del corso:
Capire le basi genetiche dell’evoluzione
Arrivare a porsi domande
scientificamente corrette
Arrivare a poter leggere criticamente un
articolo
ESERCIZI: http://darwin.eeb.uconn.edu/simulations/simulations.html
4. Dipartimento di Scienze della Vita e Biotecnologie
g.barbujani@unife.it
Ricevimento: stanza 12, lunedì 14.30 – 16.00
8. Cose da ricordare, per cominciare
1. Cos’è un gene, un allele, un aplotipo
2. Com’è fatto il DNA
3. Com’è fatto un gene Eucariote
4. Com’è fatto un gene procariote
5. Com’è la struttura dei geni (siti codificanti, siti di
regolazione, introni, esoni)
6. Come funzionano i geni
9. Cosa vuol dire che due geni sono associati?
Se le coppie A,a e B,b sono associate che gameti produce il
genotipo AaBb e il genotipo Aa BB?
Se AaBb si incrocia con AaBb che tipi di figli può avere?
Se AaBb si incrocia con aabb che tipi di figli può avere?
Cosa si intende per locus genico?
Cosa si intende per allele?
Cosa vuol dire che due geni sono indipendenti?
Se le coppie A,a e B,b sono indipendenti che gameti
produce il genotipo AaBb? E il genotipo Aa BB?
10. Che cos’è il crossing-over?
Se c’è crossing-over tra due geni associati, gli effetti del crossing-over sono
evidenziabili nei gameti?
In che modo i geni codificano le proteine?
Cosa significa dire che i gameti sono aploidi?
Qual è la differenza tra meiosi e mitosi?
Che differenza c’è tra popolazione e specie?
Quanti alleli di un dato locus ci sono in una popolazione?
Specie diverse con lo stesso numero di cromosomi si possono
incrociare?
11. Programma del corso
1. Diversità genetica
2. Equilibrio di Hardy-Weinberg
3. Inbreeding
4. Linkage disequilibrium
5. Mutazione
6. Deriva genetica
7. Flusso genico e varianze genetiche
8. Selezione
9. Mantenimento dei polimorfismi e teoria neutrale
10. Introduzione alla teoria coalescente
11. Struttura e storia della popolazione umana
+ Lettura critica di articoli
12. Programma del corso
1. Diversità genetica
2. Equilibrio di Hardy-Weinberg
3. Inbreeding
4. Linkage disequilibrium
5. Mutazione
6. Deriva genetica
7. Flusso genico e varianze genetiche
8. Selezione
9. Mantenimento dei polimorfismi e teoria neutrale
10. Introduzione alla teoria coalescente
11. Struttura e storia della popolazione umana
+ Lettura critica di articoli
15. Prima di tutto: non c’è genetica
senza variabilitÃ
Variabilità morfologica
16. 1. Variabilità morfologica
2. Variabilità serologica
3. Variabilità proteica
4. Variabilità del DNA
4.1. Varianti di singolo nucleotide: Single-Nucleotide Polymorphisms (SNP)
4.2. Varianti di lunghezza: Inserzioni/delezioni (Indel), Variable Number of
Tandem Repeats (VNTR), Short Tandem Repeats (STR)
4.3. Varianti strutturali: Copy-Number Variation (CNV)
20. Quanto DNA in una cellula?
Nell’uomo: 6 miliardi di paia di basi nei 46 cromosomi
1 base ≈ 0,8 mμ
6 miliardi di basi ≈ 5 m di DNA in 5-20 μ
5-20 μ
21. Quanto DNA in una cellula?
6 miliardi di paia di basi
1 base ≈ 0,8 mμ
6 miliardi di basi ≈ 5 m di DNA in 5-20 μ
Foglio A4, 60 battute per riga. 30 righe = 1800 basi
su ogni foglio, due facciate ≈ 2000 basi
Se 100 fogli = 1 cm
6 miliardi di paia di basi ≈ 15000 cm = 150 m
25. Some human genome statistics
Total size 3 190 491 286 bp (male, haploid) [was 3 283 984 159 in Dec. 2011]
N of protein-coding genes 21 224 [were 20 442]
N of RNA genes 15 952
N of pseudogenes 14 427
N of gene exons 679 045
N of gene transcripts 194 015
N of short variants 52 126 039 (+ 13.4 million: Lachance et al. 2012)
N of structural variants 6 303 392
From Ensembl Release 68, July 2012
Nucleotide differences with chimp 1.5 %
Structural differences with chimp 4%
Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes)
From Wu et al. (2011) PLoS Genet
26. Some human genome statistics
Total size 3 241 953 429 bp (male, haploid) [was 3 545 835 014 in June 2015] N
of protein-coding genes 19 034 [were 20 296]
N of pseudogenes 13 151 [were 14 424]
N of non-coding genes 25 173 (7 703 small, 14 889 long + 2 307 unclassified)
N of gene transcripts 198 634
N of short variants 148 892 479 [were 52 million]
N of structural variants 4 363 564 [were 6 million]
N of proteins 79 086
Human Genome Assembly GRCh38.p10, January 2017
Nucleotide differences with chimp 1.5 %
Structural differences with chimp 4%
Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes)
From Wu et al. (2011) PLoS Genet
28. I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il
10% del genoma
Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra
parte contiene importanti siti di regolazione
30. Tipi di polimorfismo studiati nel DNA
1. Single Nucleotide Polymorphism: SNP
2. Inserzione/delezione
3. Variazione del numero di copie: Indel, STR, VNTR,
4. Variazione strutturale: CNV
31. Tipi di polimorfismo studiati nel DNA
1. SNP
2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)
2017: Almeno 148 milioni di SNPs nel genoma umano
36. Tipi di polimorfismo studiati nel DNA
1. SNP: Effetti fenotipici
Cioè in regioni: introniche codificanti regolatrici intergeniche
Con sostituzioni: nonsinonime sinonime
47. Tipi di polimorfismo studiati nel DNA
4. Variazione strutturale: CNV
An ~11kb deletion on chromosome 8 revealed by ultra-high resolution CGH.
Blue lines: individuals with two copies. Red line: individual with zero copies.
48. Tipi di polimorfismo studiati nel DNA
4. Variazione strutturale: CNV
La CGH (Comparative Genomic Hybridization) rileva variazioni del numero di copie di
geni.
Competizione per il legame su cromosomi in metafase di due DNA genomici marcati
con fluorocromi diversi. Un DNA è estratto dal paziente in esame mentre l’altro DNA è
un pool di DNA genomico di riferimento.
Si legherà in proporzione più DNA se maggiore sarà il numero di copie presenti in quel
locus rispetto al numero di copie presenti nel DNA genomico di controllo. Viceversa se
ne legherà meno se minore sarà il numero di copie presenti in quel locus rispetto al
numero di copie presenti nel DNA genomico di controllo.
51. Average mutation rates for different polymorphisms
(per locus per generation)
VNTR 10-1
– 10-2
STR 10-2
– 10-4
SNPs 10-6
– 10-8
Indel (retrovirus) 10-10
– 10-11
CNV ? ïƒ
In the mitochondrial DNA hypervariable region, up to 5 x 10-5
per site per
generation
53. Misure di diversità genetica
• N di alleli
• Eterozigosi osservata:
Ho = N genotipi eteroz./N genotipi totali
• Eterozigosi attesa:
H = 1 –Σ pi
2
(la frazione di individui che ci si aspetta siano eterozigoti a un
gene sconosciuto)
54. Quand’è che una popolazione può dirsi
variabile?
A B
N alleli = 5 N alleli = 2
HO = 0.4 HO = 0.6
H = 0.35 H = 0.5
Quando il genotipo individuale è difficile da prevedere
55. Quand’è che una popolazione può dirsi
variabile?
• Quando molti siti del DNA sono variabili
diversità nucleotidica:
Ï€ = N siti polimorfici / N totale siti
• Quando ci sono grandi differenze molecolari fra I suoi membri
mismatch medio:
k = Σ dij / [N (N-1) / 2]
56. Il mismatch è il numero di sostituzioni fra coppie di
individui
TCTAGA
CCTAGA CCTAGG
CTTAGA CTTAAA
1 2
3
1
1
2 3
1
2 2
Σ dij = 18 k = 1.8
57. Si può calcolare il mismatch sia all’interno delle
popolazioni, sia fra di loro
k (rosa) = 2.0 k (fra) = 4.3 k (verde) 2.8
La distanza dAB di Nei è il rapporto fra il mismatch fra popolazioni
e la media dei mismatch interni
dAB = k (fra) / [(k (rosa) + k (verde) / 2] = 4.3 / [(2.0 + 2.8) / 2] = 4.3 / 2.4 = 1.79
63. Livelli di
diversità fra
uomo e
scimpanzè
Tempi di
dissociazione
indicano una
differenza pari
all’1.76%
(Sibley & Ahlquist,
1984)
64. Livelli di polimorfismo nell’uomo: SNP
35 milioni di SNP fra uomo e scimpanzè. Su un totale di 3 miliardi
di basi (genoma aploide) ïƒ 1.23% (Chimpanzee Genome
Sequencing Consortium, 2005)
Di questi SNP, 1.06% fissati fra specie
0.17% polimorfici nell’uomo
Kaessmann et al. (2001)
65. Livelli di polimorfismo nell’uomo: Indel
Origine della
duplicazione
Siti di
inserzione
Marquès-Bonet et al. (2009)
66. Livelli di polimorfismo nell’uomo: genomi
completi
Nel 2010 erano 14 i genomi
interamente sequenziati (6
miliardi di paia di basi)
Oggi
1-20 giorni
1 tecnico
< 1000 euro
60 x
1
1
67. Africa del sud
Americani bianchi
Yoruba
Asiatici
Polimorfici almeno lo 0.13% dei siti
Nel 2010 erano 14 i genomi interamente
sequenziati (6 miliardi di paia di basi)
68. Nel 2017 i genomi umani interamente
sequenziati sono migliaia
Population
Number of
Individual DNA Samples
African Caribbean in Barbados [ACB] 79
African Ancestry in SW USA [ASW] 62
British From England and Scotland [GBR] 100
Chinese Dai in Xishuangbanna, China [CDX] 100
Colombian in MedellÃn, Colombia [CLM] 105
Finnish in Finland [FIN] 100
Han Chinese in Beijing, China [CHB] 120
Han Chinese South [CHS] 150
Iberian Populations in Spain [IBS] 150
Japanese in Tokyo, Japan [JPT] 120
Kinh in Ho Chi Minh City, Vietnam [KHV] 100
Luhya in Webuye, Kenya [LWK] 120
Mexican Ancestry in Los Angeles [MXL] 71
Peruvian in Lima Peru [PEL] 105
Puerto Rican in Puerto Rico [PUR] 105
Toscani in Italia [TSI] 114
Yoruba in Ibadan, Nigeria [YRI] 62
71. N of
markers
Samples FST
Reference
599,356
SNPs
209 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
0.13 Weir et al. 2005
1,034,741
SNPs
71 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
0.10 Weir et al. 2005
1,007,329
SNPs
269 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
0.12 International HapMap
Consortium 2005
443,434
SNPs
3845 worldwide distributed individuals 0.052 Auton et al. 2009
2,841,354
SNPs
210 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
0.11 Barreiro et al. 2008
243,855
SNPs
554 individuals from 27 worldwide populations 0.123 Xing et al. 2009
100 Alu
insertions
710 individuals from 23 worldwide populations 0.095 Watkins et al. 2008
67 CNVs 270 individuals from 4 populations with
ancestry in Europe, Africa or Asia
0.11 Redon et al. 2006
Le stime genomiche di FST per la
popolazione umana globale sono ∼ 0.12
Le popolazioni umane esprimono ∼ 12% della varianza massima
possibile, date le loro frequenze alleliche
72. 100%
100%100%
I membri della nostra comunità sono solo un po’ più simili a noi dei membri di
comunità molto lontane
88%88%
88%
Cosa vuol dire?
73. Due persone dello
stesso continente
possono essere
geneticamente più
distanti di persone di
continenti diversi.
74. In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of
nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an
average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010)
In media, ci sono differenze più grandi fra due
africani che fra europei e asiatici
75. Nota bene
La variabilità interna di una popolazione è solo uno degli
aspetti della variabilità genetica:
Variabilità tra individui della stessa popolazione
Variabilità tra individui di popolazioni diverse
Variabilità tra individui di gruppi di popolazioni diverse
eccetera
76. PS: Cos’è una popolazione?
Hendrick: un gruppo di individui che si accoppiano e
coesistono nel tempo e nello spazio
In pratica, si usano come unità operative di analisi gruppi di
individui localizzati nello spazio, che spesso hanno in
comune vari tratti culturali, come mezzi di sussistenza,
lingua, casta (in India), religione.
La scelta dell’unità operativa di analisi dipende spesso (a) dalla
domanda scientifica che ci si pone e (b) dalla effettiva
disponibilità di dati
77. Riassunto
• La genetica di popolazioni è un ramo della genetica, e quindi si
occupa di studiare la variabilità .
• Si può descrivere la variabilità o diversità genetica a partire dal
fenotipo (morfologia o proteina) o dal genotipo (DNA).
• La diversità del DNA è dovuta a polimorfismi di singolo nucleotide
(SNP), alla presenza di elementi ripetuti (STR e VNTR) e alla presenza
di delezioni, inserzioni o duplicazioni (CNV).
• Per quantificare la diversità genetica all’interno di una popolazione si
ricorre a statistiche, fra cui: (1) numero di alleli; (2) eterozigosi
osservata; (3) eterozigosi attesa; (4) polimorfismo nucleotidico; (5)
differenza media a coppie o mismatch.
• Il mismatch medio può essere calcolato sia all’interno delle singole
popolazione, sia fra popolazioni differenti, il che porta a una semplice
statistica, la distanza dAB di Nei, che quantifica la differenza genetica
fra popolazioni.