ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau...
Transcript of ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau...
![Page 1: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/1.jpg)
ARN non codant
et
bioinformatique
![Page 2: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/2.jpg)
![Page 3: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/3.jpg)
Gènes ?
Deux types de gènes:
gènes codant pour des protèines
gènes à ARN
![Page 4: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/4.jpg)
ARN
ARNs codant
ARNm
ARNs non codants
ARNs traduction
ARNt ARNr
Petits ARNs
siARN miARN
(stARN)snoARN snARN
Ribozymes
Les familles d’ARNs
![Page 5: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/5.jpg)
Molécule simple brin
CCAGGAAUCCUGG…
Appariement entre bases par des
liaisons hydrogènes Watson-Crick: (C,G) et (A,U)
de type Wobble: (G,U)
Qu’est qu’un ARN ?
![Page 6: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/6.jpg)
Qu’est qu’un ARN ?
Possibilité de former des duplex avec
d’autres ligands: ADN
ARN
Protéines
Les ARN adoptent une structure
essentielle à leur fonction
Repliement intra-moléculaire
![Page 7: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/7.jpg)
Exemple : snoARNs
![Page 8: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/8.jpg)
Exemple: ARN 16S
![Page 9: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/9.jpg)
Exemple : RNAIII
![Page 10: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/10.jpg)
Exemple : miARN (1)
![Page 11: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/11.jpg)
![Page 12: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/12.jpg)
Structure primaire
Structure secondaire
Structure tertiaire
Structure des ARNs
![Page 13: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/13.jpg)
Structure secondaire
•Mise en évidence de la plupart des liaisons
•Repliement dans un plan
![Page 14: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/14.jpg)
Structure tertiaire
•Détermine activité biochimique
•Repliement dans l’espace
![Page 15: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/15.jpg)
Signature d’une famille
Elément de structure II : motif
![Page 16: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/16.jpg)
Motifs de structure III
![Page 17: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/17.jpg)
ARN et bioinformatique
Inférence de signature d’ARN
◦ Le motif est inconnu
Plusieurs séquences
Motif commun?
Recherche de gènes d’ARN
Le motif est connu
Une ou plusieurs séquences
Toutes les positions où une
occurrence du motif apparait
![Page 18: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/18.jpg)
Inférence (prédire) les ARNs
À partir d’une séquence Recherche de similarité dans les banques?
Biais de composition
Structure d’énergie optimale
À partir de plusieurs séquences Analyse comparative
Structure primaire
Structure secondaire
![Page 19: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/19.jpg)
Inférence (structure I)
![Page 20: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/20.jpg)
Mot
Alignement
Multiple
Consensus
Expression
Régulière
Inférence (structure I)
![Page 21: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/21.jpg)
Inférence (structure I)
Profil de poids
Chaine de Markov
Cachées
(HMM)
![Page 22: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/22.jpg)
Inférence (structure II)
Principe de la Covariation
![Page 23: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/23.jpg)
L‘exemple de l’ARNt
![Page 24: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/24.jpg)
QRNA examine les motifs conservés entre
plusieurs espèces :
Il distingue protéine et ARNnc
MSARi évalue la significativité d’un nombre
de mutations compensatoires observées
RNAz évalue la significativité de l’énergie
libre de structure individuelles entre elles et
avec une structure consensus
Exemples (Inférence)
![Page 25: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/25.jpg)
ARN et bioinformatique
Inférence de signature d’ARN
◦ Le motif est inconnu
Plusieurs séquences
Motif commun?
Recherche de gènes d’ARN
Le motif est connu
Une ou plusieurs séquences
Toutes les positions où une
occurrence du motif apparait
![Page 26: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/26.jpg)
Logiciels (outils) spécifiques La signature du motif est définie dans le logiciel
Ne s’appliquent qu’à un seul type de famille
Nécessite des programmeurs pour modifier les caractéristiques du motif recherché
Logiciels généralistes La signature du motif est donné par l’utilisateur
Le logiciel propose un langage
Selon la flexibilité du langage, l’utilisateur peut décrire les caractéristiques qu’il souhaite
Recherche de motif
![Page 27: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/27.jpg)
Séquence
ou génome
Séquence
ou génome
Entrée Sortie
candidat
candidat
candidat
candidat
candidat
candidat
candidat
candidat
Motif
Motif
OutilS
pécif
iqu
eG
én
éra
lis
te
![Page 28: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/28.jpg)
Logiciels spécifiques
Les ingrédients?
Une signature de la famille
Un score pondérant la présence de chaque
élément du motif
Algorithme de recherche efficace
Identification d’éléments dont la présence est
discriminante
![Page 29: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/29.jpg)
Logiciels spécifiques
Les avantages/inconvénients?
Avantage
Efficacité
Confiance élevée dans les scores
Inconvénients
Programmeur indépendant
Difficile de modifier l’algorithmes
![Page 30: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/30.jpg)
Logiciels spécifiques
Group I introns I: CITRON (Lisacek et al., 1994)
tRNA :
(Staden, 1980), (Marvel, 1986),
tRNAscan (Fichant et Burks, 1991), (Pavesi et al., 1994),
FASTtRNA (El-Mabrouk et Lisacek, 1996),
tRNAscan-SE (Lowe et Eddy, 1007)
snoRNA : SNOscan (Lowe et Eddy, 1997)
IRE motifs : (Dandekar et al., 1991)
La signature est définie dans le logiciel
![Page 31: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/31.jpg)
Travaille en trois étapes:
1) Recherche avec tRNAscan (Fichant & Burks, 1991) et
EutfindtRNA (Pavesi et al, A994)
2) Evaluation des candidats avec COVELS (Eddy & Durbin, 1994)
3) Localisation des éléments de structure dans les candidats
Excellent compromis entre efficacité, sensibilité et
spécificité
Classiquement utilisé pour les ARNT dans les
programmes d’annotation de génome
l’ARNt avec tRNAscan-SE
![Page 32: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/32.jpg)
Logiciels généralistes
Les ingrédients?
Une signature de la famille
Un langage permettant de traduire l’ensemble
des éléments et leurs caractéristiques
Algorithme de recherche efficace
Identification d’éléments dont la présence est
discriminante (éventuellement)
![Page 33: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/33.jpg)
Logiciels généralistes
Les avantages/inconvénients?
Avantage
Programmeur indépendant
Généralement facile de décrire un motif structuré
Inconvénients
Ne permet pas toujours de décrire l’ensemble des
caractéristiques du motif
Moins efficace
Difficile de construire des scores pertinents
![Page 34: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/34.jpg)
Logiciels généralistes
Séquence seulement
ANREP (Mehldau et Myers, 1993)
FindPattern (Devereux et al, 1984)
Séquence et structure
RNAMOT (Gautheret et al, 1990, Laferriereet al, 1994)
PALINGOL (Billoud et al., 1996)
PATSCAN (DSOUZA er al., 1997),
PATSEARCH (Pesole et alm., 2000)
La signature est à définir par l’utilisateur
![Page 35: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/35.jpg)
l’ARNt avec RnaMot
![Page 36: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/36.jpg)
Evaluation des outils (1)
OUTIL DE
PREDICTION
Exemples =
Séquences qui
correspondent au motif
Contre exemples =
Séquences qui ne
correspondent pas au motif
candidats
![Page 37: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/37.jpg)
Evaluation des outils (2)
Positifs Négatifs
Exemples Vrais Faux
Positifs Négatifs
Contre Faux Vrais
Exemples Positifs Négatifs
![Page 38: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/38.jpg)
Sensibilité : un programme est d’autant plus sensible qu’il va proposer des vrais positifs
SE = VP / (VP +FN)
Spécificité : un programme est d’autant plus spécifique qu’il ne va pas trouver des faux positifs
SP = VP /(VP + FP)
Evaluation des outils (3)
![Page 39: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/39.jpg)
Exemple :
Prédiction des ARNts dans une séquence
5 candidats sont prédits
3 correspondent à de vrais gènes : VP = 3
1 vrai gène n’a pas été trouvé : FN = 1
2 ne sont pas de vrais gènes : FP = 2
SE = 3/(3+1) = 3/4 75 %
SP = 3/(3+2) = 3/5 60 %
Evaluation des outils (4)
![Page 40: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/40.jpg)
![Page 41: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT](https://reader034.fdocuments.us/reader034/viewer/2022042102/5e7eb20f35fdd92a374e68d4/html5/thumbnails/41.jpg)
RFAM stats
503 familles Une famille : groupe d’ARN homologues et
alignables (structure II ou I)
miARN: > 20 familles
Humain 100 familles
3000 ARN différents annotés
E. Coli 40 familles