Méthodes

Prélèvement des échantillons

En tout premier lieu, des prélèvements de feuilles ont été réalisés selon un schéma de récolte précis.

Récolte_plan_web.jpgPlan de récolte - Stramatakis © UNILRécolte_Explications_web.jpgExplication du plan aux élagueurs - Stramatakis © UNILRécolte_bague_web.jpgPrélèvement des échantillons - Stramatakis © UNILRécolte_annotation_web.jpgAnnotation des échantillons - Stramatakis © UNIL

Extraction de l'ADN

A partir d'un échantillon végétal, les feuilles sont broyées et réduites en poudre pour en extraire leur ADN.

Dans un premier temps, les feuilles du chêne sont pesées, puis écrasées dans de l'azote liquide à -196°C jusqu'à l'obtention d'une poudre fine.

Extraction_feuilles_web.jpgPesée des feuilles du chêne - Stramatakis © UNILExtraction_poudre_web.jpgRéduction des feuilles en poudre - Stramatakis © UNIL

Cette poudre est remise en suspension dans des solutions chimiques permettant la lyse cellulaire. La solution résultante est filtrée dans un système de colonne pour retirer tous les débris cellulaires.

Extraction_lyse_web.jpgLyse des cellules végétales - Stramatakis © UNILExtraction_lysat_web.jpgFiltration du lysat cellulaire - Stramatakis © UNIL

La suspension claire obtenue est déposée sur une autre colonne permettant de purifier l'ADN.

Extraction_purification_web.jpgPurification de l'ADN sur colonne - Stramatakis © UNIL

La solution d'ADN est récupérée puis analysée pour connaitre sa concentration ainsi que sa pureté.

Extraction_ADN_web.jpgRécupération de la solution d'ADN - Stramatakis © UNILExtraction_mesure_web.jpgMesure de la quantité et de la qualité de l'ADN - Stramatakis © UNIL

Le Séquençage

Dans ce projet, deux méthodes de séquençage de nouvelle génération, dites à haut débit, et complémentaires ont été utilisées afin d'obtenir un génome encore inconnu de bonne qualité. La méthode de Pacific Biosciences permet d'obtenir de longs fragments et de générer un "squelette" du génome. La seconde  méthode, d'Illumina, permet d'obtenir de petits fragments précis avec peu d'erreurs. La superposition des séquences obtenues pas les deux méthodes contribue alors à générer des séquences alignées de qualité et de reconstituer les chromosomes.

Séquençage d'une simple molécule en temps réel

La société Pacific Biosciences a développé une méthode innovante permettant de séquencer des fragments d'ADN de très grande taille (jusqu'à 2500 nucléotides) à partir d'une seule molécule d'ADN.

Une enzyme ou catalyseur biologique, responsable de l'élongation de l'ADN est fixée au fond d'un puits. En présence d'une molécule d'ADN simple brin, celle-ci va être capable d'incorporer des nucléotides libres complémentaires au brin à analyser, un par un. Les nucléotides ont la particularité d'être marqués par une molécule fluorescente différente (bleu pour G, jaune pour A, vert pour T et rouge pour G). Lorsque l'enzyme incorpore un nouveau nucléotide, elle va libérer le marqueur fluorescent et générer un signal lumineux. Ce signal sera détecté dans une zone restreinte au fond du puits par le séquenceur.

PacBio_web.jpgSéquençage en temps réel de Pacific Biosciences - d'après Nature Reviews

On obtient alors une multitude de points colorés, correspondants à l'alignement des puits sur le support et aux nucléotides incorporés dans chacun de ces puits. Les images obtenues seront enregistrées et analysées par des méthodes informatiques de pointe.

PacBio5_web.jpgPhoto de résultats obtenus avec la méthode de Pacific Biosciences - Stramatakis © UNIL

Séquençage à l'aide de terminateurs réversibles

La société Illumina a développé une technologie de séquençage sur biopuce (ensemble de molécules d'ADN fixées sur une petite surface solide, telle qu’une lame de verre). Le principe est basé sur l’incorporation réversible de nucléotides fluorescents et par lecture optique de cette fluorescence. Des technologies informatiques de pointe sont utilisées pour l’acquisition, le traitement et l’analyse des images obtenues. Les coûts et le temps de séquençage sont réduits de façon drastique. Cette métode permet de séquencer en parallèle plus de 3 milliards de petits fragments d’ADN de 50 à 300 nucléotides de long avec peu d’erreurs (les erreurs principales de cette technologie sont des erreurs de substitution d’un nucléotide par un autre).

SéquençageIlluminaFasteris48_web.jpgBiopuce Illumina - Stramatakis © UNIL

Dans un premier temps, l’ADN est fragmenté en petits bouts par des méthodes mécaniques. Ceux-ci sont ensuite reliés par des adaptateurs à une lame de verre afin d’être recopiés une multitude de fois et former une colonie ou cluster (multitude de copies du même fragment d'ADN en un point donné).

Illumina_clusters.jpgAmplification de l'ADN en clusters - selon Illumina © UNIL - l'Eprouvette

La réaction de séquençage est réalisée directement sur le support ou l'ADN a été amplifié. Elle nécessite de nombreuses copies d’ADN pour détecter un signal lumineux et est basée sur l'arrêt de la synthèse d'ADN par l’utilisation d’un nucléotide terminateur fluorescent. Les différents nucléotides marqués sont incorporés, entrainant l’arrêt de l’élongation du brin d’ADN. Les nucléotides excédentaires (non incorporés) sont retirés par lavage entre chaque réaction pour que la fluorescence soit détectée et mesurée pour chaque cluster. Puis, le groupement de protection phosphorescent du nucléotide terminateur est détruit par la lumière ultraviolette, permettant à un nouveau nucléotide d’être incorporé, et ainsi de suite. La détection laser de la fluorescence est réalisée en temps réel, cycle après cycle.

Illumina_sequencing.jpgSéquençage de l'ADN selon Illumina - © UNIL - l'Eprouvette

La très haute densité de la puce (supérieure à 100 millions de molécules par centimètre carré) permet de séquencer environ 100'000 nucléotides par seconde.

Illumina_illustration.jpgIllustration d'une image obtenue avec la méthode Illumina

Assemblage du génome

En corrigeant les longues séquences générées par Pacific Biosciences en les alignant avec les données issues du séquençage Illumina, nous optimisons alors les avantages de chacune de deux technologies (couverture, fiabilité des nucléotides et longueurs des séquences). En diminuant le nombre de contigs (fragment génomique continu et ordonné, généré par l'assemblage des séquences obtenues qui se chevauchent) tout en augmentant leurs tailles nous possédons les outils pour obtenir des assemblages de génomes rapidement, à moindre coûts et de meilleure qualité.


Napoleome_Assemblage.jpgAssemblage du génome par superposition des fragments Illumina et Pacific Biosciences - l'Eprouvette © UNIL

Ces nombreuses données sont analysées et organisées par les bio-informaticiens de la plateforme Vital-IT, géré par l'Institut Suisse de Bioinformatique. Ce centre de compétence en bioinformatique soutient et collabore avec des chercheurs en Suisse et dans le monde entier. Vital-IT offre des ressources de calcul de haute performance ainsi qu'un grand espace de stockage, permettant le développement de projets de bioinformatique complexes tels que l’assemblage de génomes.

Retour

Séquençage_preparation_web.jpgPréparation des échantillons pour le séquençage - Stramatakis © UNIL