Métabolomique

La métabolomique et spectrométrie de masse.

La métabolomique est l’analyse de l’ensemble des petites molécules d’un système vivant (généralement la masse moléculaire est inférieure à 1500 Da). Le terme métabolomique est une dérivée de la métabolome qui fait référence à tous les métabolites contenus dans un système biologique, organisme, type cellulaire ou fluide biologique comme l’urine, la salive ou le plasma. Le terme métabolite inclut toutes les molécules de petite taille, comme des acides aminés, des sucres, des alcools, les phosphates de sucre, des amines, des acides gras, des lipides polaires, des hormones et vitamines, ainsi que des métabolites spécialisés, comme les composés phénoliques, flavonoïdes, monoterpènes, sesquiterpènes, polykétides, alcaloïdes, y compris les xénobiotiques telles que la plupart des biocides, médicaments et perturbateurs endocriniens. Le métabolome représente l’ultime réponse d’un organisme à une altération génétique, une pathologie, une exposition à une toxique  ou toute cause environnementale, il est en dernier échelle dans les études “omiques” (Figure 1). Il est variable selon les espèces et en fonction du temps, du stade physiologique ou pathologique.

echelle omiques

Figure 1 : Echelle des approches “omiques”donc la métabolomique reflète ce qui passe dans l’organisme.

Analyse en spectrométrie de masse.

Une analyse métabolomique en spectrométrie de masse déroule en plusieurs étapes importantes[1], d’abord la préparation des échantillons, cette étape peut faire perdre des quantités de métabolites non négligeables et favoriser des groupes de molécules pour mieux cibler celles qu’on s’intéresse. Puis le passage au spectromètre de masse où on peut choisir une infusion directe ou en couplage LC-MS avec des paramètres différents pour chaque type d’analyse. Enfin, le traitement des données qui est en général, une des difficultés majeures de la métabolomique due à la grande quantité de données.

La préparation des échantillons

La préparation des échantillons est souvent très spécifique car elle est réalisée en fonction des métabolites à étudier[2]. La très grande diversité des métabolites potentiels présents dans un échantillon biologique en termes de propriétés physico-chimiques (Hydrophilie/hydrophobie, la volatilité, la réactivité chimique/stabilité) et des concentrations différentes rend l’objectif à mesurer tous les métabolomiques impossibles. À savoir que chez l’homme, il y a plus de 42.000 métabolites dans différentes catégories, il reste encore beaucoup de métabolites à identifier. Aucune méthode ne permette de préserver tous les métabolites dans un échantillon, parce que les conditions qui stabilisent un type de composé peuvent détruire d’autres types ou influencer leurs concentrations. Il faut souvent adapter la préparation d’échantillon en fonction de ce qu’on étudie et aussi de l’état de l’échantillon. Pour les échantillons liquides comme l’urine, la dilution reste la meilleure solution, en général elle est diluée avec de l’eau pure en proportion 1 :1 à 1 :10. Pour les tissus, l’extraction à partir du tissu se fait couramment en secouant avec des mélanges de solvants tels que chloroforme–méthanol ou chloroforme–méthanol–eau. Certains échantillons comme le plasma ou le sérum contiennent des protéines qui peuvent être précipitées et éliminées par des solvants organiques comme ACN, Acétone, Méthanol…

L’analyse par spectrométrie de masse

Il existe trois différentes approches de la métabolomique, donc le premier est l’analyse ciblée d’un métabolite (ou quelques-uns) dans laquelle on s’intéresse à l’identification et la quantification des métabolites particuliers. La deuxième approche est le profilage métabolomique permet d’analyser d’un groupe ou une famille de composé. Et la dernière approche est l’empreinte métabolomique[3] (approche non ciblée) consiste à analyser le profil de l’ensemble des métabolites présents dans l’échantillon sans nécessité d’identification ou de quantification, cette approche a été appliquée à une large variété matrice biologique comme l’urine, le plasma, la salive, cellule…

Les techniques analytiques de métabolomique par la spectrométrie de masse sont soit en infusion directe[4] soit par couplage avec la chromatographie. L’infusion directe consiste à passer l’échantillon directement à la source d’ions sans séparation préalable par la chromatographie. Cette technique est couramment utilisée avec les sources d’ionisation à la pression atmosphérique, donc la source d’ions la plus utilisée est l’électrospray (ESI)[5]. Cette source d’ions est particulièrement utile car elle permet d’ioniser et vaporiser à partir de l’état liquide, les composés non volatils. L’infusion directe est une approche à haut débit, permettant de traiter un échantillon en un temps très court et préserver le maximum de métabolite. Cette technique permet d’adapter les paramètres de l’appareil en direct, en fonction de l’échantillon. L’inconvénient de cette technique est un grand nombre d’ions qui peut polluer la source, saturer l’analyseur et masquer le signal des molécules en faible concentration. Les isobares peuvent être confondues en raison d’un grand nombre d’ions détectés en même temps.

Le couplage chromatographie et spectrométrie de masse

Pour éviter les inconvénients de l’infusion directe, une séparation des métabolites est nécessaire, cela permet de réduire la surpression des ions qui sont soit en faible concentration, soit peu sensible par rapport à la technique d’ionisation. La séparation préalable permet aussi le spectromètre de masse le temps d’analyser le maximum de métabolite, afin d’envisager des études plus poussées comme la fragmentation des ions. Par contre, certains métabolites peuvent être perdus par la chromatographie.

Le couplage chromatographie est une technique idéale pour étudier une famille, un groupe de métabolites ou certains métabolites particuliers. En jouant sur les méthodes de séparation comme la chromatographie liquide[6], gazeuse ou électrophorèse capillaire, on peut éliminer certains métabolites pour mieux étudier ceux qu’on s’intéresse. Les éléments de la chromatographie jouent aussi un rôle déterminant pour sélectionner des molécules, comme les colonnes, la pression, la température…

Les spectromètres de masse

En raison d’un grand nombre de métabolites présents dans un échantillon, afin de faire la distinction entre les composés ayants la même masse nominale, les spectromètres de masse à haute résolution sont les instruments de choix pour étudier la métabolomique. La haute résolution permet également la mesure de la masse sur charge précise de l’ion pseudo-moléculaire. L’injection directe à haute résolution a été effectuée en utilisant le spectromètre de masse (TOF-MS) et le FT-ICR-MS. L’instrument TOF-MS fournit une résolution de masse acceptable entre 6.000-17.000 et la précision est entre 10-20 ppm. Tandis que le FT-ICR peut atteindre la résolution de 1 million dans les conditions favorables. Allen et al[7]. ont utilisé le TOF-MS avec la source ESI en mode positif pour analyser de l’empreinte métabolique dans les échantillons du milieu culture de cellules de levure.

Les instruments hybrides, tels que quadripolaire-TOF-MS (Q-TOF-MS) ont également été utilisés pour l’analyse de dépistage rapide de la cellule ou des extraits de plantes en utilisant le TOF comme analyseur de masse, qui fournit la mesure de la masse précise avec une résolution de masse élevée[8]. L’élucidation structurelle des biomarqueurs peut être effectuée par la fragmentation dans le même spectromètre de masse. Le FT-ICR-MS est aussi un appareil hybride qui offre une très haute résolution (100,000-1,000,000) et une très bonne précision en  masse (0,1-1 ppm), sa sensibilité et sa capacité de faire les spectres MSn [9], rend cet appareil un outil idéal pour les approches empreintes métabolomiques[10]. Cependant, le coût de cet instrument ne permet pas une large application dans le domaine métabolomique. Depuis 2005, un instrument nouveau est apparu et ne cesse de gagner le terrain dans tous les domaines de spectrométrie de masse, c’est l’Orbitrap. Cet instrument possède de nombreux avantages, sa limite de détection est très élevée, le pouvoir résolutif est de l’ordre de centaines de milliers et la précision de masse autour de 1ppm. Il n’est pas encore dépassé le FT-ICR en résolution mais il a un avantage par rapport à ce dernier c’est la vitesse de scan, qui est un paramètre important pour étudier la métabolomique. Ces deux instruments sont des instruments de choix pour la recherche métabolomique, de nombreuses études métabolomique en utilisant ces deux instruments ont été réalisées. Witting et co-auteurs[11] ont utilisé l’infusion directe dans le FT-ICR (DI-ICR-FT-MS) pour étudier les métabolomiques non-ciblées pour obtenir des profils à haute résolution de l’état métabolomique d’un Caenorhabditis elegans en interaction avec des agents pathogènes.

L’approche Shotgun, dans le cas de lipidomique, s’est avérée être une méthode très efficace pour obtenir des profils de la composition moléculaire de lipidomes complexes, et cette approche a été  démontré avec succès en combinaison avec HRMS[12],[13]. Le spectromètre de masse Orbitrap est particulièrement utile pour les études lipidomiques en raison de son acquisition rapide des spectres MS et MS/MS, sa résolution de masse est très élevée et la possibilité de changer la polarité rapide avec une précision de masse sous-ppm[14].

La fragmentation des métabolites et nomenclatures

Nomenclature de fragmentation des oligosaccharides

Domon et Costello[15] ont proposé une nomenclature pour la fragmentation des oligosaccharides donc les ions fragments provenant des ruptures glycosidiques sont appelés Bi, Cj s’ils sont du coté non réducteur et Yk, Zl (Figure 2) s’ils sont du coté réducteur, les indices correspondent à la position de la liaison glycosidique par rapport à la chaine oligosaccharide. Il faut noter que ces ions fils sont les plus observés dans les spectres MS/MS à basse énergie, il est possible qu’une des liaisons dans le cycle ait cassée à basse énergie mais cette rupture n’est pas observée dans le spectre MS/MS. À haute énergie, on observe des ruptures du cycle donnant des ions fils m,nAi du coté non réducteur et h,gXj donc les numéros aux dénominateur correspondent à la position de liaison dans le cycle (qui sont numéroté de 0 à 5).

fragmentation sucre

Figure 2 : Nomenclature de fragmentation des oligosaccharides.

Nomenclature utilisée pour décrire la  fragmentation de l’oligonucléotide

Plusieurs nomenclatures ont été proposées pour décrire la fragmentation des oligonucléotides, celle la plus acceptée est la nomenclature proposée par McLuckey et al[16] (Figure 3) basée sur la nomenclature utilisée pour les peptides. Elle s’organise autour du groupement phosphodiester et décrit deux groupes d’ions fragments :

– Ceux contenant la terminaison 5’ de l’oligomère sont notés ai, bi, ci, et di.

– Ceux qui contiennent l’extrémité 3’ sont nommés wj, xj, yj, et zj.

Les indices i et j utilisés pour la nomination de ces fragments font référence au nombre de nucléobases contenues dans l’ion fragment considéré et permettent ainsi d’indiquer la position de la liaison rompue.

            Par ailleurs, la perte d’une nucléobase sous sa forme neutre est décrite par une lettre désignant sa nature. Ainsi, A désigne l’adénine, C la cytosine, G la guanine, T la thymine et U l’uracile. On note que la perte de base est souvent observée, en effet c’est la perte de base dans la majorité de cas entraine la rupture de la séquence [97, 98]. Il existe aussi des fragments internes qui sont issus de la rupture des deux côtés et ils sont nommé B:Bj où la lettre B désigne le nom de nucléobase et les indices désignent la position de nucléobase.

nomenclature oligonucléotide

Figure 3 : Nomenclature des fragments d’oligomère d’ADN proposée par McLuckey

La fragmentation des acides gras

Les acides gras possèdent une chaine carbonée de plusieurs d’atomes de carbone. En phase gazeuse, la liaison saturée de la chaine carbonée peut être cassée par une activation classique comme CID, suivant un mécanisme 1,4 (Figure 4).

mécanisme 1,4

Figure 4 : La rupture de liaison covalente en phase gazeuse suivant le mécanisme 1,4

Cette rupture peut être produite aléatoirement tout au long de la chaine sauf la liaison insaturée, par conséquent, on observe des décalages de 14 unités de masse sur le spectre de masse. S’il y a une liaison insaturée on observe un trou parmi les pics qui sont décalés de 14 de masse, le trou correspond à un décalage de masse de 54 Da. Si la chaine carbonée est ramifiée on observe aussi un décalage de masse correspond à la masse du groupe R plus 12 Da (Figure 5). La position du groupe R et la double liaison sont faciles à localiser grâce au décalage de masse. Sur le spectre de masse des acides gras on observe aussi une perte de 45 Da qui correspond à la perte du groupe COOH. En pratique, les spectres MS/MS des acides gras sont plus compliqués à interpréter surtout pour les acides gras contenant plusieurs sites insaturés, car il peut produire des ruptures, des réarrangements qui ne sont pas prévus, et les mécanismes sont plus compliqués.

metabolite

Figure 5 : Structure d’un acide gras insaturé et ramifié.

Le traitement des données métabolomiques

Les données obtenues des différentes approches métabolomiques sont analysées en utilisant les statistiques (uni- et multi-variées), permettant de voir la différence entre les échantillons et décrire l’information obtenue. Les analyses métabolomiques génèrent de grandes quantités de données et nécessitent des outils bio-informatiques[17],[18] spécifiques, la connaissance en statistique, mathématique, afin de développer des programmes adaptés. Les logiciels de traitement de données métabolomiques sont nombreux mais ils sont moins connus en grand public, parfois ces logiciels sont développés « in house » pour des traitements spéciaux. Le principe général du traitement des données consiste à identifier des variables définies par un rapport m/z et le temps de rétention, puis à associer l’aire sous la courbe du pic chromatographique qu’elles représentent dans chacun des échantillons où elles sont retrouvées. Parmi les logiciels de traitement de données, le XCMS est le plus utilisé à notre connaissance, le logiciel est capable d’aligner le temps de rétention, faire la quantification relative. Il est intégré dans le programme statistique sous environnement R, qui est un excellent outil pour le traitement des données statistique. Des algorithmes spécialisés pour le profilage de métabolites individuels ont également été développés[19],[20]. Par exemple, le programme « LipidSearch » développé par Taguchi et co-auteurs, utilise spécifique approche des pertes de neutre détectées dans les spectres MS3, pour l’identification des espèces moléculaires phosphatidylcholine, la phosphatidylsérine et la sphingomyéline. Il existe de nombreuses bases de données métabolomique, parmi lesquelles PubChem et ChemSpider sont des plus grandes bases de données. On peut trouver également des bibliothèques de spectre de masse contenant des spectres des masse des ions précurseurs et des ions fragments comme le NIST (National Institute of Standards and Technologiy). De nombreuses bases de données spectrales en libre accès contiennent également les spectres de masse à haute résolution et la masse précise. Par exemple, le data base METLIN[21], contient des  informations des métabolites et des spectres de masse en tandem, conçus pour faciliter l’identification des métabolites[22],[23],[24]. La base de données fournit des spectres MS/MS des métabolites et chaque métabolite est lié à des ressources externes comme Kyoto Encyclopedia of Genes and Genomes (KEGG) pour la référence. Récemment, une nouvelle bibliothèque mzCloud est développée[25] fournie des informations très importantes. La bibliothèque mzCloud est un type de base de données du spectre de masse qui peut aider à prédire des structures de métabolites et d’identifier des composés inconnus, en utilisant la technique PIF (empreint digital d’ion précurseur), même si les molécules ne sont pas présentes dans la bibliothèque de spectre de masse[26]. La technique PIF repose sur des structures chimiquement plausibles des ions fragments qui sont soit utilisée pour réassembler le composé parent soit données des caractéristiques structurales.

[1] MASS SPECTROMETRY-BASED METABOLOMICS Katja Dettmer1, Pavel A. Aronov1, and Bruce D. Hammock1,2,* Mass Spectrom Rev. 2007 ; 26(1): 51–78.

[2] Basics of mass spectrometry based metabolomics Frederique Courant1,2, Jean-Philippe Antignac2,3, Gaud Dervilly-Pinel2 and Bruno Le Bizec Proteomics 2014, 14, 2369–2388.

[3] Castrillo JI, Hayes A, Mohammed S, Gaskell SJ, Oliver SG. An optimized protocol for metabolome analysis in yeast using direct infusion electrospray mass spectrometry. Phytochemistry 2003;62:929–937

[4] Smedsgaard, J. & Frisvad, J.C. Terverticillate Penicillia studied by direct electrospray mass spectrometric profiling of crude extracts. I. Chemosystematics. Biochem. Syst. Ecol. 25, 51-64

[5] Yamashita, M. and J.B. Fenn. 1984. Electrospray ion-source—another variation on the free-jet theme. J. Phys. Chem. 88:4451-4459.

[6] Monolithic Silica-Based Capillary Reversed-Phase Liquid Chromatography/Electrospray Mass Spectrometry for Plant Metabolomics American Chemical Society

Vladimir V. Tolstikov,† Arjen Lommen,‡ Kazuki Nakanishi,§ Nobuo Tanaka,| and Oliver Fiehn*,†

[7] High-throughput classification of yeast mutants for functional genomics using metabolic footprinting.

Allen J1, Davey HM, Broadhurst D, Heald JK, Rowland JJ, Oliver SG, Kell DB. Nat Biotechnol. 2003 Jun;21(6):692-6. Epub 2003 May 12.

[8] Sample preparation in matrix-assisted laser desorption/ionization mass spectrometry of whole bacterial cells and the detection of high mass (>20 kDa) proteins. Vaidyanathan S1, Winder CL, Wade SC, Kell DB, Goodacre R. Rapid Commun Mass Spectrom. 2002;16(13):1276-86.

[9] FOURIER  TRANSFORM  ION  CYCLOTRON RESONANCE  MASS  SPECTROMETRY:  A  PRIMER Alan G. Marshall,*

 Christopher L. Hendrickson, and George S. Jackson Mass Spectrometry Reviews, 1998, 17, 1–35

[10] Metabolomics applications of FT-ICR mass spectrometry. Brown SC1, Kruppa G, Dasseux JL. Mass Spectrom Rev. 2005 Mar-Apr;24(2):223-31.

[11] Witting, M.; Lucio, M.; Tziotis, D.; Wagele, B.; Suhre, K.; Voulhoux, R.; Garvis, S.; Schmitt-Kopplin, P.

DI-ICR-FT-MS-based high-throughput deepmetabotyping: Acase study of the Caenorhabditis elegans-Pseudomonas

aeruginosa infection model. Anal. Bioanal. Chem. 2015, 407, 1059–1073.

[12] Shotgun lipidomics on high resolution mass spectrometers. Schwudke D1, Schuhmann K, Herzog R, Bornstein SR, Shevchenko A. Cold Spring Harb Perspect Biol. 2011 Sep 1;3(9):a004614. doi: 10.1101/cshperspect.a004614.

[13] Klose, C.; Tarasov, K. Profiling of yeast lipids by shotgun lipidomics. Methods Mol. Biol. 2016, 1361, 309–324

[14] Schuhmann, K.; Almeida, R.; Baumert, M.; Herzog, R.; Bornstein, S.R.; Shevchenko, A. Shotgun lipidomics

on a LTQ Orbitrap mass spectrometer by successive switching between acquisition polarity modes. J. Mass

Spectrom. 2012, 47, 96–104.

[15] A systematic nomenclature for carbohydrate fragmentations in FAB-MS/MS spectra of glycoconjugates.  Bruno Domon, Catherine E Costello Glycoconjugate Journal December 1988, Volume 5, Issue 4, pp 397-409

[16] McLuckey et al. J. Am. Soc. Mass Spectrom. 1992, 3, 60-70

[17] Shulaev, V. Metabolomics technology and bioinformatics. Brief. Bioinform. 2006, 7, 128–139.

[18] Katajamaa, M.; Oresic, M. Data processing for mass spectrometry-based metabolomics. J Chromatogr A 2007,

1158, 318–328

[19] Taguchi, R.; Ishikawa, M. Precise and global identification of phospholipid molecular species by an Orbitrap

mass spectrometer and automated search engine Lipid Search. J. Chromatogr. A 2010, 1217, 4229–4239.

[20] Herzog, R.; Schwudke, D.; Shevchenko, A. LipidXplorer: Software for quantitative shotgun lipidomics

compatible with multiple mass spectrometry platforms. Curr. Protoc. Bioinform. 2013, 11, 14.12:1–14.12:30.

[21] Scripps Center for Metabolomics and Mass Spectrometry. Available online: https://metlin.scripps.edu

(accessed on 24 May 2016).

[22] Tautenhahn, R.; Cho, K.; Uritboonthai, W.; Zhu, Z.; Patti, G.J.; Siuzdak, G. An accelerated workflow for

untargeted metabolomics using the METLIN database. Nat. Biotechnol. 2012, 30, 826–828.

[23] Smith, C.A.; O’Maille, G.; Want, E.J.; Qin, C.; Trauger, S.A.; Brandon, T.R.; Custodio, D.E.; Abagyan, R.;

Siuzdak, G. METLIN: A metabolite mass spectral database. Ther. Drug Monit. 2005, 27, 747–751.

[24] Sana, T.R.; Roark, J.C.; Li, X.; Waddell, K.; Fischer, S.M. Molecular formula and METLIN personal metabolite

database matching applied to the identification of compounds generated by LC/TOF-MS. J. Biomol. Tech.

2008, 19, 258–266.

[25] mzCloud—Advanced Mass Spectral Database. Available online: https://www.mzcloud.org (accessed on

24 May 2016).

[26] Sheldon, M.T.; Mistrik, R.; Croley, T.R. Determination of ion structures in structurally related compounds

using precursor ion fingerprinting. J. Am. Soc. Mass Spectrom. 2009, 20, 370–376

Share This Post

Leave a Reply