La protéomique et spectrométrie de masse

La spectrométrie de masse et protéomique

La protéomique a pour but d’identifier et de quantifier les protéines présentes dans un échantillon biologique afin de mieux comprendre les mécanismes moléculaires dans une cellule[1]. La spectrométrie de masse a été largement utilisée pour analyser des échantillons biologiques et a évoluée pour devenir un outil indispensable pour la recherche en protéomique. Le développement récent de nouveaux spectromètres de masse comme Orbitrap et de nouvelles méthodes de dissociation telles que le transfert d’électrons dissociation (ETD)[2] ont rendu accessible à de nouveaux domaines d’application en protéomique. Bien que la stratégie protéomique bottom-up (analyse des mélanges de peptides protéolytiques) soit la plus utilisée par son efficacement et sa simplicité par rapport à la stratégie top-down (analyse des peptides plus longs ou des protéines intactes), mais cette dernière permette une caractérisation plus complète des isoformes de protéines et des modifications post-traductionnelles. Enfin, les stratégies d’étiquetage des isotopes stables[3] ont transformé la spectrométrie de masse d’un simple outil d’identification à un outil complète pour quantifier et mesurer les changements dynamiques dans l’expression des protéines, l’interaction et la modification.

Stratégie top-down en MS/MS

L’identification protéomique en mode top-down[4] consiste à analyser un mélange de protéines intacts sans avoir à digérer (Figure 1), le mélange de protéines est séparé par la chromatographie liquide, puis les protéines sont ionisées et ensuite la protéine à étudier sera isolée puis fragmentée dans l’analyseur. La masse sur charge (m/z) de l’ion de protéine et celles de ses ions fils servent à identifier la protéine. Les avantages de la stratégie top-down sont la capacité à détecter les produits de dégradation, des variantes de séquence, et des combinaisons de modifications.

Workflows_TopDown protéomique

Figure 1 : Stratégie top-down en protéomique (Image à partir de planetorbitrap)

Stratégie Bottom-up en MS/MS

La stratégie bottom-up (Figure 2) est la plus utilisée en protéomique pour identifier des protéines dans les laboratoires de spectrométrie de masse. Les protéines sont d’abord digérées par une enzyme (souvent c’est la trypsine) et on obtient un mélange de peptides. Ces peptides sont séparés par la chromatographie liquide avant d’être analysés par la spectrométrie de masse, cela permet de ne pas surcharger le spectromètre de masse. Les peptides sont d’abord identifiés par un spectre MS, puis ils sont fragmentés un par un, pour mieux les identifier. Généralement le spectromètre de masse scanne un spectre MS pour voir tous les peptides présents à un moment t dans le flux de la chromatographie, ensuite il sélectionne N ions peptidiques et les fragmente un par un. Cette méthode est appelée TopN, dont N représente le nombre de spectre MS/MS effectué après un scan MS. Il faut noter que le nombre N est dépendant à la vitesse de scan du spectromètre de masse, si N est élevé (par exemple Top20) et la vitesse de scan n’est pas suffisante, on risque de ne pas attraper les derniers peptides, car pendant que le spectromètre de masse effectue les spectres MS/MS pour les premières peptides, le flux de la chromatographie continue et les derniers peptides auraient déjà tous partis. Les peptides sont identifiés par un logiciel (Protéome discoverer, Maxquant…), à partir de ces peptides identifiés, on peut identifier la ou les protéines, il faut noter qu’il est possible d’identifier une protéine par un seul peptide si c’est un peptide unique.

bottom up protéomique

Figure 2 : la stratégie bottom-up

La préparation des échantillons

gel polyaccrylamide

Figure 3 : La migration de protéine sur gel polyacrylamide

Les protéines peuvent être digérées directement en solution (protocole de digestion en solution) puis analysées par LC-MS, mais il est préférable de les passer sur un gel polyacrylamide (Figure 3) par électrophorèse (protocole de digestion en gel). Les avantages de cette méthode sont la purification de la solution contenante le mélange de protéine et la séparation des protéines pour que le mélange soit moins complexe et le spectromètre de masse peut analyser tous les peptides. Après la migration sur gel, les protéines sont révélées par plusieurs méthodes, soit par coloration à l’argent, ou au Bleu de Coomassie, … Soit par fluorescent… Ensuite le gel est découpé (un spot de dimension 1mmx1mm) à l’endroit où les protéines intéressantes se trouvent. Les protéines se trouvent dans le ou les spots sont digérées en gel suivant le protocole que vous pouvez télécharger ici. Une fois les protéines sont digérées, les peptides peuvent rester à température ambiante plusieurs jours, pour une conservation plus longue, il est recommandé de les mettre dans un congélateur.

L’analyse LC-MS/MS

Suivant la complexité de l’échantillon, on peut prélever une partie ou la totalité de l’échantillon, généralement une analyse LC-MS/MS standard dure environ 1 heure, mais si on veut une analyse plus poussée, la durée d’analyse peut être beaucoup plus longue afin de mieux séparer les peptides. Dans ce cas, le pourcentage du solvant apolaire tel que l’acétonitrile par rapport au solvant polaire augmente très lentement. Même si la durée d’analyse est très longue, il est difficile de séparer tous les peptides, car dans un échantillon biologique, il peut y a voir des dizaines de milliers de peptides. Les pics chromatographiques des peptides sont souvent chevauchés, par conséquent, au moment où le spectromètre de masse effectue un spectre de masse MS, car il peut y avoir des centaines d’ions peptidiques présents. Pour mieux analyser les peptides, avant de réaliser une analyse LC-MS/MS, on prévoit un programme afin de traiter les ions suivant leur nature (état de charge, le m/z, l’intensité, type de modification…) ce programme est appelé data-dependent que vous pouvez télécharger ici, ce programme est utilisé pour un Orbitrap couplé avec une nano-LC (Dionex U3000).

La modification post-traductionnelle 

La modification post-traductionnelle en protéomioque est importante pour la régulation des processus cellulaires, ainsi que la localisation cellulaire des protéines, la régulation de la fonction des protéines et des formations du complexe. La modification post-traductionnelle des protéines rend la protéomique plus difficile que la génomique. Les acides aminés peuvent également être modifiés par des centaines de modifications qui changent leur poids moléculaire et la propriété physico-chimie. Les modifications naturelles les plus communes sont le clivage, l’acétylation, la formylation, l’oxydation de la méthionine, la phosphorylation, ubiquitination, et la glycosylation (en général, c’est un ensemble de modifications plutôt qu’une seule modification). En outre, d’autres modifications non post-traductionnelles, telles que la réticulation, des marqueurs fluorescents et des marqueurs de spin, peuvent être utilisées pour sonder la structure et la fonction des protéines. Pour chaque modification, il est parfois nécessaire de prévoir un programme spécifique pour des analyses LC-MS/MS comme la phosphorylation, dans laquelle, les peptides phosphorylés perdent facilement le groupement phosphate (H2PO3), qui fait chuter une masse de 98 Da, par conséquent l’ion fils n’est plus activé par une activation résonnante comme dans les analyseurs ion trap, ou le FT-ICR. Dans ce cas il faut prévoir une deuxième activation (multi-activation) pour l’ion précurseur ayant perdu une masse de 98 Da.

Pour la recherche des modifications en protéomique, l’étape d’interrogation des résultats est très importante, on doit tenir compte la masse de modifications post-traductionnelles, mais aussi la masse des molécules greffées sur le peptide pendant le processus de digestion, comme la carbamidométhyle qui est une dérivé de l’iodoacétamide. Cette molécule est utilisée pour bloquer le pont disulfure, dont tous les peptides ayant l’acide aminé cystéine contiennent aussi la carbamidométhyle qui fait un décalage de masse de 57 Da. Mais l’iodoacétamide est souvent en excès, il faut prévoir aussi une modification dynamique pour les autres acides aminés comme acide aspartique (D), Acide glutamique (E), Sérine (S), Histidine (H), Thréonine (T) et Tyrosine (Y).

La quantification

La quantification en protéomique est divisée en deux partie, la première avec le marquage d’isotope stable. Les avantages de ces méthodes sont la précision, la quantification est réalisée en une seule analyse LC-MS/MS. Mais ces méthodes demandent une préparation longue et délicate, le coût est élevé, et il est difficile de comparer plusieurs échantillons en même temps. La deuxième méthode sans marquage qu’on appelle habituellement « label-free »[5] qui ne nécessite pas une préparation particulière de l’échantillon, et on peut comparer un nombre illimité de l’échantillon. Mais cette méthode est moins précise.

La quantification par marquage d’isotope

La quantification protéomique par marquage d’isotope stable consiste à comparer les protéines ou les peptides qui ont exactement la même séquence, seules leurs masses sont différentes car l’une des protéines ou peptides possède plus d’isotope plus lourd comme 15N ou 13C. Les protéines ou peptides à comparer ont les mêmes propriétés physicochimiques, par conséquent ils passeront la colonne et seront ionisés de la même façon. Il existe plusieurs méthodes de quantification par marquage d’isotope, on peut citer ici les trois méthodes les plus connues qui sont SILAC (Stable Isotope Labeling with Amin o acids in Cell culture), ITRAQ (Isotope Tags for Relative and Absolute Quantification) et ICAT (Isotope-Coded Affinity Tag).

SILAC

Deux populations de cellules sont cultivées en milieu SILAC. L’une des populations cellulaires est alimentée avec un milieu de croissance contenant des acides aminés normaux (légère). En revanche, la deuxième population est alimentée avec un milieu de croissance contenant des acides aminés marqués avec des isotopes lourds stables (non radioactifs). Par exemple, le milieu peut contenir de l’arginine (13C) marquée sur les six atomes de carbone à la place des carbones normaux (12C). Lorsque les cellules se développent dans ce milieu, elles intègrent l’arginine lourde dans l’ensemble de leurs protéines. Par la suite, tous les peptides contenant une seule arginine lourde ont une différence de masse de 6 Da par rapport leurs homologues contenant de l’arginine légère. Alternativement, le marquage avec 13C ou 15N peut être utilisé. L’intérêt de cette technique  est que les protéines des deux populations de cellules peuvent être combinées et analysées conjointement par spectrométrie de masse. Des paires de peptides chimiquement et physiquement identiques mais de compositions en isotopes stables différentes peuvent être différenciées dans un spectromètre de masse en raison de leur différence de masse. Le rapport des intensités des pics dans le spectre de masse pour ces paires de peptides reflète le rapport d’abondance pour les deux protéines. La méthode SILAC a l’avantage d’être précise, mais elle a des inconvénients comme une préparation très longue et couteuse, il est difficile de comparer plusieurs échantillons par SILAC. Un autre inconvénient c’est le rapport de deux échantillons est limité, en effet si l’un des peptides est beaucoup plus élevé par rapport à l’autre, sa quantité peut amener à surcharger l’analyseur produisant l’effet charge espace. De plus dans les analyseurs du type Orbitrap la durée d’enregistrement d’une population d’ions en quantité plus faible est plus courte, parce que les ions se mettent en mouvement incohérence plus rapidement. Par conséquent, l’intensité de ces ions est plus faible qu’il devrait être.

ITRAQ

Le marquage isotopique en protéomique iTRAQ[6] (Isobaric tag for relative and absolute quantitation) permet d’identifier et de quantifier des protéines in vitro dans quatre  échantillons  différents  par  MS/MS. L’avantage de cette technique par rapport à SILAC c’est qu’il ne nécessite pas de cultiver les cellules dans des milieux différents, et on peut comparer jusqu’à 4 échantillons en une seule analyse LC-MS/MS.  Les peptides  sont  marqués  sur  leur  groupements amines par les réactifs iTRAQ qui sont constitués de trois parties.

– Le reporteur chargé avec des masses allant de 114 à 117 (Figure 4 et 5)

– La balance neutre avec des masses allant de 28 à 31

– Le groupement réactif peptidique.

réactif itraq

Figure 4 : Structure du réactif ITRAQ, la masse totale du groupe reporteur et la balance est toujours 145 Da.

processus itraq

Figure 5 : Principe d’ITRAQ, les peptides sont marqués avec des molécules de même propriété physico-chimique, la différence est la position et le nombre des isotopes 13C, 18O…

La combinaison entre le reporteur et la balance doit faire 145, et la propriété physico-chimique est exactement la même, parce qu’ils sont de la même molécule, la différence est le nombre d’isotopes et leur position, l’identification en MS/MS se fera grâce au reporteur qui est marqué. Dans cette  méthode,  les  protéines  sont  réduites, alkylées et digérées par  la  trypsine  ; après  le  marquage  de  chaque  échantillon  par  un  des  quatre  réactifs  iTRAQ, les 4  échantillons  sont  mélangés de la même façon. Les peptides sont séparés par la chromatographie puis analysés en MS/MS.

ICAT

La quantification protéomique par l’ICAT[7] (Isotope-Coded Affinity Tag) consiste à marquer les protéines in vitro puis, les protéines sont digérées et analysées par la spectrométrie de masse. Le réactif ICAT est greffé aux groupements thiols des résidus cystéines, c’est une alkylation par la fonction iodoacétamide. Ce réactif est constitué de trois parties.

  • L’iodoacétamide : se lie au groupement SH- des cystéines
  • Le groupement Ethylène glycol qui existe sous deux formes stables (forme lourde : 9x13C et la forme légère : 9 x12C)
  • La biotine permet d’isoler les peptides marqués par son affinité à la streptavidine

Le réactif ICAT est greffé sur les résidus Cystéines des protéines de deux échantillons différents : échantillon 1 (lourd), échantillon 2 (léger) ; après mélange des deux échantillons, les protéines sont digérées par la trypsine. Le tag biotine est coupé en milieu acide et les peptides sont identifiés et quantifiés par spectrométrie de masse.

La quantification Label free

La quantification label free (sans marquage) [8] en protéomique est une méthode quantitative la moins couteuse et la moins contraignante. Elle consiste à comparer la quantité relative d’un peptide dans un échantillon par rapport à l’autre. Théoriquement, la méthode est fiable, car pour un peptide Y, dans un échantillon A, son intensité reflète sa quantité. Pour ce même peptide mais dans l’échantillon B par une autre analyse (généralement l’échantillon B est analysé juste après l’échantillon A), tous les paramètres de l’appareil ne devraient pas changer, le peptide Y est subit les mêmes traitements comme dans l’échantillon A et son intensité reflète sa quantité dans l’échantillon B. En comparant les intensités du peptide Y dans les deux spectres de masse, on trouvera leurs quantités relatives (Figure 6).

label free

Figure 6 : La superposition de chromatographie de BSA en différente quantité, en noir 10ng, et en jaune 5ng.

En pratique, la méthode label free en protéomique est moins précise pour plusieurs raisons, d’abord si la quantité relative du peptide est trop faible, l’intensité de l’ion peptidique reflète moins bien sa quantité dans l’échantillon. La composition de l’échantillon peut influencer la réponse du peptide, par exemple, si la composition de l’échantillon A est trop riche, les autres ions peptidiques, ainsi que les contaminants peut masquer ou diminuer l’intensité de l’ion peptidique à comparer, tandis que l’échantillon B est pauvre en contaminant qui n’influence pas le signal du peptide. De plus, un peptide peut être modifié (phosphorylé, carbamidométhylé, oxydé…) ou non, même si toutes les formes de peptide sont identifiés, mais les logiciels ne savent pas encore sommer tous les surfaces chromatographiques appartenant au peptide sous tous les formes. Les paramètres de l’appareil peuvent aussi influencer l’intensité de l’ion, surtout si on compare les échantillons qui sont analysés, mais entre deux analyses il y a un changement pour l’appareil comme par exemple une calibration, ou ils sont distancés par le temps (d’un jour ou une semaine…à l’autre). Pour comparer la quantité relative des protéines qui sont la somme des mêmes peptides d’un échantillon à l’autre, il suffit de sommer toutes les surfaces chromatographiques des peptides appartenant à la protéine pour comparer, mais, si la quantité de la protéine dans un échantillon est trop faible, on ne trouve que par exemple 3 peptides et que dans l’autre échantillon avec une meilleure quantité on trouve plus de peptide (5 peptides par exemple), cela peut aussi perturber le calcul de la quantité relative. La méthode label free est une aide pour avoir une idée de la quantité relative des peptides ou protéine, plus la quantité de protéines est bonne, meilleure la précision. Si la quantité des protéines à comparer est trop faible, la méthode est moins fiable, et à utiliser avec précaution.

Annexe

La rupture peptique et la nomenclature

Un ion peptidique, une fois activé, il acquit l’énergie interne. Si son énergie interne est suffisamment grande, on observe des ruptures de liaison covalente donc trois ruptures de liaison les plus observées (Figure A1) qui donnent des séries d’ions an, bn, cn du coté N terminale et xm-n, ym-n, zm-n du coté C terminale, il faut noter que les séries d’ions bn et ym-n sont les plus observés par des méthodes d’activation classique comme la collision. Grâce à ces séries d’ions on peut reconstituer la séquence peptidique. Si on a une série d’ions complète, il est facile de reconstituer la séquence peptidique où la différence de masse entre deux ions adjacents donne l’identification de l’acide aminé entre ces deux ions. Mais en général, on a souvent des séries d’ions incomplètes, dans ce cas, il faut appuyer sur d’autres séries pour retrouver la séquence complète (Figure A2).

rupture séquence peptidique

Figure A1 : Les ruptures de liaison covalente d’un ion peptidique

spectre msms peptide

Figure A2 : Spectre MS/MS d’un ion peptidique.

[1]review article Mass spectrometry-based proteomics  Ruedi Aebersold & Matthias Mann Nature 422, 198-207 (13 March 2003)

[2] Electron transfer dissociation mass spectrometry in proteomics. Kim MS1, Pandey A. Proteomics. 2012 Feb;12(4-5):530-42

[3] Stable isotope labeling tandem mass spectrometry (SILT) to quantify protein production and clearance rates Randall J. Bateman, Ling Y. Munsell, Xianghong Chen, David M. Holtzman, and Kevin E. Yarasheski J Am Soc Mass Spectrom. 2007 Jun; 18(6): 997–1006.

[4] Protein Identification Using Top-Down Spectra Pavel A. Pevzner et al Mol Cell Proteomics. 2012 Jun; 11(6): M111.008524. doi:  10.1074/mcp.M111.008524

[5] Label-free quantification in clinical proteomics Dominik A. Megger , Thilo Bracht, Helmut E. Meyer, Barbara Sitek Biochimica et Biophysica Acta (BBA) – Proteins and Proteomics Volume 1834, Issue 8, August 2013, Pages 1581–1590

[6] Multiplexed protein quantitation in Saccharomyces cerevisiae using amine-reactive isobaric tagging reagents. Ross PL1, Huang YN, Marchese JN, Williamson B, Parker K, Hattan S, Khainovski N, Pillai S, Dey S, Daniels S, Purkayastha S, Juhasz P, Martin S, Bartlet-Jones M, He F, Jacobson A, Pappin DJ. Mol Cell Proteomics. 2004 Dec;3(12):1154-69. Epub 2004 Sep 22.

[7] A quantitative proteomic approach using two-dimensional gel electrophoresis and isotope-coded affinity tag labeling for studying human 20S proteasome heterogeneity. Froment C1, Uttenweiler-Joseph S, Bousquet-Dubouch MP, Matondo M, Borges JP, Esmenjaud C, Lacroix C, Monsarrat B, Burlet-Schiltz O. Proteomics. 2005 Jun;5(9):2351-63.

[8] An Assessment of Software Solutions for the Analysis of Mass Spectrometry Based Quantitative Proteomics Data Lukas N. Mueller, Mi-Youn Brusniak, D. R. Mani§ and Ruedi Aebersold J. Proteome Res., 2008, 7 (01), pp 51–61

Share This Post

Leave a Reply