Cartographie de la diversité des trypanosomes africains à l'aide de la protéomique spatiale à haute résolution
MaisonMaison > Nouvelles > Cartographie de la diversité des trypanosomes africains à l'aide de la protéomique spatiale à haute résolution

Cartographie de la diversité des trypanosomes africains à l'aide de la protéomique spatiale à haute résolution

Jul 01, 2023

Nature Communications volume 14, Numéro d'article : 4401 (2023) Citer cet article

2065 accès

26 Altmétrique

Détails des métriques

Les trypanosomes africains sont dix parasites eucaryotes qui imposent un fardeau important en matière de maladies humaines et vétérinaires en Afrique subsaharienne. La diversité entre les espèces et les étapes du cycle de vie est concomitante à des tropismes distincts en matière d'hôtes et de tissus au sein de ce groupe. Ici, les protéomes spatiaux de deux espèces de trypanosomes africains, Trypanosoma brucei et Trypanosoma congolense, sont cartographiés à travers deux stades de vie. Les quatre ensembles de données résultants fournissent la preuve de l’expression d’environ 5 500 protéines par type cellulaire. Plus de 2 500 protéines par type cellulaire sont classées dans des compartiments subcellulaires spécifiques, fournissant ainsi quatre protéomes spatiaux complets. L'analyse comparative révèle les principales voies d'adaptation des parasites à différentes niches biologiques et donne un aperçu des bases moléculaires de la diversité au sein et entre ces espèces pathogènes.

Les kinétoplastidés sont des eucaryotes unicellulaires flagellés qui comprennent d'importants parasites des humains, du bétail et des espèces de plantes cultivées et sont généralement transmis par des invertébrés. Dans cette classe se trouvent les trypanosomes africains, qui infectent collectivement une gamme de mammifères et provoquent la trypanosomiase africaine humaine et animale. La majorité des recherches caractérisant les trypanosomes africains ont été réalisées avec Trypanosoma brucei ; en partie parce que deux sous-espèces sont infectieuses pour l'homme, mais aussi à cause de la relative facilité de la culture in vitro et de la manipulation génétique de cette espèce. T. brucei a été étudié en tant que parasite, mais également en tant qu'organisme modèle divergent, présentant des caractéristiques biologiques eucaryotes d'intérêt à la fois bien conservées et non canoniques. Les espèces apparentées, Trypanosoma congolense et Trypanosoma vivax, sont les principaux agents responsables de la trypanosomiase bovine. Malgré leur importance vétérinaire, beaucoup moins de recherches ont été menées sur ces espèces1. Différentes espèces de trypanosomes africains ont des caractéristiques cellulaires et infectieuses distinctes, mais la base moléculaire d’une grande partie de celles-ci est inconnue2,3,4,5.

Les trypanosomes africains sont exposés à une gamme d'environnements externes différents au cours de leur cycle de vie et les parasites font la différence entre une série de stades de vie qui sont chacun adaptés pour la croissance et la survie dans leur environnement actuel ou pré-adaptés pour le prochain6. Chaque étape de la vie est basée sur une architecture cellulaire à noyau polaire commune, hautement organisée, avec un seul flagelle et une collection d'organites à copie unique et multiple. Les tailles relatives, les positions et la teneur en protéines des organites varient selon les stades de la vie. Comme dans toutes les cellules eucaryotes, la localisation subcellulaire d'une protéine dans les trypanosomes définit non seulement l'environnement biochimique de cette protéine, mais également le potentiel d'interactions moléculaires. La fonction des protéines est donc intimement liée à leur localisation.

Il existe deux approches principales pour déterminer la localisation des protéines dans une cellule : la microscopie et la protéomique. La microscopie permet une résolution précise de localisations spécifiques ; peut détecter une variation entre les cellules au sein d’un échantillon ; et peut facilement identifier des protéines localisées sur plusieurs sites, bien qu'elles puissent souffrir d'artefacts de marquage ou d'expression inappropriée. En raison de la nécessité d’obtenir un anticorps spécifique d’une protéine ou de manipuler génétiquement la protéine d’intérêt, la microscopie est généralement limitée à un petit nombre de protéines par étude. Les analyses au microscope à l’échelle du protéome constituent des ensembles de données riches et précieux, mais des efforts non triviaux et chronophages qui sont jusqu’à présent limités à quelques espèces : Saccharomyces cerevisiae7, Humains8 et T. brucei9.

La protéomique spatiale, basée sur l'isolement ou l'enrichissement d'organites suivi par spectrométrie de masse (MS), permet l'identification de protéines enrichies dans des emplacements subcellulaires spécifiques - généralement sans nécessiter de modification génétique. Ces méthodes se sont révélées très efficaces pour révéler les protéines résidant dans les organites ou les structures des trypanosomatides, telles que les mitochondries, les glycosomes, le flagelle et le noyau 10,11,12,13,14. Les méthodes basées sur la MS à haut débit peuvent désormais être utilisées pour localiser systématiquement des milliers de protéines dans une seule expérience pour plusieurs conditions, états ou types de cellules15,16,17,18,19,20,21,22. De telles méthodes incluent hyperLOPIT (localisation hyperplexée de protéines organelles par marquage isotopique)16,23. Il s’agit d’une approche protéomique quantitative grâce à laquelle une carte spatiale du protéome peut être résolue sans avoir besoin d’isoler des organites individuels grâce à l’application d’algorithmes d’apprentissage automatique24,25,26,27. HyperLOPIT et les méthodologies LOPIT associées ont été utilisées pour générer des cartes spatiales des types de cellules de mammifères, d'insectes, de levures, de plantes et de protozoaires16,21,28,29,30,31,32.

 0.85 for all pairwise comparisons), demonstrating the reproducibility between experimental iterations (Supplementary Fig. 7 and Supplementary Data 8)47. Next, to define the spatial proteomes for each cell-type, final classifications were generated by performing TAGM-MAP analysis on each combined 33-plex dataset (Fig. 1A and Supplementary Data 9). Using this approach, 2679 and 2795 proteins were classified in T. brucei BSF and PCF respectively (Fig. 3A, B and Supplementary Data 9). In T. congolense, 2507 and 2504 proteins were classified in the BSF and PCF respectively (Fig. 3A, B and Supplementary Data 9). These four spatial proteomes provide a comprehensive localisation dataset for two closely related species, across two life-stages each, which has not been achieved on this scale before in any parasitic organism./p> 1e3; Average Reporter S/N > = 5; Isolation Interference <= 50%32. PSMs matching to contaminants (cRAP and cRFP) and those with missing values in any of the 11-plex TMT quantitation channels were removed. PSM intensities were sum-normalised then median-aggregated to the protein level. Each 11-plex TMT experiment was then concatenated to form a 33-plex dataset and proteins with missing values in any of the experiments were removed35./p>0.999 and separately an outlier probability <5 E-5. Proteins that did not meet the thresholding criteria were designated as ‘unknown’. To assess the reproducibility of classifications produced by individual experimental iterations, TAGM-MAP was also performed with the default settings on each 11-plex dataset separately. Classifications were retained if they exceeded a localisation probability >0.99. To assess the variability in classification between the experiments, datasets were compared pairwise using the adjusted Rand index which assigns a score of 0 if consistency is what is expected at random and 1 for perfect consistency using the R package mmclust (v1.0.1)47. To avoid inflating or deflating the ARI due to an excess of “unknown” allocations these were filtered before comparison. Analysis using TAGM-MCMC was then used to provide insight into proteins that were unknown according to TAGM-MAP where it could be due to dynamic protein localisation. This model was implemented using Markov-chain Monte-Carlo. The collapsed Gibbs sampler was run in parallel for 9 chains (T. brucei) and 4 chains (T. congolense) with each chain run for 10,000 iterations. Convergence was assessed using the Gelman-Rubin’s diagnostic and all Markov chains were retained for T. congolense; whilst for T. brucei the best two chains were retained. No thresholding criteria was applied with protein allocations and compartment joint probabilities are reported. Joint probabilities were used to evaluate proteins that may exhibit localisation to more than one compartment./p>=2X the number of genes versus the counterpart in T. brucei or T. congolense accordingly. Cases of two-one gene count orthogroups in T. brucei-T. congolense where two fasta header identifiers matched to a single gene identifier were removed from this set in T. brucei./p>