Le génome humain bien plus souple qu'on ne le pensait !
Plus de neuf gènes sur dix seraient capables de produire des protéines distinctes aux rôles différents voire antagonistes. Leur expression varie d'un tissu à l'autre et même d'une personne à l'autre. Appelé épissage alternatif, ce phénomène était déjà connu, mais son ampleur inattendue vient d'être révélée par le travail de deux équipes américaines. Les généticiens ont décidément encore beaucoup de travail...
Qu'il est loin le temps où l'on enseignait qu'un gène contient, sous forme d'une suite ininterrompue de paires de bases, le code nécessaire à la fabrication d'une protéine et d'une seule. Ainsi, le code génétique apparaissait un peu comme une bande magnétique sur laquelle se succéderaient des morceaux de musique sagement rangés les uns derrière les autres. Des décennies de recherche génétique ont singulièrement compliqué le tableau, surtout par l'étude du génome des organismes à cellules (comme nous), encore appelés eucaryotes, alors que les premiers travaux avaient été réalisés sur des bactéries.
Le bel ordonnancement décrit dans les années 1960 à 1970 laisse la place à une complexité extrême, avec des gènes en morceaux, qui se dupliquent et se régulent mutuellement. Quant à l'idée qu'un gène représente le code nécessaire à la fabrication d'une seule protéine, elle s'est fissurée il y a déjà une dizaine d'années lorsque les généticiens ont repéré le déroutant phénomène de l'épissage alternatif.
Chez les eucaryotes, les gènes sont interrompus par d'étranges séquences, les introns, qui ne contiennent pas d'informations sur la protéine à fabriquer. Les parties codantes, appelées exons, doivent être raboutées au moment de la lecture du gène par un mécanisme dit d'épissage. Une longue molécule d'ARN messager vient alors copier l'intégralité du gène, sans tenir compte des introns.
Il est apparu que, durant cette opération, la copie produite n'était pas toujours la même. Il arrive en effet qu'un petit morceau de code, inclus dans les exons, ne soit pas copié sur l'ARN messager. La protéine résultante est donc différente. C'est l'épissage alternatif, un mécanisme sous le contrôle d'un ensemble de molécules appelé spliceosome (en anglais, splice siginfie épissage). Ces protéines sœurs, issues d'un même gène par des voies différentes, sont des isoformes.
L'ADN, une double hélice sur laquelle se succèdent les structures moléculaires appelées bases et dont il existe quatre formes : l'adénine, la thymine, la guanine et la cytosine (A, T, G, C). Appariées de façon complémentaire entre deux brins, elles forment des paires de bases (A-T et G-C) et leur succession forme le code génétique.
L'expression des gènes diffère selon le tissu
Les généticiens ont d'abord pensé que le phénomène était rare. L'idée était alors qu'il ne concernait que quelques pourcents des gènes. Une décennie plus tard, le consensus s'accordait plutôt autour de 50%. En 2003, une publication américaine poussait le curseur jusqu'à 74% après une étude chez l'être humain sur 10.000 gènes provenant de 52 tissus ou lignées cellulaires en culture.
C'est ce chiffre que viennent d'augmenter encore une fois deux équipes américaines, l'une du MIT (Massachusetts Institute of Technology, Cambridge, Etats-Unis), dirigée par Christopher Burge, et l'autre de l'université de Toronto (Canada), sous la direction de Benjamin Blencowe. Selon les articles publiés dans Nature et Nature Genetics, il faudrait faire notablement grimper cette estimation. L'équipe américaine affirme que nous en sommes à 94%. Le joli mécanisme découvert chez les bactéries, par lequel un gène d'un seul tenant donne à chaque lecture la même protéine, n'est donc plus, chez un mammifère comme l'être humain, qu'une exception marginale...
Pour parvenir à ce résultat, les chercheurs ont utilisé une enzyme capable de construire un brin d'ADN à partir d'un ARN messager. Appelée transcriptase inverse, une enzyme de ce genre effectue donc, comme son nom l'indique, une traduction en sens contraire au chemin normal. On peut donc grâce à elle reconstituer le gène tel qu'il a été lu et vérifier éventuellement quelles portions d'ADN ont été omises dans la transcription en ARN messager. On saura alors précisément quelle isoforme de la protéine allait être fabriquée.
Christopher Burge et ses collègues ont étudié dix tissus différents et cinq lignées cellulaires tumorales, issus de vingt individus. En tout, l'étude a porté sur plus de treize milliards de paires de bases, soit l'équivalent de quatre génomes humains complets. L'équipe canadienne de Benjamin Blencow, elle, s'est intéressée à six tissus, prélevés notamment dans le cerveau, le foie, les muscles et les poumons.
Les chercheurs ont montré que la nature des isoformes produites dépend fortement du tissu. Ainsi, un même gène ne donnera pas la même protéine selon qu'il est présent dans une cellule du cerveau ou d'un muscle. Les effets de deux isoformes peuvent être très différents, voire contraires comme le soulignent les auteurs américains. Dans un même tissu, les isoformes peuvent changer au fil du développement embryonnaire et de la progression de la différenciation des cellules. Enfin dans une tumeur cancéreuse, les isoformes peuvent aussi être différentes de celles des cellules du tissu originel.
C'est donc une ouverture énorme pour les généticiens, qui ont désormais devant eux un nouveau travail pour comprendre les mécanismes conduisant une cellule à produire telle ou telle isoforme. Manifestement, il ne suffit plus de dénicher le gène de ceci ou de cela pour comprendre l'origine d'un caractère particulier ou d'une maladie...