Blog-like notes

Conventions d’écriture des gènes

Ceci est une compilation de quelques-unes des conventions d’écriture des gènes en vigueur chez les biologistes. Ces conventions s’appliquent généralement par espèce (ou taxon supérieur) plutôt que par discipline.

Dans le tableau ci-dessous, chaque convention est exemplifiée en l’appliquant en gène codant la protéine CenH3.

Espèce Nom du gène Symbole du gène Nom de la protéine Source
Mouches (D. melanogaster) Centromere identifier1 Cid Centromere identifier, CID FlyBase
Poisson-zèbre (D. rerio) centromere protein A cenpa Cenpa Zebrafish Model Organism Database
Souris (M. musculus) centromere protein A Cenpa2 CENPA Mouse Genome Informatics
Homme (H. sapiens) centromere protein A CENPA CENPA HUGO Gene Nomenclature Committee
Poulet (G. gallus) centromere protein A CENPA CENPA Chicken Gene Nomenclature Committee
Grenouilles (Xenopus sp.) centromere protein a cenpa cenpa XenBase
Maïs (Z. mays) centromeric histone H3 cenH33 Maize Genetics and Genomics Database
Levure bourgeonnante (S. cerevisiae) CSE44 Cse4p Saccharomyces Genome Database
Levure à fission (S. pombe) cnp1 Cnp1p 5 Forsburg Lab
Arabette des dames (A. thaliana) HTR12 HTR12 HTR12 University of British Columbia

Une généralité peut être déduite de ce tableau : dans tous les cas de figure, le nom et le symbole du gène s’écrivent en italique, tandis que le nom de la protéine s’écrit en roman.

La capitalisation est en revanche très variable. Sur ce point, les conventions se répartissent en deux catégories : celles imposant une capitalisation constante et indépendante du gène considéré (par exemple, la convention pour les gènes humains), et celles dont la capitalisation dépend des caractéristiques du gène (dominance notamment).

  1. Le nom prend une capitale initiale s’il vient d’un phénotype mutant dominant ou représente la fonction du gène sauvage, la même règle s’applique au symbole. L’usage admet des exceptions.
  2. Le symbole prend normalement la capitale initiale, sauf si le gène n’est connu que par un phénotype mutant récessif.
  3. Le symbole est normalement entièrement en bas de casse ; le symbole d’un allèle mutant dominant prend la capitale initiale.
  4. Le nom s’écrit entièrement en capitales pour les gènes sauvages ou les mutants dominants, entièrement en bas-de-casse pour les mutants récessifs.
  5. Le suffice « p » est optionnel.