name: phylogenetics
description: Construire et analyser des arbres phylogénétiques avec MAFFT (alignement multiple), IQ-TREE 2 (maximum de vraisemblance) et FastTree (NJ/ML rapide). Visualiser avec ETE3 ou FigTree. Pour l'analyse évolutive, la génomique microbienne, la phylodynamique virale, l'analyse de familles protéiques et les études d'horloge moléculaire.
license: Unknown
tags: [scientific-skills, phylogenetics, cheminformatics, machine-learning, bioinformatics]
metadata:
skill-author: Kuan-lin Huang
----|-------------|---------|
| GTR+G4 | General Time Reversible + Gamma | Modèle ADN le plus flexible |
| HKY+G4 | Hasegawa-Kishino-Yano + Gamma | Modèle à deux taux (courant) |
| TrN+G4 | Tamura-Nei | Transitions inégales |
| JC | Jukes-Cantor | Le plus simple ; tous les taux égaux |
Modèles protéiques
| Modèle | Description | Cas d'usage |
|---|---|---|
LG+G4 |
Le-Gascuel + Gamma | Meilleur modèle de protéine en moyenne |
WAG+G4 |
Whelan-Goldman | Largement utilisé |
JTT+G4 |
Jones-Taylor-Thornton | Modèle classique |
Q.pfam+G4 |
Entraîné sur pfam | Pour les familles protéiques similaires à Pfam |
Q.bird+G4 |
Spécifique aux oiseaux | Protéines de vertébrés |
Conseil : Utilisez -m TEST pour laisser IQ-TREE sélectionner automatiquement le meilleur modèle.
Bonnes pratiques
- Qualité d'alignement d'abord : Un mauvais alignement → des arbres peu fiables ; vérifiez l'alignement manuellement
- Utilisez
linsipour les petits (<200 séq),fftnsouautopour les gros alignements - Sélection du modèle : Utilisez toujours
-m TESTavec IQ-TREE sauf si vous avez une raison spécifique - Bootstrap : Utilisez ≥1000 ultra-rapides bootstraps (
-B 1000) pour le support des branches - Enracinez l'arbre : Les arbres non enracinés peuvent être trompeurs ; utilisez un groupe externe ou un enracinement au point milieu
- FastTree pour >5000 séquences : IQ-TREE devient lent ; FastTree est 10–100× plus rapide
- Taillez les longs alignements : TrimAl supprime les colonnes peu fiables ; améliore la précision de l'arbre
- Vérifiez la recombinaison dans les séquences virales/bactériennes avant de construire des arbres (
RDP4,GARD)
Ressources supplémentaires
- MAFFT : https://mafft.cbrc.jp/alignment/software/
- IQ-TREE 2 : http://www.iqtree.org/ | Tutoriel : https://www.iqtree.org/workshop/molevol2022
- FastTree : http://www.microbesonline.org/fasttree/
- ETE3 : http://etetoolkit.org/
- FigTree (visualisation GUI) : https://tree.bio.ed.ac.uk/software/figtree/
- iTOL (visualisation web) : https://itol.embl.de/
- MUSCLE (aligneur alternatif) : https://www.drive5.com/muscle/
- TrimAl (élagage d'alignement) : https://vicfero.github.io/trimal/