phylogenetics

Par mkurman · zorai

npx skills add https://github.com/mkurman/zorai --skill phylogenetics

name: phylogenetics description: Construire et analyser des arbres phylogénétiques avec MAFFT (alignement multiple), IQ-TREE 2 (maximum de vraisemblance) et FastTree (NJ/ML rapide). Visualiser avec ETE3 ou FigTree. Pour l'analyse évolutive, la génomique microbienne, la phylodynamique virale, l'analyse de familles protéiques et les études d'horloge moléculaire. license: Unknown tags: [scientific-skills, phylogenetics, cheminformatics, machine-learning, bioinformatics] metadata: skill-author: Kuan-lin Huang ----|-------------|---------| | GTR+G4 | General Time Reversible + Gamma | Modèle ADN le plus flexible | | HKY+G4 | Hasegawa-Kishino-Yano + Gamma | Modèle à deux taux (courant) | | TrN+G4 | Tamura-Nei | Transitions inégales | | JC | Jukes-Cantor | Le plus simple ; tous les taux égaux |

Modèles protéiques

Modèle Description Cas d'usage
LG+G4 Le-Gascuel + Gamma Meilleur modèle de protéine en moyenne
WAG+G4 Whelan-Goldman Largement utilisé
JTT+G4 Jones-Taylor-Thornton Modèle classique
Q.pfam+G4 Entraîné sur pfam Pour les familles protéiques similaires à Pfam
Q.bird+G4 Spécifique aux oiseaux Protéines de vertébrés

Conseil : Utilisez -m TEST pour laisser IQ-TREE sélectionner automatiquement le meilleur modèle.

Bonnes pratiques

  • Qualité d'alignement d'abord : Un mauvais alignement → des arbres peu fiables ; vérifiez l'alignement manuellement
  • Utilisez linsi pour les petits (<200 séq), fftns ou auto pour les gros alignements
  • Sélection du modèle : Utilisez toujours -m TEST avec IQ-TREE sauf si vous avez une raison spécifique
  • Bootstrap : Utilisez ≥1000 ultra-rapides bootstraps (-B 1000) pour le support des branches
  • Enracinez l'arbre : Les arbres non enracinés peuvent être trompeurs ; utilisez un groupe externe ou un enracinement au point milieu
  • FastTree pour >5000 séquences : IQ-TREE devient lent ; FastTree est 10–100× plus rapide
  • Taillez les longs alignements : TrimAl supprime les colonnes peu fiables ; améliore la précision de l'arbre
  • Vérifiez la recombinaison dans les séquences virales/bactériennes avant de construire des arbres (RDP4, GARD)

Ressources supplémentaires

Skills similaires