Traduction en cours…
trtllm-moe-develop
Par nvidia · skills
Examiner, concevoir et refactoriser le code PyTorch MoE de TensorRT-LLM pour l'adéquation architecturale, la qualité du code, la maintenabilité et la testabilité. À utiliser systématiquement pour toute modification, revue, refactorisation ou planification de conception touchant les modules MoE, notamment tensorrt_llm/_torch/modules/fused_moe, ConfigurableMoE, les backends MoE, MoEScheduler/moe_scheduler.py, l'exécution forward/le chunking, les stratégies de communication, EPLB, la quantification/gestion des poids, le routage, les factories, la documentation MoE ou les tests MoE. À utiliser également lorsque l'utilisateur demande si une conception MoE respecte l'architecture actuelle ou si une refactorisation MoE est raisonnable.
npx skills add https://github.com/nvidia/skills --skill trtllm-moe-develop
Skills similaires
Automatiser l'intégration de modèles HuggingFace dans AutoDeploy avec tests et rapport.
Générer du code d'évaluation Python à partir de traces de production LLM Datadog.
Construire des applications LLM avec Claude via le SDK officiel adapté au langage.
Consulter la documentation officielle OpenAI pour guider développeurs, migrations et sélection de modèles.
Créer et interroger un index full-text-search Pinecone avec l'API preview.