Traduction en cours…
cutile-autotuning
Par nvidia · skills
À utiliser lors de l'ajout, la modification, l'optimisation ou le débogage de code d'autotuning CuTile. Signaux déclencheurs : `exhaustive_search` / `replace_hints` / `hints_fn` / `cuda.tile.tune` dans le code, `autotune` dans les noms de fichiers, ou problèmes de correction/performance dans des kernels CuTile autotuned. Couvre : le pattern tune-once/cache/launch, les configurations par architecture (sm80–sm120), la conception de l'espace de paramètres (tailles de tuiles, occupancy, num_ctas), et 7 pièges courants avec leurs solutions.
npx skills add https://github.com/nvidia/skills --skill cutile-autotuning
Skills similaires
Ajouter l'autotuning aux kernels CuTile via recherche exhaustive avec cache et lancement optimisé.
Construire des applications LLM avec Claude via le SDK officiel adapté au langage.
Générer du code d'évaluation Python à partir de traces de production LLM Datadog.
Écrire, déboguer et optimiser des kernels GPU haute performance avec cuTile Python.
Écrire, déboguer et optimiser des kernels GPU haute performance avec cuTile Python.