cutile-autotuning

Par nvidia · skills

À utiliser lors de l'ajout, la modification, l'optimisation ou le débogage de code d'autotuning CuTile. Signaux déclencheurs : `exhaustive_search` / `replace_hints` / `hints_fn` / `cuda.tile.tune` dans le code, `autotune` dans les noms de fichiers, ou problèmes de correction/performance dans des kernels CuTile autotuned. Couvre : le pattern tune-once/cache/launch, les configurations par architecture (sm80–sm120), la conception de l'espace de paramètres (tailles de tuiles, occupancy, num_ctas), et 7 pièges courants avec leurs solutions.

npx skills add https://github.com/nvidia/skills --skill cutile-autotuning

Traduction en cours…

Skills similaires