optimize-for-gpu

Par mkurman · zorai

npx skills add https://github.com/mkurman/zorai --skill optimize-for-gpu

name: optimize-for-gpu description: "Accélérer le code Python sur GPU avec CuPy, Numba CUDA, Warp, cuDF, cuML, cuGraph, KvikIO, cuCIM, cuxfilter, cuVS, cuSpatial et RAFT. À utiliser chaque fois que l'utilisateur mentionne l'accélération GPU/CUDA/NVIDIA, ou veut accélérer les workloads NumPy, pandas, scikit-learn, scikit-image, NetworkX, GeoPandas ou Faiss. Couvre la simulation physique, le rendu différentiable, le lancer de rayon sur maillage, les systèmes de particules (DEM/SPH/fluides), la recherche vectorielle/similarité, l'IO fichier GPUDirect Storage, les tableaux de bord interactifs, l'analyse géospatiale, l'imagerie médicale et les solveurs d'valeurs propres creux. À utiliser aussi quand vous voyez du code Python lié au CPU (boucles, grands tableaux, pipelines ML, analyse de graphes, traitement d'image) qui bénéficierait d'une accélération GPU, même si ce n'est pas explicitement demandé." tags: [gpu-acceleration, cupy-numba-cuda, rapids-ecosystem, gpu-ml-pipelines, optimize-for-gpu] metadata: author: K-Dense, Inc. ---|-------------| | references/cupy.md | L'utilisateur a du code NumPy/SciPy, ou a besoin d'opérations sur tableau sur GPU | | references/numba.md | L'utilisateur a besoin de kernels CUDA personnalisés, de contrôle GPU fin ou de ufuncs GPU | | references/cudf.md | L'utilisateur a du code pandas, ou a besoin d'opérations sur dataframe sur GPU | | references/cuml.md | L'utilisateur a du code scikit-learn, ou a besoin d'entraînement/inférence/prétraitement ML sur GPU | | references/cugraph.md | L'utilisateur a du code NetworkX, ou a besoin d'analyse de graphes sur GPU | | references/warp.md | L'utilisateur a besoin de simulation GPU, calcul spatial, requêtes maillage/volume, programmation différentiable ou robotique | | references/kvikio.md | L'utilisateur a besoin d'IO fichier haute performance vers/depuis GPU, GPUDirect Storage, lecture S3/HTTP vers GPU ou Zarr sur GPU | | references/cuxfilter.md | L'utilisateur veut des tableaux de bord interactifs accélérés sur GPU, filtrage croisé ou visualisation EDA | | references/cucim.md | L'utilisateur a du code scikit-image, ou a besoin de traitement d'image, pathologie numérique ou lecture WSI sur GPU | | references/cuvs.md | L'utilisateur a besoin de recherche vectorielle, plus proches voisins, recherche de similarité ou retrieval RAG sur GPU | | references/cuspatial.md | L'utilisateur a du code GeoPandas/shapely, ou a besoin de jointures spatiales, calculs de distance ou analyse de trajectoires sur GPU | | references/raft.md | L'utilisateur a besoin de solveurs d'valeurs propres creux, gestion de mémoire device ou primitives multi-GPU |

Consultez la référence spécifique avant d'écrire du code — elles contiennent des patterns d'API détaillés, des techniques d'optimisation et des pièges spécifiques à chaque bibliothèque.

Skills similaires