customize

Flux de déploiement guidé interactif pour les modèles Azure OpenAI avec contrôle total de la personnalisation. Sélection pas à pas de la version du modèle, du SKU (GlobalStandard/Standard/ProvisionedManaged), de la capacité, de la politique RAI (filtre de contenu) et des options avancées (quota dynamique, traitement prioritaire, spillover). À UTILISER POUR : déploiement personnalisé, personnaliser le déploiement d'un modèle, choisir la version, sélectionner le SKU, définir la capacité, configurer le filtre de contenu, politique RAI, options de déploiement, déploiement détaillé, déploiement avancé, déploiement PTU, débit provisionné. NE PAS UTILISER POUR : déploiement rapide vers la région optimale (utiliser le preset).

npx skills add https://github.com/microsoft/skills --skill customize

Personnaliser le déploiement du modèle

Workflow guidé interactif pour déployer des modèles Azure OpenAI avec contrôle total de la personnalisation sur la version, la SKU, la capacité, le filtrage du contenu et les options avancées.

Référence rapide

Propriété Description
Flow Déploiement guidé interactif étape par étape
Customization Version, SKU, Capacity, RAI Policy, Advanced Options
SKU Support GlobalStandard, Standard, ProvisionedManaged, DataZoneStandard
Best For Contrôle précis de la configuration du déploiement
Authentication Azure CLI (az login)
Tools Azure CLI, MCP tools (optional)

Quand utiliser cette skill

Utilisez cette skill quand vous avez besoin d'un contrôle précis de la configuration du déploiement :

  • Choisir une version de modèle spécifique (pas juste la dernière)
  • Sélectionner la SKU de déploiement (GlobalStandard vs Standard vs PTU)
  • Définir la capacité exacte dans la plage disponible
  • Configurer le filtrage du contenu (sélection de la politique RAI)
  • Activer les fonctionnalités avancées (quota dynamique, traitement prioritaire, spillover)
  • Déploiements PTU (Provisioned Throughput Units)

Alternative : Utilisez preset pour un déploiement rapide vers la meilleure région disponible avec configuration automatique.

Comparaison : customize vs preset

Fonctionnalité customize preset
Focus Contrôle total de la personnalisation Sélection optimale de région
Version Selection L'utilisateur choisit parmi les disponibles Utilise la dernière automatiquement
SKU Selection L'utilisateur choisit (GlobalStandard/Standard/PTU) GlobalStandard uniquement
Capacity L'utilisateur spécifie la valeur exacte Auto-calculée (50% de la disponible)
RAI Policy L'utilisateur sélectionne parmi les options Politique par défaut uniquement
Region Région actuelle d'abord, basculement à toutes les régions si pas de capacité Vérifie la capacité sur toutes les régions en amont
Use Case Exigences de déploiement précises Déploiement rapide vers la meilleure région

Prérequis

  • Abonnement Azure avec le rôle Cognitive Services Contributor ou Owner
  • ID de ressource du projet Azure AI Foundry (format : /subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}/projects/{project})
  • Azure CLI installé et authentifié (az login)
  • Optionnel : Définir la variable d'environnement PROJECT_RESOURCE_ID

Vue d'ensemble du workflow

Flow complet (14 phases)

1. Verify Authentication
2. Get Project Resource ID
3. Verify Project Exists
4. Get Model Name (if not provided)
5. List Model Versions → User Selects
6. List SKUs for Version → User Selects
7. Get Capacity Range → User Configures
   7b. If no capacity: Cross-Region Fallback → Query all regions → User selects region/project
8. List RAI Policies → User Selects
9. Configure Advanced Options (if applicable)
10. Configure Version Upgrade Policy
11. Generate Deployment Name
12. Review Configuration
13. Execute Deployment & Monitor

Fast Path (Defaults)

Si l'utilisateur accepte tous les paramètres par défaut (version la plus récente, SKU GlobalStandard, capacité recommandée, politique RAI par défaut, politique de mise à niveau standard), le déploiement s'effectue en environ 5 interactions.


Résumés des phases

⚠️ À LIRE OBLIGATOIREMENT : Avant d'exécuter toute phase, chargez references/customize-workflow.md pour les scripts complets et les détails d'implémentation. Les résumés ci-dessous décrivent ce que chaque phase fait — le fichier de référence contient le comment (commandes CLI, motifs de quota, formules de capacité, logique de basculement inter-régions).

Phase Action Détails clés
1. Verify Auth Vérifier az account show; inviter az login si nécessaire Vérifier que le bon abonnement est actif
2. Get Project ID Lire la variable d'env PROJECT_RESOURCE_ID ou inviter l'utilisateur Format d'ID de ressource ARM requis
3. Verify Project Analyser l'ID de ressource, appeler az cognitiveservices account show Extrait subscription, RG, account, project, region
4. Get Model Lister les modèles via az cognitiveservices account list-models L'utilisateur sélectionne parmi les disponibles ou saisit un nom personnalisé
5. Select Version Interroger les versions du modèle choisi Recommander la dernière ; l'utilisateur choisit dans la liste
6. Select SKU Interroger le catalogue de modèles + quota de l'abonnement, afficher uniquement les SKU déployables ⚠️ Ne jamais coder les listes SKU en dur — toujours interroger les données en direct
7. Configure Capacity Interroger l'API de capacité, valider min/max/step, l'utilisateur saisit la valeur Basculement inter-régions si pas de capacité dans la région actuelle
8. Select RAI Policy Présenter les options de filtre de contenu Par défaut : Microsoft.DefaultV2
9. Advanced Options Quota dynamique (GlobalStandard), traitement prioritaire (PTU), spillover Disponibilité dépendant de la SKU
10. Upgrade Policy Choisir : OnceNewDefaultVersionAvailable / OnceCurrentVersionExpired / NoAutoUpgrade Par défaut : mise à niveau automatique sur nouvelle version par défaut
11. Deployment Name Auto-générer un nom unique, permettre l'override personnalisé Valide le format : ^[\w.-]{2,64}$
12. Review Afficher le résumé complet de la configuration, confirmer avant de procéder L'utilisateur approuve ou annule
13. Deploy & Monitor az cognitiveservices account deployment create, interroger le statut Timeout après 5 min; afficher endpoint + lien du portail

Gestion des erreurs

Problèmes courants et résolutions

Erreur Cause Résolution
Model not found Nom de modèle invalide Lister les modèles disponibles avec az cognitiveservices account list-models
Version not available Version non supportée pour la SKU Sélectionner une version ou SKU différente
Insufficient quota Capacity > quota disponible La skill recherche automatiquement toutes les régions; échoue uniquement si aucune région n'a de quota
SKU not supported SKU non disponible dans la région Basculement inter-régions qui recherche d'autres régions automatiquement
Capacity out of range Valeur de capacité invalide PRÉVENU : La skill valide min/max/step à l'entrée (Phase 7)
Deployment name exists Conflit de noms Génération de noms auto-incrémentée
Authentication failed Non connecté Exécuter az login
Permission denied Permissions insuffisantes Assigner le rôle Cognitive Services Contributor
Capacity query fails Erreur API/permissions/réseau DÉPLOIEMENT BLOQUÉ : N'ira pas de l'avant sans données de quota valides

Commandes de dépannage

# Check deployment status
az cognitiveservices account deployment show --name <account> --resource-group <rg> --deployment-name <name>

# List all deployments
az cognitiveservices account deployment list --name <account> --resource-group <rg> -o table

# Check quota usage
az cognitiveservices usage list --name <account> --resource-group <rg>

# Delete failed deployment
az cognitiveservices account deployment delete --name <account> --resource-group <rg> --deployment-name <name>

Guides de sélection et sujets avancés

Pour les tableaux de comparaison SKU, les formules de dimensionnement PTU et les détails des options avancées, chargez references/customize-guides.md.

Sélection SKU : GlobalStandard (production/HA) → Standard (dev/test) → ProvisionedManaged (haut volume/débit garanti) → DataZoneStandard (résidence des données).

Capacité : Les SKU basées sur TPM vont de 1K (dev) à 100K+ (grande production). Les SKU basées sur PTU utilisent la formule : (Input TPM × 0,001) + (Output TPM × 0,002) + (Requests/min × 0,1).

Options avancées : Quota dynamique (GlobalStandard uniquement), traitement prioritaire (PTU uniquement, coût supplémentaire), spillover (débordement vers déploiement de secours).


Skills connexes

  • preset - Déploiement rapide vers la meilleure région avec configuration automatique
  • microsoft-foundry - Parent skill pour toutes les opérations Azure AI Foundry
  • quota — Pour l'affichage des quotas, les demandes d'augmentation et la résolution des erreurs de quota, déférez à cette skill au lieu de dupliquer les conseils
  • rbac - Gérer les permissions et le contrôle d'accès

Notes

  • Définir la variable d'environnement PROJECT_RESOURCE_ID pour ignorer l'invitation
  • Les SKU ne sont pas toutes disponibles dans toutes les régions ; la capacité varie par abonnement/région/modèle
  • Les politiques RAI personnalisées peuvent être configurées dans le portail Azure
  • Les mises à niveau automatiques de version se produisent pendant les fenêtres de maintenance
  • Utiliser Azure Monitor et Application Insights pour les déploiements en production

Skills similaires