customize

Flux de déploiement guidé interactif pour les modèles Azure OpenAI avec contrôle de personnalisation complet. Sélection étape par étape de la version du modèle, SKU (GlobalStandard/Standard/ProvisionedManaged), capacité, politique RAI (filtre de contenu) et options avancées (quota dynamique, traitement prioritaire, débordement). UTILISER POUR : déploiement personnalisé, personnaliser le déploiement du modèle, choisir la version, sélectionner le SKU, définir la capacité, configurer le filtre de contenu, politique RAI, options de déploiement, déploiement détaillé, déploiement avancé, déploiement PTU, débit provisionné. NE PAS UTILISER POUR : déploiement rapide vers la région optimale (utiliser le préréglage).

npx skills add https://github.com/microsoft/skills --skill customize

Personnaliser le déploiement du modèle

Workflow guidé interactif pour déployer des modèles Azure OpenAI avec contrôle total de la personnalisation sur la version, la SKU, la capacité, le filtrage de contenu et les options avancées.

Référence rapide

Propriété Description
Flow Déploiement guidé étape par étape interactif
Customization Version, SKU, Capacité, RAI Policy, Options avancées
SKU Support GlobalStandard, Standard, ProvisionedManaged, DataZoneStandard
Best For Contrôle précis de la configuration de déploiement
Authentication Azure CLI (az login)
Tools Azure CLI, MCP tools (optionnel)

Quand utiliser cette compétence

Utilisez cette compétence quand vous avez besoin d'un contrôle précis de la configuration de déploiement :

  • Choisir une version spécifique du modèle (pas seulement la dernière)
  • Sélectionner la SKU de déploiement (GlobalStandard vs Standard vs PTU)
  • Définir la capacité exacte dans la plage disponible
  • Configurer le filtrage de contenu (sélection de la politique RAI)
  • Activer les fonctionnalités avancées (quota dynamique, traitement prioritaire, débordement)
  • Déploiements PTU (Provisioned Throughput Units)

Alternative : Utilisez preset pour un déploiement rapide vers la meilleure région disponible avec configuration automatique.

Comparaison : customize vs preset

Fonctionnalité customize preset
Focus Contrôle total de la personnalisation Sélection de région optimale
Version Selection L'utilisateur choisit parmi les disponibles Utilise automatiquement la dernière
SKU Selection L'utilisateur choisit (GlobalStandard/Standard/PTU) GlobalStandard uniquement
Capacité L'utilisateur spécifie la valeur exacte Calculée automatiquement (50% du disponible)
RAI Policy L'utilisateur sélectionne parmi les options Politique par défaut uniquement
Région Région actuelle d'abord, bascule vers toutes les régions si pas de capacité Vérifie la capacité sur toutes les régions en amont
Use Case Exigences de déploiement précises Déploiement rapide vers la meilleure région

Prérequis

  • Abonnement Azure avec rôle Cognitive Services Contributor ou Owner
  • ID de ressource du projet Azure AI Foundry (format : /subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}/projects/{project})
  • Azure CLI installé et authentifié (az login)
  • Optionnel : Définir la variable d'environnement PROJECT_RESOURCE_ID

Vue d'ensemble du workflow

Flux complet (14 phases)

1. Verify Authentication
2. Get Project Resource ID
3. Verify Project Exists
4. Get Model Name (if not provided)
5. List Model Versions → User Selects
6. List SKUs for Version → User Selects
7. Get Capacity Range → User Configures
   7b. If no capacity: Cross-Region Fallback → Query all regions → User selects region/project
8. List RAI Policies → User Selects
9. Configure Advanced Options (if applicable)
10. Configure Version Upgrade Policy
11. Generate Deployment Name
12. Review Configuration
13. Execute Deployment & Monitor

Chemin rapide (Valeurs par défaut)

Si l'utilisateur accepte toutes les valeurs par défaut (dernière version, SKU GlobalStandard, capacité recommandée, politique RAI par défaut, politique de mise à niveau standard), le déploiement s'effectue en ~5 interactions.


Résumés des phases

⚠️ À LIRE ABSOLUMENT : Avant d'exécuter une phase, chargez references/customize-workflow.md pour les scripts complets et les détails d'implémentation. Les résumés ci-dessous décrivent ce que fait chaque phase — le fichier de référence contient le comment (commandes CLI, modèles de quota, formules de capacité, logique de basculement cross-région).

Phase Action Détails clés
1. Verify Auth Vérifier az account show ; inviter az login si nécessaire Vérifier que le bon abonnement est actif
2. Get Project ID Lire la variable d'environnement PROJECT_RESOURCE_ID ou inviter l'utilisateur Format ARM resource ID requis
3. Verify Project Analyser l'ID de ressource, appeler az cognitiveservices account show Extrait subscription, RG, account, project, region
4. Get Model Lister les modèles via az cognitiveservices account list-models L'utilisateur sélectionne parmi les disponibles ou entre un nom personnalisé
5. Select Version Interroger les versions du modèle choisi Recommander la dernière ; l'utilisateur choisit dans la liste
6. Select SKU Interroger le catalogue du modèle + quota d'abonnement, afficher uniquement les SKUs déployables ⚠️ Ne jamais hardcoder les listes de SKU — toujours interroger les données en temps réel
7. Configure Capacity Interroger l'API de capacité, valider min/max/step, l'utilisateur entre une valeur Basculement cross-région si pas de capacité dans la région actuelle
8. Select RAI Policy Présenter les options de filtrage de contenu Par défaut : Microsoft.DefaultV2
9. Advanced Options Quota dynamique (GlobalStandard), traitement prioritaire (PTU), débordement Disponibilité dépendante de la SKU
10. Upgrade Policy Choisir : OnceNewDefaultVersionAvailable / OnceCurrentVersionExpired / NoAutoUpgrade Par défaut : auto-upgrade sur nouvelle version par défaut
11. Deployment Name Générer automatiquement un nom unique, permettre un remplacement personnalisé Valide le format : ^[\w.-]{2,64}$
12. Review Afficher le résumé complet de la configuration, confirmer avant de procéder L'utilisateur approuve ou annule
13. Deploy & Monitor az cognitiveservices account deployment create, interroger le statut Timeout après 5 min ; afficher endpoint + lien portail

Gestion des erreurs

Problèmes courants et résolutions

Erreur Cause Résolution
Model not found Nom de modèle invalide Lister les modèles disponibles avec az cognitiveservices account list-models
Version not available Version non supportée pour la SKU Sélectionner une version ou SKU différente
Insufficient quota Capacité > quota disponible La compétence recherche automatiquement toutes les régions ; échoue seulement si aucune région n'a de quota
SKU not supported SKU non disponible dans la région Basculement cross-région recherche automatiquement d'autres régions
Capacity out of range Valeur de capacité invalide PRÉVENU : La compétence valide min/max/step à l'entrée (Phase 7)
Deployment name exists Conflit de noms Génération de noms auto-incrémentée
Authentication failed Pas connecté Exécuter az login
Permission denied Permissions insuffisantes Assigner le rôle Cognitive Services Contributor
Capacity query fails Erreur API/permissions/réseau DÉPLOIEMENT BLOQUÉ : N'avancera pas sans données de quota valides

Commandes de dépannage

# Vérifier le statut du déploiement
az cognitiveservices account deployment show --name <account> --resource-group <rg> --deployment-name <name>

# Lister tous les déploiements
az cognitiveservices account deployment list --name <account> --resource-group <rg> -o table

# Vérifier l'utilisation du quota
az cognitiveservices usage list --name <account> --resource-group <rg>

# Supprimer un déploiement échoué
az cognitiveservices account deployment delete --name <account> --resource-group <rg> --deployment-name <name>

Guides de sélection et sujets avancés

Pour les tableaux de comparaison des SKU, les formules de dimensionnement PTU et les détails des options avancées, chargez references/customize-guides.md.

Sélection SKU : GlobalStandard (production/HA) → Standard (dev/test) → ProvisionedManaged (haut volume/débit garanti) → DataZoneStandard (résidence des données).

Capacité : Les SKU basées sur TPM vont de 1K (dev) à 100K+ (grande production). Les SKU basées sur PTU utilisent la formule : (Input TPM × 0.001) + (Output TPM × 0.002) + (Requests/min × 0.1).

Options avancées : Quota dynamique (GlobalStandard uniquement), traitement prioritaire (PTU uniquement, coût supplémentaire), débordement (débordement vers déploiement de secours).


Compétences associées

  • preset - Déploiement rapide vers la meilleure région avec configuration automatique
  • microsoft-foundry - Compétence parente pour toutes les opérations Azure AI Foundry
  • quota — Pour l'affichage des quotas, les demandes d'augmentation et le dépannage des erreurs de quota, reportez-vous à cette compétence au lieu de dupliquer les conseils
  • rbac - Gérer les permissions et le contrôle d'accès

Notes

  • Définir la variable d'environnement PROJECT_RESOURCE_ID pour ignorer l'invite
  • Toutes les SKU ne sont pas disponibles dans toutes les régions ; la capacité varie selon l'abonnement/région/modèle
  • Les politiques RAI personnalisées peuvent être configurées dans le portail Azure
  • Les mises à niveau automatiques de version se produisent pendant les fenêtres de maintenance
  • Utiliser Azure Monitor et Application Insights pour les déploiements en production