Personnaliser le déploiement du modèle
Workflow guidé interactif pour déployer des modèles Azure OpenAI avec contrôle total de la personnalisation sur la version, la SKU, la capacité, le filtrage du contenu et les options avancées.
Référence rapide
| Propriété | Description |
|---|---|
| Flow | Déploiement guidé interactif étape par étape |
| Customization | Version, SKU, Capacity, RAI Policy, Advanced Options |
| SKU Support | GlobalStandard, Standard, ProvisionedManaged, DataZoneStandard |
| Best For | Contrôle précis de la configuration du déploiement |
| Authentication | Azure CLI (az login) |
| Tools | Azure CLI, MCP tools (optional) |
Quand utiliser cette skill
Utilisez cette skill quand vous avez besoin d'un contrôle précis de la configuration du déploiement :
- ✅ Choisir une version de modèle spécifique (pas juste la dernière)
- ✅ Sélectionner la SKU de déploiement (GlobalStandard vs Standard vs PTU)
- ✅ Définir la capacité exacte dans la plage disponible
- ✅ Configurer le filtrage du contenu (sélection de la politique RAI)
- ✅ Activer les fonctionnalités avancées (quota dynamique, traitement prioritaire, spillover)
- ✅ Déploiements PTU (Provisioned Throughput Units)
Alternative : Utilisez preset pour un déploiement rapide vers la meilleure région disponible avec configuration automatique.
Comparaison : customize vs preset
| Fonctionnalité | customize | preset |
|---|---|---|
| Focus | Contrôle total de la personnalisation | Sélection optimale de région |
| Version Selection | L'utilisateur choisit parmi les disponibles | Utilise la dernière automatiquement |
| SKU Selection | L'utilisateur choisit (GlobalStandard/Standard/PTU) | GlobalStandard uniquement |
| Capacity | L'utilisateur spécifie la valeur exacte | Auto-calculée (50% de la disponible) |
| RAI Policy | L'utilisateur sélectionne parmi les options | Politique par défaut uniquement |
| Region | Région actuelle d'abord, basculement à toutes les régions si pas de capacité | Vérifie la capacité sur toutes les régions en amont |
| Use Case | Exigences de déploiement précises | Déploiement rapide vers la meilleure région |
Prérequis
- Abonnement Azure avec le rôle Cognitive Services Contributor ou Owner
- ID de ressource du projet Azure AI Foundry (format :
/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}/projects/{project}) - Azure CLI installé et authentifié (
az login) - Optionnel : Définir la variable d'environnement
PROJECT_RESOURCE_ID
Vue d'ensemble du workflow
Flow complet (14 phases)
1. Verify Authentication
2. Get Project Resource ID
3. Verify Project Exists
4. Get Model Name (if not provided)
5. List Model Versions → User Selects
6. List SKUs for Version → User Selects
7. Get Capacity Range → User Configures
7b. If no capacity: Cross-Region Fallback → Query all regions → User selects region/project
8. List RAI Policies → User Selects
9. Configure Advanced Options (if applicable)
10. Configure Version Upgrade Policy
11. Generate Deployment Name
12. Review Configuration
13. Execute Deployment & Monitor
Fast Path (Defaults)
Si l'utilisateur accepte tous les paramètres par défaut (version la plus récente, SKU GlobalStandard, capacité recommandée, politique RAI par défaut, politique de mise à niveau standard), le déploiement s'effectue en environ 5 interactions.
Résumés des phases
⚠️ À LIRE OBLIGATOIREMENT : Avant d'exécuter toute phase, chargez references/customize-workflow.md pour les scripts complets et les détails d'implémentation. Les résumés ci-dessous décrivent ce que chaque phase fait — le fichier de référence contient le comment (commandes CLI, motifs de quota, formules de capacité, logique de basculement inter-régions).
| Phase | Action | Détails clés |
|---|---|---|
| 1. Verify Auth | Vérifier az account show; inviter az login si nécessaire |
Vérifier que le bon abonnement est actif |
| 2. Get Project ID | Lire la variable d'env PROJECT_RESOURCE_ID ou inviter l'utilisateur |
Format d'ID de ressource ARM requis |
| 3. Verify Project | Analyser l'ID de ressource, appeler az cognitiveservices account show |
Extrait subscription, RG, account, project, region |
| 4. Get Model | Lister les modèles via az cognitiveservices account list-models |
L'utilisateur sélectionne parmi les disponibles ou saisit un nom personnalisé |
| 5. Select Version | Interroger les versions du modèle choisi | Recommander la dernière ; l'utilisateur choisit dans la liste |
| 6. Select SKU | Interroger le catalogue de modèles + quota de l'abonnement, afficher uniquement les SKU déployables | ⚠️ Ne jamais coder les listes SKU en dur — toujours interroger les données en direct |
| 7. Configure Capacity | Interroger l'API de capacité, valider min/max/step, l'utilisateur saisit la valeur | Basculement inter-régions si pas de capacité dans la région actuelle |
| 8. Select RAI Policy | Présenter les options de filtre de contenu | Par défaut : Microsoft.DefaultV2 |
| 9. Advanced Options | Quota dynamique (GlobalStandard), traitement prioritaire (PTU), spillover | Disponibilité dépendant de la SKU |
| 10. Upgrade Policy | Choisir : OnceNewDefaultVersionAvailable / OnceCurrentVersionExpired / NoAutoUpgrade | Par défaut : mise à niveau automatique sur nouvelle version par défaut |
| 11. Deployment Name | Auto-générer un nom unique, permettre l'override personnalisé | Valide le format : ^[\w.-]{2,64}$ |
| 12. Review | Afficher le résumé complet de la configuration, confirmer avant de procéder | L'utilisateur approuve ou annule |
| 13. Deploy & Monitor | az cognitiveservices account deployment create, interroger le statut |
Timeout après 5 min; afficher endpoint + lien du portail |
Gestion des erreurs
Problèmes courants et résolutions
| Erreur | Cause | Résolution |
|---|---|---|
| Model not found | Nom de modèle invalide | Lister les modèles disponibles avec az cognitiveservices account list-models |
| Version not available | Version non supportée pour la SKU | Sélectionner une version ou SKU différente |
| Insufficient quota | Capacity > quota disponible | La skill recherche automatiquement toutes les régions; échoue uniquement si aucune région n'a de quota |
| SKU not supported | SKU non disponible dans la région | Basculement inter-régions qui recherche d'autres régions automatiquement |
| Capacity out of range | Valeur de capacité invalide | PRÉVENU : La skill valide min/max/step à l'entrée (Phase 7) |
| Deployment name exists | Conflit de noms | Génération de noms auto-incrémentée |
| Authentication failed | Non connecté | Exécuter az login |
| Permission denied | Permissions insuffisantes | Assigner le rôle Cognitive Services Contributor |
| Capacity query fails | Erreur API/permissions/réseau | DÉPLOIEMENT BLOQUÉ : N'ira pas de l'avant sans données de quota valides |
Commandes de dépannage
# Check deployment status
az cognitiveservices account deployment show --name <account> --resource-group <rg> --deployment-name <name>
# List all deployments
az cognitiveservices account deployment list --name <account> --resource-group <rg> -o table
# Check quota usage
az cognitiveservices usage list --name <account> --resource-group <rg>
# Delete failed deployment
az cognitiveservices account deployment delete --name <account> --resource-group <rg> --deployment-name <name>
Guides de sélection et sujets avancés
Pour les tableaux de comparaison SKU, les formules de dimensionnement PTU et les détails des options avancées, chargez references/customize-guides.md.
Sélection SKU : GlobalStandard (production/HA) → Standard (dev/test) → ProvisionedManaged (haut volume/débit garanti) → DataZoneStandard (résidence des données).
Capacité : Les SKU basées sur TPM vont de 1K (dev) à 100K+ (grande production). Les SKU basées sur PTU utilisent la formule : (Input TPM × 0,001) + (Output TPM × 0,002) + (Requests/min × 0,1).
Options avancées : Quota dynamique (GlobalStandard uniquement), traitement prioritaire (PTU uniquement, coût supplémentaire), spillover (débordement vers déploiement de secours).
Skills connexes
- preset - Déploiement rapide vers la meilleure région avec configuration automatique
- microsoft-foundry - Parent skill pour toutes les opérations Azure AI Foundry
- quota — Pour l'affichage des quotas, les demandes d'augmentation et la résolution des erreurs de quota, déférez à cette skill au lieu de dupliquer les conseils
- rbac - Gérer les permissions et le contrôle d'accès
Notes
- Définir la variable d'environnement
PROJECT_RESOURCE_IDpour ignorer l'invitation - Les SKU ne sont pas toutes disponibles dans toutes les régions ; la capacité varie par abonnement/région/modèle
- Les politiques RAI personnalisées peuvent être configurées dans le portail Azure
- Les mises à niveau automatiques de version se produisent pendant les fenêtres de maintenance
- Utiliser Azure Monitor et Application Insights pour les déploiements en production