Personnaliser le déploiement du modèle
Workflow guidé interactif pour déployer des modèles Azure OpenAI avec contrôle total de la personnalisation sur la version, la SKU, la capacité, le filtrage de contenu et les options avancées.
Référence rapide
| Propriété | Description |
|---|---|
| Flow | Déploiement guidé étape par étape interactif |
| Customization | Version, SKU, Capacité, RAI Policy, Options avancées |
| SKU Support | GlobalStandard, Standard, ProvisionedManaged, DataZoneStandard |
| Best For | Contrôle précis de la configuration de déploiement |
| Authentication | Azure CLI (az login) |
| Tools | Azure CLI, MCP tools (optionnel) |
Quand utiliser cette compétence
Utilisez cette compétence quand vous avez besoin d'un contrôle précis de la configuration de déploiement :
- ✅ Choisir une version spécifique du modèle (pas seulement la dernière)
- ✅ Sélectionner la SKU de déploiement (GlobalStandard vs Standard vs PTU)
- ✅ Définir la capacité exacte dans la plage disponible
- ✅ Configurer le filtrage de contenu (sélection de la politique RAI)
- ✅ Activer les fonctionnalités avancées (quota dynamique, traitement prioritaire, débordement)
- ✅ Déploiements PTU (Provisioned Throughput Units)
Alternative : Utilisez preset pour un déploiement rapide vers la meilleure région disponible avec configuration automatique.
Comparaison : customize vs preset
| Fonctionnalité | customize | preset |
|---|---|---|
| Focus | Contrôle total de la personnalisation | Sélection de région optimale |
| Version Selection | L'utilisateur choisit parmi les disponibles | Utilise automatiquement la dernière |
| SKU Selection | L'utilisateur choisit (GlobalStandard/Standard/PTU) | GlobalStandard uniquement |
| Capacité | L'utilisateur spécifie la valeur exacte | Calculée automatiquement (50% du disponible) |
| RAI Policy | L'utilisateur sélectionne parmi les options | Politique par défaut uniquement |
| Région | Région actuelle d'abord, bascule vers toutes les régions si pas de capacité | Vérifie la capacité sur toutes les régions en amont |
| Use Case | Exigences de déploiement précises | Déploiement rapide vers la meilleure région |
Prérequis
- Abonnement Azure avec rôle Cognitive Services Contributor ou Owner
- ID de ressource du projet Azure AI Foundry (format :
/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}/projects/{project}) - Azure CLI installé et authentifié (
az login) - Optionnel : Définir la variable d'environnement
PROJECT_RESOURCE_ID
Vue d'ensemble du workflow
Flux complet (14 phases)
1. Verify Authentication
2. Get Project Resource ID
3. Verify Project Exists
4. Get Model Name (if not provided)
5. List Model Versions → User Selects
6. List SKUs for Version → User Selects
7. Get Capacity Range → User Configures
7b. If no capacity: Cross-Region Fallback → Query all regions → User selects region/project
8. List RAI Policies → User Selects
9. Configure Advanced Options (if applicable)
10. Configure Version Upgrade Policy
11. Generate Deployment Name
12. Review Configuration
13. Execute Deployment & Monitor
Chemin rapide (Valeurs par défaut)
Si l'utilisateur accepte toutes les valeurs par défaut (dernière version, SKU GlobalStandard, capacité recommandée, politique RAI par défaut, politique de mise à niveau standard), le déploiement s'effectue en ~5 interactions.
Résumés des phases
⚠️ À LIRE ABSOLUMENT : Avant d'exécuter une phase, chargez references/customize-workflow.md pour les scripts complets et les détails d'implémentation. Les résumés ci-dessous décrivent ce que fait chaque phase — le fichier de référence contient le comment (commandes CLI, modèles de quota, formules de capacité, logique de basculement cross-région).
| Phase | Action | Détails clés |
|---|---|---|
| 1. Verify Auth | Vérifier az account show ; inviter az login si nécessaire |
Vérifier que le bon abonnement est actif |
| 2. Get Project ID | Lire la variable d'environnement PROJECT_RESOURCE_ID ou inviter l'utilisateur |
Format ARM resource ID requis |
| 3. Verify Project | Analyser l'ID de ressource, appeler az cognitiveservices account show |
Extrait subscription, RG, account, project, region |
| 4. Get Model | Lister les modèles via az cognitiveservices account list-models |
L'utilisateur sélectionne parmi les disponibles ou entre un nom personnalisé |
| 5. Select Version | Interroger les versions du modèle choisi | Recommander la dernière ; l'utilisateur choisit dans la liste |
| 6. Select SKU | Interroger le catalogue du modèle + quota d'abonnement, afficher uniquement les SKUs déployables | ⚠️ Ne jamais hardcoder les listes de SKU — toujours interroger les données en temps réel |
| 7. Configure Capacity | Interroger l'API de capacité, valider min/max/step, l'utilisateur entre une valeur | Basculement cross-région si pas de capacité dans la région actuelle |
| 8. Select RAI Policy | Présenter les options de filtrage de contenu | Par défaut : Microsoft.DefaultV2 |
| 9. Advanced Options | Quota dynamique (GlobalStandard), traitement prioritaire (PTU), débordement | Disponibilité dépendante de la SKU |
| 10. Upgrade Policy | Choisir : OnceNewDefaultVersionAvailable / OnceCurrentVersionExpired / NoAutoUpgrade | Par défaut : auto-upgrade sur nouvelle version par défaut |
| 11. Deployment Name | Générer automatiquement un nom unique, permettre un remplacement personnalisé | Valide le format : ^[\w.-]{2,64}$ |
| 12. Review | Afficher le résumé complet de la configuration, confirmer avant de procéder | L'utilisateur approuve ou annule |
| 13. Deploy & Monitor | az cognitiveservices account deployment create, interroger le statut |
Timeout après 5 min ; afficher endpoint + lien portail |
Gestion des erreurs
Problèmes courants et résolutions
| Erreur | Cause | Résolution |
|---|---|---|
| Model not found | Nom de modèle invalide | Lister les modèles disponibles avec az cognitiveservices account list-models |
| Version not available | Version non supportée pour la SKU | Sélectionner une version ou SKU différente |
| Insufficient quota | Capacité > quota disponible | La compétence recherche automatiquement toutes les régions ; échoue seulement si aucune région n'a de quota |
| SKU not supported | SKU non disponible dans la région | Basculement cross-région recherche automatiquement d'autres régions |
| Capacity out of range | Valeur de capacité invalide | PRÉVENU : La compétence valide min/max/step à l'entrée (Phase 7) |
| Deployment name exists | Conflit de noms | Génération de noms auto-incrémentée |
| Authentication failed | Pas connecté | Exécuter az login |
| Permission denied | Permissions insuffisantes | Assigner le rôle Cognitive Services Contributor |
| Capacity query fails | Erreur API/permissions/réseau | DÉPLOIEMENT BLOQUÉ : N'avancera pas sans données de quota valides |
Commandes de dépannage
# Vérifier le statut du déploiement
az cognitiveservices account deployment show --name <account> --resource-group <rg> --deployment-name <name>
# Lister tous les déploiements
az cognitiveservices account deployment list --name <account> --resource-group <rg> -o table
# Vérifier l'utilisation du quota
az cognitiveservices usage list --name <account> --resource-group <rg>
# Supprimer un déploiement échoué
az cognitiveservices account deployment delete --name <account> --resource-group <rg> --deployment-name <name>
Guides de sélection et sujets avancés
Pour les tableaux de comparaison des SKU, les formules de dimensionnement PTU et les détails des options avancées, chargez references/customize-guides.md.
Sélection SKU : GlobalStandard (production/HA) → Standard (dev/test) → ProvisionedManaged (haut volume/débit garanti) → DataZoneStandard (résidence des données).
Capacité : Les SKU basées sur TPM vont de 1K (dev) à 100K+ (grande production). Les SKU basées sur PTU utilisent la formule : (Input TPM × 0.001) + (Output TPM × 0.002) + (Requests/min × 0.1).
Options avancées : Quota dynamique (GlobalStandard uniquement), traitement prioritaire (PTU uniquement, coût supplémentaire), débordement (débordement vers déploiement de secours).
Compétences associées
- preset - Déploiement rapide vers la meilleure région avec configuration automatique
- microsoft-foundry - Compétence parente pour toutes les opérations Azure AI Foundry
- quota — Pour l'affichage des quotas, les demandes d'augmentation et le dépannage des erreurs de quota, reportez-vous à cette compétence au lieu de dupliquer les conseils
- rbac - Gérer les permissions et le contrôle d'accès
Notes
- Définir la variable d'environnement
PROJECT_RESOURCE_IDpour ignorer l'invite - Toutes les SKU ne sont pas disponibles dans toutes les régions ; la capacité varie selon l'abonnement/région/modèle
- Les politiques RAI personnalisées peuvent être configurées dans le portail Azure
- Les mises à niveau automatiques de version se produisent pendant les fenêtres de maintenance
- Utiliser Azure Monitor et Application Insights pour les déploiements en production