Déployer le modèle dans la région optimale
Automatise le déploiement intelligent du modèle Azure OpenAI en vérifiant la capacité dans les régions et en déployant vers la meilleure option disponible.
Ce que fait cette compétence
- Vérifie l'authentification Azure et la portée du projet
- Vérifie la capacité dans la région du projet actuel
- En cas d'absence de capacité : analyse toutes les régions et affiche les alternatives disponibles
- Filtre les projets par région sélectionnée
- Prend en charge la création de nouveaux projets si nécessaire
- Déploie le modèle avec la SKU GlobalStandard
- Surveille la progression du déploiement
Prérequis
- Azure CLI installé et configuré
- Abonnement Azure actif avec permissions de lecture/création Cognitive Services
- ID de ressource du projet Azure AI Foundry (
PROJECT_RESOURCE_IDvariable d'env ou fourni interactivement)- Format :
/subscriptions/{sub-id}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}/projects/{project} - Trouvé dans : portail Azure AI Foundry → Projet → Aperçu → ID de ressource
- Format :
Flux rapide
Chemin rapide (la région actuelle a de la capacité)
1. Vérifier authentification → 2. Obtenir projet → 3. Vérifier capacité région actuelle
→ 4. Déployer immédiatement
Chemin région alternative (pas de capacité)
1. Vérifier authentification → 2. Obtenir projet → 3. Vérifier région actuelle (pas de capacité)
→ 4. Interroger toutes les régions → 5. Afficher alternatives → 6. Sélectionner région + projet
→ 7. Déployer
Phases de déploiement
| Phase | Action | Commandes clés |
|---|---|---|
| 1. Vérifier Auth | Vérifier la connexion Azure CLI et l'abonnement | az account show, az login |
| 2. Obtenir Projet | Analyser PROJECT_RESOURCE_ID ARM ID, vérifier l'existence |
az cognitiveservices account show |
| 3. Obtenir Modèle | Lister les modèles disponibles, l'utilisateur sélectionne modèle + version | az cognitiveservices account list-models |
| 4. Vérifier région actuelle | Interroger la capacité avec SKU GlobalStandard | az rest --method GET .../modelCapacities |
| 5. Requête multi-région | Si pas de capacité locale, interroger toutes les régions | Même API capacité sans filtre de localisation |
| 6. Sélectionner région + projet | L'utilisateur choisit une région ; trouver ou créer un projet | az cognitiveservices account list, az cognitiveservices account create |
| 7. Déployer | Générer un nom unique, calculer la capacité (50% disponible, min 50 TPM), créer déploiement | az cognitiveservices account deployment create |
Pour des instructions détaillées étape par étape, consultez la référence de flux.
Gestion des erreurs
| Erreur | Symptôme | Résolution |
|---|---|---|
| Échec auth | az account show retourne une erreur |
Exécuter az login puis az account set --subscription <id> |
| Pas de quota | Toutes les régions affichent 0 capacité | Se référer à la compétence quota pour les demandes d'augmentation et le dépannage ; vérifier les déploiements existants ; essayer des modèles alternatifs |
| Modèle non trouvé | Liste de capacité vide | Vérifier le nom du modèle avec az cognitiveservices account list-models ; vérifier la sensibilité à la casse |
| Conflit de nom | « deployment already exists » | Ajouter un suffixe au nom de déploiement (géré automatiquement par le script generate_deployment_name) |
| Région indisponible | La région ne supporte pas le modèle | Sélectionner une région différente de la liste disponible |
| Permission refusée | « Forbidden » ou « Unauthorized » | Vérifier le rôle Cognitive Services Contributor : az role assignment list --assignee <user> |
Utilisation avancée
# Capacité personnalisée
az cognitiveservices account deployment create ... --sku-capacity <value>
# Vérifier le statut du déploiement
az cognitiveservices account deployment show --name <acct> --resource-group <rg> --deployment-name <name> --query "{Status:properties.provisioningState}"
# Supprimer le déploiement
az cognitiveservices account deployment delete --name <acct> --resource-group <rg> --deployment-name <name>
Notes
- SKU : GlobalStandard uniquement — Version API : 2024-10-01 (GA stable)
Compétences connexes
- microsoft-foundry - Compétence parent pour les opérations Azure AI Foundry
- quota — Pour l'affichage des quotas, les demandes d'augmentation et le dépannage des erreurs de quota, se référer à cette compétence
- azure-quick-review - Examiner les ressources Azure pour la conformité
- azure-cost-estimation - Estimer les coûts des déploiements Azure
- azure-validate - Valider l'infrastructure Azure avant le déploiement