preset

Déploie intelligemment les modèles Azure OpenAI dans les régions optimales en analysant la capacité de toutes les régions disponibles. Vérifie automatiquement la région actuelle en premier et affiche des alternatives si nécessaire. UTILISER POUR : déploiement rapide, région optimale, meilleure région, sélection automatique de région, configuration rapide, vérification de capacité multi-région, déploiement haute disponibilité, déployer au meilleur emplacement. NE PAS UTILISER POUR : sélection de SKU personnalisé (utiliser customize), sélection de version spécifique (utiliser customize), configuration de capacité personnalisée (utiliser customize), déploiements PTU (utiliser customize).

npx skills add https://github.com/microsoft/skills --skill preset

Déployer le modèle dans la région optimale

Automatise le déploiement intelligent du modèle Azure OpenAI en vérifiant la capacité dans les régions et en déployant vers la meilleure option disponible.

Ce que fait cette compétence

  1. Vérifie l'authentification Azure et la portée du projet
  2. Vérifie la capacité dans la région du projet actuel
  3. En cas d'absence de capacité : analyse toutes les régions et affiche les alternatives disponibles
  4. Filtre les projets par région sélectionnée
  5. Prend en charge la création de nouveaux projets si nécessaire
  6. Déploie le modèle avec la SKU GlobalStandard
  7. Surveille la progression du déploiement

Prérequis

  • Azure CLI installé et configuré
  • Abonnement Azure actif avec permissions de lecture/création Cognitive Services
  • ID de ressource du projet Azure AI Foundry (PROJECT_RESOURCE_ID variable d'env ou fourni interactivement)
    • Format : /subscriptions/{sub-id}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}/projects/{project}
    • Trouvé dans : portail Azure AI Foundry → Projet → Aperçu → ID de ressource

Flux rapide

Chemin rapide (la région actuelle a de la capacité)

1. Vérifier authentification → 2. Obtenir projet → 3. Vérifier capacité région actuelle
→ 4. Déployer immédiatement

Chemin région alternative (pas de capacité)

1. Vérifier authentification → 2. Obtenir projet → 3. Vérifier région actuelle (pas de capacité)
→ 4. Interroger toutes les régions → 5. Afficher alternatives → 6. Sélectionner région + projet
→ 7. Déployer

Phases de déploiement

Phase Action Commandes clés
1. Vérifier Auth Vérifier la connexion Azure CLI et l'abonnement az account show, az login
2. Obtenir Projet Analyser PROJECT_RESOURCE_ID ARM ID, vérifier l'existence az cognitiveservices account show
3. Obtenir Modèle Lister les modèles disponibles, l'utilisateur sélectionne modèle + version az cognitiveservices account list-models
4. Vérifier région actuelle Interroger la capacité avec SKU GlobalStandard az rest --method GET .../modelCapacities
5. Requête multi-région Si pas de capacité locale, interroger toutes les régions Même API capacité sans filtre de localisation
6. Sélectionner région + projet L'utilisateur choisit une région ; trouver ou créer un projet az cognitiveservices account list, az cognitiveservices account create
7. Déployer Générer un nom unique, calculer la capacité (50% disponible, min 50 TPM), créer déploiement az cognitiveservices account deployment create

Pour des instructions détaillées étape par étape, consultez la référence de flux.


Gestion des erreurs

Erreur Symptôme Résolution
Échec auth az account show retourne une erreur Exécuter az login puis az account set --subscription <id>
Pas de quota Toutes les régions affichent 0 capacité Se référer à la compétence quota pour les demandes d'augmentation et le dépannage ; vérifier les déploiements existants ; essayer des modèles alternatifs
Modèle non trouvé Liste de capacité vide Vérifier le nom du modèle avec az cognitiveservices account list-models ; vérifier la sensibilité à la casse
Conflit de nom « deployment already exists » Ajouter un suffixe au nom de déploiement (géré automatiquement par le script generate_deployment_name)
Région indisponible La région ne supporte pas le modèle Sélectionner une région différente de la liste disponible
Permission refusée « Forbidden » ou « Unauthorized » Vérifier le rôle Cognitive Services Contributor : az role assignment list --assignee <user>

Utilisation avancée

# Capacité personnalisée
az cognitiveservices account deployment create ... --sku-capacity <value>

# Vérifier le statut du déploiement
az cognitiveservices account deployment show --name <acct> --resource-group <rg> --deployment-name <name> --query "{Status:properties.provisioningState}"

# Supprimer le déploiement
az cognitiveservices account deployment delete --name <acct> --resource-group <rg> --deployment-name <name>

Notes

  • SKU : GlobalStandard uniquement — Version API : 2024-10-01 (GA stable)

Compétences connexes

  • microsoft-foundry - Compétence parent pour les opérations Azure AI Foundry
  • quota — Pour l'affichage des quotas, les demandes d'augmentation et le dépannage des erreurs de quota, se référer à cette compétence
  • azure-quick-review - Examiner les ressources Azure pour la conformité
  • azure-cost-estimation - Estimer les coûts des déploiements Azure
  • azure-validate - Valider l'infrastructure Azure avant le déploiement

Skills similaires