Personnaliser le déploiement du modèle

Workflow guidé interactif pour déployer des modèles Azure OpenAI avec contrôle total de la personnalisation sur la version, la SKU, la capacité, le filtrage de contenu et les options avancées.

Référence rapide

Propriété	Description
Flow	Déploiement guidé étape par étape interactif
Customization	Version, SKU, Capacité, RAI Policy, Options avancées
SKU Support	GlobalStandard, Standard, ProvisionedManaged, DataZoneStandard
Best For	Contrôle précis de la configuration de déploiement
Authentication	Azure CLI (`az login`)
Tools	Azure CLI, MCP tools (optionnel)

Quand utiliser cette compétence

Utilisez cette compétence quand vous avez besoin d'un contrôle précis de la configuration de déploiement :

✅ Choisir une version spécifique du modèle (pas seulement la dernière)
✅ Sélectionner la SKU de déploiement (GlobalStandard vs Standard vs PTU)
✅ Définir la capacité exacte dans la plage disponible
✅ Configurer le filtrage de contenu (sélection de la politique RAI)
✅ Activer les fonctionnalités avancées (quota dynamique, traitement prioritaire, débordement)
✅ Déploiements PTU (Provisioned Throughput Units)

Alternative : Utilisez preset pour un déploiement rapide vers la meilleure région disponible avec configuration automatique.

Comparaison : customize vs preset

Fonctionnalité	customize	preset
Focus	Contrôle total de la personnalisation	Sélection de région optimale
Version Selection	L'utilisateur choisit parmi les disponibles	Utilise automatiquement la dernière
SKU Selection	L'utilisateur choisit (GlobalStandard/Standard/PTU)	GlobalStandard uniquement
Capacité	L'utilisateur spécifie la valeur exacte	Calculée automatiquement (50% du disponible)
RAI Policy	L'utilisateur sélectionne parmi les options	Politique par défaut uniquement
Région	Région actuelle d'abord, bascule vers toutes les régions si pas de capacité	Vérifie la capacité sur toutes les régions en amont
Use Case	Exigences de déploiement précises	Déploiement rapide vers la meilleure région

Prérequis

Abonnement Azure avec rôle Cognitive Services Contributor ou Owner
ID de ressource du projet Azure AI Foundry (format : /subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}/projects/{project})
Azure CLI installé et authentifié (az login)
Optionnel : Définir la variable d'environnement PROJECT_RESOURCE_ID

Vue d'ensemble du workflow

Flux complet (14 phases)

1. Verify Authentication
2. Get Project Resource ID
3. Verify Project Exists
4. Get Model Name (if not provided)
5. List Model Versions → User Selects
6. List SKUs for Version → User Selects
7. Get Capacity Range → User Configures
   7b. If no capacity: Cross-Region Fallback → Query all regions → User selects region/project
8. List RAI Policies → User Selects
9. Configure Advanced Options (if applicable)
10. Configure Version Upgrade Policy
11. Generate Deployment Name
12. Review Configuration
13. Execute Deployment & Monitor

Chemin rapide (Valeurs par défaut)

Si l'utilisateur accepte toutes les valeurs par défaut (dernière version, SKU GlobalStandard, capacité recommandée, politique RAI par défaut, politique de mise à niveau standard), le déploiement s'effectue en ~5 interactions.

Résumés des phases

⚠️ À LIRE ABSOLUMENT : Avant d'exécuter une phase, chargez references/customize-workflow.md pour les scripts complets et les détails d'implémentation. Les résumés ci-dessous décrivent ce que fait chaque phase — le fichier de référence contient le comment (commandes CLI, modèles de quota, formules de capacité, logique de basculement cross-région).

Phase	Action	Détails clés
1. Verify Auth	Vérifier `az account show` ; inviter `az login` si nécessaire	Vérifier que le bon abonnement est actif
2. Get Project ID	Lire la variable d'environnement `PROJECT_RESOURCE_ID` ou inviter l'utilisateur	Format ARM resource ID requis
3. Verify Project	Analyser l'ID de ressource, appeler `az cognitiveservices account show`	Extrait subscription, RG, account, project, region
4. Get Model	Lister les modèles via `az cognitiveservices account list-models`	L'utilisateur sélectionne parmi les disponibles ou entre un nom personnalisé
5. Select Version	Interroger les versions du modèle choisi	Recommander la dernière ; l'utilisateur choisit dans la liste
6. Select SKU	Interroger le catalogue du modèle + quota d'abonnement, afficher uniquement les SKUs déployables	⚠️ Ne jamais hardcoder les listes de SKU — toujours interroger les données en temps réel
7. Configure Capacity	Interroger l'API de capacité, valider min/max/step, l'utilisateur entre une valeur	Basculement cross-région si pas de capacité dans la région actuelle
8. Select RAI Policy	Présenter les options de filtrage de contenu	Par défaut : `Microsoft.DefaultV2`
9. Advanced Options	Quota dynamique (GlobalStandard), traitement prioritaire (PTU), débordement	Disponibilité dépendante de la SKU
10. Upgrade Policy	Choisir : OnceNewDefaultVersionAvailable / OnceCurrentVersionExpired / NoAutoUpgrade	Par défaut : auto-upgrade sur nouvelle version par défaut
11. Deployment Name	Générer automatiquement un nom unique, permettre un remplacement personnalisé	Valide le format : `^[\w.-]{2,64}$`
12. Review	Afficher le résumé complet de la configuration, confirmer avant de procéder	L'utilisateur approuve ou annule
13. Deploy & Monitor	`az cognitiveservices account deployment create`, interroger le statut	Timeout après 5 min ; afficher endpoint + lien portail

Gestion des erreurs

Problèmes courants et résolutions

Erreur	Cause	Résolution
Model not found	Nom de modèle invalide	Lister les modèles disponibles avec `az cognitiveservices account list-models`
Version not available	Version non supportée pour la SKU	Sélectionner une version ou SKU différente
Insufficient quota	Capacité > quota disponible	La compétence recherche automatiquement toutes les régions ; échoue seulement si aucune région n'a de quota
SKU not supported	SKU non disponible dans la région	Basculement cross-région recherche automatiquement d'autres régions
Capacity out of range	Valeur de capacité invalide	PRÉVENU : La compétence valide min/max/step à l'entrée (Phase 7)
Deployment name exists	Conflit de noms	Génération de noms auto-incrémentée
Authentication failed	Pas connecté	Exécuter `az login`
Permission denied	Permissions insuffisantes	Assigner le rôle Cognitive Services Contributor
Capacity query fails	Erreur API/permissions/réseau	DÉPLOIEMENT BLOQUÉ : N'avancera pas sans données de quota valides

Commandes de dépannage

# Vérifier le statut du déploiement
az cognitiveservices account deployment show --name <account> --resource-group <rg> --deployment-name <name>

# Lister tous les déploiements
az cognitiveservices account deployment list --name <account> --resource-group <rg> -o table

# Vérifier l'utilisation du quota
az cognitiveservices usage list --name <account> --resource-group <rg>

# Supprimer un déploiement échoué
az cognitiveservices account deployment delete --name <account> --resource-group <rg> --deployment-name <name>

Guides de sélection et sujets avancés

Pour les tableaux de comparaison des SKU, les formules de dimensionnement PTU et les détails des options avancées, chargez references/customize-guides.md.

Sélection SKU : GlobalStandard (production/HA) → Standard (dev/test) → ProvisionedManaged (haut volume/débit garanti) → DataZoneStandard (résidence des données).

Capacité : Les SKU basées sur TPM vont de 1K (dev) à 100K+ (grande production). Les SKU basées sur PTU utilisent la formule : (Input TPM × 0.001) + (Output TPM × 0.002) + (Requests/min × 0.1).

Options avancées : Quota dynamique (GlobalStandard uniquement), traitement prioritaire (PTU uniquement, coût supplémentaire), débordement (débordement vers déploiement de secours).

Compétences associées

preset - Déploiement rapide vers la meilleure région avec configuration automatique
microsoft-foundry - Compétence parente pour toutes les opérations Azure AI Foundry
quota — Pour l'affichage des quotas, les demandes d'augmentation et le dépannage des erreurs de quota, reportez-vous à cette compétence au lieu de dupliquer les conseils
rbac - Gérer les permissions et le contrôle d'accès

Notes

Définir la variable d'environnement PROJECT_RESOURCE_ID pour ignorer l'invite
Toutes les SKU ne sont pas disponibles dans toutes les régions ; la capacité varie selon l'abonnement/région/modèle
Les politiques RAI personnalisées peuvent être configurées dans le portail Azure
Les mises à niveau automatiques de version se produisent pendant les fenêtres de maintenance
Utiliser Azure Monitor et Application Insights pour les déploiements en production