Kit de développement Azure AI Transcription pour Python
Bibliothèque cliente pour Azure AI Transcription (reconnaissance vocale) avec transcription en temps réel et par lots.
Installation
pip install azure-ai-transcription
Variables d'environnement
TRANSCRIPTION_ENDPOINT=https://<resource>.cognitiveservices.azure.com
TRANSCRIPTION_KEY=<your-key>
Authentification
Utilisez l'authentification par clé d'abonnement (DefaultAzureCredential n'est pas pris en charge par ce client) :
import os
from azure.ai.transcription import TranscriptionClient
client = TranscriptionClient(
endpoint=os.environ["TRANSCRIPTION_ENDPOINT"],
credential=os.environ["TRANSCRIPTION_KEY"]
)
Transcription (par lots)
job = client.begin_transcription(
name="meeting-transcription",
locale="en-US",
content_urls=["https://<storage>/audio.wav"],
diarization_enabled=True
)
result = job.result()
print(result.status)
Transcription (temps réel)
stream = client.begin_stream_transcription(locale="en-US")
stream.send_audio_file("audio.wav")
for event in stream:
print(event.text)
Bonnes pratiques
- Activez la diarization quand plusieurs interlocuteurs sont présents
- Utilisez la transcription par lots pour les fichiers longs stockés dans le blob storage
- Capturez les timestamps pour la génération de sous-titres
- Spécifiez la langue pour améliorer la précision de la reconnaissance
- Gérez la contre-pression du streaming pour la transcription en temps réel
- Fermez les sessions de transcription une fois terminées