Kit de développement Azure AI Transcription pour Python

Bibliothèque cliente pour Azure AI Transcription (reconnaissance vocale) avec transcription en temps réel et par lots.

Installation

pip install azure-ai-transcription

Variables d'environnement

TRANSCRIPTION_ENDPOINT=https://<resource>.cognitiveservices.azure.com
TRANSCRIPTION_KEY=<your-key>

Authentification

Utilisez l'authentification par clé d'abonnement (DefaultAzureCredential n'est pas pris en charge par ce client) :

import os
from azure.ai.transcription import TranscriptionClient

client = TranscriptionClient(
    endpoint=os.environ["TRANSCRIPTION_ENDPOINT"],
    credential=os.environ["TRANSCRIPTION_KEY"]
)

Transcription (par lots)

job = client.begin_transcription(
    name="meeting-transcription",
    locale="en-US",
    content_urls=["https://<storage>/audio.wav"],
    diarization_enabled=True
)
result = job.result()
print(result.status)

Transcription (temps réel)

stream = client.begin_stream_transcription(locale="en-US")
stream.send_audio_file("audio.wav")
for event in stream:
    print(event.text)

Bonnes pratiques

Activez la diarization quand plusieurs interlocuteurs sont présents
Utilisez la transcription par lots pour les fichiers longs stockés dans le blob storage
Capturez les timestamps pour la génération de sous-titres
Spécifiez la langue pour améliorer la précision de la reconnaissance
Gérez la contre-pression du streaming pour la transcription en temps réel
Fermez les sessions de transcription une fois terminées

azure-ai-transcription-py