azure-ai-transcription-py

npx skills add https://github.com/microsoft/skills --skill azure-ai-transcription-py

Kit de développement Azure AI Transcription pour Python

Bibliothèque cliente pour Azure AI Transcription (reconnaissance vocale) avec transcription en temps réel et par lots.

Installation

pip install azure-ai-transcription

Variables d'environnement

TRANSCRIPTION_ENDPOINT=https://<resource>.cognitiveservices.azure.com
TRANSCRIPTION_KEY=<your-key>

Authentification

Utilisez l'authentification par clé d'abonnement (DefaultAzureCredential n'est pas pris en charge par ce client) :

import os
from azure.ai.transcription import TranscriptionClient

client = TranscriptionClient(
    endpoint=os.environ["TRANSCRIPTION_ENDPOINT"],
    credential=os.environ["TRANSCRIPTION_KEY"]
)

Transcription (par lots)

job = client.begin_transcription(
    name="meeting-transcription",
    locale="en-US",
    content_urls=["https://<storage>/audio.wav"],
    diarization_enabled=True
)
result = job.result()
print(result.status)

Transcription (temps réel)

stream = client.begin_stream_transcription(locale="en-US")
stream.send_audio_file("audio.wav")
for event in stream:
    print(event.text)

Bonnes pratiques

  1. Activez la diarization quand plusieurs interlocuteurs sont présents
  2. Utilisez la transcription par lots pour les fichiers longs stockés dans le blob storage
  3. Capturez les timestamps pour la génération de sous-titres
  4. Spécifiez la langue pour améliorer la précision de la reconnaissance
  5. Gérez la contre-pression du streaming pour la transcription en temps réel
  6. Fermez les sessions de transcription une fois terminées

Skills similaires