Transcription YouTube
Extraire les transcriptions de vidéos YouTube en utilisant youtube-transcript-api.
Utilisation
Exécutez le script avec une URL YouTube ou un ID de vidéo :
uv run scripts/get_transcript.py "VIDEO_URL_OR_ID"
Avec horodatages :
uv run scripts/get_transcript.py "VIDEO_URL_OR_ID" --timestamps
Paramètres par défaut
- Sans horodatages (défaut) : texte brut, une ligne par segment de sous-titre
- Avec horodatages : format
[MM:SS] texte(ou[HH:MM:SS]pour les vidéos plus longues)
Formats d'URL supportés
https://www.youtube.com/watch?v=VIDEO_IDhttps://youtu.be/VIDEO_IDhttps://youtube.com/embed/VIDEO_ID- ID de vidéo brut (11 caractères)
Sortie
- CRITIQUE : VOUS NE DEVEZ JAMAIS MODIFIER LA TRANSCRIPTION RETOURNÉE
- Si la transcription est sans horodatages, vous DEVEZ la nettoyer pour qu'elle soit organisée par paragraphes complets et les lignes ne coupent pas au milieu des phrases.
- Si vous avez été invité à enregistrer la transcription dans un fichier spécifique, enregistrez-la dans le fichier demandé.
- Si aucun fichier de sortie n'a été spécifié, utilisez l'ID de vidéo YouTube avec le suffixe
-transcript.txt.
Notes
- Récupère les sous-titres générés automatiquement ou ajoutés manuellement (selon ce qui est disponible)
- Requiert que la vidéo ait les sous-titres activés
- Revient aux sous-titres générés automatiquement si les sous-titres manuels ne sont pas disponibles