pdf

Skill Codex curé pour la manipulation de fichiers PDF : lecture visuelle par rendu en PNG (Poppler), génération avec reportlab et extraction de texte avec pdfplumber ou pypdf.

npx skills add https://github.com/openai/skills --skill pdf

Rôle du skill

Ce skill fait partie du catalogue curé du repo openai/skills, qui regroupe des instructions et ressources packagées pour que les agents AI (notamment Codex) puissent accomplir des tâches répétables de façon fiable. Le skill pdf est conçu pour guider l'agent dans toutes les opérations impliquant des fichiers PDF : lecture, création programmatique et validation visuelle du rendu final.

Ce que couvre ce skill

Le SKILL.md décrit un workflow structuré en plusieurs étapes :

  • Revue visuelle en priorité : convertir les pages PDF en images PNG via pdftoppm (fourni par Poppler) pour inspecter mise en page, espacement et lisibilité avant toute livraison.
  • Génération : utiliser reportlab pour créer des documents PDF avec une mise en forme contrôlée.
  • Extraction de texte : utiliser pdfplumber ou pypdf pour des vérifications rapides de contenu, sans se fier à ces outils pour la fidélité visuelle.

Il définit également des conventions de nommage de fichiers, un dossier temporaire (tmp/pdfs/) et un dossier de sortie final (output/pdf/), ainsi que des critères de qualité précis (typographie cohérente, absence de texte rogné, tableaux nets, pas de tirets Unicode problématiques).

Dépendances attendues

Le skill liste les paquets Python nécessaires (reportlab, pdfplumber, pypdf) et l'outil système Poppler pour le rendu, avec les commandes d'installation via uv, pip et les gestionnaires de paquets système courants (Homebrew, apt). Si une dépendance est manquante dans l'environnement, l'agent est instruit d'en informer l'utilisateur plutôt que d'échouer silencieusement.

Comment l'utiliser

Ce skill étant dans le dossier .curated, il peut être installé dans Codex via le $skill-installer en spécifiant son nom (pdf), puis en redémarrant Codex. Une fois en place, il oriente automatiquement le comportement de l'agent dès qu'une tâche implique la manipulation de fichiers PDF, en lui fournissant un cadre de travail précis et des critères de livraison clairs.

Skills similaires