Defuddle
Utilisez Defuddle CLI pour extraire du contenu lisible et épuré des pages web. À préférer à WebFetch pour les pages web standard — supprime la navigation, les publicités et le désordre, réduisant l'utilisation de tokens.
Si non installé : npm install -g defuddle
Usage
Utilisez toujours --md pour la sortie markdown :
defuddle parse <url> --md
Enregistrer dans un fichier :
defuddle parse <url> --md -o content.md
Extraire des métadonnées spécifiques :
defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain
Formats de sortie
| Flag | Format |
|---|---|
--md |
Markdown (choix par défaut) |
--json |
JSON avec HTML et markdown |
| (aucun) | HTML |
-p <name> |
Propriété de métadonnées spécifique |