deep-research

Par elophanto · elophanto

À utiliser pour investiguer toute affirmation, question ou sujet pour lequel la première réponse facile est probablement insuffisante. Reformule la question comme une affirmation falsifiable, hiérarchise les sources, présente le meilleur argument en faveur de la thèse adverse, et effectue une validation croisée via des chemins indépendants avant d'énoncer un niveau de confiance. Remplace « Je vais faire une recherche rapide » par une investigation structurée.

npx skills add https://github.com/elophanto/elophanto --skill deep-research

Déclencheurs

  • recherche approfondie
  • recherche ceci
  • enquête sur ceci
  • aller au fond des choses
  • est-ce vrai
  • vérification des faits
  • valider cette affirmation
  • ce qui se passe vraiment
  • séparer le signal du bruit
  • trouver le point de vue contraire
  • présenter la meilleure version de cet argument
  • ce consensus est-il juste
  • vision mainstream vs réalité
  • creuser davantage
  • pas satisfait par une réponse superficielle

Recherche approfondie

Vue d'ensemble

La plupart des « recherches » via moteur de recherche retournent la même réponse cinq fois parce que cinq sites copient une même source. Ce n'est pas de la recherche, c'est l'amplification du consensus. Cette compétence existe pour faire le travail plus difficile : formuler correctement la question, hiérarchiser les preuves, présenter le meilleur argument de la dissidence, et aboutir à un intervalle de confiance — pas à un paragraphe qui sonne confiant.

Règle absolue : ne jamais énoncer une conclusion sans (a) le niveau de la source, (b) le contre-argument le plus solide et ce qui le réfuterait, et (c) ce que vous ne savez pas.

Phase 1 — formuler comme une affirmation réfutable

Reformulez la question ouverte en une ou plusieurs affirmations qui pourraient être fausses. Pas « X est-il efficace ? » mais « l'affirmation que X réduit Y d'au moins Z% dans la population P ».

Les questions vagues donnent des réponses vagues. La première chose à faire est d'affiner.

Si la question de l'utilisateur ne peut pas être transformée en affirmation réfutable, c'est en soi le résultat — soulevez-le (« cette question est irréfutable telle que posée parce que… ») au lieu de prétendre la rechercher.

Phase 2 — fixer le budget

Avant de rechercher quoi que ce soit, notez :

  • Budget de sources : ~6–10 sources pour la routine, ~20+ pour les enjeux élevés.
  • Budget de tours : nombre maximum d'appels web_search / web_extract.
  • Conditions d'arrêt :
    • confiance atteinte et stable sur deux chemins de source indépendants, OU
    • budget épuisé (rédiger la réponse partielle + inconnues restantes), OU
    • l'affirmation est irréfutable / aucune source primaire n'existe (dites-le).

Les budgets bornés empêchent les investigations qui traînent. L'épuisement du budget est un résultat valide — reconnaître ce que vous n'avez pas pu vérifier plutôt que de rembourrer avec des sources faibles.

Phase 3 — rubrique de source hiérarchisée

Évaluez chaque source par niveau avant de l'incorporer à la réponse.

Niveau Quoi Exemples
1. Primaire Données originales, le document réel Articles (avec méthodes), documents judiciaires, SEC 13F/initié, transactions on-chain, ensembles de données, déclarations officielles, commits GitHub, fiches réglementaires
2. Expert Experts du domaine citant des sources primaires Articles de synthèse, rapports d'analystes sectoriels, revues évaluées par les pairs, blogs d'experts nommés avec citations primaires
3. Journalisme Reporters synthétisant Outlets de qualité avec journalistes nommés, citations sourçées, liens vers des sources primaires
4. Agrégateur/réseaux sociaux Ré-résumant Consensus Reddit/HN/X, Wikipedia (utiliser comme carte, pas comme territoire), réécrits de news généralistes
5. IA/SEO Correspondance de motifs de contenu Articles générés par LLM, fermes de contenu, listicles « 10 choses que vous devez savoir »

Règles strictes :

  • Une affirmation qui existe uniquement au niveau 4–5 est non vérifiée. Marquez-la comme telle. Ne l'escaladez pas juste parce que plusieurs sites la répètent (blanchiment de citations).
  • Quand le niveau 3 cite le niveau 1, allez lire le niveau 1. Ne faites pas confiance au résumé.
  • Une seule source de niveau 1 vaut dix sources de niveau 4 disant la même chose.
  • Les sources de niveau 5 sont du bruit sauf si elles citent une source de niveau 1 — auquel cas elles sont un pointeur vers le niveau 1, pas une source en elles-mêmes.

Utilisez web_search (Search.sh) et web_extract pour extraire du contenu ; pour les enquêtes critiques, tirez aussi de knowledge_search(scope="learned") au cas où nous aurions déjà des leçons antérieures sur le sujet.

Phase 4 — consensus vs dissidence

Pour chaque affirmation majeure, identifiez deux camps :

  1. Consensus mainstream — ce que disent la plupart des sources de niveau 2/3.
  2. Dissidence la plus solide — la voix la plus crédibilisée et la mieux étayée qui désaccorde avec le consensus. Pas un contraire aléatoire. Celle dont l'argument changerait vraiment le consensus s'il tenait.

Présentez la meilleure version de la dissidence. Formulez l'argument dissident dans sa forme la plus solide — ce que vous diriez si vous deviez vraiment le défendre. Puis demandez : quelles preuves le réfuteraient ? Si cette preuve existe et tient, la dissidence perd. Si la dissidence présentée favorablement tient bon face à son propre test de réfutation, le consensus est plus faible qu'il n'y paraît.

Cette étape est non-optionnelle. Si vous ne trouvez pas de dissidence crédible, c'est le résultat — dites « aucune dissidence crédible n'existe aux niveaux 1–2, ce qui suggère un consensus fort ou une sous-investigation par les experts ; à signaler pour suivi ».

Phase 5 — validation croisée via chemins indépendants

Une affirmation corroborée par deux sources du même domaine est à peine plus forte qu'une source. Une affirmation corroborée par des sources de domaines indépendants (p. ex., données on-chain + document judiciaire + expert nommé) est beaucoup plus forte.

Pour l'affirmation centrale, identifiez ≥2 chemins indépendants vers la même conclusion. Si vous ne trouvez qu'un chemin, votre confiance reste limitée par le niveau de ce seul chemin.

Phase 6 — journaliser chaque étape

Conservez un journal de recherche par investigation afin que le travail soit reproductible et que la chaîne de raisonnement de l'agent soit explorable. Utilisez l'une des deux options :

Option A (markdown — préféré pour les investigations narratives) : écrivez dans knowledge/learned/research/{date}-{slug}.md avec frontmatter :

---
claim: "<affirmation réfutable>"
verdict: supported | contradicted | inconclusive
confidence: 0.0–1.0
sources: <count>
tiers: {primary: N, expert: N, journalism: N, aggregator: N, ai: N}
dissent: <résumé d'une ligne de la meilleure version de la dissidence>
unknowns: <liste de ce qui n'a pas été vérifié>
---

(narrative: formulation → sources parcourues → dissidence → validation croisée →
verdict + confiance + réserves)

Option B (TSV — préféré pour les sweeps paramétriques / multi-affirmations) : ajoutez à knowledge/learned/research/{slug}.tsv :

claim   source_url  tier    supports    confidence  notes

Utilisez knowledge_write pour persister ; l'indexeur fait remonter les futures requêtes knowledge_search sur les investigations antérieures sur la même affirmation. Ne re-recherchez pas ce que vous avez déjà enquêté la semaine dernière — vérifiez d'abord le journal.

Phase 7 — résultat

Le livrable n'est pas un paragraphe. C'est :

  1. Verdict (une phrase) — soutenu / contredit / sans conclusion.
  2. Confiance (0,0–1,0) — ce qui la changerait vers le haut ou le bas.
  3. Meilleure preuve — la citation unique la plus solide, avec son niveau.
  4. Meilleur contre-argument — la dissidence présentée favorablement + pourquoi elle a perdu (ou non).
  5. Ce que vous ne savez pas — les inconnues bornées. Jamais vide.
  6. Piste de reproduction — lien vers le fichier du journal de recherche.

Puis, si l'utilisateur a posé une question (versus vous demander de mener l'enquête), une réponse directe de 2–4 phrases qui respecte tout ce qui précède.

Règles strictes — ce qu'il NE FAUT PAS faire

  • Pas de « j'ai lu X sources et elles s'accordent toutes » sans nommer les niveaux. Cinq sources de niveau 4 d'accord, c'est du bruit, pas du signal.
  • Pas de conclusion sans dissidence présentée favorablement — même si vous la rejetez, faites le travail de l'énoncer.
  • Pas de chaînes primaire→résumé non divulguées. Si vous lisez un résumé qui cite une source primaire, allez lire la primaire. Si vous ne pouvez pas y accéder, dites-le.
  • Pas de fuites de certitude. Si vos preuves sont surtout de niveau 3, le verdict est « soutenu par le journalisme, pas encore par la primaire ». Ne pas arrondir.
  • Pas de fouille infinie. Quand le budget touche à sa fin, arrêtez-vous et rapportez, même partiel. Reprendre avec plus de budget est une investigation séparée.
  • Pas de correspondance de motifs avec des cas antérieurs sans vérifier qu'ils s'appliquent. « Cela ressemble à la situation X » est une hypothèse, pas un résultat.

Quand escalader vs continuer de façon autonome

Cette compétence est conçue pour les contextes de l'esprit autonome et du heartbeat — elle ne s'arrête pas pour demander à l'utilisateur « dois-je continuer ? ». La boucle s'exécute jusqu'au budget atteint ou aux conditions d'arrêt rencontrées, exactement comme la boucle d'expérience autonome.

Escaladez à l'utilisateur uniquement quand :

  • L'affirmation est irréfutable telle que posée (demander une question plus nette).
  • Toutes les sources primaires sont payantes / inaccessibles (demander l'accès).
  • La dissidence la plus solide est assez crédible pour que le verdict puisse basculer avec plus d'investigation — la surfacer comme une décision « de goût ».
  • Budget épuisé et confiance toujours <0,6 sur une affirmation critique.

Sinon, terminez l'investigation, journalisez-la, retournez le verdict.

Ce que cette compétence NE FAIT PAS

  • Remplacer le jugement expert dans les domaines pour lesquels l'agent n'est pas entraîné (médical, juridique, conseil financier — la source de niveau 1 est « consultez un professionnel », et le verdict sur l'opinion synthétisée est « n'agissez pas sur cela sans en avoir un »).
  • Auto-publier les résultats. Le résultat est un journal de recherche + verdict structuré ; agir sur le verdict est une décision séparée que l'utilisateur prend.
  • Enquêter sur les signaux de trading en direct ou les mouvements de marché à court terme (compétence différente ; celle-ci concerne les affirmations testables sur un horizon de temps plus long qu'elles ne sont tradables).

Vérifier

  • Chaque affirmation non triviale du résultat est associée à un lien de source, un chemin de fichier, ou un résultat de requête, et non énoncée comme une assertion brute
  • Les sources s'étendent sur au moins 2–3 origines indépendantes ; les conclusions à source unique sont signalées comme telles
  • Les contre-preuves ou limitations sont explicitement énumérées, pas omises pour rendre le récit plus lisse
  • Les nombres du livrable portent des unités, des fenêtres de temps, et une date « au » (p. ex., « 1,2 M USD ARR au 30/04/2026 »)
  • Les citations directes sont verbatim et citent leur localisation ; les paraphrases sont marquées comme telles
  • Les sources périmées ou inatteignables sont notées dans la bibliographie plutôt que silencieusement supprimées

Skills similaires