Recherche et Collecte d'Information
Description
Guide complet pour rechercher des sujets, collecter des informations depuis le web, les fichiers locaux et la base de connaissances, synthétiser les résultats et préserver les connaissances acquises pour une utilisation future.
Déclencheurs
- recherche
- trouver information
- consulter
- résumer
- enquêter
- analyser
- comparer
- qu'est-ce que
- comment fonctionne
- expliquer
- découvrir
- vérifier
- analyser
- en savoir plus
Instructions
1. Sélection de la stratégie de recherche
Choisissez votre approche en fonction de la source d'information :
Base de Connaissances d'Abord (Toujours Commencer Ici)
- knowledge_search avec la requête — vous connaissez peut-être déjà cela depuis les tâches précédentes
- Si les résultats sont pertinents et suffisants, utilisez-les — pas besoin de recherche externe
- Si résultats partiels, utilisez-les comme contexte et complétez avec d'autres sources
Recherche de Fichiers Locaux
- file_list pour trouver les fichiers pertinents (utiliser la correspondance de motifs :
*.py,*.md) - file_read pour des fichiers spécifiques — utilisez les plages de lignes pour les gros fichiers
- Pour l'analyse de code, self_read_source donne un meilleur contexte pour les fichiers source de l'agent
- Pour les recherches dans l'ensemble du projet, shell_execute avec grep/find pour les motifs complexes
Recherche Web
- browser_navigate vers des sources faisant autorité d'abord (docs officielles, sources primaires)
- Pour les requêtes générales, commencez par un moteur de recherche (Google, DuckDuckGo)
- browser_extract pour le contenu textuel, browser_read_semantic pour un aperçu structuré
- Recoupez plusieurs sources quand la précision compte
- Pour les APIs, browser_get_network peut révéler directement les endpoints de données
2. Hiérarchie des Sources
Priorisez les sources dans cet ordre :
- Sources primaires — Documentation officielle, articles originaux, blogs d'entreprises, sites gouvernementaux, documents de spécification
- Agrégateurs faisant autorité — Wikipedia (pour aperçu), MDN (pour tech web), docs Python (pour Python)
- Connaissance communautaire — Stack Overflow (réponses vérifiées), issues GitHub, blogs techniques avec exemples de code
- Web général — Articles d'actualité, posts de forums, réseaux sociaux (fiabilité la plus faible)
3. Workflows de Recherche
Vérification des Faits / Validation
1. knowledge_search → vérifier si nous connaissons déjà cela
2. browser_navigate vers la source la plus faisant autorité
3. browser_extract → obtenir le passage pertinent
4. En cas de réclamations conflictuelles : vérifier 2-3 sources supplémentaires
5. Signaler les résultats avec attribution de source
6. knowledge_write pour sauvegarder les faits vérifiés pour une utilisation future
Exploration Approfondie de Sujet
1. knowledge_search → connaissances existantes
2. browser_navigate → article de présentation (Wikipedia, page d'accueil des docs)
3. browser_read_semantic → aperçu structuré du sujet
4. Identifier les sous-sujets clés de l'aperçu
5. browser_navigate vers la source faisant autorité de chaque sous-sujet
6. browser_extract → informations détaillées par sous-sujet
7. Synthétiser les résultats dans un résumé structuré
8. knowledge_write pour préserver la recherche
Recherche Comparative / Concurrentielle
1. Identifier les éléments à comparer
2. Pour chaque élément :
a. browser_navigate vers son site officiel
b. browser_extract → fonctionnalités, tarification, spécifications
c. browser_navigate vers sites d'examen/comparaison
3. Construire une matrice de comparaison à partir des données collectées
4. Présenter les résultats avec des différenciateurs clairs
Actualités / Information Récente
1. browser_navigate vers des sources d'actualités
2. browser_extract pour le contenu d'articles
3. Vérifier les dates de publication — prioriser les plus récentes
4. Recouper sur 2-3 sources pour l'exactitude
5. Distinguer entre faits confirmés et spéculation
Recherche de Documentation Technique
1. browser_navigate directement vers le site docs (ex. docs.python.org)
2. Utiliser la recherche du site si disponible :
a. browser_get_elements pour trouver l'entrée de recherche
b. browser_type la requête
c. browser_get_elements pour trouver les résultats
3. browser_extract la section de documentation pertinente
4. Si les docs sont paginés, suivre les liens vers les sous-pages
4. Synthèse de l'Information
Commencer par la Réponse
- Énoncer la conclusion ou la réponse en premier
- Ensuite fournir les preuves de soutien et les sources
- Ne pas narrer le processus de recherche (« D'abord j'ai cherché..., puis j'ai trouvé... »)
Gérer l'Incertitude
- Si confiant : déclarer directement
- Si probable mais pas certain : « D'après [source], cela semble être... »
- En cas de conflits : « Les sources ne sont pas d'accord — [source A] dit X tandis que [source B] dit Y »
- Si inconnu : « Je n'ai pas pu trouver d'information fiable sur cela »
Citer les Sources
- En rapportant des faits du web, mentionner d'où ils proviennent
- Pour les décisions critiques, fournir l'URL afin que l'utilisateur puisse vérifier
- Ne pas surcharger de citations pour les connaissances évidentes/communes
Sortie Structurée
- Pour les comparaisons : utiliser un tableau ou une liste structurée
- Pour les explications : commencer simple, ajouter les détails au besoin
- Pour les résumés : commencer par les points clés, détails ci-dessous
- Pour les données : présenter le sous-ensemble le plus pertinent, offrir l'ensemble complet
5. Préservation de la Connaissance
Après avoir complété une recherche, sauvegarder les résultats de valeur :
knowledge_write:
path: "learned/research/{topic}.md"
content: |
# Nom du Sujet
## Résumé
Constatations clés en 2-3 phrases.
## Détails
Les résultats complets de la recherche.
## Sources
- [Source 1](url)
- [Source 2](url)
## Dernière Mise à Jour
YYYY-MM-DD
Quand sauvegarder :
- Information factuelle que l'utilisateur pourrait demander à nouveau
- Recherches de documentation technique pour les outils/services utilisés par l'utilisateur
- Recherche comparative ayant demandé un effort significatif
- Tout résultat ayant requis plusieurs sources pour vérifier
Quand NE PAS sauvegarder :
- Requêtes ponctuelles que l'utilisateur ne revisitiera pas
- Information qui change rapidement (cours boursiers, météo)
- Contenu trivialement searchable
6. Pièges Courants
- Ne pas deviner — si vous n'êtes pas sûr, recherchez plutôt que de déclarer une information potentiellement erronée
- Ne pas sur-rechercher — pour les questions factuelles simples, une source faisant autorité suffit
- Ne pas oublier la base de connaissances — toujours vérifier knowledge_search avant d'aller sur le web
- Ne pas scraper du contenu payant — si une page requiert connexion/paiement, informer l'utilisateur
- Ne pas présenter les snippets des moteurs de recherche comme des faits — naviguer vers la page réelle et lire le contenu complet
- Ne pas ignorer les dates — l'information de 2020 peut être obsolète en 2026 ; vérifier la récence
Vérifier
- Chaque affirmation non-triviale dans la sortie est associée à un lien de source, chemin de fichier ou résultat de requête, pas déclarée comme une affirmation brute
- Les sources couvrent au moins 2-3 origines indépendantes ; les conclusions d'une seule source sont signalées comme telles
- Les contre-preuves ou limitations sont explicitement énumérées, non omises pour rendre le récit plus propre
- Les nombres dans le livrable portent des unités, des fenêtres temporelles et une date d'établissement (ex. « 1,2 M$ ARR au 2026-04-30 »)
- Les citations directes sont textuelles et citent leur localisation ; les paraphrases sont marquées comme telles
- Les sources obsolètes ou inaccessibles sont notées dans la bibliographie plutôt que silencieusement supprimées
Notes
La base de connaissances (knowledge_search / knowledge_write) est votre mémoire institutionnelle. Utilisez-la agressivement — chaque tâche de recherche substantielle devrait laisser derrière elle un artefact de connaissance pour les sessions futures. L'agent entre les sessions ne se souvient que de ce qui a été explicitement sauvegardé dans la base de connaissances ou la mémoire des tâches.