research-lookup : recherche académique et scientifique pour agents

Capacités principales

1. Requêtes de recherche générale (API Chat parallèle)

Backend par défaut. Fournit une recherche multi-source complète avec citations via l'API Chat (core model).

Exemples de requêtes:
- "Recent advances in CRISPR gene editing 2025"
- "Compare mRNA vaccines vs traditional vaccines for cancer treatment"
- "AI adoption in healthcare industry statistics"
- "Global renewable energy market trends and projections"
- "Explain the mechanism underlying gut microbiome and depression"

La réponse inclut:

Rapport de recherche complet en markdown
Citations intégrées provenant de sources web faisant autorité
Sections structurées avec les principaux résultats
Perspectives multiples et points de données
URLs des sources pour vérification

2. Recherche d'articles académiques (Perplexity sonar-pro-search)

Utilisé pour les requêtes spécifiques à l'académique. Privilégie les bases de données savantes et les sources évaluées par les pairs.

Exemples de requêtes:
- "Find papers on transformer attention mechanisms in NeurIPS 2024"
- "Foundational papers on quantum error correction"
- "Systematic review of immunotherapy in non-small cell lung cancer"
- "Cite the original BERT paper and its most influential follow-ups"
- "Published studies on CRISPR off-target effects in clinical trials"

La réponse inclut:

Résumé des principaux résultats de la littérature académique
5-8 citations de haute qualité avec auteurs, titres, journaux, années, DOIs
Comptages de citations et indicateurs de tier de lieu de publication
Principaux statistiques et points forts de la méthodologie
Lacunes de recherche et orientations futures

3. Information technique et méthodologique

Exemples de requêtes:
- "Western blot protocol for protein detection"
- "Statistical power analysis for clinical trials"
- "Machine learning model evaluation metrics comparison"

4. Données statistiques et de marché

Exemples de requêtes:
- "Prevalence of diabetes in US population 2025"
- "Global AI market size and growth projections"
- "COVID-19 vaccination rates by country"

Priorisation de la qualité et de la popularité des articles

CRITIQUE : Lors de la recherche d'articles, TOUJOURS privilégier les articles de haute qualité et influents.

Classement basé sur les citations

Âge de l'article	Seuil de citations	Classification
0-3 ans	20+ citations	Remarquable
0-3 ans	100+ citations	Hautement influent
3-7 ans	100+ citations	Significatif
3-7 ans	500+ citations	Article fondateur
7+ ans	500+ citations	Œuvre majeure
7+ ans	1000+ citations	Fondamental

Tiers de qualité des lieux de publication

Tier 1 - Lieux de publication de premier plan (Toujours privilégier):

Sciences générales: Nature, Science, Cell, PNAS
Médecine: NEJM, Lancet, JAMA, BMJ
Spécifiques au domaine: Nature Medicine, Nature Biotechnology, Nature Methods
Top CS/AI: NeurIPS, ICML, ICLR, ACL, CVPR

Tier 2 - Spécialisées à fort impact (Forte préférence):

Journaux avec Impact Factor > 10
Conférences de premier plan dans les sous-domaines (EMNLP, NAACL, ECCV, MICCAI)

Tier 3 - Spécialisées respectées (Inclure si pertinent):

Journaux avec Impact Factor 5-10

Intégration technique

Variables d'environnement

# Backend principal (API Chat parallèle) - OBLIGATOIRE
export PARALLEL_API_KEY="your_parallel_api_key"

# Backend de recherche académique (Perplexity) - OBLIGATOIRE pour les requêtes académiques
export OPENROUTER_API_KEY="your_openrouter_api_key"

Spécifications API

API Chat parallèle:

Endpoint: https://api.parallel.ai (compatible avec OpenAI SDK)
Modèle: core (latence 60s-5min, synthèse complexe multi-source)
Sortie: Texte Markdown avec citations intégrées
Citations: Base de recherche avec URLs, raisonnement et niveaux de confiance
Rate limits: 300 req/min
Package Python: openai

Perplexity sonar-pro-search:

Modèle: perplexity/sonar-pro-search (via OpenRouter)
Mode de recherche: Académique (privilégie les sources évaluées par les pairs)
Contexte de recherche: Élevé (recherche complète)
Temps de réponse: 5-15 secondes

Utilisation en ligne de commande

# Recherche auto-routée (recommandé) — TOUJOURS enregistrer dans sources/
python research_lookup.py "your query" -o sources/research_YYYYMMDD_HHMMSS_<topic>.md

# Forcer un backend spécifique — TOUJOURS enregistrer dans sources/
python research_lookup.py "your query" --force-backend parallel -o sources/research_<topic>.md
python research_lookup.py "your query" --force-backend perplexity -o sources/papers_<topic>.md

# Sortie JSON — TOUJOURS enregistrer dans sources/
python research_lookup.py "your query" --json -o sources/research_<topic>.json

# Requêtes batch — TOUJOURS enregistrer dans sources/
python research_lookup.py --batch "query 1" "query 2" "query 3" -o sources/batch_research_<topic>.md

OBLIGATOIRE: Enregistrer tous les résultats dans le dossier sources

Tous les résultats de recherche-lookup DOIVENT être enregistrés dans le dossier sources/ du projet.

C'est non négociable. Les résultats de recherche sont coûteux à obtenir et critiques pour la reproductibilité.

Règles d'enregistrement

Backend	Cible du drapeau `-o`	Modèle de nom de fichier
Recherche approfondie parallèle	`sources/research_<topic>.md`	`research_YYYYMMDD_HHMMSS_<brief_topic>.md`
Perplexity (académique)	`sources/papers_<topic>.md`	`papers_YYYYMMDD_HHMMSS_<brief_topic>.md`
Requêtes batch	`sources/batch_<topic>.md`	`batch_research_YYYYMMDD_HHMMSS_<brief_topic>.md`

Comment enregistrer

CRITIQUE: Chaque appel à research_lookup.py DOIT inclure le drapeau -o pointant vers le dossier sources/.

CRITIQUE: Les fichiers enregistrés DOIVENT conserver toutes les citations, URLs des sources et DOIs. La sortie texte par défaut inclut automatiquement une section Sources (avec titre, date, URL pour chaque source) et une section Additional References (avec DOIs et URLs académiques extraits du texte de réponse). Pour les métadonnées de citation maximales, utilisez --json.

# Recherche générale — enregistrer dans sources/ (inclut sections Sources + Additional References)
python research_lookup.py "Recent advances in CRISPR gene editing 2025" \
  -o sources/research_20250217_143000_crispr_advances.md

# Recherche d'articles académiques — enregistrer dans sources/ (inclut citations d'articles avec DOIs)
python research_lookup.py "Find papers on transformer attention mechanisms in NeurIPS 2024" \
  -o sources/papers_20250217_143500_transformer_attention.md

# Format JSON pour les métadonnées de citation maximales (objets de citation complets avec URLs, DOIs, extraits)
python research_lookup.py "CRISPR clinical trials" --json \
  -o sources/research_20250217_143000_crispr_trials.json

# Backend forcé — enregistrer dans sources/
python research_lookup.py "AI regulation landscape" --force-backend parallel \
  -o sources/research_20250217_144000_ai_regulation.md

# Requêtes batch — enregistrer dans sources/
python research_lookup.py --batch "mRNA vaccines efficacy" "mRNA vaccines safety" \
  -o sources/batch_research_20250217_144500_mrna_vaccines.md

Préservation des citations dans les fichiers enregistrés

Chaque format de sortie préserve les citations différemment:

Format	Citations incluses	Quand utiliser
Texte (défaut)	Section `Sources (N):` avec `[titre] (date) + URL` + `Additional References (N):` avec DOIs et URLs académiques	Utilisation standard — lisible par l'humain avec toutes les citations
JSON (`--json`)	Objets de citation complets: `url`, `title`, `date`, `snippet`, `doi`, `type`	Quand vous avez besoin de métadonnées de citation maximales

Pour le backend Parallel, les fichiers enregistrés incluent: rapport de recherche + liste Sources (titre, URL) + Additional References (DOIs, URLs académiques). Pour le backend Perplexity, les fichiers enregistrés incluent: résumé académique + liste Sources (titre, date, URL, extrait) + Additional References (DOIs, URLs académiques).

Utilisez --json quand vous avez besoin de:

Analyser les métadonnées de citation par programme
Préserver les données complètes de DOI et d'URL pour la génération BibTeX
Maintenir les objets de citation structurés pour les références croisées

Pourquoi tout enregistrer

Reproductibilité: Chaque citation et affirmation peut être retracée à sa source de recherche brute
Récupération de fenêtre de contexte: Si le contexte est compressé, les résultats enregistrés peuvent être relus sans re-requête
Piste d'audit: Le dossier sources/ documente exactement comment toutes les informations de recherche ont été rassemblées
Réutilisation entre sections: Plusieurs sections peuvent référencer la même recherche enregistrée sans requêtes en double
Efficacité des coûts: Vérifiez sources/ pour les résultats existants avant de faire de nouveaux appels API
Support d'examen par les pairs: Les examinateurs peuvent vérifier la recherche soutenant chaque citation

Avant de faire une nouvelle requête, vérifiez d'abord les sources

Avant d'appeler research_lookup.py, vérifiez si un résultat pertinent existe déjà:

ls sources/  # Vérifier les résultats enregistrés existants

Si une recherche antérieure couvre le même sujet, relisez le fichier enregistré au lieu de faire un nouvel appel API.

Journalisation

Lors de l'enregistrement des résultats de recherche, toujours enregistrer:

[HH:MM:SS] SAVED: Research lookup to sources/research_20250217_143000_crispr_advances.md (3,800 words, 8 citations)
[HH:MM:SS] SAVED: Paper search to sources/papers_20250217_143500_transformer_attention.md (6 papers found)

Intégration avec la rédaction scientifique

Cette compétence améliore la rédaction scientifique en fournissant:

Support de revue de littérature: Rassembler la recherche actuelle pour introduction et discussion — enregistrer dans sources/
Validation des méthodes: Vérifier les protocoles par rapport aux normes actuelles — enregistrer dans sources/
Contextualisation des résultats: Comparer les résultats avec des études récentes similaires — enregistrer dans sources/
Amélioration de la discussion: Soutenir les arguments avec les dernières preuves — enregistrer dans sources/
Gestion des citations: Fournir des citations correctement formatées — enregistrer dans sources/

Outils complémentaires

Tâche	Outil
Recherche web générale	compétence `parallel-web` (`parallel_web.py search`)
Vérification de citation	compétence `parallel-web` (`parallel_web.py extract`)
Recherche approfondie (tout sujet)	compétence `research-lookup` ou `parallel-web`
Recherche d'articles académiques	`research-lookup` (auto-routage vers Perplexity)
Recherche Google Scholar	compétence `citation-management`
Recherche PubMed	compétence `citation-management`
DOI vers BibTeX	compétence `citation-management`
Vérification des métadonnées	compétence `parallel-web` (`parallel_web.py search` ou `extract`)

Gestion des erreurs et limitations

Limitations connues:

API Chat parallèle (modèle core): Les requêtes complexes peuvent prendre jusqu'à 5 minutes
Perplexity: Cutoff d'information, peut ne pas accéder au texte intégral derrière les paywalls
Les deux: Impossible d'accéder aux bases de données propriétaires ou restreintes

Comportement de secours:

Si la clé API du backend sélectionné est manquante, essaie l'autre backend
Si les deux backends échouent, retourne une réponse d'erreur structurée
Reformulez les requêtes pour de meilleurs résultats si la réponse initiale est insuffisante

Exemples d'utilisation

Exemple 1: Recherche générale (route vers Parallel)

Requête: "Recent advances in transformer attention mechanisms 2025"

Backend: API Chat parallèle (modèle core)

Réponse: Rapport markdown complet avec citations provenant de sources faisant autorité, couvrant les articles récents, les innovations clés et les points de référence de performance.

Exemple 2: Recherche d'articles académiques (route vers Perplexity)

Requête: "Find papers on CRISPR off-target effects in clinical trials"

Backend: Perplexity sonar-pro-search (mode académique)

Réponse: Liste organisée de 5-8 articles à fort impact avec citations complètes, DOIs, comptages de citations et indicateurs de tier de lieu de publication.

Exemple 3: Analyse comparative (route vers Parallel)

Requête: "Compare and contrast mRNA vaccines vs traditional vaccines for cancer treatment"

Backend: API Chat parallèle (modèle core)

Réponse: Rapport comparatif détaillé avec données provenant de multiples sources, analyse structurée et preuves citées.

Exemple 4: Données de marché (route vers Parallel)

Requête: "Global AI adoption in healthcare statistics 2025"

Backend: API Chat parallèle (modèle core)

Réponse: Données de marché actuelles, taux d'adoption, projections de croissance et analyse régionale avec citations de sources.

Résumé

Cette compétence sert d'interface de recherche principale avec routage intelligent dual-backend:

API Chat parallèle (défaut, modèle core): Recherche complète multi-source pour tout sujet
Perplexity sonar-pro-search: Recherches d'articles académiques uniquement
Routage automatique: Détecte les requêtes académiques et les route de manière appropriée
Remplacement manuel: Forcer n'importe quel backend si nécessaire
Complémentaire: Fonctionne aux côtés de la compétence parallel-web pour la recherche web et l'extraction d'URL

Capacités principales

1. Requêtes de recherche générale (API Chat parallèle)

2. Recherche d'articles académiques (Perplexity sonar-pro-search)

3. Information technique et méthodologique

4. Données statistiques et de marché

Priorisation de la qualité et de la popularité des articles

Classement basé sur les citations

Tiers de qualité des lieux de publication

Intégration technique

Variables d'environnement

Spécifications API

Utilisation en ligne de commande

OBLIGATOIRE: Enregistrer tous les résultats dans le dossier sources

Règles d'enregistrement

Comment enregistrer

Préservation des citations dans les fichiers enregistrés

Pourquoi tout enregistrer

Avant de faire une nouvelle requête, vérifiez d'abord les sources

Journalisation

Intégration avec la rédaction scientifique

Outils complémentaires

Gestion des erreurs et limitations

Exemples d'utilisation

Exemple 1: Recherche générale (route vers Parallel)

Exemple 2: Recherche d'articles académiques (route vers Perplexity)

Exemple 3: Analyse comparative (route vers Parallel)

Exemple 4: Données de marché (route vers Parallel)

Résumé

Skills similaires