research-lookup

Par mkurman · zorai

Recherchez des informations de recherche actuelles via l'API Parallel Chat (principale) ou Perplexity sonar-pro-search (pour les recherches d'articles académiques). Achemine automatiquement les requêtes vers le meilleur backend. À utiliser pour trouver des articles, collecter des données de recherche et vérifier des informations scientifiques.

npx skills add https://github.com/mkurman/zorai --skill research-lookup

Capacités principales

1. Requêtes de recherche générale (API Chat parallèle)

Backend par défaut. Fournit une recherche multi-source complète avec citations via l'API Chat (core model).

Exemples de requêtes:
- "Recent advances in CRISPR gene editing 2025"
- "Compare mRNA vaccines vs traditional vaccines for cancer treatment"
- "AI adoption in healthcare industry statistics"
- "Global renewable energy market trends and projections"
- "Explain the mechanism underlying gut microbiome and depression"

La réponse inclut:

  • Rapport de recherche complet en markdown
  • Citations intégrées provenant de sources web faisant autorité
  • Sections structurées avec les principaux résultats
  • Perspectives multiples et points de données
  • URLs des sources pour vérification

2. Recherche d'articles académiques (Perplexity sonar-pro-search)

Utilisé pour les requêtes spécifiques à l'académique. Privilégie les bases de données savantes et les sources évaluées par les pairs.

Exemples de requêtes:
- "Find papers on transformer attention mechanisms in NeurIPS 2024"
- "Foundational papers on quantum error correction"
- "Systematic review of immunotherapy in non-small cell lung cancer"
- "Cite the original BERT paper and its most influential follow-ups"
- "Published studies on CRISPR off-target effects in clinical trials"

La réponse inclut:

  • Résumé des principaux résultats de la littérature académique
  • 5-8 citations de haute qualité avec auteurs, titres, journaux, années, DOIs
  • Comptages de citations et indicateurs de tier de lieu de publication
  • Principaux statistiques et points forts de la méthodologie
  • Lacunes de recherche et orientations futures

3. Information technique et méthodologique

Exemples de requêtes:
- "Western blot protocol for protein detection"
- "Statistical power analysis for clinical trials"
- "Machine learning model evaluation metrics comparison"

4. Données statistiques et de marché

Exemples de requêtes:
- "Prevalence of diabetes in US population 2025"
- "Global AI market size and growth projections"
- "COVID-19 vaccination rates by country"

Priorisation de la qualité et de la popularité des articles

CRITIQUE : Lors de la recherche d'articles, TOUJOURS privilégier les articles de haute qualité et influents.

Classement basé sur les citations

Âge de l'article Seuil de citations Classification
0-3 ans 20+ citations Remarquable
0-3 ans 100+ citations Hautement influent
3-7 ans 100+ citations Significatif
3-7 ans 500+ citations Article fondateur
7+ ans 500+ citations Œuvre majeure
7+ ans 1000+ citations Fondamental

Tiers de qualité des lieux de publication

Tier 1 - Lieux de publication de premier plan (Toujours privilégier):

  • Sciences générales: Nature, Science, Cell, PNAS
  • Médecine: NEJM, Lancet, JAMA, BMJ
  • Spécifiques au domaine: Nature Medicine, Nature Biotechnology, Nature Methods
  • Top CS/AI: NeurIPS, ICML, ICLR, ACL, CVPR

Tier 2 - Spécialisées à fort impact (Forte préférence):

  • Journaux avec Impact Factor > 10
  • Conférences de premier plan dans les sous-domaines (EMNLP, NAACL, ECCV, MICCAI)

Tier 3 - Spécialisées respectées (Inclure si pertinent):

  • Journaux avec Impact Factor 5-10

Intégration technique

Variables d'environnement

# Backend principal (API Chat parallèle) - OBLIGATOIRE
export PARALLEL_API_KEY="your_parallel_api_key"

# Backend de recherche académique (Perplexity) - OBLIGATOIRE pour les requêtes académiques
export OPENROUTER_API_KEY="your_openrouter_api_key"

Spécifications API

API Chat parallèle:

  • Endpoint: https://api.parallel.ai (compatible avec OpenAI SDK)
  • Modèle: core (latence 60s-5min, synthèse complexe multi-source)
  • Sortie: Texte Markdown avec citations intégrées
  • Citations: Base de recherche avec URLs, raisonnement et niveaux de confiance
  • Rate limits: 300 req/min
  • Package Python: openai

Perplexity sonar-pro-search:

  • Modèle: perplexity/sonar-pro-search (via OpenRouter)
  • Mode de recherche: Académique (privilégie les sources évaluées par les pairs)
  • Contexte de recherche: Élevé (recherche complète)
  • Temps de réponse: 5-15 secondes

Utilisation en ligne de commande

# Recherche auto-routée (recommandé) — TOUJOURS enregistrer dans sources/
python research_lookup.py "your query" -o sources/research_YYYYMMDD_HHMMSS_<topic>.md

# Forcer un backend spécifique — TOUJOURS enregistrer dans sources/
python research_lookup.py "your query" --force-backend parallel -o sources/research_<topic>.md
python research_lookup.py "your query" --force-backend perplexity -o sources/papers_<topic>.md

# Sortie JSON — TOUJOURS enregistrer dans sources/
python research_lookup.py "your query" --json -o sources/research_<topic>.json

# Requêtes batch — TOUJOURS enregistrer dans sources/
python research_lookup.py --batch "query 1" "query 2" "query 3" -o sources/batch_research_<topic>.md

OBLIGATOIRE: Enregistrer tous les résultats dans le dossier sources

Tous les résultats de recherche-lookup DOIVENT être enregistrés dans le dossier sources/ du projet.

C'est non négociable. Les résultats de recherche sont coûteux à obtenir et critiques pour la reproductibilité.

Règles d'enregistrement

Backend Cible du drapeau -o Modèle de nom de fichier
Recherche approfondie parallèle sources/research_<topic>.md research_YYYYMMDD_HHMMSS_<brief_topic>.md
Perplexity (académique) sources/papers_<topic>.md papers_YYYYMMDD_HHMMSS_<brief_topic>.md
Requêtes batch sources/batch_<topic>.md batch_research_YYYYMMDD_HHMMSS_<brief_topic>.md

Comment enregistrer

CRITIQUE: Chaque appel à research_lookup.py DOIT inclure le drapeau -o pointant vers le dossier sources/.

CRITIQUE: Les fichiers enregistrés DOIVENT conserver toutes les citations, URLs des sources et DOIs. La sortie texte par défaut inclut automatiquement une section Sources (avec titre, date, URL pour chaque source) et une section Additional References (avec DOIs et URLs académiques extraits du texte de réponse). Pour les métadonnées de citation maximales, utilisez --json.

# Recherche générale — enregistrer dans sources/ (inclut sections Sources + Additional References)
python research_lookup.py "Recent advances in CRISPR gene editing 2025" \
  -o sources/research_20250217_143000_crispr_advances.md

# Recherche d'articles académiques — enregistrer dans sources/ (inclut citations d'articles avec DOIs)
python research_lookup.py "Find papers on transformer attention mechanisms in NeurIPS 2024" \
  -o sources/papers_20250217_143500_transformer_attention.md

# Format JSON pour les métadonnées de citation maximales (objets de citation complets avec URLs, DOIs, extraits)
python research_lookup.py "CRISPR clinical trials" --json \
  -o sources/research_20250217_143000_crispr_trials.json

# Backend forcé — enregistrer dans sources/
python research_lookup.py "AI regulation landscape" --force-backend parallel \
  -o sources/research_20250217_144000_ai_regulation.md

# Requêtes batch — enregistrer dans sources/
python research_lookup.py --batch "mRNA vaccines efficacy" "mRNA vaccines safety" \
  -o sources/batch_research_20250217_144500_mrna_vaccines.md

Préservation des citations dans les fichiers enregistrés

Chaque format de sortie préserve les citations différemment:

Format Citations incluses Quand utiliser
Texte (défaut) Section Sources (N): avec [titre] (date) + URL + Additional References (N): avec DOIs et URLs académiques Utilisation standard — lisible par l'humain avec toutes les citations
JSON (--json) Objets de citation complets: url, title, date, snippet, doi, type Quand vous avez besoin de métadonnées de citation maximales

Pour le backend Parallel, les fichiers enregistrés incluent: rapport de recherche + liste Sources (titre, URL) + Additional References (DOIs, URLs académiques). Pour le backend Perplexity, les fichiers enregistrés incluent: résumé académique + liste Sources (titre, date, URL, extrait) + Additional References (DOIs, URLs académiques).

Utilisez --json quand vous avez besoin de:

  • Analyser les métadonnées de citation par programme
  • Préserver les données complètes de DOI et d'URL pour la génération BibTeX
  • Maintenir les objets de citation structurés pour les références croisées

Pourquoi tout enregistrer

  1. Reproductibilité: Chaque citation et affirmation peut être retracée à sa source de recherche brute
  2. Récupération de fenêtre de contexte: Si le contexte est compressé, les résultats enregistrés peuvent être relus sans re-requête
  3. Piste d'audit: Le dossier sources/ documente exactement comment toutes les informations de recherche ont été rassemblées
  4. Réutilisation entre sections: Plusieurs sections peuvent référencer la même recherche enregistrée sans requêtes en double
  5. Efficacité des coûts: Vérifiez sources/ pour les résultats existants avant de faire de nouveaux appels API
  6. Support d'examen par les pairs: Les examinateurs peuvent vérifier la recherche soutenant chaque citation

Avant de faire une nouvelle requête, vérifiez d'abord les sources

Avant d'appeler research_lookup.py, vérifiez si un résultat pertinent existe déjà:

ls sources/  # Vérifier les résultats enregistrés existants

Si une recherche antérieure couvre le même sujet, relisez le fichier enregistré au lieu de faire un nouvel appel API.

Journalisation

Lors de l'enregistrement des résultats de recherche, toujours enregistrer:

[HH:MM:SS] SAVED: Research lookup to sources/research_20250217_143000_crispr_advances.md (3,800 words, 8 citations)
[HH:MM:SS] SAVED: Paper search to sources/papers_20250217_143500_transformer_attention.md (6 papers found)

Intégration avec la rédaction scientifique

Cette compétence améliore la rédaction scientifique en fournissant:

  1. Support de revue de littérature: Rassembler la recherche actuelle pour introduction et discussion — enregistrer dans sources/
  2. Validation des méthodes: Vérifier les protocoles par rapport aux normes actuelles — enregistrer dans sources/
  3. Contextualisation des résultats: Comparer les résultats avec des études récentes similaires — enregistrer dans sources/
  4. Amélioration de la discussion: Soutenir les arguments avec les dernières preuves — enregistrer dans sources/
  5. Gestion des citations: Fournir des citations correctement formatées — enregistrer dans sources/

Outils complémentaires

Tâche Outil
Recherche web générale compétence parallel-web (parallel_web.py search)
Vérification de citation compétence parallel-web (parallel_web.py extract)
Recherche approfondie (tout sujet) compétence research-lookup ou parallel-web
Recherche d'articles académiques research-lookup (auto-routage vers Perplexity)
Recherche Google Scholar compétence citation-management
Recherche PubMed compétence citation-management
DOI vers BibTeX compétence citation-management
Vérification des métadonnées compétence parallel-web (parallel_web.py search ou extract)

Gestion des erreurs et limitations

Limitations connues:

  • API Chat parallèle (modèle core): Les requêtes complexes peuvent prendre jusqu'à 5 minutes
  • Perplexity: Cutoff d'information, peut ne pas accéder au texte intégral derrière les paywalls
  • Les deux: Impossible d'accéder aux bases de données propriétaires ou restreintes

Comportement de secours:

  • Si la clé API du backend sélectionné est manquante, essaie l'autre backend
  • Si les deux backends échouent, retourne une réponse d'erreur structurée
  • Reformulez les requêtes pour de meilleurs résultats si la réponse initiale est insuffisante

Exemples d'utilisation

Exemple 1: Recherche générale (route vers Parallel)

Requête: "Recent advances in transformer attention mechanisms 2025"

Backend: API Chat parallèle (modèle core)

Réponse: Rapport markdown complet avec citations provenant de sources faisant autorité, couvrant les articles récents, les innovations clés et les points de référence de performance.

Exemple 2: Recherche d'articles académiques (route vers Perplexity)

Requête: "Find papers on CRISPR off-target effects in clinical trials"

Backend: Perplexity sonar-pro-search (mode académique)

Réponse: Liste organisée de 5-8 articles à fort impact avec citations complètes, DOIs, comptages de citations et indicateurs de tier de lieu de publication.

Exemple 3: Analyse comparative (route vers Parallel)

Requête: "Compare and contrast mRNA vaccines vs traditional vaccines for cancer treatment"

Backend: API Chat parallèle (modèle core)

Réponse: Rapport comparatif détaillé avec données provenant de multiples sources, analyse structurée et preuves citées.

Exemple 4: Données de marché (route vers Parallel)

Requête: "Global AI adoption in healthcare statistics 2025"

Backend: API Chat parallèle (modèle core)

Réponse: Données de marché actuelles, taux d'adoption, projections de croissance et analyse régionale avec citations de sources.


Résumé

Cette compétence sert d'interface de recherche principale avec routage intelligent dual-backend:

  • API Chat parallèle (défaut, modèle core): Recherche complète multi-source pour tout sujet
  • Perplexity sonar-pro-search: Recherches d'articles académiques uniquement
  • Routage automatique: Détecte les requêtes académiques et les route de manière appropriée
  • Remplacement manuel: Forcer n'importe quel backend si nécessaire
  • Complémentaire: Fonctionne aux côtés de la compétence parallel-web pour la recherche web et l'extraction d'URL

Skills similaires