Évaluation Savante
Présentation générale
Appliquez le framework ScholarEval pour évaluer systématiquement les travaux savants et de recherche. Cette compétence offre une méthodologie d'évaluation structurée basée sur les critères d'évaluation de la recherche évaluée par les pairs, permettant une analyse complète des articles académiques, des propositions de recherche, des revues de littérature et des écrits savants selon plusieurs dimensions de qualité.
Quand utiliser cette compétence
Utilisez cette compétence quand :
- Vous évaluez des articles de recherche pour leur qualité et leur rigueur
- Vous évaluez l'exhaustivité et la qualité d'une revue de littérature
- Vous examinez la conception de la méthodologie de recherche
- Vous évaluez les approches d'analyse de données
- Vous évaluez l'écriture savante et la présentation
- Vous fournissez des retours structurés sur des travaux académiques
- Vous comparez la qualité de recherche par rapport aux critères établis
- Vous évaluez la pertinence de publication pour des lieux cibles
- Vous fournissez une évaluation quantitative pour compléter l'évaluation qualitative par les pairs
Amélioration visuelle avec des schémas scientifiques
Lors de la création de documents avec cette compétence, envisagez toujours d'ajouter des diagrammes et schémas scientifiques pour améliorer la communication visuelle.
Si votre document ne contient pas déjà de schémas ou de diagrammes :
- Utilisez la compétence scientific-schematics pour générer des diagrammes de qualité publication alimentés par l'IA
- Décrivez simplement le diagramme souhaité en langage naturel
- Nano Banana Pro génère, examine et affine automatiquement le schéma
Pour les nouveaux documents : Les schémas scientifiques doivent être générés par défaut pour représenter visuellement les concepts clés, les workflows, les architectures ou les relations décrits dans le texte.
Comment générer des schémas :
python scripts/generate_schematic.py "your diagram description" -o figures/output.png
L'IA génère automatiquement :
- Des images de qualité publication avec un formatage approprié
- Examen et affinage par plusieurs itérations
- Accessibilité garantie (daltonienne, contraste élevé)
- Sorties enregistrées dans le répertoire figures/
Quand ajouter des schémas :
- Diagrammes du framework d'évaluation
- Arbres de décision des critères d'évaluation de qualité
- Visualisations de workflows savants
- Organigrammes de méthodologie d'évaluation
- Visualisations de barèmes de notation
- Diagrammes de processus d'évaluation
- Tout concept complexe qui bénéficie d'une visualisation
Pour des conseils détaillés sur la création de schémas, consultez la documentation de la compétence scientific-schematics.
Workflow d'évaluation
Étape 1 : Évaluation initiale et définition de la portée
Commencez par identifier le type de travail savant évalué et la portée de l'évaluation :
Types de travaux :
- Article de recherche complet (empirique, théorique ou revue)
- Proposition de recherche ou protocole
- Revue de littérature (systématique, narrative ou de portée)
- Chapitre de thèse ou de dissertation
- Résumé de conférence ou article court
Portée de l'évaluation :
- Complète (toutes les dimensions)
- Ciblée (aspects spécifiques comme la méthodologie ou l'écriture)
- Comparative (comparaison avec d'autres travaux)
Demandez à l'utilisateur de clarifier si la portée est ambiguë.
Étape 2 : Évaluation par dimensions
Évaluez systématiquement le travail selon les dimensions de ScholarEval. Pour chaque dimension applicable, évaluez la qualité, identifiez les forces et les faiblesses, et fournissez des scores si approprié.
Consultez references/evaluation_framework.md pour les critères détaillés et les barèmes de chaque dimension.
Dimensions d'évaluation principales :
-
Formulation du problème et questions de recherche
- Clarté et spécificité des questions de recherche
- Signification théorique ou pratique
- Faisabilité et pertinence de la portée
- Nouveauté et potentiel de contribution
-
Revue de littérature
- Exhaustivité de la couverture
- Synthèse critique par rapport à simple résumé
- Identification des lacunes de recherche
- Actualité et pertinence des sources
- Contextualisation appropriée
-
Méthodologie et conception de la recherche
- Pertinence pour les questions de recherche
- Rigueur et validité
- Reproductibilité et transparence
- Considérations éthiques
- Reconnaissance des limitations
-
Collecte de données et sources
- Qualité et pertinence des données
- Taille d'échantillon et représentativité
- Procédures de collecte de données
- Crédibilité et fiabilité des sources
-
Analyse et interprétation
- Pertinence des méthodes analytiques
- Rigueur de l'analyse
- Cohérence logique
- Explications alternatives examinées
- Alignement résultats-affirmations
-
Résultats et conclusions
- Clarté de la présentation
- Rigueur statistique ou qualitative
- Qualité de la visualisation
- Justesse de l'interprétation
- Discussion des implications
-
Écriture savante et présentation
- Clarté et organisation
- Ton et style académiques
- Grammaire et mécanique
- Flux logique
- Accessibilité au public cible
-
Citations et références
- Exhaustivité des citations
- Qualité et pertinence des sources
- Précision des citations
- Équilibre des perspectives
- Respect des normes de citation
Étape 3 : Notation et classement
Pour chaque dimension évaluée, fournissez :
Évaluation qualitative :
- Forces clés (2-3 points spécifiques)
- Domaines pour amélioration (2-3 points spécifiques)
- Problèmes critiques (le cas échéant)
Notation quantitative (optionnelle) : Utilisez une échelle de 5 points le cas échéant :
- 5 : Excellent - Qualité exemplaire, publiable dans les meilleures revues
- 4 : Bon - Qualité forte avec améliorations mineures nécessaires
- 3 : Adéquat - Qualité acceptable avec domaines notables pour amélioration
- 2 : Nécessite amélioration - Révisions significatives requises
- 1 : Faible - Problèmes fondamentaux nécessitant révision majeure
Pour calculer les scores globaux par programmation, utilisez scripts/calculate_scores.py.
Étape 4 : Synthétiser l'évaluation générale
Fournissez un résumé d'évaluation intégré :
- Évaluation générale de qualité - Jugement holistique du mérite savant du travail
- Forces majeures - 3-5 forces clés selon les dimensions
- Faiblesses critiques - 3-5 domaines principaux nécessitant attention
- Recommandations prioritaires - Liste classée des améliorations par impact
- Pertinence de publication (le cas échéant) - Évaluation de l'adéquation pour les lieux cibles
Étape 5 : Fournir des retours actionnables
Transformez les conclusions d'évaluation en retours constructifs et actionnables :
Structure des retours :
- Spécifique - Référencez des sections, paragraphes ou numéros de page exacts
- Actionnable - Fournissez des suggestions concrètes pour amélioration
- Priorisé - Classez les recommandations par importance et faisabilité
- Équilibré - Reconnaissez les forces tout en abordant les faiblesses
- Basé sur des preuves - Ancrez les retours dans les critères d'évaluation
Options de format des retours :
- Rapport structuré avec analyse dimension par dimension
- Commentaires annotés mappés aux sections spécifiques du document
- Résumé exécutif avec conclusions et recommandations clés
- Analyse comparative par rapport aux normes de référence
Étape 6 : Considérations contextuelles
Ajustez l'approche d'évaluation en fonction de :
Stade de développement :
- Brouillon précoce : Focalisez-vous sur les problèmes conceptuels et structurels
- Brouillon avancé : Focalisez-vous sur le raffinement et le polissage
- Soumission finale : Contrôle de qualité complet
Objectif et lieu :
- Article de journal : Normes élevées pour rigueur et contribution
- Article de conférence : Équilibre entre nouveauté et clarté de présentation
- Travail étudiant : Retours pédagogiques avec orientation développementale
- Proposition de subvention : Accent sur faisabilité et impact
Normes spécifiques à la discipline :
- Domaines STEM : Accent sur reproductibilité et rigueur statistique
- Sciences sociales : Équilibre entre normes quantitatives et qualitatives
- Sciences humaines : Accent sur argumentation et interprétation savante
Ressources
references/evaluation_framework.md
Critères d'évaluation détaillés, barèmes et indicateurs de qualité pour chaque dimension de ScholarEval. Chargez cette référence lors de la réalisation d'évaluations pour accéder aux directives d'évaluation spécifiques et barèmes de notation.
Motifs de recherche pour accès rapide :
- « Critères de formulation du problème »
- « Barème de revue de littérature »
- « Évaluation de méthodologie »
- « Indicateurs de qualité des données »
- « Normes de rigueur analytique »
- « Liste de vérification de qualité d'écriture »
scripts/calculate_scores.py
Script Python pour calculer les scores d'évaluation globaux à partir des évaluations au niveau des dimensions. Supporte la moyenne pondérée, l'analyse de seuils et la visualisation des scores.
Utilisation :
python scripts/calculate_scores.py --scores <dimension_scores.json> --output <report.txt>
Bonnes pratiques
- Maintenez l'objectivité - Basez les évaluations sur des critères établis, pas des préférences personnelles
- Soyez complet - Évaluez systématiquement toutes les dimensions applicables
- Fournissez des preuves - Supportez les évaluations avec des exemples spécifiques du travail
- Restez constructif - Présentez les faiblesses comme des opportunités d'amélioration
- Considérez le contexte - Ajustez les attentes en fonction du stade et de l'objectif du travail
- Documentez la justification - Expliquez le raisonnement derrière les évaluations et les scores
- Encouragez les forces - Reconnaissez explicitement ce que le travail réalise bien
- Priorisez les retours - Focalisez-vous d'abord sur les améliorations à haut impact
Exemple de workflow d'évaluation
Demande de l'utilisateur : « Évaluez cet article de recherche sur l'apprentissage automatique pour la découverte de médicaments »
Processus de réponse :
- Identifiez le type de travail (article de recherche empirique) et la portée (évaluation complète)
- Chargez
references/evaluation_framework.mdpour les critères détaillés - Évaluez systématiquement chaque dimension :
- Formulation du problème : Question de recherche claire sur les performances du modèle ML
- Revue de littérature : Couverture complète des travaux récents sur ML et découverte de médicaments
- Méthodologie : Architecture d'apprentissage profond appropriée avec procédures de validation
- [Continuez à travers toutes les dimensions...]
- Calculez les scores par dimension et l'évaluation générale
- Synthétisez les conclusions dans un rapport structuré mettant en avant :
- Méthodologie forte et code reproductible
- Nécessite évaluation sur ensemble de données plus diversifié
- L'écriture pourrait améliorer la clarté dans la section résultats
- Fournissez des recommandations priorisées avec des suggestions spécifiques
Intégration avec Scientific Writer
Cette compétence s'intègre parfaitement avec le workflow scientific writer :
Après génération d'article :
- Utilisez Scholar Evaluation comme alternative ou complément à l'évaluation par les pairs
- Générez
SCHOLAR_EVALUATION.mdaux côtés dePEER_REVIEW.md - Fournissez des scores quantitatifs pour suivre l'amélioration entre révisions
Pendant la révision :
- Réévaluez des dimensions spécifiques après traitement des retours
- Suivez les améliorations de score sur plusieurs versions
- Identifiez les faiblesses persistantes nécessitant attention
Préparation à la publication :
- Évaluez la pertinence pour le journal/la conférence cible
- Identifiez les lacunes avant soumission
- Comparez par rapport aux normes de publication
Notes
- La rigueur d'évaluation devrait correspondre à l'objectif et au stade du travail
- Certaines dimensions peuvent ne pas s'appliquer à tous les types de travaux (par ex., collecte de données pour les articles purement théoriques)
- Les différences culturelles et disciplinaires dans les normes savantes doivent être considérées
- Ce framework complète, mais ne remplace pas, l'expertise spécifique au domaine
- Utilisez en combinaison avec la compétence peer-review pour évaluation complète
Citation
Cette compétence est basée sur le framework ScholarEval introduit dans :
Moussa, H. N., Da Silva, P. Q., Adu-Ampratwum, D., East, A., Lu, Z., Puccetti, N., Xue, M., Sun, H., Majumder, B. P., & Kumar, S. (2025). ScholarEval: Research Idea Evaluation Grounded in Literature. arXiv preprint arXiv:2510.16234. https://arxiv.org/abs/2510.16234
Résumé : ScholarEval est un framework d'évaluation augmenté par récupération qui évalue les idées de recherche basées sur deux critères fondamentaux : la solidité (la validité empirique des méthodes proposées basée sur la littérature existante) et la contribution (le degré d'avancement réalisé par l'idée selon différentes dimensions par rapport à la recherche antérieure). Le framework atteint une couverture significativement plus élevée des points d'évaluation annotés par les experts et est consistemment préféré aux systèmes de base en termes d'actionnabilité d'évaluation, de profondeur et de support de preuves.