aeon-autoresearch
Boucle d'auto-amélioration. À partir d'une SKILL.md cible, génère quatre variations améliorées en parallèle, évalue chacune, applique la gagnante.
Entrées
| Param | Description |
|---|---|
target |
Nom de la compétence ou chemin vers SKILL.md. Obligatoire. |
mode |
evolve (défaut) écrit le diff. dry-run évalue et affiche, n'écrit rien. |
Les quatre variations
- A — Meilleures entrées : remplacer les APIs dépréciées, ajouter des solutions de secours, corriger les endpoints cassés.
- B — Sortie plus affutée : format plus serré, signal au lieu de bruit, verdicts explicites, pas de remplissage interdit.
- C — Plus robuste : gestion des données vides, retries, déduplication d'état, sensibilité aux rate limits.
- D — Repenser : méthodologie fondamentalement différente pour le même objectif.
Chacune est une SKILL.md complète et exécutable. Forme du frontmatter préservée.
Évaluation
1-5 par axe, total pondéré max 50 :
| Axe | Poids |
|---|---|
| Amélioration vs original | 3× |
| Valeur de la sortie | 2× |
| Clarté, qualité des données, robustesse | 1,5× chacun |
| Conventions | 1× |
Départage (écart ≤ 2 points) : préférer la variation apportant la plus grande amélioration unique sur plusieurs petites.
Garantie de sécurité
Si chaque variation évalue ≤ original sur Improvement, la compétence s'interrompt avec AUTORESEARCH_NO_IMPROVEMENT. Aucun fichier écrit. Les compétences fonctionnelles ne sont jamais dégradées.
Préserve l'objectif fondamental de l'original, la forme du frontmatter et les variables d'environnement déclarées.
Versioning
À l'intérieur d'un dépôt git, les changements arrivent dans une branche (autoresearch/${target}) — l'opérateur examine le diff avant fusion. En dehors d'un dépôt, l'original est préservé à ${target}/SKILL.md.before-autoresearch pour restauration.
Sortie
Le diff, plus un rapport avec le tableau d'évaluation pour les quatre variations et une justification d'un paragraphe pour la gagnante.
Fonctionne avec aeon-skill-evals (identifie ce qui sous-performe) et aeon-skill-repair (bugs déterministes ; autoresearch traite les améliorations qualitatives).