data-card-writer

Par mkurman · zorai

Skill de rédaction de data cards structurées (format "Datasheets for Datasets" de Gebru et al.) intégré à la plateforme multi-agent Zorai.

npx skills add https://github.com/mkurman/zorai --skill data-card-writer

Data Card Writer

Ce skill permet à un agent de la plateforme Zorai de générer automatiquement une fiche descriptive complète pour un jeu de données, en suivant le cadre méthodologique « Datasheets for Datasets » publié par Gebru et al. (2021). L'objectif est de documenter systématiquement l'origine, la composition, le processus de collecte, les transformations appliquées, les limitations et les conditions de licence d'un dataset.

Structure du skill

Le SKILL.md fournit un template Markdown détaillé organisé en huit sections : Motivation, Composition, Collection Process, Preprocessing, Uses, Distribution, Limitations, Maintenance et Citation. Chaque section liste les champs attendus avec des indications claires sur ce qu'il faut y renseigner. Un checklist de validation accompagne le template pour s'assurer qu'aucune section n'est laissée vide, que les limitations sont honnêtement décrites, et que la licence est vérifiée plutôt que supposée.

Intégration dans Zorai

Dans le contexte du repo mkurman/zorai, ce skill s'inscrit dans la catégorie scientific-skills. La plateforme Zorai étant un runtime multi-agent durable, ce skill peut être invoqué par un agent (par exemple Swarog) dans le cadre d'un objectif plus large impliquant la gestion, l'audit ou la publication de datasets. L'agent remplit le template à partir des informations disponibles dans le contexte de la tâche en cours.

Utilisation

Pour utiliser ce skill, l'agent a besoin d'informations sur le dataset cible : sa provenance, sa structure, ses métadonnées de collecte et sa licence. Il produit en sortie un document Markdown formaté, prêt à être versionné avec le dataset ou publié dans un repository. La checklist de validation intégrée guide l'agent pour produire une fiche honnête et complète, conforme aux bonnes pratiques de la communauté de recherche en machine learning.

Skills similaires