gdm-science-bundle

Par mkurman · zorai

Fournisseur du bundle google-deepmind/science-skills (37 skills pour la recherche scientifique). À utiliser lorsqu'un utilisateur pose des questions sur l'un des éléments suivants : analyse d'effets de variants uniques AlphaGenome (effets RNA-seq / DNase / ChIP / TF, perturbation de l'épissage, résolution d'ontologie UBERON/CL pour les variants non codants), récupération et analyse de la base de données AlphaFold, requêtes de bioactivité ChEMBL, recherches ClinicalTrials.gov, interprétation de variants ClinVar, dbSNP, service de recherche d'ontologie EMBL-EBI (OLS4), cCREs ENCODE, REST Ensembl, recherche structurale Foldseek, gnomAD, GTEx, Human Protein Atlas, InterPro, profils de facteurs de transcription JASPAR, recherche bibliographique (arXiv / bioRxiv / EuropePMC / OpenAlex), récupération de séquences NCBI (EFetch), openFDA, OpenTargets, PDB, MSA de séquences protéiques / recherche de similarité, PubChem, PubMed, visualisation structurale PyMOL, QuickGO, Reactome, STRING, conservation UCSC & TFBS, UniBind, UniProt, ou tout workflow les combinant. Toujours lire le fichier SKILL.md de chaque skill dans `skills/<name>/` et n'invoquer Python qu'à travers `uv run`.

npx skills add https://github.com/mkurman/zorai --skill gdm-science-bundle

GDM Science Bundle (vendored)

Une copie vendorisée du bundle google-deepmind/science-skills (pin : voir UPSTREAM_PIN.txt). Ce répertoire est le fallback de long tail : pour les 5 sous-plugins avec support first-class zorai (alphagenome, alphafold, uniprot, clinvar, chembl) préférez le sous-plugin correspondant plugins/zorai-plugin-science/ pour les paramètres typés et les réponses structurées. Pour tous les autres sous-skills de ce bundle, suivez le workflow ci-dessous.

Comment utiliser un sous-skill dans ce bundle

  1. Lisez d'abord le fichier SKILL.md du skill. Structure : skills/<skill_dir>/SKILL.md — le frontmatter YAML du fichier est le contrat de routage ; le corps markdown est le workflow complet avec étapes, corrections d'erreurs, et modèles de rapport. Ne sautez jamais cette lecture.
  2. Invoquez Python uniquement via uv run. Les scripts DeepMind utilisent des blocs # /// script ... # /// inline PEP 723, donc uv run résoudra et installera les bonnes dépendances dans un cache isolé (~/.cache/uv/). N'utilisez jamais python3 bare ou pip install.
  3. Lisez les Prerequisites de chaque skill avant de l'exécuter. La plupart des skills ont besoin de uv sur PATH (le runtime zorai l'a), un fichier ~/.env avec la clé API pertinente, et possiblement une étape de notification qui enregistre l'utilisation du skill.
  4. Ne lisez jamais, ne faites pas cat, echo, printenv, ni os.environ.get sur le fichier .env ou ses clés. Les scripts DeepMind chargent les credentials via dotenv à l'intérieur du script — ils tirent les clés du disque mais ne les exposent pas au contexte de l'agent. Gardez-le ainsi.
  5. Lors de l'exécution dans le sandbox zorai, l'injection de credentials est gérée par le système de paramètres du plugin (voir les sous-plugins zorai_plugin_science) ; pour les long-tail skills ici, utilisez le chargement normal sur disque de dotenv.

Inventaire des sous-skills dans ce bundle

Sous-skill (kebab-case) Chemin sous ce bundle Notes
alphafold-database-fetch-and-analyze skills/alphafold_database_fetch_and_analyze/ Compute, a aussi un sous-plugin zorai.
alphagenome-single-variant-analysis skills/alphagenome_single_variant_analysis/ Compute + clé API, a aussi un sous-plugin zorai.
chembl-database skills/chembl_database/ REST, a aussi un sous-plugin zorai.
clinical-trials-database skills/clinical_trials_database/ REST.
clinvar-database skills/clinvar_database/ REST, a aussi un sous-plugin zorai.
dbsnp-database skills/dbsnp_database/ REST (NCBI EFetch).
embl-ebi-ols skills/embl_ebi_ols/ REST (OLS4).
encode-ccres-database skills/encode_ccres_database/ REST.
ensembl-database skills/ensembl_database/ REST.
foldseek-structural-search skills/foldseek_structural_search/ Compute (binaire Foldseek).
gnomad-database skills/gnomad_database/ REST.
gtex-database skills/gtex_database/ REST.
human-protein-atlas-database skills/human_protein_atlas_database/ REST.
interpro-database skills/interpro_database/ REST.
jaspar-database skills/jaspar_database/ REST.
literature-search-arxiv skills/literature_search_arxiv/ REST.
literature-search-biorxiv skills/literature_search_biorxiv/ REST.
literature-search-europepmc skills/literature_search_europepmc/ REST.
literature-search-openalex skills/literature_search_openalex/ REST (clé optionnelle).
ncbi-sequence-fetch skills/ncbi_sequence_fetch/ REST (EFetch).
openfda-database skills/openfda_database/ REST.
opentargets-database skills/opentargets_database/ REST (GraphQL).
pdb-database skills/pdb_database/ REST.
protein-sequence-msa skills/protein_sequence_msa/ Compute.
protein-sequence-similarity-search skills/protein_sequence_similarity_search/ Compute.
pubchem-database skills/pubchem_database/ REST.
pubmed-database skills/pubmed_database/ REST.
pymol skills/pymol/ Compute (binaire PyMOL).
quickgo-database skills/quickgo_database/ REST.
reactome-database skills/reactome_database/ REST.
string-database skills/string_database/ REST.
ucsc-conservation-and-tfbs skills/ucsc_conservation_and_tfbs/ REST.
unibind-database skills/unibind_database/ REST.
uniprot-database skills/uniprot_database/ REST, a aussi un sous-plugin zorai.
uv skills/uv/ Interne. Configure uv. Le runtime zorai le fournit déjà.
scienceskillscommon skills/scienceskillscommon/ Interne. Helpers partagés pour les autres skills. Ne l'invoquez pas directement.
workflow-skill-creator skills/workflow_skill_creator/ Meta-skill. À ignorer ; l'agent n'a pas besoin d'écrire de nouveaux skills en cours de tâche.

Règles de runtime partagées

  • Tous les scripts s'attendent à être exécutés depuis le répertoire du skill (ou avec --project $SKILL_DIR pour les appels ad-hoc). Le SKILL.md du skill vous le dira.
  • Les artefacts de sortie doivent aller sous le répertoire de travail de l'utilisateur (ou le chemin que l'utilisateur spécifie). Ne polluez pas skills/.
  • Confirmez avec l'utilisateur avant d'invoquer quoi que ce soit avec un coût réel ou une limite de débit (appels API AlphaGenome, pulls en masse OpenAlex, requêtes serveur Foldseek, etc.).
  • Si le SKILL.md d'un sous-skill dit d'enregistrer un LICENSE_NOTIFICATION.txt dans le répertoire du skill, sautez l'écriture du fichier lors de l'exécution via zorai (le bundle est en lecture seule dans le repo) ; mentionnez plutôt l'URL de licence upstream à l'utilisateur une fois par session.

Licence & attribution

  • Code dans ce bundle — Apache License 2.0 (voir LICENSE).
  • Documentation dans ce bundle — Creative Commons Attribution 4.0 International (CC-BY-4.0).
  • Les fournisseurs de base de données individuels ont leurs propres conditions. Voir SKILL_LICENSES.md pour la liste complète. Vous êtes responsable de vous assurer que toute donnée récupérée via ces skills est utilisée en conformité avec les conditions du fournisseur upstream.
  • Repo upstream : https://github.com/google-deepmind/science-skills
  • Pin : voir UPSTREAM_PIN.txt pour le hash de commit exact auquel ce bundle a été vendorisé. Pour actualiser, re-vendorisez à un commit plus récent et mettez à jour le pin.

Skills similaires