agent-browser

Par mkurman · zorai

Skill d'automatisation de navigateur pour agents IA dans la plateforme Zorai, permettant la navigation web, l'interaction avec des formulaires et l'extraction de données.

npx skills add https://github.com/mkurman/zorai --skill agent-browser

agent-browser : skill d'automatisation de navigateur

Ce skill fait partie de l'écosystème Zorai, une plateforme d'exécution multi-agents persistante et auditable. Il s'intègre dans le répertoire skills/gsd-2/skills/ du repository mkurman/zorai et expose à Claude une interface CLI (agent-browser) dédiée à l'automatisation de navigateur via Playwright.

Ce que fait ce skill

Le skill agent-browser donne aux agents IA la capacité d'interagir programmatiquement avec des pages web : ouvrir des URLs, prendre des snapshots de l'arbre d'accessibilité, cliquer sur des éléments, remplir des formulaires, capturer des screenshots, évaluer du JavaScript dans le contexte du navigateur, et gérer des sessions isolées. Il couvre également des cas avancés comme la comparaison visuelle (diff screenshot), l'authentification avec réutilisation d'état, et l'enregistrement vidéo de workflows.

Sécurité et gouvernance

Conformément à l'esprit auditable de Zorai, le skill intègre plusieurs mécanismes de contrôle : une allowlist de domaines pour restreindre la navigation à des destinations approuvées, une policy d'actions configurable via un fichier JSON pour bloquer les opérations destructives, et une limite de taille de sortie (AGENT_BROWSER_MAX_OUTPUT) pour éviter de saturer le contexte de l'agent.

Utilisation dans Zorai

Le skill se déclenche lorsqu'un utilisateur ou un agent exprime un besoin d'interaction web — naviguer sur un site, scraper des données, tester une application, automatiser une connexion. Il est conçu pour être invoqué par les agents de la plateforme Zorai (Swarog, Swarozyc, etc.) dans le cadre d'objectifs durables. Des templates prêts à l'emploi sont fournis dans le répertoire templates/ pour les cas d'usage courants (remplissage de formulaire, session authentifiée, extraction de contenu).

Skills similaires