agents-lab

Local-first lab for reusable AI-agent primitives and the curated pi-stack.

View on GitHub

Agents-as-Tools Calibration Score (primitive)

Objetivo

Avaliar se a stack está calibrada para usar agentes como tools com governança, boundedness e observabilidade adequadas, em modo report-only.

Surface

Line budget snapshot (anti-bloat)

line_budget_snapshot expõe recomendação estável ok|watch|extract para arquivos acima do budget faseado (watch/extract/critical), sem mutação e sem dispatch.

Campos principais:

Dimensões

recommendationCode

Contrato complementar de agent run

Nota semântica: agent run é o nome canônico da execução concreta de worker; local slice nomeia a unidade local de continuidade, enquanto singleSliceOnly fica como contrato de parada quando necessário. Ver docs/research/agent-run-semantic-consolidation-2026-05.md.

A primitive evaluateAgentSpawnReadiness (exposta no runtime como agent_spawn_readiness_gate) cobre o próximo passo após calibração geral e exige, em modo report-only:

Decisão canônica:

Contrato complementar de agent run plan

A primitive buildAgentRunPlan (exposta no runtime como agent_run_plan) é o degrau L1 report-only antes de qualquer novo worker de uma fatia. Ela bloqueia quando faltam:

Mesmo no caminho verde, ela apenas retorna ready-for-operator-decision; não autoriza dispatch.

Registry upsert dry-first

A primitive buildAgentRunRegistryUpsertPacket (exposta como agent_run_registry_upsert) reduz scripts ad hoc para criar/atualizar .pi/reports/agent-runs.json.

Contrato:

Outcome packet pós-run

A primitive buildAgentRunOutcomePacket (exposta como agent_run_outcome_packet) separa processState de contractDecision depois da run. Ela é report-only e compara:

Decisões canônicas:

Isso evita tratar completed como sucesso quando o provider cria paths errados, como ocorreu no canary Dashscope.

Invariantes