Agent Runtime & Tool Contracts
Agent Runtime & Tool Contracts
Section titled “Agent Runtime & Tool Contracts”Objetivo
Section titled “Objetivo”O Agent Runtime formaliza os agentes funcionais do Standard SCF Agentic Assessment Model, seus contratos de tools, guardrails, rastreabilidade e integração com o Assessment Engine. A primeira versão é um runtime local/in-memory testável; ela não chama LLM real, não executa tools externas e não grava achados finais.
O Standard SCF Agentic Assessment Model é um modelo de IA agêntica para conduzir assessments baseados no Secure Controls Framework, no qual agentes especializados colaboram sob orquestração controlada para ingerir documentos, construir KB, mapear frameworks, gerar SoA, avaliar evidências, produzir Gap Analysis, medir maturidade, gerar POA&M e preparar relatórios, sempre com rastreabilidade, validação de schema, controle de escopo e aprovação humana.
Comportamento Agentic
Section titled “Comportamento Agentic”- Recebe assessment novo.
- Verifica documentos disponíveis.
- Aciona ingestão.
- Consulta SCF estruturado.
- Aguarda escolha de framework.
- Propõe SoA.
- Aguarda aprovação.
- Executa Evidence Analysis.
- Gera Gap Analysis.
- Aguarda aprovação.
- Mede maturidade.
- Gera POA&M.
- Gera relatório.
- Fecha assessment.
Agentes Funcionais
Section titled “Agentes Funcionais”knowledge_steward: organiza KB/evidências; não decide compliance.scf_control_analyst: analisa controles SCF; não cria mappings oficiais.framework_mapper: consulta mappings oficiais; não inventa crosswalks.scope_soa_architect: cria drafts de escopo/SoA; não aprova.evidence_analyst: classifica evidências; não transforma ausência de evidência em falha.gap_analyst: cria drafts de Gap Analysis; não finaliza sem aprovação.maturity_assessor: sugere maturidade; não aprova maturidade.poam_planner: cria drafts de POA&M; não publica sem aprovação.report_writer: compõe relatórios; não altera achados aprovados.
Os contratos vivem em packages/agent-runtime/src/contracts.ts.
Tool Contracts
Section titled “Tool Contracts”Tools iniciais:
assessment_state_readartifact_version_readscf_control_lookupscf_mapping_lookupkb_evidence_searchartifact_draft_createvalidation_result_writeapproval_event_create
Cada tool declara descrição, risco e schema Zod de input. Inputs devem carregar contexto explícito de tenant, organização, assessment, framework, SCF version e trace.
Guardrails
Section titled “Guardrails”O runtime bloqueia:
- uso de tool fora da allowlist do agente;
- mismatch de
tenant_id,organization_idouassessment_id; - output sem
assumptions,limitations,sourceseconfidence_score; - escrita direta de achados finais;
- criação de mappings oficiais por agente;
- approval event direto por agente funcional.
Rastreabilidade
Section titled “Rastreabilidade”Cada agent_run registra:
agent_run_idtenant_idorganization_idassessment_idagent_idagent_versionprompt_versionmodelinput_hashoutput_hashconfidence_scoretrace_id- status e timestamps
Tool calls são rastreáveis por agent_tool_calls com hash de input/output, risco, status e trace.
Integração com Assessment Engine
Section titled “Integração com Assessment Engine”O Agent Runtime não altera lifecycle diretamente. Ele produz runs, tool calls e outputs schema-validados que outros workflows podem associar a artifacts draft. Aprovações continuam no Assessment Engine e exigem approval events humanos.
Endpoints MVP:
GET /api/v1/agent-runtime/agentsPOST /api/v1/assessments/:assessmentId/agent-runsGET /api/v1/assessments/:assessmentId/agent-runsGET /api/v1/agent-runs/:agentRunIdPOST /api/v1/agent-runs/:agentRunId/tool-callsPOST /api/v1/agent-runs/:agentRunId/complete
Limitações do MVP
Section titled “Limitações do MVP”- Runtime em memória no API Gateway.
- Sem execução de LLM real.
- Sem tool execution real contra SCF/KB/Artifacts; só validação contratual e rastreio.
- Sem queue
AGENT_TASK_QUEUEconectada ao runtime. - Persistência PostgreSQL real de runs/tool calls depende de adapters.
Decisões em Aberto
Section titled “Decisões em Aberto”- Modelo de RBAC/ABAC por agente/tool.
- Formato definitivo de prompt registry e versionamento.
- Estratégia de execução assíncrona via Cloudflare Queues.
- Política de retenção para prompts, hashes e outputs.
- Adapters PostgreSQL para
agent_runs,agent_decisionseagent_tool_calls.