O método: Agent Entry Chain (AEC)
Uma fonte só é usada por um agente de IA se sobreviver a uma cadeia de etapas. O Agent Entry Chain dá nome próprio a essa cadeia para que possa ser citada, medida e auditada.
Definição
A probabilidade de um agente de IA descobrir, abrir, entender, citar e acionar uma fonte é o produto das probabilidades de cada etapa da cadeia. Por ser multiplicativa, uma única etapa próxima de zero colapsa o resultado final — independentemente da qualidade das restantes.
P(uso pelo agente) =
P(descoberta)
× P(crawlability)
× P(indexação)
× P(correspondência com a query)
× P(seleção da fonte)
× P(extração do conteúdo)
× P(ação)As sete etapas
| # | Etapa | Pergunta que responde | Sinais que a determinam |
|---|---|---|---|
| 1 | Descoberta | O agente consegue encontrar o URL? | Sitemap, backlinks, presença em índices, llms.txt, menções. |
| 2 | Crawlability | O agente é autorizado e capaz de obter o ficheiro? | robots.txt, estado HTTP, ausência de bloqueios anti-bot. |
| 3 | Indexação | A fonte está em cache/índice quando a query surge? | Indexação em motores e índices de IA, frescura, canonical. |
| 4 | Correspondência | O conteúdo casa com a intenção da query? | Páginas por intenção, títulos claros, vocabulário do utilizador. |
| 5 | Seleção | Entre fontes concorrentes, esta é escolhida? | Autoria, datas, evidência, desambiguação, coerência entre camadas. |
| 6 | Extração | O agente lê o conteúdo sem corrupção? | Content-Type correto, HTML semântico, Markdown, JSON-LD fiel. |
| 7 | Ação | O agente pode fazer algo além de ler? | API, MCP, formulários sem CAPTCHA, contacto machine-readable. |
O elo mais fraco governa
O valor prático do modelo é diagnóstico: encontrar a etapa de menor probabilidade e corrigi-la primeiro. A auditoria de 2026-06-12 a este site é um exemplo: a etapa 6 (extração) estava perto de zero porque /docs/*.md era servido como application/octet-stream; e a etapa 1 (descoberta) estava comprometida por links relativos que o fetcher do agente não seguia. Nenhuma quantidade de bom conteúdo nas outras etapas compensava esses dois quase-zeros.
Como medir cada etapa
- Descoberta: a fonte aparece quando se pesquisa o tema/domínio num motor ou agente? (binário por query)
- Crawlability:
curl -sIdevolve 200 para os assets-chave? robots permite o user-agent? - Indexação: nº de páginas-chave indexadas em Search Console/Bing e citadas por agentes.
- Correspondência: taxa de queries de teste em que o domínio aparece nos resultados relevantes.
- Seleção: o agente cita/recomenda a fonte vs. apenas a vê.
- Extração: Content-Type correto; o resumo gerado por um modelo não tem erros factuais.
- Ação: existe uma ferramenta/endpoint/contacto invocável com schema claro.
Detalhe operacional de cada métrica na página de Medição.