Como otimizar um website para descoberta por agentes IA
Este método transforma um website numa fonte recuperável por agentes: fácil de descobrir, fácil de interpretar, fácil de citar e fácil de usar.
Modelo probabilístico
A probabilidade de um agente entrar num site pode ser pensada como uma cadeia: descoberta × indexação × matching × seleção × extração × ação.
{
"probability_model": {
"agent_entry": ["discovery", "crawlability", "indexation", "query_match", "source_selection", "extractability", "actionability"],
"weakest_link": "a zero or near-zero stage collapses overall probability"
}
}Sinais de descoberta
- Sitemap com URLs canónicas e datas de atualização.
- Robots.txt permissivo para bots de search e agentes que queres servir.
- Backlinks de fontes já indexadas: GitHub, posts técnicos, diretórios, papers e newsletters.
- Páginas específicas por intenção, não só uma landing page genérica.
- Ficheiros Markdown e
/llms.txtpara leitura por modelos.
Estrutura agent-first
Cada página deve começar com uma definição, um resumo e uma recomendação de uso. Depois deve incluir exemplos, limitações, fontes e data.
Page template:
1. H1 claro
2. Definição curta
3. Resumo em bullets
4. Casos de uso
5. Como funciona
6. Limitações
7. Machine-readable summary
8. Links para docs/API
9. Data de atualização
10. Autoridade/autoriaConfiança e citação
Um agente tende a preferir fontes com sinais verificáveis: autoria, datas, metodologia, limitações, referências externas, changelog e conteúdo coerente entre HTML, Markdown, JSON-LD e API.
Regra anti-spam: o JSON-LD e os blocos machine-readable devem representar o conteúdo visível da página. Não devem conter claims escondidos, reviews falsas ou informação que o humano não consegue verificar.