SEO e IA
3 de jul. de 2026
Go back
Cloudflare muda as regras para crawlers de IA: o que todo profissional de SEO precisa fazer antes de setembro de 2026
Autor: Rafael Lins
A Cloudflare reformulou completamente a classificação de crawlers de IA. Entenda como Search, Agent e Training passam a ser tratados separadamente, o impacto para SEO, AI Visibility e o que muda em setembro de 2026.

Durante anos, o controle sobre bots era relativamente simples.
O profissional de SEO precisava responder perguntas como:
devo bloquear este crawler?
devo permitir o Googlebot?
devo permitir o Bingbot?
devo bloquear algum scraper?
Com a explosão da Inteligência Artificial, esse modelo deixou de fazer sentido.
Hoje um mesmo fornecedor pode utilizar diversos crawlers diferentes para objetivos completamente distintos.
Um crawler pode:
indexar seu site para mecanismos de busca;
visitar páginas em nome de um usuário usando um agente de IA;
copiar conteúdo para treinamento permanente de modelos.
Todos esses comportamentos são diferentes.
Foi exatamente por isso que a Cloudflare anunciou uma das maiores mudanças já feitas em gerenciamento de crawlers.
A empresa abandonou o conceito de "bots de IA" como uma categoria única e passou a classificá-los pelo comportamento.
Essa atualização faz parte do segundo Content Independence Day, iniciativa lançada pela Cloudflare para devolver aos proprietários de sites um controle muito maior sobre como seu conteúdo é utilizado por sistemas de IA. oai_citation:0‡The Cloudflare Blog
O problema do modelo antigo
Até agora praticamente todas as soluções trabalhavam assim:
Esse modelo não representa mais a realidade.
Imagine o Google.
O Googlebot pode:
indexar páginas para Search;
alimentar AI Overviews;
responder AI Mode;
acessar páginas para outros recursos.
Já um agente do ChatGPT pode visitar seu site em tempo real apenas para responder uma pergunta feita por um usuário.
Já outro crawler pode apenas coletar conteúdo para treinamento de modelos.
Todos são "IA".
Mas seus objetivos são completamente diferentes.
A nova taxonomia da Cloudflare
Agora a classificação deixa de ser baseada em "quem é o bot".
Ela passa a considerar:
o que ele faz.
A Cloudflare definiu três grandes categorias.
Search
Bots que indexam seu conteúdo para responder perguntas posteriormente.
Exemplos:
mecanismos de busca
índices de respostas
sistemas de descoberta
A expectativa da Cloudflare é que esse comportamento continue gerando algum retorno ao produtor do conteúdo, seja por tráfego de referência ou modelos futuros de remuneração.
Agent
São agentes que visitam seu site em tempo real representando um usuário.
Exemplos:
ChatGPT abrindo uma página
Claude utilizando navegador
Gemini controlando Chrome
futuros agentes autônomos
Nesse caso o bot não está treinando modelos.
Ele está executando uma tarefa.
Exemplo:
Training
Aqui entram crawlers cujo objetivo é absorver permanentemente seu conteúdo para treinamento ou fine tuning de modelos.
Esse é justamente o comportamento que gerou tantas discussões nos últimos anos.
Por que isso muda completamente o SEO
Essa atualização praticamente cria uma nova disciplina dentro do SEO.
Antes falávamos apenas sobre:
indexação
rastreamento
robots.txt
sitemap
Agora precisamos pensar também em:
Search
Agent
Training
Separadamente.
Um mesmo crawler pode ter vários comportamentos
Esse talvez seja o ponto mais importante.
A Cloudflare afirma que diversos crawlers exercem múltiplas funções.
Exemplo:
ou
A partir de setembro, esses crawlers passam a ser tratados considerando todos os seus comportamentos.
Isso significa que bloquear "Training" poderá bloquear também crawlers híbridos que executam Search e Training ao mesmo tempo.
Mudança importante em 15 de setembro de 2026
A Cloudflare anunciou novos padrões de comportamento.
Para novos domínios protegidos pela plataforma:
Páginas com anúncios terão por padrão:
Search permitido
Agent bloqueado
Training bloqueado
Essa decisão parte do entendimento de que páginas monetizadas dependem da visita de pessoas reais.
Treinamento de IA e agentes autônomos podem reduzir esse retorno econômico.
Ainda assim, os proprietários podem alterar essas configurações manualmente.
O novo sinal "use" no robots.txt
Outra novidade extremamente interessante é a extensão dos Content Signals.
Além das preferências já existentes, passa a existir um novo parâmetro:
Permite interação imediata, sem armazenamento.
Permite indexação, pequenos trechos e link para a fonte.
Esse passa a ser o novo padrão.
Permite resumir e reproduzir conteúdo.
Importante:
Esses valores são preferências declaradas.
Não representam bloqueios obrigatórios.
Funcionam da mesma forma que o robots.txt tradicional: sinalizam a intenção do proprietário do site.
Verified Bots também mudou
Outro ponto pouco comentado.
Até agora:
Verified significava praticamente:
Agora não.
Verified significa apenas:
Quem define se ele poderá acessar o site continua sendo a política configurada pelo proprietário.
Além disso, bots que reproduzem integralmente conteúdo deixam de ser elegíveis ao status Verified.
BotBase
A Cloudflare também apresentou o BotBase.
Ele funciona como um diretório pesquisável contendo todos os bots conhecidos pela plataforma.
Será possível visualizar:
categoria;
comportamento;
finalidade;
identificador;
regras específicas.
Para clientes Enterprise isso representa um enorme ganho de governança.
O fim do conceito "bloquear todos os bots"
Esse talvez seja o principal aprendizado.
Até pouco tempo muitas empresas faziam exatamente isto:
Hoje isso já não faz sentido.
Você pode perfeitamente querer:
permitir Search;
permitir SEO crawlers;
permitir Ads Verification;
bloquear Training;
bloquear Agent.
Esse nível de granularidade praticamente não existia até agora.
Como isso conversa com outros temas do mercado
Essa mudança está totalmente alinhada com outras iniciativas recentes.
Google:
AI Optimization Guide
AI Mode
AI Overviews
Google Extended
Cloudflare:
Pay Per Crawl
Attribution Business Insights
Monetization Gateway
Content Signals
GA4:
AI Assistant Traffic
Todos caminham para a mesma direção.
Separar:
busca;
agentes;
treinamento.
O que profissionais de SEO devem fazer agora
Recomendações práticas:
revisar robots.txt;
revisar Content Signals;
identificar quais crawlers realmente precisam acessar o site;
entender a diferença entre Search, Agent e Training;
documentar a política de IA do domínio;
acompanhar os novos padrões antes de setembro.
Como isso afeta sites com anúncios
Quem monetiza conteúdo por publicidade precisa prestar atenção.
A Cloudflare parte do princípio de que páginas com anúncios existem para receber visitantes humanos.
Se agentes ou crawlers substituírem essas visitas sem gerar retorno financeiro, o modelo econômico do site pode ser comprometido.
Essa discussão conversa diretamente com temas como:
AI Overviews;
zero-click searches;
AI Search;
monetização de conteúdo.
Como a Ad Rock está tratando esse cenário
Na Ad Rock já vínhamos implementando diversos recursos voltados para AI Visibility, incluindo:
llms.txt;
Content Signals;
AI Dataset;
AI Visibility;
estruturas semânticas;
otimização para AI Search;
governança de crawlers.
Essa atualização da Cloudflare reforça uma tendência que já observávamos: SEO deixa de ser apenas otimização para buscadores e passa a incluir também o gerenciamento da forma como agentes de IA descobrem, utilizam e referenciam conteúdos.
Conclusão
O segundo Content Independence Day marca uma mudança importante na forma como o ecossistema web trata crawlers de Inteligência Artificial.
A pergunta deixa de ser "este bot é IA?" e passa a ser "qual é exatamente o comportamento desse bot?".
Essa distinção entre Search, Agent e Training tende a influenciar profundamente estratégias de SEO, AI Visibility, monetização de conteúdo e governança digital.
Mais do que bloquear ou permitir bots, o futuro passa a ser controlar de forma granular como cada tipo de automação pode utilizar o conteúdo publicado.
Referências
Cloudflare Blog – Your site, your rules: new AI traffic options for all customers
https://blog.cloudflare.com/content-independence-day-ai-options/
Go back





