SEO e IA
12 de fev. de 2026
Go back
O Google acabou de revelar acidentalmente como seus sistemas de busca por IA realmente funcionam
Entenda como funciona o pipeline de ranqueamento da IA do Google, incluindo Discovery Engine, sinais de ranking, chunking de 500 tokens e impacto no SEO.

Fique por dentro do que há de mais relavante no Marketing Digital, assine a nossa newsletter:
Agora que nada disso é mais segredo, vamos falar sobre isso.
2026 será um ano decisivo para muitas empresas quando o assunto é busca tradicional (Google) e busca por IA (ChatGPT, Gemini, Perplexity, etc.).
Vamos começar do início.
Metehan Yesilyurt — que já havia viralizado anteriormente ao analisar com precisão os fatores de ranqueamento do Perplexity — recentemente detalhou os fatores de ranqueamento da IA do Google em um post de blog.
O conteúdo é fascinante.
E muitos dos fatores “vazados” validam exatamente o que a SEO Stuff vem fazendo ao longo do último ano para gerar mais tráfego e vendas para seus clientes.
seo-stuff.com
Basicamente, como apontado por Yesilyurt, ao comercializar sua infraestrutura interna por meio de um produto chamado Google Cloud Discovery Engine (Vertex AI Search), o Google acabou revelando muito sobre como seus sistemas de IA funcionam.
Se você entende o que o Discovery Engine expõe, você entende como o Google AI Mode, AI Overviews e os futuros recursos de busca por IA provavelmente estão ranqueando e recuperando conteúdo.
Vou falar sobre os 7 sinais de ranqueamento abaixo, mas recomendo fortemente a leitura do post completo linkado, pois ele entra em um nível técnico muito mais profundo.
Os 7 sinais de ranqueamento da IA do Google
1. Base Ranking
A pontuação inicial de relevância do algoritmo central.
2. Gecko Score (similaridade por embeddings)
Similaridade vetorial entre o conteúdo e a consulta.
Correspondência semântica.
3. Jetstream (relevância por cross-attention)
Modelo mais avançado que entende negação, contraste, contexto e nuance melhor do que embeddings tradicionais.
4. BM25 (correspondência por palavras-chave)
Autoexplicativo.
Sim, palavras-chave ainda importam.
5. PCTR (taxa de clique prevista)
Modelo de previsão em três níveis:
Nível 1: Popularidade
Nível 2: PCTR
Nível 3: PCTR personalizado (ativado apenas após 100.000+ consultas)
6. Freshness (atualidade)
Pontuação baseada em recência temporal.
7. Boost / Bury Rules
Ajustes manuais de ranqueamento baseados em regras de negócio.
Este é o olhar mais transparente que já tivemos sobre o pipeline de ranqueamento da IA do Google.
Como funciona o pipeline de recuperação (retrieval)
O Discovery Engine também expõe como o Google recupera conteúdo:
Tamanho máximo de chunk: 500 tokens (aprox. 375 palavras)
Opcional: headings ancestrais acompanham cada chunk
Tabelas e imagens são analisadas
Parser de layout + entendimento aprimorado pelo Gemini (indexação com LLM)
Isso significa que todo ponto importante precisa caber em blocos de até 500 tokens, com headings claros e estrutura limpa.
Se o seu conteúdo é um grande bloco de texto sem organização, acabou.
Sim, schema importa (e agora está confirmado)
Pode até ser controverso dizer isso nas redes sociais, mas sempre foi óbvio — e agora está confirmado.
O Discovery Engine mostra que o Google processa dados estruturados com três flags independentes:
Searchable (impacta recuperação)
Indexable (impacta filtragem e ordenação)
Retrievable (impacta o que a IA pode responder)
Esses sinais são independentes.
Ou seja:
Um campo pode influenciar o ranqueamento sem aparecer na resposta
Ou aparecer na resposta sem influenciar o ranking
Isso é uma pista enorme de como o Google usa schema no AI Mode.
O pipeline de busca por IA em 4 etapas
Prepare
Entendimento da consulta, sinônimos (sensíveis ao tempo), autocomplete, NLU.
Retrieve
Chunking, parsing de layout, extração de schema, embeddings.
Signal
Aplicação dos 7 sinais de ranqueamento.
Serve
O Gemini 2.5 Flash gera a resposta final, aplica instruções, filtros de segurança, perguntas relacionadas e regras de grounding.
Busca tradicional, AI Overviews e AI Mode são apenas configurações diferentes do mesmo pipeline.
O que tudo isso significa na prática
Você precisa otimizar três camadas ao mesmo tempo:
Camada 1: Similaridade semântica (Gecko)
Seu conteúdo precisa corresponder claramente à intenção dos prompts que você deseja capturar.
Camada 2: Relevância por cross-attention (Jetstream)
O Jetstream recompensa:
Definições claras
Respostas diretas
Comparações
“X vs Y”
“Melhor para ___”
“Sem ___”
Camada 3: Clareza em nível de chunk
Seu conteúdo precisa ser extraível em blocos de até 500 tokens com:
Headings baseados em perguntas
Respostas de 2–3 frases
Resumos TL;DR
HTML limpo
Afirmações factuais
Listas e comparações
É exatamente isso que os sistemas de IA citam.
Por que isso funciona tão bem para IA Search
É exatamente por isso que a abordagem da SEO Stuff (seo-stuff.com) funciona tão bem em buscas por IA.
As descobertas do Discovery Engine validam completamente a estratégia adotada pela SEO Stuff antes mesmo dessa documentação se tornar pública.
Conclusão
O Google não está escondendo sua arquitetura de busca por IA.
Ele literalmente expôs:
Os sinais
As camadas de ranqueamento
O tamanho dos chunks
A lógica de parsing
Os modelos semânticos
As camadas de engajamento
O fluxo de geração de respostas
As marcas que entendem isso e estruturam seu conteúdo de acordo vão atravessar a próxima era da busca com enorme vantagem competitiva.
Se a IA está substituindo o primeiro clique, seu conteúdo precisa substituir a primeira impressão.
Simples assim.
Go back




