Quando você testá um site no Sonar IA e ve “bloqueado” ou “sem llms.txt”, a pergunta natural e: por que isso importa? A resposta está nas 3 camadas que decidem se as IAs te citam: e entender cada uma muda completamente o que você vai fazer a seguir.
As 3 camadas que decidem se as IAs te citam não são teoria. Sao o que o Sonar IA verifica em paralelo toda vez que alguem roda um diagnóstico. E cada camada pode estar falhando de forma independente, sem que as outras estejam erradas.
As 3 camadas que decidem se as IAs te citam
A visibilidade de uma empresa para IAs generativas como ChatGPT, Claude e Perplexity não depende de um fator so. Depende de tres camadas que precisam estar alinhadas ao mesmo tempo.
Camada 1: robots.txt: a permissão declarada
O robots.txt e o arquivo na raiz do site que diz para os bots o que podem rastrear. Para as IAs, os principais bots são GPTBot, ClaudeBot, PerplexityBot, Google-Extended e Applebot-Extended. Se algum desses estiver bloqueado nesse arquivo, a IA interpreta como “o site não quer ser indexado” e para por ai.
Mas liberar o robots.txt e so a Camada 1 das 3 camadas que decidem se as IAs te citam. Muitos sites ja tem isso correto e ainda não aparecem nas respostas das IAs. O problema está nas proximas camadas.
Camada 2: CDN e firewall: a porta de entrada real
Entre o bot de IA e o conteúdo do seu site existe uma infraestrutura de seguranca. O Cloudflare e o mais comum: usado por mais de 20% dos sites na internet. Em 2024, o Cloudflare ativou por padrão um recurso que bloqueia todos os bots de IA antes de eles chegarem ao conteúdo, independentemente do que o robots.txt diz.
Essa e a camada mais critica das 3 camadas que decidem se as IAs te citam: e a que mais empresas estão falhando sem saber. O robots.txt libera, o Cloudflare bloqueia, e o resultado e invisibilidade total. Para entender como detectar e resolver isso, veja o artigo sobre Cloudflare bloqueando bots de IA.
Camada 3: llms.txt: o contexto que você entrega diretamente
O llms.txt e um arquivo novo, diferente do robots.txt, criado específicamente para IAs. Enquanto o robots.txt diz “pode ou não pode rastrear”, o llms.txt diz “aqui está o que você precisa saber sobre a minha empresa, produtos e como me citar corretamente”.
Das 3 camadas que decidem se as IAs te citam, o llms.txt e a que menos empresas tem configurado: e justamente por isso representa a maior vantagem competitiva agora. Veja mais sobre o llms.txt e como implementar.
Como as 3 camadas interagem na prática
O cenario mais comum que o Sonar IA encontra e este: robots.txt liberado (Camada 1 OK), Cloudflare bloqueando silenciosamente (Camada 2 falhando), sem llms.txt (Camada 3 ausente). O gestor não sabe de nada disso porque o site continua funcionando normalmente para usuarios humanos.
O ponto central das 3 camadas que decidem se as IAs te citam e que elas são independentes. Corrigir a Camada 1 não resolve a Camada 2. Ter a Camada 2 ok não garante visibilidade se a Camada 1 estiver bloqueando. E as duas corretas sem a Camada 3 significa que as IAs podem te encontrar mas não tem contexto para te citar com precisão.
Como auditar as 3 camadas agora
Você pode auditar as 3 camadas que decidem se as IAs te citam manualmente: verificando o robots.txt no browser, acessando o painel do Cloudflare e procurando o llms.txt no domínio. Leva entre 10 e 20 minutos e exige acesso técnico a cada uma dessas areas.
Ou pode usar o Sonar IA: que verifica as 3 camadas em paralelo e entrega o diagnóstico em menos de 10 segundos, sem precisar de acesso técnico. Gratis.
Para entender o modelo completo de visibilidade para IAs e como o robots.txt se encaixa nas 3 camadas, veja o guia sobre robots.txt para IA. E para entender o impacto comercial de não aparecer para as IAs, veja como o comprador B2B ja pesquisa no ChatGPT antes de te procurar.
O que são as 3 camadas de visibilidade para IAs?
Sao robots.txt (permissão declarada), CDN/Cloudflare (acesso real de rede) e llms.txt (contexto estruturado para citação). As 3 camadas que decidem se as IAs te citam precisam estar alinhadas ao mesmo tempo. Cada uma pode falhar de forma independente.
Como saber se meu site está visível para o ChatGPT?
A forma mais rápida e usar o Sonar IA em noblah.com.br/geo-seo: diagnóstico gratis que verifica as 3 camadas em menos de 10 segundos. Alternativa manual: checar o robots.txt no browser, acessar o painel do Cloudflare e buscar o arquivo llms.txt no domínio.
