Metodologia · como o Espelho funciona
Pessoas que não existem, feitas de gente que existe
O Espelho transforma dados públicos reais do IBGE (Instituto Brasileiro de Geografia e Estatística) e atitudes de mercado em arquétipos sintéticos calibrados: retratos de grupos de brasileiros que você pode ler, filtrar e até entrevistar. Esta página explica, em linguagem simples e sem pular o rigor, como cada arquétipo é construído, de onde vêm os dados e por que dá pra confiar (e até onde).
O que é um arquétipo sintético
Imagine pegar centenas de milhares de brasileiros reais de uma pesquisa oficial, agrupar os que pensam e vivem de forma parecida, e desenhar um retrato médio de cada grupo. Esse retrato é o arquétipo. Ele não é ninguém específico: é a média de um grupo real, com a variação interna preservada. Sintético porque o montamos no computador; calibrado porque cada peça vem de um dado medido e é conferida contra o Brasil real.
A régua única: afinidade base 100
Para não confundir quem lê, tudo que é tendência usa a mesma régua: afinidade base 100. O número 100 é a média entre os grupos. Acima de 100, aquele grupo se inclina mais que a média para aquilo; abaixo de 100, menos. É uma leitura direcional (aponta para onde), não um cadastro de pessoas nem uma projeção de quanta gente compra. Um único jeito de ler, do começo ao fim.
Partimos do microdado da PNAD Contínua (Pesquisa Nacional por Amostra de Domicílios Contínua, do IBGE): centenas de milhares de brasileiros entrevistados de verdade, cada um com idade, região, escolaridade, cor/raça, renda e situação urbana ou rural. A partir deles montamos uma população virtual de 300 mil pessoas que reproduz o Brasil.
Por que dá pra confiar: cada pessoa real carrega um peso amostral calculado pelo IBGE, que diz quantos brasileiros ela representa. Respeitando esse peso, a nossa população nasce com a mesma proporção de jovens e idosos, Norte e Sudeste, rico e pobre que o país tem.
A PNAD diz quem a pessoa é, mas não como ela pensa. Pintamos sobre cada pessoa as atitudes do TGI (Target Group Index, da Kantar), um grande estudo de consumo e atitudes. Usamos a probabilidade real medida por gênero × classe × idade, e ainda ajustada por metrópole onde a PNAD permite identificar.
Por que dá pra confiar: nada é inventado. Cada atitude vem de uma célula medida (um recorte de gente parecida na pesquisa), então uma mulher classe C de capital recebe a inclinação que o TGI realmente observou em mulheres classe C de capital.
Pela mesma lógica de célula trazemos hábitos de bases públicas do IBGE, por região × sexo × faixa de idade. Já entram o digital (uso de internet e posse de celular, da PNAD TIC), a saúde e os hábitos (fumante, atividade física, plano de saúde, autoavaliação de saúde, da PNS) e o consumo (peso da alimentação no orçamento, da POF), todos puxados pela SIDRA (IBGE), sempre de uma célula medida e com o ano da coleta explícito.
Para leitura, esses hábitos viram afinidade base 100, a mesma régua de tudo: acima de 100, o grupo se inclina mais que a média; abaixo, menos. Assim nada se mistura com percentual cravado.
A classe social (NSE, Nível Socioeconômico) é estimada a partir de renda e escolaridade, e fica marcada como estimativa, nunca como medida. Das atitudes derivamos 9 eixos de valor (fé, família, mérito, abertura, segurança, status, entre outros) que resumem como a pessoa enxerga o mundo. Esses eixos são sempre de valor e atitude, nunca de política ou voto.
Um algoritmo agrupa as 300 mil pessoas por semelhança de valores somada à demografia real em cerca de 400 arquétipos. Cada arquétipo é um conjunto coeso de pessoas parecidas.
Por que dá pra confiar: guardamos a dispersão interna de cada grupo. O arquétipo não vira um número único e seco: ele mantém a variação natural de quem está dentro dele, como um grupo de verdade.
Sobre os arquétipos somamos sinais de afinidade, lidos na mesma afinidade base 100. Vêm do YouGov Profiles (temas, atitudes e marcas) e do Google Audience Insights (interesses por audiência). São direcionais: dizem onde um grupo se inclina mais ou menos que a média, nunca um cadastro nem uma projeção de audiência. São eles que dão alcance a gostos amplos (amantes de cachorro, fãs de futebol, interesse em viagem) e alimentam o construtor de público por afinidade.
Para um time ler fácil, a IA compõe o grupo num retrato único: um apelido, uma frase, um perfil. Isso é composição (síntese ancorada nos dados), não dado medido, e fica sempre sinalizado pelo ponto de proveniência ao lado do conteúdo.
Como cada arquétipo tem um perfil rico e ancorado, a IA pode responder em primeira pessoa de forma coerente com aquele grupo. Daí nascem a conversa com um indivíduo do arquétipo e a pesquisa de campo sintética, sempre como leitura de direção, não como pesquisa real com margem de erro.
O que são as "pessoas virtuais"
Cada arquétipo é a composição de centenas de pessoas reais da PNAD que pensam parecido. Os indivíduos que aparecem dentro dele são amostras desse grupo, com atributos reais. Ninguém aqui é uma pessoa específica: são retratos médios com dispersão, calibrados contra o Brasil real.
O que é singular aqui
Ferramentas comuns param na demografia (idade, classe, região). O Espelho soma a isso a psicografia (os 9 eixos de valor) e as atitudes do TGI, calibrados contra IBGE e Kantar. Você não filtra só "mulher classe C do Sudeste": filtra "quem valoriza fé e família, é mais aberta a novidade e está nessa demografia".
A leitura por identidades de valor tem como referência conceitual o livro Brasil no Espelho, de Felipe Nunes, que mostra que os brasileiros se agrupam por valores e atitudes, não só por demografia. Por isso os eixos são sempre de valor, e nunca de política ou voto.
A espinha · quem a pessoa é (público, IBGE)
PNAD Contínua (Pesquisa Nacional por Amostra de Domicílios Contínua). É a base de tudo. O IBGE (Instituto Brasileiro de Geografia e Estatística) visita domicílios pelo país inteiro e entrevista centenas de milhares de brasileiros reais, em ondas trimestrais. Cada pessoa vem com seu peso amostral. Como entra: é a espinha da população virtual, de onde saem idade, sexo, região, escolaridade, cor/raça, renda e situação urbana ou rural. Dado público e oficial.
Atitudes e hábitos · como a pessoa pensa e vive
TGI (Target Group Index, da Kantar): estudo de consumo e atitudes com cerca de 24,7 mil respondentes no Brasil. De onde saem as atitudes que viram os 9 eixos de valor. Licenciado.
Hábitos públicos, todos do IBGE e puxados pela SIDRA (Sistema IBGE de Recuperação Automática, a API pública de tabelas agregadas): PNAD TIC (suplemento de Tecnologia da Informação e Comunicação da PNAD: uso de internet e posse de celular), PNS (Pesquisa Nacional de Saúde: fumante, atividade física, plano de saúde e autoavaliação de saúde) e POF (Pesquisa de Orçamentos Familiares: peso da alimentação no orçamento). Como entram: hábitos já agregados por célula demográfica, com o ano da coleta explícito. Dados públicos.
Valores medidos do WVS (World Values Survey, a pesquisa mundial de valores, onda 7, coleta no Brasil em 2018): confiança nas pessoas, religiosidade, satisfação com a vida e importância da família. Como entram: taxas ponderadas por célula de macrorregião, sexo e faixa de idade, pintadas como afinidade base 100. Em células com poucos respondentes, o valor é regredido com cuidado estatístico (shrinkage) para a média da região e do país, evitando que poucos casos distorçam. Microdado de uso não comercial.
Sinais de afinidade · onde o grupo se inclina
YouGov Profiles: painel global de consumidores (na plataforma Crunch.io) com cerca de 61 mil respondentes no Brasil e milhares de variáveis de atitude, marca e comportamento. De onde vêm sinais de atitude e marca. Licenciado.
Google Audience Insights (Insights Finder, do Google Ads): dá índices de afinidade de interesses e marcas por audiência, já em base 100. De onde vêm os sinais de afinidade do ecossistema digital. Acesso por allowlist. Como entram: os dois viram afinidade base 100, sempre direcionais, alimentando o construtor de público por afinidade.
Calibração e próximos passos
A calibração usa totais oficiais do IBGE (via SIDRA) para ajustar a população virtual até bater com o Brasil real por célula, uma técnica de reponderação iterativa. Assim a demografia da base não escorrega.
Cada fonte entra com sua proveniência honesta (medido, estimado, composição ou sinal) e o ano da coleta. Nada é inventado: quando um recorte não existe na base aberta, a dimensão fica de fora em vez de ser chutada.
Recência: dados mais recentes pesam mais nas análises e avaliações. A ordem de frescor é Google Insights Finder, YouGov Profiles, TGI, SIDRA e, por último, o WVS (coleta de 2018). O peso de cada fonte combina o quão quente ela é com o tempo desde a coleta, então um sinal recente conta mais que um valor antigo, sem que o índice base 100 exibido mude. O WVS continua valendo, só pesa menos.
Vem direto do dado real (IBGE/TGI/SIDRA): sexo, idade, região, escolaridade, raça, renda, atitudes, eixos de valor e hábitos públicos (digital, saúde e consumo: PNAD TIC, PNS e POF via SIDRA). Alta confiança para direção.
Inferido por modelo a partir dos dados: a classe social (NSE) e as respostas da conversa. Confiança média, sempre sinalizado.
A síntese legível do grupo (apelido, retrato, frase). Dá cor e facilita a leitura; ancorada nos dados, mas não é medição. A composição fica sempre sinalizada pelo ponto de proveniência ao lado do conteúdo.
Indicador relativo de afinidade vs a média (base 100, métrica única do Espelho), de fontes de painel (YouGov) e do ecossistema Google. Os hábitos de bases públicas também são exibidos nessa mesma leitura de afinidade base 100. É direcional: aponta inclinação acima ou abaixo da média, não é cadastro nem projeção de audiência.
Explorar e entender
- Galeria & Constelações: navegue os grupos do amplo ao particular.
- Mapa: cruze duas dimensões (valor, idade, renda) e veja os grupos se reorganizarem.
- Categoria: quem tem mais afinidade com finanças, beleza, viagem, etc.
- Afinidades: parta de interesses, marcas ou atitudes (sinais) e o Espelho ordena os arquétipos mais afins, por afinidade base 100.
Aplicar a um trabalho
- Por brief: cole o brief, o Espelho extrai o público e ordena os arquétipos úteis.
- Conceito: teste uma ideia e veja o encaixe estratégico por arquétipo.
- Pesquisa: defina um público (a IA preenche os filtros) e faça uma pergunta ao segmento.
Rodapé pronto pra colar no slide
Cole isto como fonte no canto do slide. É transparente sobre o que é (sintético) e no que se ancora (IBGE + Kantar), então responde aos questionamentos mais comuns:
Versão curta (verbal): "Esse perfil vem do Espelho, nossa base de arquétipos sintéticos calibrada com IBGE e Kantar. Ela aponta direção e tendência, e a gente valida com pesquisa quando a aposta cresce."
Como falar (e o que nunca afirmar)
- Pode dizer: "tendência", "direção", "perfil", "hipótese a validar", "calibrado contra IBGE/TGI".
- Pode dizer: "este grupo tende a valorizar X" / "tem afinidade com Y".
- Nunca afirme: "X% do público compra Y" como número projetável.
- Nunca trate um arquétipo como pessoa real ou a conversa como pesquisa com margem de erro.
- Nunca omita que é sintético + calibrado: a transparência é o que torna a citação defensável.
Sempre que possível, mostre a proveniência (medido / estimado / composição) ao lado do dado no slide.
Limites honestos (leia isto)
O Espelho hoje alcança gostos amplos: graças aos sinais de afinidade, você consegue ler quem se inclina mais a temas como amantes de cachorro, fãs de futebol ou interesse em viagem, e não só atributos demográficos. Esse alcance é real, mas continua sendo uma leitura de direção, não de magnitude projetável.
Os arquétipos são sintéticos, não respondentes reais, então nunca trate as respostas como pesquisa de campo com margem de erro. A classe é estimada; as atitudes são pintadas sob independência (capturam o nível, não toda correlação entre si); o condicionamento por metrópole cobre só capitais e regiões metropolitanas identificáveis. Os hábitos de bases públicas (digital, saúde e consumo: PNAD TIC, PNS e POF via SIDRA) são pintados pela mesma célula demográfica, sob a mesma hipótese de independência, e refletem o ano da coleta da tabela: leia como ordenação relativa entre perfis, não como taxa cravada de hoje. Os sinais (YouGov Profiles e Google Audience Insights) são afinidade relativa direcional em base 100: dizem se um grupo se inclina acima ou abaixo da média, e não são cadastro nem projeção de audiência. Use para orientar decisão e hipótese, validando com pesquisa real quando a aposta for grande.
Camada de leitura · do amplo ao particular
Galeria de arquétipos
Cada arquétipo é um grupo de pessoas parecidas (mesmos valores e perfil), montado a partir de dados reais do IBGE. Toque para abrir um.
Agrupamento · do amplo ao particular
Constelações de arquétipos
Cada constelação reúne arquétipos próximos em valores. Toque para ver as pessoas dentro dela.
Arquétipos úteis para o seu público
Descreva o público do brief
Cole o brief. O leitor extrai o público-alvo e ordena os arquétipos mais úteis, por atributos reais. Direção, não tamanho de audiência.
Mapa · exploração interativa
Mapa de arquétipos
Escolha duas dimensões e veja os arquétipos se reorganizarem no plano. Tamanho do ponto = tamanho do grupo. Toque num ponto para abrir o arquétipo.
Pesquisa de campo · público sintético
Rodar uma pesquisa
Defina o público (a IA lê e preenche os filtros; você ajusta como num gerenciador de anúncios) e faça uma pergunta. Os indivíduos sintéticos que batem respondem, e a IA sintetiza. Direção, não número projetável.
Filtro por categoria
Quem conversa com a categoria
Por afinidade de valor, sem você nomear o público.
Testar uma ideia ou peça
Teste uma ideia nos arquétipos
A IA lê sua ideia, compara com os valores de cada arquétipo e mostra quais combinam mais. Diz pra quem a ideia faz sentido, não se a peça está bem executada.