Metodologia · como o Espelho™ funciona

Pessoas que não existem, feitas de gente que existe

O Espelho™ transforma dados públicos reais do IBGE (Instituto Brasileiro de Geografia e Estatística) e atitudes de mercado em arquétipos sintéticos calibrados: retratos de grupos de brasileiros que você pode ler, filtrar e até entrevistar. Esta página explica, em linguagem simples e sem pular o rigor, como cada arquétipo é construído, de onde vêm os dados e por que dá pra confiar (e até onde).

A ideia em uma frase

O que é um arquétipo sintético

Imagine pegar centenas de milhares de brasileiros reais de uma pesquisa oficial, agrupar os que pensam e vivem de forma parecida, e desenhar um retrato médio de cada grupo. Esse retrato é o arquétipo. Ele não é ninguém específico: é a média de um grupo real, com a variação interna preservada. Sintético porque o montamos no computador; calibrado porque cada peça vem de um dado medido e é conferida contra o Brasil real.

A régua única: afinidade base 100

Para não confundir quem lê, tudo que é tendência usa a mesma régua: afinidade base 100. O número 100 é a média entre os grupos. Acima de 100, aquele grupo se inclina mais que a média para aquilo; abaixo de 100, menos. É uma leitura direcional (aponta para onde), não um cadastro de pessoas nem uma projeção de quanta gente compra. Um único jeito de ler, do começo ao fim.

Como um arquétipo nasce, passo a passo

Começa com gente real do IBGE

Partimos do microdado da PNAD Contínua (Pesquisa Nacional por Amostra de Domicílios Contínua, do IBGE): centenas de milhares de brasileiros entrevistados de verdade, cada um com idade, região, escolaridade, cor/raça, renda e situação urbana ou rural. A partir deles montamos uma população virtual de 300 mil pessoas que reproduz o Brasil.

Por que dá pra confiar: cada pessoa real carrega um peso amostral calculado pelo IBGE, que diz quantos brasileiros ela representa. Respeitando esse peso, a nossa população nasce com a mesma proporção de jovens e idosos, Norte e Sudeste, rico e pobre que o país tem.

Ganha jeito de pensar (atitudes)

A PNAD diz quem a pessoa é, mas não como ela pensa. Pintamos sobre cada pessoa as atitudes do YouGov, um grande estudo de consumo e atitudes. Usamos a probabilidade real medida por gênero × classe × idade, e ainda ajustada por metrópole onde a PNAD permite identificar.

Por que dá pra confiar: nada é inventado. Cada atitude vem de uma célula medida (um recorte de gente parecida na pesquisa), então uma mulher classe C de capital recebe a inclinação que o YouGov realmente observou em mulheres classe C de capital.

Ganha hábitos públicos por célula

Pela mesma lógica de célula trazemos hábitos de bases públicas do IBGE, por região × sexo × faixa de idade. Já entram o digital (uso de internet e posse de celular, da PNAD TIC), a saúde e os hábitos (fumante, atividade física, plano de saúde, autoavaliação de saúde, da PNS) e o consumo (peso da alimentação no orçamento, da POF), todos puxados pela SIDRA (IBGE), sempre de uma célula medida e com o ano da coleta explícito.

Para leitura, esses hábitos viram afinidade base 100, a mesma régua de tudo: acima de 100, o grupo se inclina mais que a média; abaixo, menos. Assim nada se mistura com percentual cravado.

Estima classe e resume valores

A classe social (NSE, Nível Socioeconômico) é estimada a partir de renda e escolaridade, e fica marcada como estimativa, nunca como medida. Das atitudes derivamos 9 eixos de valor (fé, família, mérito, abertura, segurança, status, entre outros) que resumem como a pessoa enxerga o mundo. Esses eixos são sempre de valor e atitude, nunca de política ou voto.

Agrupa em arquétipos

Um algoritmo agrupa as 300 mil pessoas por semelhança de valores somada à demografia real em cerca de 400 arquétipos. Cada arquétipo é um conjunto coeso de pessoas parecidas.

Por que dá pra confiar: guardamos a dispersão interna de cada grupo. O arquétipo não vira um número único e seco: ele mantém a variação natural de quem está dentro dele, como um grupo de verdade.

Recebe sinais de afinidade

Sobre os arquétipos somamos sinais de afinidade, lidos na mesma afinidade base 100. Vêm do YouGov Profiles (temas, atitudes e marcas) e do Google Audience Insights (interesses por audiência). São direcionais: dizem onde um grupo se inclina mais ou menos que a média, nunca um cadastro nem uma projeção de audiência. São eles que dão alcance a gostos amplos (amantes de cachorro, fãs de futebol, interesse em viagem) e alimentam o construtor de público por afinidade.

Ganha um retrato legível

Para um time ler fácil, a IA compõe o grupo num retrato único: um apelido, uma frase, um perfil. Isso é composição (síntese ancorada nos dados), não dado medido, e fica sempre sinalizado pelo ponto de proveniência ao lado do conteúdo.

Conversa e pesquisa de campo

Como cada arquétipo tem um perfil rico e ancorado, a IA pode responder em primeira pessoa de forma coerente com aquele grupo. Daí nascem a conversa com um indivíduo do arquétipo e a pesquisa de campo sintética, sempre como leitura de direção, não como pesquisa real com margem de erro.

O que são as "pessoas virtuais"

Cada arquétipo é a composição de centenas de pessoas reais da PNAD que pensam parecido. Os indivíduos que aparecem dentro dele são amostras desse grupo, com atributos reais. Ninguém aqui é uma pessoa específica: são retratos médios com dispersão, calibrados contra o Brasil real.

O que é singular aqui

Ferramentas comuns param na demografia (idade, classe, região). O Espelho™ soma a isso a psicografia (os 9 eixos de valor) e as atitudes do YouGov, calibradas contra o IBGE. Você não filtra só "mulher classe C do Sudeste": filtra "quem valoriza fé e família, é mais aberta a novidade e está nessa demografia".

A leitura por identidades de valor tem como referência conceitual o livro Brasil no Espelho, de Felipe Nunes, que mostra que os brasileiros se agrupam por valores e atitudes, não só por demografia. Por isso os eixos são sempre de valor, e nunca de política ou voto.

De onde vêm os dados (as fontes)

A espinha · quem a pessoa é (público, IBGE)

PNAD Contínua (Pesquisa Nacional por Amostra de Domicílios Contínua). É a base de tudo. O IBGE (Instituto Brasileiro de Geografia e Estatística) visita domicílios pelo país inteiro e entrevista centenas de milhares de brasileiros reais, em ondas trimestrais. Cada pessoa vem com seu peso amostral. Como entra: é a espinha da população virtual, de onde saem idade, sexo, região, escolaridade, cor/raça, renda e situação urbana ou rural. Dado público e oficial.

Atitudes e hábitos · como a pessoa pensa e vive

YouGov: estudo de consumo e atitudes com cerca de 61 mil respondentes no Brasil. De onde saem as atitudes que viram os 9 eixos de valor. Licenciado.

Hábitos públicos, todos do IBGE e puxados pela SIDRA (Sistema IBGE de Recuperação Automática, a API pública de tabelas agregadas): PNAD TIC (suplemento de Tecnologia da Informação e Comunicação da PNAD: uso de internet e posse de celular), PNS (Pesquisa Nacional de Saúde: fumante, atividade física, plano de saúde e autoavaliação de saúde) e POF (Pesquisa de Orçamentos Familiares: peso da alimentação no orçamento). Como entram: hábitos já agregados por célula demográfica, com o ano da coleta explícito. Dados públicos.

Valores medidos do WVS (World Values Survey, a pesquisa mundial de valores, onda 7, coleta no Brasil em 2018): confiança nas pessoas, religiosidade, satisfação com a vida e importância da família. Como entram: taxas ponderadas por célula de macrorregião, sexo e faixa de idade, pintadas como afinidade base 100. Em células com poucos respondentes, o valor é regredido com cuidado estatístico (shrinkage) para a média da região e do país, evitando que poucos casos distorçam. Microdado de uso não comercial.

Sinais de afinidade · onde o grupo se inclina

YouGov Profiles: painel global de consumidores (na plataforma Crunch.io) com cerca de 61 mil respondentes no Brasil e milhares de variáveis de atitude, marca e comportamento. De onde vêm sinais de atitude e marca. Licenciado.

Google Audience Insights (Insights Finder, do Google Ads): dá índices de afinidade de interesses e marcas por audiência, já em base 100. De onde vêm os sinais de afinidade do ecossistema digital. Acesso por allowlist. Como entram: os dois viram afinidade base 100, sempre direcionais, alimentando o construtor de público por afinidade.

Calibração e próximos passos

A calibração usa totais oficiais do IBGE (via SIDRA) para ajustar a população virtual até bater com o Brasil real por célula, uma técnica de reponderação iterativa. Assim a demografia da base não escorrega.

Cada fonte entra com sua proveniência honesta (medido, estimado, composição ou sinal) e o ano da coleta. Nada é inventado: quando um recorte não existe na base aberta, a dimensão fica de fora em vez de ser chutada.

Recência: dados mais recentes pesam mais nas análises e avaliações. A ordem de frescor é Google Insights Finder, YouGov Profiles, YouGov, SIDRA e, por último, o WVS (coleta de 2018). O peso de cada fonte combina o quão quente ela é com o tempo desde a coleta, então um sinal recente conta mais que um valor antigo, sem que o índice base 100 exibido mude. O WVS continua valendo, só pesa menos.

Lógica de confiança · níveis de proveniência

Medido

Vem direto do dado real (IBGE/YouGov/SIDRA): sexo, idade, região, escolaridade, raça, renda, atitudes, eixos de valor e hábitos públicos (digital, saúde e consumo: PNAD TIC, PNS e POF via SIDRA). Alta confiança para direção.

Estimado

Inferido por modelo a partir dos dados: a classe social (NSE) e as respostas da conversa. Confiança média, sempre sinalizado.

Composição

A síntese legível do grupo (apelido, retrato, frase). Dá cor e facilita a leitura; ancorada nos dados, mas não é medição. A composição fica sempre sinalizada pelo ponto de proveniência ao lado do conteúdo.

Sinal

Indicador relativo de afinidade vs a média (base 100, métrica única do Espelho™), de fontes de painel (YouGov) e do ecossistema Google. Os hábitos de bases públicas também são exibidos nessa mesma leitura de afinidade base 100. É direcional: aponta inclinação acima ou abaixo da média, não é cadastro nem projeção de audiência.

Alcance e Foco · dois números, dois papéis

Alcance (prevalência)

Responde "quantos brasileiros têm esse traço". É a soma da prevalência absoluta arquétipo a arquétipo, ponderada pela população real: se quase todo grupo gosta de cachorro, o alcance é alto, como na vida. Não é um corte de quem se destaca, é a penetração do traço. Vem com proveniência: medido (YouGov, SIDRA), ancorado em fonte externa citada, ou estimado por IA (sempre com faixa, nunca passado como medido). Quando não há base de prevalência, o traço fica só direcional, sem número de alcance.

Foco (afinidade)

Responde "quais arquétipos se destacam nesse traço", os que indexam acima da média (base 100). É o recorte para mirar uma campanha, naturalmente menor que o alcance. Um traço pode ter alcance grande (muita gente tem) e foco estreito (poucos grupos se destacam): os dois números são complementares, não concorrentes. Por isso a tela mostra os dois lado a lado, e o Público salvo para ativação usa o foco.

Como usar em publicidade e marketing

Explorar e entender

Galeria & Constelações: navegue os grupos do amplo ao particular.
Mapa: cruze duas dimensões (valor, idade, renda) e veja os grupos se reorganizarem.
Categoria: quem tem mais afinidade com finanças, beleza, viagem, etc.
Afinidades: parta de interesses, marcas ou atitudes (sinais) e o Espelho™ ordena os arquétipos mais afins, por afinidade base 100.

Aplicar a um trabalho

Por brief: cole o brief, o Espelho™ extrai o público e ordena os arquétipos úteis.
Conceito: teste uma ideia e veja o encaixe estratégico por arquétipo.
Pesquisa: defina um público (a IA preenche os filtros) e faça uma pergunta ao segmento.

Como citar numa apresentação (com segurança)

Rodapé pronto pra colar no slide

Cole isto como fonte no canto do slide. É transparente sobre o que é (sintético) e no que se ancora (IBGE + Kantar), então responde aos questionamentos mais comuns:

Fonte: ESPELHO™ / Galeria: arquétipos sintéticos calibrados sobre microdados da PNAD Contínua (IBGE), atitudes do YouGov, hábitos de bases públicas (PNAD TIC, PNS e POF via SIDRA/IBGE) e sinais de afinidade (YouGov Profiles e Google Audience Insights, base 100, direcionais). Leitura direcional de perfil e valor, não projeção de audiência.

Versão curta (verbal): "Esse perfil vem do Espelho™, nossa base de arquétipos sintéticos calibrada com IBGE e Kantar. Ela aponta direção e tendência, e a gente valida com pesquisa quando a aposta cresce."

Como falar (e o que nunca afirmar)

Pode dizer: "tendência", "direção", "perfil", "hipótese a validar", "calibrado contra IBGE/YouGov".
Pode dizer: "este grupo tende a valorizar X" / "tem afinidade com Y".

Nunca afirme: "X% do público compra Y" como número projetável.
Nunca trate um arquétipo como pessoa real ou a conversa como pesquisa com margem de erro.
Nunca omita que é sintético + calibrado: a transparência é o que torna a citação defensável.

Sempre que possível, mostre a proveniência (medido / estimado / composição) ao lado do dado no slide.

Limites honestos (leia isto)

O Espelho™ hoje alcança gostos amplos: graças aos sinais de afinidade, você consegue ler quem se inclina mais a temas como amantes de cachorro, fãs de futebol ou interesse em viagem, e não só atributos demográficos. Esse alcance é real, mas continua sendo uma leitura de direção, não de magnitude projetável.

Os arquétipos são sintéticos, não respondentes reais, então nunca trate as respostas como pesquisa de campo com margem de erro. A classe é estimada; as atitudes são pintadas sob independência (capturam o nível, não toda correlação entre si); o condicionamento por metrópole cobre só capitais e regiões metropolitanas identificáveis. Os hábitos de bases públicas (digital, saúde e consumo: PNAD TIC, PNS e POF via SIDRA) são pintados pela mesma célula demográfica, sob a mesma hipótese de independência, e refletem o ano da coleta da tabela: leia como ordenação relativa entre perfis, não como taxa cravada de hoje. Os sinais (YouGov Profiles e Google Audience Insights) são afinidade relativa direcional em base 100: dizem se um grupo se inclina acima ou abaixo da média, e não são cadastro nem projeção de audiência. Use para orientar decisão e hipótese, validando com pesquisa real quando a aposta for grande.

Camada de leitura · do amplo ao particular

Galeria de arquétipos

Cada arquétipo é um grupo de pessoas parecidas (mesmos valores e perfil), montado a partir de dados reais do IBGE. Toque para abrir um.

Agrupamento · do amplo ao particular

Constelações de arquétipos

Cada constelação reúne arquétipos próximos em valores. Toque para ver as pessoas dentro dela.

Arquétipos úteis para o seu público

Descreva o público do brief

Cole o brief. O leitor extrai o público-alvo e ordena os arquétipos mais úteis, por atributos reais. Direção, não tamanho de audiência.

Territórios · distribuição geográfica

Onde está esse público

Veja a concentração regional do seu Público e identifique bolsões onde sua audiência existe mas a mídia ainda não chegou.

Mapa · exploração interativa

Mapa de arquétipos

Escolha duas dimensões e veja os arquétipos se reorganizarem no plano. Tamanho do ponto = tamanho do grupo. Toque num ponto para abrir o arquétipo.

Pesquisa de campo · público sintético

Rodar uma pesquisa

Defina o público (a IA lê e preenche os filtros; você ajusta como num gerenciador de anúncios) e faça uma pergunta. Os indivíduos sintéticos que batem respondem, e a IA sintetiza. Direção, não número projetável.

Filtro por categoria

Quem conversa com a categoria

Por afinidade de valor, sem você nomear o público.

Testar uma ideia ou peça

Teste uma ideia nos arquétipos

A IA lê sua ideia, compara com os valores de cada arquétipo e mostra quais combinam mais. Diz pra quem a ideia faz sentido, não se a peça está bem executada.

Pessoas que não existem, feitas de gente que existe

O que é um arquétipo sintético

A régua única: afinidade base 100

O que são as "pessoas virtuais"

O que é singular aqui

A espinha · quem a pessoa é (público, IBGE)

Atitudes e hábitos · como a pessoa pensa e vive

Sinais de afinidade · onde o grupo se inclina

Calibração e próximos passos

Alcance (prevalência)

Foco (afinidade)

Explorar e entender

Aplicar a um trabalho

Rodapé pronto pra colar no slide

Como falar (e o que nunca afirmar)

Limites honestos (leia isto)

Galeria de arquétipos

Constelações de arquétipos

Descreva o público do brief

Onde está esse público

Mapa de arquétipos

Rodar uma pesquisa

Quem conversa com a categoria

Teste uma ideia nos arquétipos

Pergunte ao
Brasil inteiro.

Defina um público

Leia o grupo

Ouça e teste

Brief, categoria, afinidade

Galeria, mapa, constelações

Pesquisa, conversa, grupo

Conceito, alcance e foco

IBGE · PNAD Contínua

YouGov

SIDRA · IBGE

Google Audience Insights

Calibrado contra o Brasil real

Proveniência sempre à mão

Honesto sobre o que é

Comece a ler o Brasil.

Pessoas que não existem, feitas de gente que existe

O que é um arquétipo sintético

A régua única: afinidade base 100

O que são as "pessoas virtuais"

O que é singular aqui

A espinha · quem a pessoa é (público, IBGE)

Atitudes e hábitos · como a pessoa pensa e vive

Sinais de afinidade · onde o grupo se inclina

Calibração e próximos passos

Alcance (prevalência)

Foco (afinidade)

Explorar e entender

Aplicar a um trabalho

Rodapé pronto pra colar no slide

Como falar (e o que nunca afirmar)

Limites honestos (leia isto)

Galeria de arquétipos

Constelações de arquétipos

Descreva o público do brief

Onde está esse público

Mapa de arquétipos

Rodar uma pesquisa

Quem conversa com a categoria

Teste uma ideia nos arquétipos

Entrar no Espelho™

Pergunte aoBrasil inteiro.

Defina um público

Leia o grupo

Ouça e teste

Brief, categoria, afinidade

Galeria, mapa, constelações

Pesquisa, conversa, grupo

Conceito, alcance e foco

IBGE · PNAD Contínua

YouGov

SIDRA · IBGE

Google Audience Insights

Calibrado contra o Brasil real

Proveniência sempre à mão

Honesto sobre o que é

Comece a ler o Brasil.

Pergunte ao
Brasil inteiro.