Como são feitos os gráficos enganosos – e como não ser enganado por eles

A visualização é uma das ferramentas mais importantes que temos para analisar dados. Mas tabelas e gráficos podem ser facilmente usadas tanto para educar, como para mentir. Neste artigo, vamos dar uma olhada nas três formas mais comuns em que as visualizações podem ser enganosas. Eixo Y truncado Uma das maneiras mais fáceis de deturpar […]

A visualização é uma das ferramentas mais importantes que temos para analisar dados. Mas tabelas e gráficos podem ser facilmente usadas tanto para educar, como para mentir. Neste artigo, vamos dar uma olhada nas três formas mais comuns em que as visualizações podem ser enganosas.

Eixo Y truncado

whatsapp invite banner

Uma das maneiras mais fáceis de deturpar seus dados é mexer com o eixo y (vertical) de um gráfico de barras, gráfico de linha ou de dispersão. Na maioria dos casos, o eixo y varia de 0 a um valor máximo, que abrange o intervalo de dados. No entanto, às vezes alteramos o intervalo para destacar melhor as diferenças. Levada ao extremo, esta técnica pode fazer diferenças em dados parecerem muito maiores do que são.

Vamos ver como isso funciona na prática. Os dois gráficos abaixo mostram os mesmos dados, mas usam diferentes escalas para o eixo y:

misleading1_yaxis

No lado esquerdo, restringimos o eixo y na faixa de 3,140% a 3,154%. Dessa forma, parece que as taxas de juros estão subindo rapidamente! À primeira vista, o tamanho das barras significam que as taxas em 2012 são várias vezes superiores às de 2008. Mas ao exibir os dados com um eixo-y começando em zero conta uma história mais precisa, onde as taxas de juros estão praticamente estáticas.

Se este exemplo parece exagerado, seguem alguns exemplos do mundo real de eixos y truncados:

misleading1_fox misleading1_baseball

Este gráfico da Globo News foi além: colocou um eixo y começando em 4% sem deixar isso claro, e ainda errou a última barra, fazendo 5,91% parecer maior que 6,50%.

000blog

Eles desfizeram os dois erros alguns dias depois:

globo news grafico

Gráficos cumulativos

Muitas pessoas optam por criar gráficos cumulativos usando dados como número de usuários, receita, downloads ou outras métricas importantes. Por exemplo, em vez de mostrar um gráfico da receita trimestral, a empresa pode optar pela receita acumulada até hoje. Seria algo assim:

misleading2_cumulative

Não dá para tirar muita informação deste gráfico. Ele se move para cima e para a direita, então tudo deve estar indo bem! Mas o gráfico não-cumulativo mostra um cenário diferente:

misleading2_normal

Agora as coisas estão muito mais claras. As receitas diminuíram ao longo dos últimos dez anos! Se examinarmos o gráfico cumulativo, é possível dizer que a inclinação diminui à medida que o tempo passa, indicando que a receita caiu. No entanto, isto não é imediatamente óbvio, e o gráfico é extremamente enganoso.

Há muitos casos reais de gráficos cumulativos que fazem uma situação parecer muito mais positiva do que é. Um exemplo proeminente é este gráfico cumulativo da Apple com as vendas do iPhone. O Quartz fez uma versão mais sincera, mostrando as vendas em cada trimestre, que caem após o lançamento de cada iPhone:

lb_7986_adjusted_bw

Ignorar convenções

Uma das táticas mais insidiosas na construção de gráficos é violar práticas padronizadas. Estamos acostumados com gráficos de pizza representarem partes de um todo, ou que cronogramas evoluam da esquerda para a direita. Assim, quando essas regras são violadas, fica difícil ver o que realmente está acontecendo. Somos levados a interpretar mal os dados, devido à nossa dependência destas convenções.

Eis um exemplo de um gráfico de pizza que o canal Fox exibiu durante a corrida presidencial nos EUA em 2012:

misleading3_pie

As três fatias da pizza não somam 100%. Provavelmente, a pesquisa permitia múltiplas respostas, caso em que um gráfico de barras seria mais apropriado. Em vez disso, temos a impressão de que cada um dos três candidatos têm cerca de um terço do apoio, o que não é o caso.

Outro exemplo é essa visualização da Reuters, que parece mostrar o contrário do que realmente está acontecendo:

misleading3_deaths

À primeira vista, parece que as mortes por arma de fogo estão em declínio na Flórida. Mas um olhar mais atento mostra que o eixo y está de cabeça para baixo, com zero no início e o valor máximo na parte inferior. À medida que as mortes por arma aumentam, a linha se move para baixo, violando uma convenção bem estabelecida: valores y aumentam à medida que nos movemos para cima na página.

Há uma conclusão simples de tudo isso: tenha cuidado ao criar visualizações, e tome ainda mais cuidado ao interpretar gráficos criados por outros. Nós cobrimos três técnicas comuns, mas é apenas a ponta do iceberg de como visualizações de dados são criadas para enganar.

Você tem um exemplo de uma visualização particularmente malfeita? Poste nos comentários abaixo.


Este post foi publicado originalmente no blog Heap Analytics, e foi republicado (com adaptações) com permissão de Ravi Parikh. Para saber mais, visite o blog e siga Ravi no Twitter.

fique por dentro
das novidades giz Inscreva-se agora para receber em primeira mão todas as notícias sobre tecnologia, ciência e cultura, reviews e comparativos exclusivos de produtos, além de descontos imperdíveis em ofertas exclusivas