Rafael Zambelli


#2 Como mentir com Estatística


Olá para você sintonizado no Zambiscast,

Hello to you tuned in to Zambiscast,

o seu podcast de assuntos variados.

your podcast on various topics.

Nosso tema de hoje é um tanto quanto polêmico.

Our topic today is somewhat controversial.

Vou começar fazendo uma pergunta para você.

I will start by asking you a question.

Você acha que as fake news, as notícias falsas, são uma coisa recente?

Do you think that fake news is a recent thing?

Eu digo isso porque estamos na era da informação, na era das redes sociais,

I say this because we are in the information age, in the age of social media,

e nós somos bombardeados a todo momento com informações,

and we are bombarded at all times with information,

seja de economia, política, entretenimento, alimentação e assim por diante.

be it economics, politics, entertainment, food, and so on.

O que motivou o episódio de hoje?

What motivated today's episode?

Bom, eu recentemente li um livro intitulado Como Mentir com Estatística.

Well, I recently read a book titled How to Lie with Statistics.

A princípio o título pode soar bem esquisito.

At first, the title may sound quite strange.

Seria este então um livro para mentirosos?

Would this then be a book for liars?

Seria eu, enquanto leitor, aprender a mentir usando dados estatísticos?

Would I, as a reader, learn to lie using statistical data?

Será o intensivão de como mentir com uma maneira apropriada?

Will it be the crash course on how to lie appropriately?

Sinceramente, quando eu mostrei esse livro para algumas pessoas,

Honestly, when I showed this book to some people,

os comentários foram exatamente estes.

the comments were exactly these.

Algumas pessoas até me olharam um pouco torto,

Some people even looked at me a bit strangely,

uma vez que trabalho com pesquisa e desenvolvimento,

since I work with research and development,

e de certa forma estaria eu querendo mascarar algum tipo de dado?

Am I, in a way, trying to mask some kind of data?

Fazer algum tipo de fraude?

To commit some type of fraud?

Me tornar especialista em mentir utilizando dados estatísticos?

Becoming an expert in lying using statistical data?

Obviamente que não.

Obviously not.

Confesso que o título me deixou bem curioso e por isso eu comprei o livro.

I confess that the title made me very curious, and that's why I bought the book.

Então está aí uma primeira jogada de marketing.

So here's a first marketing move.

Bom, mas chega de enrolação.

Well, enough with the nonsense.

Vamos às minhas considerações sobre ele, claro, depois da nossa trilha sonora.

Let's go to my considerations about him, of course, after our soundtrack.

O livro Como Mentir com Estatística?

The book How to Lie with Statistics?

é de autoria de Daryl Ruff e é um livro escrito no longínquo ano de 1954.

It is authored by Daryl Ruff and is a book written in the distant year of 1954.

Então veja bem, ele é repleto de ilustrações de Arvind Gais e é um livro super leve para se ler.

So you see, it is full of illustrations by Arvind Gais and it is a very light book to read.

Logo de cara, o livro nos leva a uma reflexão sobre a amostra e a amostragem.

Right off the bat, the book leads us to a reflection on the sample and sampling.

E o que seria isso?

And what would that be?

Bom, muitas pesquisas se baseiam em uma quantidade finita de amostras.

Well, many studies are based on a finite amount of samples.

Por exemplo, quando lemos ou ouvimos algo sobre pesquisa eleitoral,

For example, when we read or hear something about electoral research,

existe um número de eleitores que foi consultado para a geração daquele resultado.

There is a number of voters who were consulted to generate that result.

Isto é, a amostra daquela pesquisa.

This is the sample of that research.

O primeiro ponto importante que o autor enfatiza é

The first important point that the author emphasizes is

a amostra utilizada, ela é real ou ela é tendenciosa?

Is the sample used real or is it biased?

Por exemplo, quando ouvimos a seguinte frase

For example, when we hear the following sentence

Há uma alta taxa de criminalidade aqui?

Is there a high crime rate here?

Se você se basear pelos programas policiais, você fatalmente concordará com essa frase.

If you base your opinion on police programs, you will inevitably agree with this statement.

Mas aí eu te levo a uma pergunta.

But then I take you to a question.

Há uma reflexão.

There is a reflection.

E isso é o que o livro faz muito ao longo das suas 157 páginas.

And that is what the book does a lot throughout its 157 pages.

O primeiro questionamento que eu apresento aqui é

The first question I present here is

Será que os habitantes de bairro com maior índice de desenvolvimento humano, IDH,

Are the inhabitants of neighborhoods with a higher human development index, HDI,

hão de concordar com a frase que existe uma alta taxa de criminalidade aqui?

Will you agree with the statement that there is a high crime rate here?

A mesma coisa se aplica à média salarial.

The same applies to the average salary.

Parece mentira, mas não é. Olha só.

It seems like a lie, but it isn't. Just look.

No dia primeiro de abril de 2019,

On April first, 2019,

o dia de abril tradicionalmente é considerado o dia da mentira,

April Fool's Day is traditionally considered the day of the lie,

o jornal O Estado de Minas publicou que o salário médio do brasileiro é de R$ 2.340.

The newspaper O Estado de Minas reported that the average salary of Brazilians is R$ 2,340.

Você concorda com essa afirmação?

Do you agree with this statement?

Vou te dar um pouco de munição para que você pense um pouquinho mais.

I'm going to give you a little bit of ammunition so that you think a bit more.

Se estudarmos Estado por Estado,

If we study state by state,

essa média salarial vai ser maior ou menor?

Will this average salary be higher or lower?

Veremos que não é bem assim.

We will see that it is not quite like that.

Dessa forma, sempre quando você ouvir a palavra média,

In this way, whenever you hear the word average,

tenha muito cuidado.

be very careful.

Nesse contexto, nós temos que lembrar o conceito de média, mediana e moda.

In this context, we have to remember the concepts of mean, median, and mode.

Você já se deparou com esses conceitos?

Have you come across these concepts?

Se não, vamos aqui dar uma refrescada na nossa memória.

If not, let's refresh our memory here.

A média aritmética é a soma de todos os salários recebidos pela amostra,

The arithmetic mean is the sum of all the salaries received by the sample,

ou seja, os indivíduos,

that is to say, the individuals,

e dividido pelo número de trabalhadores ou de indivíduos consultados.

and divided by the number of workers or individuals consulted.

Já a moda é o valor mais frequente recebido pelos trabalhadores,

Fashion is already the most frequently received value by workers.

na amostragem, ou seja, no número de trabalhadores

in the sampling, that is, in the number of workers

que foram considerados para realizar essa pesquisa.

that were considered to conduct this research.

E a mediana representa o valor central do salário dos trabalhadores.

And the median represents the central value of the workers' salaries.

Fatalmente, acredito eu, que a moda,

I believe, fatally, that fashion,

o valor mais frequente que iremos encontrar

the most frequent value we will encounter

se fôssemos avaliar todo o trabalhador formal no Brasil,

if we were to evaluate all formal workers in Brazil,

esse valor seria o do salário mínimo,

this amount would be the minimum wage,

que é quase R$ 1.000,00,

which is almost R$ 1,000.00,

menos da metade da média aritmética

less than half of the arithmetic average

apresentada pela matéria no jornal.

presented by the article in the newspaper.

Certamente utilizarão uma destas.

They will certainly use one of these.

E qual será a escolhida?

And which one will be chosen?

A média, a moda ou a mediana?

The average, the mode, or the median?

Obviamente, aquela que beneficiará quem a escreve ou quem a apresenta.

Obviously, the one that will benefit the person who writes it or presents it.

Então, para ter um resultado fiel, baseado em uma amostragem,

So, to have an accurate result based on a sampling,

deve-se utilizar uma amostra representativa,

a representative sample should be used,

que é aquela livre de toda fonte de tendenciosidade,

that is free from all sources of bias,

ou seja, que há algum tipo de tendência,

that is, that there is some kind of trend,

ou seja, que há algum tipo de tendência.

In other words, there is some type of trend.

Vamos para outro exemplo prático e fresquinho.

Let's go for another practical and fresh example.

No dia 18 de julho de 2019,

On July 18, 2019,

o portal Money Times publicou a seguinte matéria.

The Money Times portal published the following article.

Consumidor brasileiro consegue comprar 476 litros de gasolina com salário,

The Brazilian consumer can buy 476 liters of gasoline with their salary.

revela a pesquisa.

reveals the research.

E a matéria continua, abre aspas.

And the article continues, quote.

Quanto de gasolina é possível comprar com salário no Brasil?

How much gasoline can you buy with a salary in Brazil?

A nova pesquisa, realizada pelo time analítico do Picot,

The new research, conducted by Picot's analytical team,

aparentemente um set de descontos,

apparently a set of discounts,

tomou como base o preço médio de 1 litro de gasolina no primeiro semestre de 2019,

used the average price of 1 liter of gasoline in the first half of 2019 as a basis,

que foi de R$ 4,35,

that was R$ 4.35,

e o salário líquido médio do brasileiro de R$ 2.000.

and the average net salary of Brazilians is R$ 2,000.

E chegou à conclusão de que o consumidor brasileiro

And came to the conclusion that the Brazilian consumer

consegue comprar 476 litros de combustível com o que ganha.

Can you buy 476 liters of fuel with what you earn?

Você pode começar a duvidar quando a informação carece de informação.

You can start to doubt when the information lacks information.

Oi? Como é?

Hi? How is it?

Informação que carece de informação?

Information that lacks information?

Sim, é isso mesmo.

Yes, that's right.

Quais regiões foram levadas em consideração

Which regions were taken into consideration?

para que o salário médio chegasse a R$ 2.000?

so that the average salary would reach R$ 2,000?

Além disso, área urbana ou área rural?

Furthermore, urban area or rural area?

50% da urbana, 50% da rural foi levado em consideração para isso?

Was 50% of the urban and 50% of the rural taken into account for this?

Foram avaliados indivíduos em todos os estados da federação?

Were individuals assessed in all states of the federation?

E o preço da gasolina de R$ 4,35?

And what about the price of gasoline at R$ 4.35?



estamos nesse momento de gravação do podcast no mês de julho,

we are currently recording the podcast in the month of July,

e somente agora a gasolina chegou neste patamar aqui em Fortaleza.

And only now has gasoline reached this level here in Fortaleza.

Após eu apresentar esses dois exemplos,

After I present these two examples,

eu faço um link com o livro,

I make a link with the book,

porque no segundo capítulo o autor enfatiza

because in the second chapter the author emphasizes

que a média bem escolhida faz total diferença

that a well-chosen average makes all the difference

no modo de como querem te enganar.

in the way they want to deceive you.

Nos capítulos que se seguem,

In the following chapters,

o autor vai relatar sobre os erros mais comuns em gráficos

the author will discuss the most common mistakes in graphs

e como estes têm informações omitidas para transmitir

and since they have information omitted to convey

uma informação totalmente desconexa com a realidade,

an information that is completely disconnected from reality,

o tal gráfico do exagero ou gráfico exagerado.

the so-called exaggeration graph or exaggerated graph.

É comum verificar isso principalmente nos balanços de empresas

It is common to verify this mainly in company balances.

que não estão muito bem das pernas.

who are not very well off on their feet.

A manipulação mais comum é nos eixos das variáveis,

The most common manipulation is in the axes of the variables.

sobretudo na faixa de valores que é apresentada.

especially in the price range that is presented.

Mas ao final do livro,

But at the end of the book,

o autor começa a ter seu comentário sobre a falsa correlação.

the author begins to have his commentary on the false correlation.

Por exemplo,

For example,

um certo dia,

one certain day,

alguém teve o trabalho

someone had the job

de realizar uma pesquisa

to conduct a survey

se fumantes tiram notas mais baixas na faculdade

if smokers get lower grades in college

do que os não fumantes.

than non-smokers.

E a incrível conclusão desse estudo foi que sim!

And the incredible conclusion of this study was that yes!

Mas aí nós temos que abrir alguns parênteses

But then we have to open some parentheses.

e colocar aí vários pontos de interrogação.

and put several question marks there.

Seria o fumo a causa das notas mais baixas?

Could smoking be the cause of the lower grades?

Ou o fumo é consequência dessas notas baixas?

Or is smoking a consequence of those low grades?

Pela pesquisa feita,

According to the research conducted,

ficar longe do tabaco é crucial

staying away from tobacco is crucial

para tirar as boas notas.

to get good grades.

E aí, o que você acha?

So, what do you think?

Muito provavelmente não há uma correlação

It is very likely that there is no correlation.

da forma com que é apresentada.

in the way it is presented.

Isso também se aplica a diversos blogueiros e youtubers

This also applies to various bloggers and YouTubers.

sem formação técnica na área de alimentos.

without technical training in the food area.

E aí eu digo a área de alimentos

And then I say the food area.

especificamente porque a minha formação

specifically because of my training

é voltada para essa área.

is focused on this area.

Um dos meus passatempos preferidos,

One of my favorite hobbies,

dentre os passatempos menos importantes,

among the less important hobbies,

é assistir esse pessoal cheio de razão e sensacionalismo.

It's watching these people full of reason and sensationalism.

E novamente fazendo um leak com o livro.

And again leaking with the book.

Abre aspas.

Open quotes.

A falácia é um recurso bem antigo,

The fallacy is a very old resource,

mas tem forte tendência

but has a strong tendency

a seguir em materiais estatísticos

following in statistical materials

nos quais é disfarçada

in which it is disguised

por uma confusão de números

due to a mix-up of numbers

e informações impressionantes.

and impressive information.

Certa vez estava assistindo a um vídeo

Once I was watching a video.

que me foi enviado sobre um tal palestrante

that was sent to me about a certain speaker

cuja palestra, a entrevista,

whose lecture, the interview,

tinha um título bem sonoro

it had a very catchy title

relacionando alimentos e morte.

relating food and death.

A entrevista como um todo

The interview as a whole

era um show de horrores.

It was a horror show.

Mas algumas coisas me chamaram a atenção

But some things caught my attention.

e que são bem explícitas no livro

and which are very explicit in the book

Como Mentir com Estatística.

How to Lie with Statistics.

Não o livro que o palestrante quer vender

Not the book that the speaker wants to sell.

em seu site.

on your site.

E também após cada entrevista.

And also after each interview.

E este é o primeiro sinal de alerta.

And this is the first warning sign.

Tenha um pouco de cautela

Be a little cautious.

quando alguém, ao final de várias informações,

when someone, at the end of several pieces of information,

quer te vender um produto.

wants to sell you a product.

O palestrante cita que estudos em Harvard,

The speaker mentions that studies at Harvard,

na Tailândia e não sei mais aonde,

in Thailand and I don't know where else,

que tal o alimento XYZ faz mal,

how about food XYZ is bad for you,

causa aquilo, causa não sei o que.

that causes this, causes I don't know what.

Essa, para o autor do livro,

This, for the author of the book,

é uma tática extremamente conhecida

it is an extremely well-known tactic

e exemplificada no seu último capítulo,

and exemplified in its last chapter,



Como Contestar uma Estatística

How to Answer a Statistic

e parte de algumas premissas básicas.

and part of some basic premises.

Quem está dizendo?

Who is saying?

A primeira característica

The first characteristic

é procurar a parcialidade,

it is to seek bias,

geralmente comercial.

generally commercial.

Principalmente quem se baseia

Mainly those who rely on

na metodologia do nome OK.

in the methodology of the name OK.

Respaldado no prestígio alheio

Backed by someone else's prestige.

sem dar maiores informações.

without giving further information.



dizer que um estudo é de Harvard

to say that a study is from Harvard

é da USP,

it's from USP,

da Unicamp,

from Unicamp,

da UFC,

from the UFC,

é trazer o peso institucional

it is to bring the institutional weight

e a credibilidade

and credibility

mundial destas universidades

worldwide of these universities

para si.

for you.

Mas onde está o estudo de Harvard?

But where is the Harvard study?

Há citações sobre o artigo

There are citations about the article.



Dificilmente você verá alguém

You will hardly see someone.

trazer a fonte total

bring the total source

do estudo citado.

from the cited study.

Podemos passar

We can pass.

horas e horas aqui falando a fio

hours and hours here talking endlessly

sobre estudos hipotéticos

about hypothetical studies

se baseando em nomes de renomados

based on names of renowned figures

que ninguém conhece,

that nobody knows,

como o Dr. Florence Feelgood

like Dr. Florence Feelgood

da Universidade de Jarenford, na Inglaterra,

from Jarenford University, in England,

que ambos, nome e universidade,

that both, name and university,

sequer existem.

they don’t even exist.

Mas a grande maioria das pessoas

But the vast majority of people

vai acreditar, porque é do exterior,

you will believe, because it's from abroad,

tem prestígio.

has prestige.

Segundo ponto importante, como ele sabe?

Second important point, how does he know?

Onde está o seu know-how,

Where is your know-how,

pesquisas próprias e etc?

personal research and so on?

Qual a fonte

What is the source?

e o ano do material consultado?

And what is the year of the consulted material?

Como foram feitas estas pesquisas?

How were these surveys conducted?

Qual a amostragem?

What is the sampling?

Qual a relação com os resultados?

What is the relationship with the results?

Foi aprovado

It was approved.

no comitê de ética destas instituições

in the ethics committee of these institutions



Apenas perguntinhas para você

Just a few questions for you.

ficar com a pulga atrás da orelha.

to have a nagging doubt

Terceiro ponto, o que está faltando

Third point, what is missing.

Geralmente neste caso

Generally in this case

faltam diversas informações

Several pieces of information are missing.

como amostragem, metodologia

as sampling, methodology

e o que de fato mostra os resultados.

and what actually shows the results.

Porque apenas citar

Because just to quote

não é muito vantajoso

it's not very advantageous

para informar o público.

to inform the public.

É preciso ir um pouco mais além.

It is necessary to go a little further.

Quarto ponto,

Fourth point,

isso faz sentido?

Does this make sense?

Muitas vezes vão tentar relacionar o aumento

Many times they will try to relate the increase.

do número de doenças

of the number of diseases

com relação à alimentação.

regarding food.

Como se fosse uma correlação perfeita.

As if it were a perfect correlation.

E isso não é verdade.

And that is not true.

Abre aspas.

Open quotes.

Até 1950 não existia

Until 1950 it did not exist.

casos de Alzheimer.

Alzheimer cases.

São os alimentos processados.

They are processed foods.

Até 1920 não existia infarto.

Until 1920, there was no such thing as a heart attack.

A culpa é do ovo, da manteiga,

It's the egg's fault, the butter's fault,

do leite.

of milk.

E aí eu faço um comentário em cima disso.

And then I make a comment on that.

Não existiam

They did not exist.

essas doenças

these diseases

ou não eram contabilizadas

or they were not accounted for

como tal?

as such?

Os métodos de detecção nessa época

The detection methods at that time.

a medicina era evoluída

the medicine was advanced

a este ponto?

at this point?

Só para você pensar.

Just for you to think about.

Por isso que este livro é extremamente positivo

That's why this book is extremely positive.

para o senso crítico

for critical sense

e causa um verdadeiro boom no nosso cérebro.

and causes a real boom in our brain.

Você começa a identificar isso

You start to identify this.

no dia a dia com muita facilidade.

in everyday life with great ease.

Para esse podcast não ficar muito longo

To prevent this podcast from getting too long

fiz também um post no blog

I also made a post on the blog.

abordando mais aspectos deste livro.

addressing more aspects of this book.

O link você encontra na

You can find the link in the

biografia no meu perfil do Instagram

biography in my Instagram profile

arroba R.A. Zambelli

@"R.A. Zambelli"

ou através do link direto

or through the direct link



Espero que este podcast

I hope this podcast

tenha instigado você a buscar

have instigated you to seek

sempre informações concretas

always concrete information

que tenha aberto o horizonte para vislumbrar

that has opened the horizon to glimpse

nunca mais ser enganado

never be deceived again

por quem mente com estatística.

for those who lie with statistics.

Até o próximo episódio, pessoal!

Until the next episode, everyone!

