Média ou mediana? Entendendo a diferença de cada uma na prática

Yuri Matheus
Yuri Matheus

Compartilhe

Avalie este artigo

7 minutos de leitura

Vamos entender como a estatística pode nos ajudar a analisar dados de forma mais precisa no nosso dia a dia? 

Imagine que você está avaliando o desempenho de uma turma para saber se uma nova abordagem de ensino trouxe resultados positivos. Para fazer esse acompanhamento, você coleta as notas de uma turma de 21 alunos antes e depois da mudança. 

Ao olhar para a planilha de notas atual, você encontra os seguintes valores: 

6.0, 7.1, 5.5, 3.0, 10.0, 100.0, 6.5, 8.2, 2.9, 3.5, 9.9, 9.1, 8.2, 7.6, 9.9, 10.0, 6.7, 4.9, 10.0, 6.8, 6.0 

Para descobrir o desempenho geral da turma, o primeiro passo natural é calcular a média aritmética simples, certo? Basta somar todas as notas e dividir pelo total de estudantes: 

Média = (6.0 + 7.1 + 5.5 + ... + 6.0) / 21 

O resultado desse cálculo é aproximadamente 11.51. Mas espere aí... As notas vão de 0 a 10, então como a média pode ser maior que 11? 

Neste artigo, vamos desvendar esse mistério e explorar: 

  • O que é a média e como ela se comporta; 
  • O que são outliers e como eles afetam seus dados; 
  • O que é a mediana e como calculá-la; 
  • Como lidar com conjuntos de dados pares e ímpares; 
  • A diferença entre média, mediana e moda. 

Vamos dominar a análise dos seus dados? Então, vamos nessa! 

Entendendo a média e os famosos outliers 

A média aritmética é uma medida que distribui o valor total de forma igualitária entre todos os elementos. O ponto central aqui é que ela é influenciada por absolutamente todos os valores da amostra.  

Se tivermos um único valor muito fora do padrão, a média será puxada para perto dele. Olhando com atenção para a nossa lista de notas, conseguimos identificar o culpado pelo 11.51: existe uma nota registrada como 100.0

Em análise de dados, esses valores que se distanciam drasticamente do restante do conjunto são chamados de outliers (ou valores discrepantes). Eles podem surgir por dois motivos principais: 

  • Erros de digitação ou coleta: Alguém pode ter digitado 100.0 em vez de 10.0 ou 1.0; 
  • Fenômenos raros: Um caso real, mas muito fora da curva comum. 

Em amostras gigantescas, um outlier isolado não faz tanta diferença. Porém, em amostras pequenas, como a nossa turma de 21 alunos, um único valor incorreto distorce toda a realidade. 

Para resolver isso, podemos investigar se o dado está correto e corrigi-lo. Caso a correção não seja possível, outra saída inteligente é usar a mediana

Banner da Alura para a Semana do Orgulho Nerd anunciando até 44% de desconto em cursos de tecnologia, mais dois meses grátis. A imagem convida a começar a jornada no universo tech e destaca um bônus de gift card de 50 reais para plataformas como PlayStation, Xbox e Nintendo, incentivando a estudar programação e desenvolver carreira em tecnologia.

O que é mediana e como funciona

A mediana é a medida de posição que fica exatamente no centro do seu conjunto de dados. Isso significa que ela divide a sua amostra em duas partes iguais: 50% dos dados estarão abaixo dela e 50% estarão acima. 

A grande vantagem da mediana é que ela não se importa com os valores extremos, apenas com a ordem das coisas. Se a última nota for 10.0 ou 100.0, a posição central continuará sendo a mesma. 

Para encontrar a mediana, o primeiro passo obrigatório é organizar os dados em ordem crescentemente. Vamos ordenar as notas da nossa turma: 

2.9, 3.0, 3.5, 4.9, 5.5, 6.0, 6.0, 6.5, 6.7, 6.8, 7.1, 7.6, 8.2, 8.2, 9.1, 9.9, 9.9, 10.0, 10.0, 10.0, 100.0 

Como temos 21 elementos (um número ímpar), existe um único valor que fica perfeitamente no meio. Para descobrir a posição dele de forma matemática, usamos um cálculo simples: 

Posição = (N + 1) / 2 

Onde N é o número de elementos. No nosso caso: 

Posição = (21 + 1) / 2 = 11 

O elemento que ocupa a 11ª posição é a nossa mediana. Vamos visualizar onde ele se encontra na tabela abaixo: 

Posição Nota 
2.9 
3.0 
... ... 
11 7.1 
... ... 
21 100.0 

A nossa nota mediana é 7.1. Ela reflete muito melhor a realidade da turma do que aquele 11.51 de antes. 

Se usarmos o valor da mediana (7.1) para substituir aquele outlier incorreto (100.0) e recalcularmos a média, o novo resultado vai para 7.09. Uma nota muito mais condizente com o cenário real da sala. 

E se a amostra for um número par? 

No exemplo anterior foi fácil porque tínhamos um elemento central exato. Mas o que acontece se um aluno trancar a disciplina e ficarmos com 20 notas? Ou se estivéssemos analisando uma amostra par? 

Quando o número de elementos é par, não existe uma única posição central. Em vez disso, identificamos os dois valores do meio

Para encontrar a posição desses dois elementos centrais, usamos duas regrinhas de divisão: 

Posição 1 = N / 2 

Posição 2 = (N / 2) + 1 

Vamos ver como funciona na prática usando uma amostra menor com 6 elementos, já ordenados: 

1, 2, 5, 7, 9, 11 

Aplicando as fórmulas para encontrar as posições centrais: 

  • Posição 1: 6 / 2 = 3 (O terceiro elemento, que é o número 5) 
  • Posição 2: (6 / 2) + 1 = 4 (O quarto elemento, que é o número 7) 

Agora que temos os dois valores centrais (5 e 7), basta calcular a média aritmética entre eles para encontrar a mediana definitiva: 

Mediana = (5 + 7) / 2 = 6 

Portanto, a mediana dessa amostra par é 6. 

Resumo das medidas: Média, Mediana e Moda 

Para fechar o diagnóstico dos seus dados com chave de ouro, vale a pena conhecer o trio completo das medidas de tendência central, adicionando a moda nessa conta. 

  • Média: É a soma de todos os valores dividida pela quantidade de elementos. Ótima para distribuições uniformes, mas muito sensível a valores extremos (outliers). 
  • Mediana: É o valor central que divide os dados ao meio. Excelente para lidar com dados que possuem extremos muito desproporcionais. 
  • Moda: É o valor que aparece com maior frequência na sua amostra. No caso das nossas notas originais da turma, a nota que mais se repete é 10.0 (aparece 3 vezes). 

Curiosidade: um conjunto de dados pode ter uma única moda (unimodal), duas modas (bimodal), várias (multimodal) ou nenhuma, caso nenhum valor se repita (amodal). 

Ampliando seus horizontes estatísticos 

O universo da análise de dados vai muito além.  

Dependendo do seu objetivo, você pode se deparar com outros tipos de cálculos, como a média ponderada (onde cada valor tem um peso diferente, muito usada no cálculo de notas escolares com trabalhos e provas) ou as médias geométrica e harmônica, utilizadas para analisar taxas de crescimento e proporções. 

Aprender a escolher a ferramenta estatística certa é o diferencial para gerar relatórios confiáveis e entender o que os dados realmente estão tentando contar sobre o seu negócio ou projeto. 

Quer iniciar sua jornada nessa área? 

Se você gostou de desvendar esses mistérios e quer entender como aplicar a matemática, a programação e a análise de dados para resolver problemas reais de mercado, o caminho ideal é conhecer a Carreira de Ciência de Dados. 

É uma jornada estruturada passo a passo, pensada para construir sua evolução profissional com clareza e consistência. Olha só como funciona: 

  • Base sólida: Você começa aprendendo lógica e programação com Python, descobre como realizar consultas estruturadas em bancos de dados usando SQL (como o SQLite) e estuda os fundamentos de matemática para Data Science. E, ganha familiaridade com computação em nuvem para entender a estrutura dos projetos atuais. 
  • Evolução gradual: Após consolidar essa base, a jornada avança pelos níveis seguintes, onde você entra de cabeça em bibliotecas de análise de dados (como o Pandas), cria visualizações visuais completas, trabalha com Big Data, Inteligência Artificial e desenvolve modelos de Machine Learning com Scikit-Learn e TensorFlow. 
  • Apoio prático: Todo esse percurso é acompanhado por profissionais atuantes que compartilham cenários reais e as práticas utilizadas no mercado de tecnologia de hoje. 

Que tal dar o próximo passo? Pratique os cálculos de média e mediana com suas próprias planilhas e confira a estrutura completa da nossa formação para guiar seus estudos rumo ao mercado de tecnologia. Siga firme e bons estudos! 

Avalie este artigo

Yuri Matheus
Yuri Matheus

Yuri é desenvolvedor e instrutor. É estudante de Sistemas de Informação na FIAP e formado como Técnico em Informática no Senac SP. O seu foco é nas plataformas Java e Python e em outras áreas como Arquitetura de Software e Machine Learning. Yuri também atua como editor de conteúdo no blog da Alura, onde escreve, principalmente, sobre Redes, Docker, Linux, Java e Python.

Veja outros artigos sobre Data Science