Noções elementares de Estatística: medidas de tendência central e de dispersão         

1 – Introdução

No Novo Dicionário Brasileiro – Ed. Melhoramentos – 7ª edição – 1971 lê-se para o verbete estatística -  1. conjunto de processos que tem por objeto a observação, classificação formal e análise dos fenômenos coletivos ou de massa, bem como a indução das leis a que tais fenômenos globalmente obedeçam. 2. apresentação numérica, em tabelas ou gráficos, dos resultados da observação de fenômenos de massa. Claro que o termo massa , refere-se à população e não ao conceito físico.

Os dados estatísticos devem ser apresentados na forma de tabelas, de modo a facilitar a sua interpretação. Imaginemos por exemplo o conjunto de valores a seguir, coletados numa sala de aula com 32 alunos, referente às idades dos alunos em anos:

17, 17, 17, 18, 18, 18, 18, 18,
19, 19, 19, 19, 19, 20, 20, 20,
20, 20, 20, 20, 21, 21, 21, 21,
21, 21, 21, 21, 22, 22, 23, 23.

Nota: dados expressos desta forma são ditos dados não agrupados.

Poderemos representar estes dados de uma forma mais organizada, conforme tabela a seguir, onde a coluna frequência representa o número de ocorrências de cada idade:

Idade (a)

Freqüência

17

3

18

5

19

5

20

7

21

8

22

2

23

2

Total

32

Observem que a apresentação dos dados na forma de tabela facilita e muito a interpretação.

Considere agora a relação dos pesos (em kg) de 30 alunos de uma sala, indicada a seguir:

75 – 68 – 75 – 59 – 68 – 80 – 84 – 68 – 80 – 68
68 – 75 – 75 – 80 – 80 – 75 – 80 – 68 – 84 – 75
68 – 59 – 68 – 80 – 80 – 68 – 80 – 75 – 68 – 80

Observem que estes dados não agrupados, podem até causar confusão para sua interpretação. E vejam que são somente 30 alunos; imaginem se fossem 3000?  Vejam os mesmos dados agrupados conforme tabela abaixo:

Peso (kg)

Freqüência (f)

59

2

68

10

75

7

80

9

84

2

Total

30

É evidente que a representação na forma de tabela é muito mais conveniente para qualquer análise que se deseje fazer em relação aos dados. O uso de tabelas (dados agrupados) é muito difundido em Estatística.

Os mesmos dados acima, poderiam ser agrupados com os pesos em classes de 10 em 10 kg, da seguinte forma:

Peso (em kg)

Freqüência

50 |---- 60

2

60 |---- 70

10

   70 |---- 80

7

80 |---- 90

11

Total

30

Notas:
a) claro que poderíamos dividir os pesos de 5 em 5kg, 6 em 6kg, etc. Estes intervalos são denominados classes
b) o símbolo |--- significa que o extremo 50 pertence ao intervalo e o extremo 60 não pertence ao intervalo. Por exemplo, se quiséssemos indicar que o valor 60 pertence ao intervalo, escreveríamos: 50|---|60. (Os pontos tracejados devem ser escritos de forma contínua; não encontrei símbolo para isto no teclado).

Na Estatística, a representação dos dados através de tabelas é bastante comum. Estes dados tabulados são conhecidos como distribuições de frequência.

2 – Apresentaremos a seguir, definições e comentários cobrados no ensino médio, ou seja: Média Aritmética,  Moda, Mediana, Variância e Desvio Padrão. Os cálculos estatísticos envolvendo as distribuições de freqüência serão vistos em cursos regulares de Estatística, na Universidade. O que será mostrado aqui será apenas uma introdução bastante elementar, tal qual os conceitos são cobrados ao nível do ensino médio.

A) Medidas de tendência central

Média Aritmética Simples - MAS: Dados  n  valores x1, x2, x3, ... , xn , chama-se média aritmética destes n valores, ao valor
Ma = (x1 + x2 + x3 + ... + xn) / n

Exemplo: qual a média aritmética de 5, 7, 6 e 8?
M = (5 + 7 + 6 + 8) / 4 = 6,5.

Média Aritmética Ponderada - MAP: Às vezes, é importante atribuir-se pesos diferenciados a cada valor, para o cálculo da média e, neste caso, a média recebe o nome de média ponderada.
Assim, dados n valores  x1, x2, x3, ... , xn  aos quais são atribuídos os pesos k1, k2, k3, ... , kn  respectivamente, a média ponderada destes n valores será dada por:

Mp = (x1.k1 + x2.k2 + x3.k3 + ... xn.kn) / (k1 + k2 + k3 + ... + kn)

Exemplo 1: Se os valores 10, 8 e 6 possuem pesos 4, 3 e 2 respectivamente, a média ponderada destes valores será igual a:

Mp = (10.4 + 8.3 + 6.2) / (4 + 3 + 2) = 76 / 9 = 8,44.

Exemplo 2: Qual a média aritmética da distribuição de pesos de 30 alunos de uma escola conforme mostrada na tabela a seguir?

Peso (kg)

Freqüência (f)

59

2

68

10

75

7

80

9

84

2

Total

30

Solução:  a média aritmética neste caso será dada pelo quociente:

Mp = (59.2 + 68.10 + 75.7 + 80.9 + 84.2) / (2 + 10 + 7 + 9 + 2)
Mp = (108 + 680 + 525 + 720 + 168) / 30
Mp =  2201/30 = 73,36

Nota: Fazendo k1 = k2 = k3 = ... = kn = 1 na fórmula acima, obteremos:
Mp = (x1.1 + x2.1 + x3.1 + ... + xn.1) / (1 + 1 + 1 + ... + 1 )
Ora, no denominador temos o peso 1 somado n vezes e, portanto, igual a n.
Assim, teremos:
Mp = (x1 + x2 + x3 + ... + xn) / n, que é a fórmula da média aritmética. Portanto, a média aritmética simples é um caso particular da média aritmética ponderada, onde os pesos dos valores x1, x2, ... xn, são  unitários, ou seja, igual à unidade.

Moda - Dados  n  valores x1, x2, x3, ... , xn , chama-se moda destes n valores, ao valor que mais se repete, ou seja, que possui maior freqüência. .
Exemplo: qual a moda do seguinte conjunto de valores:
10, 10, 10, 10, 10, 20,
20, 35, 35, 35, 78, 78,
78, 78, 78, 78, 78, 78,
78
, 90, 90, 90, 92, 94 ?
Resposta: M0 = 78, porque é o mais repetido, ou seja, 78 é o valor de maior freqüência.

Observe que estes dados poderiam ser tabulados da seguinte forma:

Valor

Freqüência

10

5

20

2

35

3

78

9

90

2

onde na coluna freqüência estão indicados os números de repetições de cada valor. Nota: um conjunto de valores pode ter mais de uma moda ou até não ter nenhuma. No caso do conjunto possuir apenas uma moda ele é dito unimodal.

Mediana – Dados  n  valores x1, x2, x3, ... , xn , ordenados de forma crescente ou decrescente, chama-se mediana destes n valores, ao valor que ocupa a posição central.
Exemplo: a mediana do seguinte conjunto de valores:
12, 14, 16, 18, 20, 22, 24, 26, 28  é  igual a 20, pois 20 é o valor central.
Se o número de elementos do conjunto de valores for par, a mediana será igual à média aritmética dos dois termos centrais.
Exemplo: a mediana do conjunto de valores 12, 14, 16, 18, 20, 22, 24, 26, 28, 30 será igual a Me = (20 + 22) / 2 = 42/2 = 21.

B) Medidas de dispersão

Desvio médio – Seja o conjunto de valores x1, x2, x3, ... , xn  e seja Ma a média aritmética desses valores. Sendo Di o desvio médio do valor xi, define-se:
Di = xi – Ma

Exemplo: Seja o conjunto de valores 10, 10, 12, 12, 12, 14, 16, 18 , 20, 20.
A média aritmética desses 10 valores será igual a:
Ma = (10+10+12+12+12+14+16+18+20+20) / 10 = 144 / 10 = 14,4
Por exemplo, o desvio médio do valor 10 , será igual a 10 – 14,4 = -4,4.
O desvio médio do valor 14 será igual a 14 – 14,4 = -0,4
O desvio médio do valor 18 será igual a 18 – 14,4 = +3,6 e assim sucessivamente.

Variância - Seja o conjunto de valores x1, x2, x3, ... , xn  e seja Ma a média aritmética desses valores. Sendo Di o desvio médio do valor xi, define-se a variância deste conjunto como sendo a média aritmética da soma dos quadrados dos desvios médios.

Como o conjunto x1, x2, x3, ... , xn  possui n elementos, a variância v será calculada pela fórmula a seguir, decorrente da definição acima:


A fórmula acima pode parecer um pouquinho estranha. Caso necessário, visite o arquivo sobre
somatórios.
Vamos dar um exemplo para desmistificá-la:
Seja o conjunto de  valores: 10, 12, 14, 16, 18, 20
A média aritmética destes valores será: Ma = (10+12+14+16+18+20)/ 6 = 90/6 = 15
Os desvios médios serão:
D1 = 10 – 15 = -5
D2 =  12 – 15 = -3
D3 = 14 – 15 = -1
D4 = 16 – 15 = 1
D5 = 18 – 15 = 3
D6 = 20 – 15 = 5
Então a variância V será igual a:

V = [(-5)2 + (-3)2 + (-1)2 + 12 + 32 +52] / 6 = 70 / 6 = 11,67

Desvio padrão – chama-se desvio padrão
s de um conjunto de valores, à raiz quadrada da variância, ou seja, s = Öv. Assim, por exemplo, o desvio padrão do conjunto de valores dado no exemplo acima será igual à raiz quadrada de 11,67 , ou seja,  
Ö11,67 = 3,42.
A fórmula para o cálculo do desvio padrão de um conjunto de valores x1 , x2, x3, ... , xn  de média aritmética Ma será dada por:

Notas:
a)
s : símbolo para representar o desvio padrão; letra grega  sigma minúscula
b)
S : símbolo para representar somatório ; letra grega sigma maiúscula.
c) se ocorrer x1 = x2 = x3 = ... = xn , os desvios médios xi – Ma serão nulos e, neste caso, o desvio padrão será nulo. Aliás, esta é a única forma do desvio padrão ser nulo.

Exemplo: calcule o desvio padrão da distribuição de freqüência a seguir:

Produto

Preço unitário (R$)

A

10,00

B

12,00

C

14,00

D

16,00

Inicialmente, calculamos a média aritmética dos dados:
Ma = (10 + 12 + 14 + 16) / 4 = 13, ou seja, a média aritmética dos preços é igual a R$13,00
Em seguida calculamos os desvios médios e os seus quadrados:
10 – 13 = -3 
? quadrado = (-3)2 = 9
12 – 13 = -1
? quadrado = (-1)2 = 1
14 – 13 = +1
? quadrado = (+1)2 = 1
16 – 13 = + 3
? quadrado = (+3)2 = 9
Calculamos a variância:
v = (9 + 1 + 1 + 9) / 4 = 5
O desvio padrão será igual então à raiz quadrada da variância ou seja:
s = Ö5 = 2,23 .
Nota: a unidade do desvio padrão é a mesma da média. Portanto,
s = R$2,23.

Nota: quanto maior o desvio padrão, maior o grau de dispersão dos dados de um determinado conjunto de valores ou seja, quanto mais assimétricos os dados, maior o desvio padrão. Somente a título de exemplo ilustrativo, considere os casos simples abaixo:
a) valores 4 e 6: média aritmética = (4+6)/2 = 5 e desvio padrão = 1.
b) valores 4 e 10: média aritmética = (4+12)/2 = 8 e desvio padrão = 4.
Observe que os dados 4 e 6 são mais “homogêneos” que os dados 4 e 12 (maior assimetria no segundo caso) e o desvio padrão do segundo conjunto de valores é bem maior que o do primeiro. 

Coeficiente de variação – se um dado conjunto de valores possui média aritmética Ma e desvio padrão s define-se o coeficiente de variação Cv como segue: 

Por exemplo, no caso anterior a média aritmética dos valores é igual a 15 e o desvio padrão é igual a 3,42. O coeficiente de variação será igual a (3,42/15).100 = 22,8%.

Nota: o uso do coeficiente de variação permite a comparação dos graus de dispersão de duas ou mais distribuições de freqüência .

Exemplo: Considere que numa sala de aula se tenha calculado a média aritmética das alturas (em centímetros) e dos pesos dos alunos (em quilogramas) e os seus respectivos desvios padrões, e se tenha obtido os seguintes resultados:
Alturas: Ma = 175 cm e 
s = 10 cm
Pesos: Ma = 60 kg e
s = 6 kg.
Qual dos dois conjuntos de dados apresenta maior dispersão em relação à média?

Isto poderá ser respondido através do cálculo do coeficiente de variação para ambos os casos. Vejamos:
Alturas: Cv = (10/175).100 = 5,71%
Pesos: Cv = (6/60).100 = 10%

Como 10% > 5,71%, concluímos que a distribuição dos pesos apresenta maior dispersão do que a distribuição das alturas. Poderemos dizer então, que a distribuição das alturas é mais "homogênea" do ponto de vista estatístico, do que a distribuição dos pesos na amostra de alunos dada como exemplo.

Paulo Marques, 17 de dezembro de 2006 - Feira de Santana - BA. Editado em 05/02/2011.

VOLTAR