Distribuição de Freqüência
É uma maneira de organizar uma série de dados em um agrupamento, exibindo o número de observações em classes e pode ser apresentada sob forma gráfica ou tabular. Os dados podem ser classificados em: Dados Discretos (refere-se normalmente a contagem) ou Dados Contínuos (onde os dados podem assumir qualquer valor do conjunto dos números reais).
Glossário:
N: total de dados da amostra.
f ou fi : freqüência (número de vezes que a observação acontece)
fr: freqüência relativa (número de vezes que a observação acontece dividido pelo tamanho da amostra)
fa: freqüência acumulada (a soma de todas as freqüências até a atual)
Exemplos:
Dados não agrupados em classes: os valores aparecem individualmente (agrupamentos discretos).
10, 10, 10, 10, 10, 12, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13
13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 16, 16, 16, 16.
x f fr fa x. f
10 05 05/34 05 50
12 06 06/34 11 72
13 11 11/34 22 143
14 08 08/34 30 112
16 04 04/34 34 64
å 34
Dados agrupados em classes: os valores aparecem agrupados em classes (agrupamentos contínuos).
08,0 - 09,0 - 10,0 - 10,2 - 10,5 - 10,5 - 11,0 - 12,5 - 12,5 - 12,6 - 13,0 - 13,2 - 13,5 - 13,7 - 13,8 - 14,0 - 14,0 - 14,5
14,5 - 15,0 - 15,2 - 15,4 - 15,5 - 15,8 - 16,4 - 16,5 - 16,6 - 16,6 - 16,7 - 17,1 - 17,2 - 18,0 - 18,5 - 19,2 - 19,5 - 19,5.
N = 36
A: amplitude de variação dos dados amostrais (a diferença entre o maior e o menor dado da amostra)
19,5 – 08 = 11,5
Número de classes: k = 1 + 3,3 log N ou k =
k = 6 (nem sempre esse número é exato, arredonda-se para o mais conveniente)
h: intervalo de classe h = A / k
h = 11,5/6 = 1,91666...
h = 2 (arredondando para o mais conveniente)
xi : a média aritmética dos limites do intervalo de cada classe
Então teremos 6 classes, onde a primeira começa com o limite inferior 8, e teremos intervalos de 2 em 2.
Classe fi fa xi fi . xi
å 36
Medidas de tendência central ou Medidas de concentração
Em uma amostra, quando se tem os valores de uma variável, é fácil constatar que os dados quase nunca se distribuem uniformemente, havendo concentração em alguns pontos, notadamente próximos ao centro da distribuição. Delas, as mais importantes em são: Média, Mediana e Moda.
Média de dados não agrupados
Se tivermos uma série de N valores de uma variável x ( x1, x2, x3, x4, ... xn ) a média será determinada pela expressão:
Me = (x1 + x2 + x3 + x4 + . . . + xn) / N = å xi / N (nos casos em que alguns dos xi é repetido, faz a média aritmética ponderada) Média de dados agrupados
Me = å fi . xi / N ( N = å fi )
Para os exemplos apresentados acima teremos:
No primeiro exemplo: Me = (50 + 72 + 143 + 112 + 64) / 34 = 441 / 34 = ~ 12,97 (onde ~ representa aproximadamente)
Que é o mesmo que somar 10 + 10 + . . . + 16 = 441 e depois dividir por 34
No segundo exemplo: Me = (18 + 55 + 104 +135 + 119 + 95) / 36 = 526 / 36 = ~ 14,61
Mediana de dados não agrupados
Será o valor de "x" que ocupa a posição central se N for ímpar. Se N for par, tomam-se os 2 valores que estão nas posições centrais e divide-se por 2.
Mediana de dados agrupados em classes
Pode ser encontrada pela fórmula Mi = li + [(N / 2 – fa[i – 1]) / fc] . h
li = limite inferior da classe que deve conter a mediana
fc = freqüência da classe que deve conter a Mi
Mi = Mediana
fa[i – 1] = freqüência acumulada anterior da classe que deve conter a mediana
Para os exemplos apresentados acima teremos:
No primeiro exemplo: Mi = 13 (considerando os dados não agrupados somaríamos o 17º com o 18º e dividiríamos por 2)
ou como pode ser facilmente observado há apenas 5 grupos de elementos: 10, 12, 13, 14 e 16. E portanto, o termo central é 13.
No segundo exemplo: a metade de N é 36 / 2 = 18, pela freqüência acumulada notamos que a classe entre 14 e 16 tem acúmulo de 24 (a freqüência acumulada anterior é 15 o que ainda falta para 18), portanto a classe entre 14 e 16 é onde se encontra a mediana (e o limite inferior é 14).
Mi = 14 + [(36 / 2 - 15) / 9]. 2 = 14 + (3 / 9). 2 = ~ 14 + 0,33. 2 = ~ 14,66
Moda
É o valor amostral que tem a maior freqüência, isto é, encontrado em maior número de vezes. Uma distribuição pode ter apenas uma moda (unimodal), duas modas (bimodal), três modas (trimodal), etc., ou ainda não apresentar moda (amodal), isto ocorre quando todas as freqüências são iguais.
Em distribuições moderadamente assimétricas pode-se encontrar a moda pela fórmula de Pearson:
Mo = 3 Mi – 2 MePara os exemplos apresentados acima teremos:
No primeiro exemplo: Mo = 13 (pois é a variável que apresenta a maior freqüência, ou seja, 11).
No segundo exemplo: podemos obter com o auxílio da fórmula acima, pois já temos a média Me = 14,61 e a mediana Mi = 14,66 (ambos aproximadamente), daí teremos Mo = 3. 14,66 – 2. 14,61 = 43,98 – 29,22 = 14,76.
Medidas de dispersão
É o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio.
Variância
Considerando uma série de N valores de uma variável x (x1, x2, x3, x4, ..., xn), com média Me, a variância pode ser determinada por:
s2 = å ( xi – Me ) 2 / (N – 1) = å (xi2) – N.Me2 / (N – 1), ou
= [ å x2 – ( å x) 2 / N ] / ( N – 1), ou ainda
= [ å fi xi2 – (å fi. xi)2 / N ] / ( N – 1)
Para os exemplos apresentados acima teremos:
x f fa x. f x2 x2. f
10 05 05 50 100 500
12 06 11 72 144 864
13 11 22 143 169 1859
14 08 30 112 196 1568
16 04 34 64 256 1024
441 5815
No primeiro exemplo: s2 = [ å fi xi2 – (å fi. xi)2 / N ] / ( N – 1)
= [5815 – (441)2 / 34] / 33 =
= [5815 – (194481) / 34] / 33 = [5815 – 5720,029] / 33 = ~ 2,878
No segundo exemplo a idéia e semelhante.
Desvio padrão
Como a variância é dada com medidas quadradas, temos como converter as mesmas medidas que possuímos, basta extrair a raiz quadrada da mesma.
s =
Coeficiente de variação
C = s / Me
Tipos de Curvas
Nenhum comentário:
Postar um comentário