sexta-feira, 22 de julho de 2011

Estatística : Frequência acumulada

Distribuição de Freqüência

É uma maneira de organizar uma série de dados em um agrupamento, exibindo o número de observações em classes e pode ser apresentada sob forma gráfica ou tabular. Os dados podem ser classificados em: Dados Discretos (refere-se normalmente a contagem) ou Dados Contínuos (onde os dados podem assumir qualquer valor do conjunto dos números reais).

Glossário:

N: total de dados da amostra.

f ou f_i : freqüência (número de vezes que a observação acontece)

fr: freqüência relativa (número de vezes que a observação acontece dividido pelo tamanho da amostra)

fa: freqüência acumulada (a soma de todas as freqüências até a atual)

Exemplos:

Dados não agrupados em classes: os valores aparecem individualmente (agrupamentos discretos).

10, 10, 10, 10, 10, 12, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13

13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 16, 16, 16, 16.

x f fr fa x. f

10 05 05/34 05 50

12 06 06/34 11 72

13 11 11/34 22 143

14 08 08/34 30 112

16 04 04/34 34 64

å 34

Dados agrupados em classes: os valores aparecem agrupados em classes (agrupamentos contínuos).

08,0 - 09,0 - 10,0 - 10,2 - 10,5 - 10,5 - 11,0 - 12,5 - 12,5 - 12,6 - 13,0 - 13,2 - 13,5 - 13,7 - 13,8 - 14,0 - 14,0 - 14,5

14,5 - 15,0 - 15,2 - 15,4 - 15,5 - 15,8 - 16,4 - 16,5 - 16,6 - 16,6 - 16,7 - 17,1 - 17,2 - 18,0 - 18,5 - 19,2 - 19,5 - 19,5.

N = 36

A: amplitude de variação dos dados amostrais (a diferença entre o maior e o menor dado da amostra)

19,5 – 08 = 11,5

Número de classes: k = 1 + 3,3 log N ou k =

k = 6 (nem sempre esse número é exato, arredonda-se para o mais conveniente)

h: intervalo de classe h = A / k

h = 11,5/6 = 1,91666...

h = 2 (arredondando para o mais conveniente)

x_{i :}a média aritmética dos limites do intervalo de cada classe

Então teremos 6 classes, onde a primeira começa com o limite inferior 8, e teremos intervalos de 2 em 2.

Classe f_i fa x_i f_i . x_i

8 10 02 02 09 18

10 12 05 07 11 55

12 14 08 15 13 104

14 16 09 24 15 135 (possível classe da mediana)

16 18 07 31 17 119

18 20 05 36 19 95

å 36

Medidas de tendência central ou Medidas de concentração

Em uma amostra, quando se tem os valores de uma variável, é fácil constatar que os dados quase nunca se distribuem uniformemente, havendo concentração em alguns pontos, notadamente próximos ao centro da distribuição. Delas, as mais importantes em são: Média, Mediana e Moda.

Média de dados não agrupados

Se tivermos uma série de N valores de uma variável x ( x₁, x₂, x₃, x₄, ... x_n) a média será determinada pela expressão:

Me = (x₁ + x₂ + x₃+ x₄ + . . . + x_n) / N = å x_i / N (nos casos em que alguns dos x_i é repetido, faz a média aritmética ponderada)

Média de dados agrupados

Me = å f_i. x_i / N (N = å f_i )

Para os exemplos apresentados acima teremos:

No primeiro exemplo: Me = (50 + 72 + 143 + 112 + 64) / 34 = 441 / 34 = ~ 12,97 (onde ~ representa aproximadamente)

Que é o mesmo que somar 10 + 10 + . . . + 16 = 441 e depois dividir por 34

No segundo exemplo: Me = (18 + 55 + 104 +135 + 119 + 95) / 36 = 526 / 36 = ~ 14,61

Mediana de dados não agrupados

Será o valor de "x" que ocupa a posição central se N for ímpar. Se N for par, tomam-se os 2 valores que estão nas posições centrais e divide-se por 2.

Mediana de dados agrupados em classes

Pode ser encontrada pela fórmula Mi = li + [(N / 2 – fa_{[i – 1]}) / fc] . h

li = limite inferior da classe que deve conter a mediana

fc = freqüência da classe que deve conter a Mi

Mi = Mediana

fa_{[i – 1]} = freqüência acumulada anterior da classe que deve conter a mediana

Para os exemplos apresentados acima teremos:

No primeiro exemplo: Mi = 13 (considerando os dados não agrupados somaríamos o 17º com o 18º e dividiríamos por 2)

ou como pode ser facilmente observado há apenas 5 grupos de elementos: 10, 12, 13, 14 e 16. E portanto, o termo central é 13.

No segundo exemplo: a metade de N é 36 / 2 = 18, pela freqüência acumulada notamos que a classe entre 14 e 16 tem acúmulo de 24 (a freqüência acumulada anterior é 15 o que ainda falta para 18), portanto a classe entre 14 e 16 é onde se encontra a mediana (e o limite inferior é 14).

Mi = 14 + [(36 / 2 - 15) / 9]. 2 = 14 + (3 / 9). 2 = ~ 14 + 0,33. 2 = ~ 14,66

Moda

É o valor amostral que tem a maior freqüência, isto é, encontrado em maior número de vezes. Uma distribuição pode ter apenas uma moda (unimodal), duas modas (bimodal), três modas (trimodal), etc., ou ainda não apresentar moda (amodal), isto ocorre quando todas as freqüências são iguais.

Em distribuições moderadamente assimétricas pode-se encontrar a moda pela fórmula de Pearson:

Mo = 3 Mi – 2 Me

Para os exemplos apresentados acima teremos:

No primeiro exemplo: Mo = 13 (pois é a variável que apresenta a maior freqüência, ou seja, 11).

No segundo exemplo: podemos obter com o auxílio da fórmula acima, pois já temos a média Me = 14,61 e a mediana Mi = 14,66 (ambos aproximadamente), daí teremos Mo = 3. 14,66 – 2. 14,61 = 43,98 – 29,22 = 14,76.

Medidas de dispersão

É o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio.

Variância

Considerando uma série de N valores de uma variável x (x₁, x₂, x₃, x₄, ..., x_n), com média Me, a variância pode ser determinada por:

s² = å ( x_i – Me )² / (N – 1) = å (x_i²) – N.Me² / (N – 1), ou

= [ å x² – (å x)² / N ] / (N – 1), ou ainda

= [ å f_i x_i² – (å f_i. x_i)² / N ] / (N – 1)

Para os exemplos apresentados acima teremos:

x f fa x. f x² x². f

10 05 05 50 100 500

12 06 11 72 144 864

13 11 22 143 169 1859

14 08 30 112 196 1568

16 04 34 64 256 1024

441 5815

No primeiro exemplo: s² = [ å f_i x_i² – (å f_i. x_i)² / N ] / (N – 1)

= [5815 – (441)² / 34] / 33 =

= [5815 – (194481) / 34] / 33 = [5815 – 5720,029] / 33 = ~ 2,878

No segundo exemplo a idéia e semelhante.

Desvio padrão

Como a variância é dada com medidas quadradas, temos como converter as mesmas medidas que possuímos, basta extrair a raiz quadrada da mesma.

s =

Coeficiente de variação

C = s / Me

Tipos de Curvas

sexta-feira, 22 de julho de 2011

Estatística : Frequência acumulada

h = 2 (arredondando para o mais conveniente)

Medidas de tendência central ou Medidas de concentração

Média de dados não agrupados

Moda

Medidas de dispersão

É o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio.

Variância

Considerando uma série de N valores de uma variável x (x₁, x₂, x₃, x₄, ..., x_n), com média Me, a variância pode ser determinada por:

Nenhum comentário:

Postar um comentário

Quem sou eu

Arquivo do blog

sexta-feira, 22 de julho de 2011

Estatística : Frequência acumulada

h = 2 (arredondando para o mais conveniente)

Medidas de tendência central ou Medidas de concentração

Média de dados não agrupados

Moda

Medidas de dispersão

É o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio.

Variância

Considerando uma série de N valores de uma variável x (x1, x2, x3, x4, ..., xn), com média Me, a variância pode ser determinada por:

Nenhum comentário:

Postar um comentário

Considerando uma série de N valores de uma variável x (x₁, x₂, x₃, x₄, ..., x_n), com média Me, a variância pode ser determinada por: