sexta-feira, 22 de julho de 2011

Estatística : Frequência acumulada

Distribuição de Freqüência
É uma maneira de organizar uma série de dados em um agrupamento, exibindo o número de observações em classes e pode ser apresentada sob forma gráfica ou tabular. Os dados podem ser classificados em: Dados Discretos (refere-se normalmente a contagem) ou Dados Contínuos (onde os dados podem assumir qualquer valor do conjunto dos números reais).
Glossário:
N: total de dados da amostra.
f ou fi : freqüência (número de vezes que a observação acontece)
fr: freqüência relativa (número de vezes que a observação acontece dividido pelo tamanho da amostra)
fa: freqüência acumulada (a soma de todas as freqüências até a atual)
Exemplos:
Dados não agrupados em classes: os valores aparecem individualmente (agrupamentos discretos).
10, 10, 10, 10, 10, 12, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13
13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 16, 16, 16, 16.
    x          f            fr            fa        x. f
    10           05            05/34           05          50
    12           06            06/34           11          72 
    13           11            11/34           22         143 
    14           08            08/34           30         112
    16           04            04/34           34           64
             å  34
Dados agrupados em classes: os valores aparecem agrupados em classes (agrupamentos contínuos).
08,0 -  09,0 - 10,0 - 10,2 - 10,5 - 10,5 - 11,0 - 12,5 - 12,5 - 12,6 - 13,0 - 13,2 - 13,5 - 13,7 - 13,8 - 14,0 - 14,0 - 14,5
14,5 - 15,0 -  15,2 - 15,4 - 15,5 - 15,8 - 16,4 - 16,5 - 16,6 - 16,6 - 16,7 - 17,1 - 17,2 - 18,0 - 18,5 - 19,2 - 19,5 - 19,5.
N = 36
A: amplitude de variação dos dados amostrais (a diferença entre o maior e o menor dado da amostra)
19,5 08 = 11,5 
Número de classes: k = 1 + 3,3 log N     ou        k =
k = 6    (nem sempre esse número é exato, arredonda-se para o mais conveniente)
h: intervalo de classe h = A / k
h = 11,5/6 = 1,91666...

h = 2    (arredondando para o mais conveniente)


 xi : a média aritmética dos limites do intervalo de cada classe

Então teremos 6 classes, onde a primeira começa com o limite inferior 8, e teremos intervalos de 2 em 2.
            Classe          fi           fa        xi       fi .  xi  
             8      10           02           02        09            18   
      10      12           05           07        11            55
      12      14           08           15        13          104
      14      16           09           24        15          135   (possível classe da mediana)
      16      18           07           31        17          119
      18      20           05           36        19            95
                         å  36

Medidas de tendência central ou Medidas de concentração

Em uma amostra, quando se tem os valores de uma variável, é fácil constatar que os dados quase nunca se distribuem uniformemente, havendo concentração em alguns pontos, notadamente próximos ao centro da distribuição. Delas, as mais importantes em são: Média, Mediana e Moda.

Média de dados não agrupados

Se tivermos uma série de N valores de uma variável x ( x1, x2, x3, x4, ... xn ) a média será determinada pela expressão:
Me = (x1 + x2 + x3 + x4 + . . . + xn) / N = å xi / N (nos casos em que alguns dos xi é repetido, faz a média aritmética ponderada)
Média de dados agrupados
Me = å fi . xi / N ( N = å fi )

Para os exemplos apresentados acima teremos:
No primeiro exemploMe = (50 + 72 + 143 + 112 + 64) / 34 = 441 / 34 = ~ 12,97 (onde ~ representa aproximadamente)
                    Que é o mesmo que somar 10 + 10 + . . . + 16 = 441 e depois dividir por 34
No segundo exemplo: Me = (18 + 55 + 104 +135 + 119 + 95) / 36 = 526 / 36 = ~ 14,61

Mediana de dados não agrupados
Será o valor de "x" que ocupa a posição central se N for ímpar. Se N for par, tomam-se os 2 valores que estão nas posições centrais e divide-se por 2.
Mediana de dados agrupados em classes
Pode ser encontrada pela fórmula  Mi = li + [(N / 2 – fa[i – 1]) / fc] . h
li = limite inferior da classe que deve conter a mediana
fc = freqüência da classe que deve conter a Mi
Mi = Mediana 
fa[i – 1] = freqüência acumulada anterior da classe que deve conter a mediana

Para os exemplos apresentados acima teremos:
No primeiro exemploMi = 13 (considerando os dados não agrupados somaríamos o 17º com o 18º e dividiríamos por 2)
                                ou como pode ser facilmente observado há apenas 5 grupos de elementos: 10, 12, 13, 14 e 16. E portanto, o termo central é 13.
No segundo exemplo: a metade de N é 36 / 2 = 18, pela freqüência acumulada notamos que a classe entre 14 e 16 tem acúmulo de 24 (a freqüência acumulada anterior é 15 o que ainda falta para 18), portanto a classe entre 14 e 16 é onde se encontra a mediana (e o limite inferior é 14).
Mi = 14 + [(36 / 2 - 15) / 9]. 2 = 14 + (3 / 9). 2 = ~ 14 + 0,33. 2 = ~ 14,66

Moda

É o valor amostral que tem a maior freqüência, isto é, encontrado em maior número de vezes. Uma distribuição pode ter apenas uma moda (unimodal), duas modas (bimodal), três modas (trimodal), etc., ou ainda não apresentar moda (amodal), isto ocorre quando todas as freqüências são iguais. 
Em distribuições moderadamente assimétricas pode-se encontrar a moda pela fórmula de Pearson:
Mo = 3 Mi – 2 Me

Para os exemplos apresentados acima teremos:
No primeiro exemploMo = 13 (pois é a variável que apresenta a maior freqüência, ou seja, 11).
No segundo exemplo: podemos obter com o auxílio da fórmula acima, pois já temos a média Me = 14,61 e a mediana Mi = 14,66 (ambos aproximadamente), daí teremos Mo = 3. 14,66 2. 14,61 = 43,98 – 29,22 = 14,76.


Medidas de dispersão

É o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio.

 

Variância

Considerando uma série de N valores de uma variável x (x1, x2, x3, x4, ..., xn), com média Me, a variância pode ser determinada por:

s2 = å ( xi – Me ) 2 / (N – 1) = å (xi2) – N.Me2 / (N – 1), ou
    = [ å x2 – ( å x) 2 / N ] / ( N – 1), ou ainda
    = [ å fi xi2 – (å fi. xi)2 / N ] / ( N – 1)
Para os exemplos apresentados acima teremos:
    x          f          fa        x. f         x2      x2. f
    10           05           05          50            100        500
    12           06           11          72            144        864
    13           11           22         143           169      1859
    14           08           30         112           196      1568
    16           04           34           64           256      1024
                                               441                       5815
No primeiro exemplos2  = [ å fi xi2 – (å fi. xi)2 / N ] / ( N – 1)
                                = [5815 (441)2 / 34] / 33 =
                                        = [5815 (194481) / 34] / 33 = [5815 5720,029] / 33 = ~ 2,878
No segundo exemplo a idéia e semelhante.

Desvio padrão
Como a variância é dada com medidas quadradas, temos como converter as mesmas medidas que possuímos, basta extrair a raiz quadrada da mesma. 
s =
Coeficiente de variação
C = s / Me

Tipos de Curvas

Nenhum comentário:

Postar um comentário