Estatística - Conceitos básicos
Dom 3 Abr 2005 04:56 |
- Detalhes
- Categoria: Estatística
- Atualização: Segunda, 26 Setembro 2005 01:11
- Autor: vovó Vicki
- Acessos: 60606
A Mediana e a Amplitude Inter-Quartis
Uma outra forma de sumarizar dados é em termos dos quantis ou percentis. Essas medidas são particularmente úteis para dados não simétricos. A mediana (ou percentil 50) é o valor que divide os dados ordenados ao meio, isto é, metade dos dados têm valores maiores do que a mediana e a outra metade tem valores menores do que a mediana. Adicionalmente, os quartis inferior e superior, Q1 e Q3, são definidos como os valores abaixo dos quais estão um quarto e três quartos, respectivamente, dos dados. Estes três valores são frequentemente usados para resumir os dados juntamente com o mínimo e o máximo.
No caso da contagem da letra A em 4 textos diferentes de 500 letras, as frequências encontradas foram 68, 81, 67 e 83. Primeiramente, ordena-se as contagens: 67, 68, 81, 83. Depois calcula-se a mediana:
número de contagens + 1 / 2 = 4 + 1 / 2 = 5 / 2 = 2.5
A mediana está exatamente entre o segundo e o terceiro valor, ou seja, entre 68 e 81. Neste caso, a mediana será 68 + (81 - 68) x 0.5 = 68 + 13 x 0.5 = 68 + 6.5 = 74.5
O quartil inferior, chamado de Q1, indica o ponto abaixo do qual se encontram 1/4 dos valores medidos e é calculado
número de contagens + 1 / 4 = 4 + 1 / 4 = 5 / 4 = 1.25
Q1 está entre o primeiro e o segundo valor medido, ou seja, entre 67 e 68. Q1 = 67 + (68 - 67) x 0.25 = 67 + 1 x 0.25 = 67 + 0.25 = 67.25.
O quartil superior, chamado de Q3, indica o ponto abaixo do qual se encontram 3/4 dos valores medidos e é calculado
(número de contagens + 1) x 3 / 4 = (4 + 1) x 3 / 4 = 15 / 4 = 3.75
Q3 está entre o terceiro e o quarto valor medido, ou seja, entre 81 e 83. Q3 = 81 + (83 - 81) x 0.75 = 81 + 2 x 0.75 = 81 + 1.5 = 82.5.
A medida de dispersão é a amplitude inter-quartis: IQR = Q3 - Q1. No exemplo da letra A, IQR = 82.5 - 67.25 = 15.25.
A Moda
A moda é o valor que ocorre com maior frequência. Em algumas contagens, como no caso da contagem da letras A, ocorre mais de um "pico". Neste caso, este conjunto de dados é chamado de multimodal (as contagens da letra A parecem ter moda ao redor de 60 e ao redor de 80). Nestes casos, é interessante separar amostras usando algum critério, por exemplo, separar vogais de consoantes. No Português, as letras mais frequentes, em ordem decrescente, são A, E, O, S, R, I, N, etc. A letra A é a mais frequente e é a moda do idioma. Se considerarmos apenas as vogais, a letra A continua sendo a moda, mas se considerarmos apenas as consoantes, a letra S será a moda.
- << Anterior
- Próximo