Medidas de tendência Central
As mais importante medidas de tendência central, são a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda, média geométrica, média harmônica, quartis. Quando se estuda variabilidade, as medidas mais importantes são: amplitude, desvio padrão e variância.
Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados. Pode-se mostrar, que quando a distribuição dos dados é "normal", então a melhor medida de localização do centro, é a média. Sendo a Distribuição Normal uma das distribuições mais importantes e que surge com mais freqüência nas aplicações, (esse fato justifica a grande utilização da média).
A média possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero.
A média tem uma outra característica, que torna a sua utilização vantajosa em certas aplicações: Quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média. Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida.
MODA
Define-se moda como sendo: o valor que surge com mais freqüência se os dados são discretos, ou, o intervalo de classe com maior freqüência se os dados são contínuos. Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal. Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana.
MEDIANA
A mediana, é uma medida de localização do centro da distribuição dos dados, definida do seguinte modo: Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana.
Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos: Se n é ímpar, a mediana é o elemento médio. Se n é par, a mediana é a semi-soma dos dois elementos médios.
Considerações a respeito de Média e Mediana
Se se representarmos os elementos da amostra ordenada com a seguinte notação: X1:n , X2:n , ... , Xn:n então uma expressão para o cálculo da mediana será: Como medida de localização, a mediana é mais robusta do que a média, pois não é tão sensível aos dados. 1- Quando a distribuição é simétrica, a média e a mediana coincidem. 2- A mediana não é tão sensível, como a média, às observações que são muito maiores ou muito menores do que as restantes (outliers). Por outro lado a média reflete o valor de todas as observações.
Como já vimos, a média ao contrário da mediana, é uma medida muito influenciada por valores "muito grandes" ou "muito pequenos", mesmo que estes valores surjam em pequeno número na amostra. Estes valores são os responsáveis pela má utilização da média em muitas situações em que teria mais significado utilizar a mediana.
A partir do exposto, deduzimos que se a distribuição dos dados: 1. for aproximadamente simétrica, a média aproxima-se da mediana 2. for enviesada para a direita (alguns valores grandes como "outliers"), a média tende a ser maior que a mediana 3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a média tende a ser inferior à mediana.