Un estadÃstico (muestral) es una medida cuantitativa, derivada de un conjunto de datos de una muestra con el objetivo de estimar o contrastar caracterÃsticas de una población o modelo estadÃstico.
Más formalmente un estadÃstico es una función medible que dado una muestra estadÃstica de valores, les asigna un número que sirve para estimar los parámetros de la distribución de la que procede la muestra. Asà por ejemplo la media muestral de valores sirve para estimar el valor esperado de una variable, la varianza muestral de una muestra amplia sirve para estimar la varianza de la población, etc.
Contenido |
editar EstadÃsticos muestrales
editar Media muestral
Si se tiene una muestra estadÃstica de valores (X1,X2,...,Xn) de valores para una variable aleatoria X con distribución de probabilidad F(x,θ) [donde θ es un conjunto de parámetros de la distribución] se define la media muestral n-ésima como:
editar Varianza muestral
De forma analoga a la Media Muestral y utilizando los mismos elementos que en la misma, la definición de Varianza es la siguiente:
editar Momentos muestrales
Con las mismas notaciones usadas a la media y varianza muestral se define el estadÃstico momento muestral no centrado como:
Nótese que m1 es precisamente la media muestral. Análogamente se define el estadÃstico momento muestral centrado como:
que guarda las siguientes relaciones con estadÃsticos previamente definidos:
editar Estimación de parámetros
La estimación de parámetros consiste en aproximar valores poblacionales a partir del conjunto de valores de una muestra. Por ejemplo determinar la media de la población en cierto aspecto a partir de la media muestral, para poder determinar dicha existen básicamente dos procedimientos buscar estadÃsticos suficientes o la estimación puntual.
editar EstadÃsticos suficientes
El concepto de estadÃstico suficiente fue introducido por Fisher en 1922, y como originalmente indicó, un estadÃstico es suficiente para los objetivos de la inferencia estadÃstica si contiene, en cierto sentido toda la «información» acerca de la función de distribución a partir de la cual se ha generado la muestra.
Formalmente si
es una muestra de una variable aleatoria
cuya distribución de probabilidad pertenece a una familia de distribuciones dadas por un vector paramétrico
, entonces se dice que un cierto estadÃstico
es suficiente para θ o para la familia si y sólo si, la distribución condicionada de X1,X2,...,Xn | T no depende de θ.
editar Estimación puntual
La estimación puntual consiste en utilizar el valor de una estadÃstica o un valor estadÃstico para calcular el parámetro de una población. Por ejemplo, cuando usamos la media muestral para estimar la media de una población, o la proporción de una muestra para estimar el parámetro de una distribución binomial.
Una "estimación puntual" de algún parámetro de una población es un solo valor obtenido a partir de un estadÃstico.
editar Contraste de hipótesis
editar Prueba o test χ2 (chi-cuadrado)
editar Test t-Student
Es un test que permite decidir si dos variables aleatorias normales (gausianas) y con la misma varianza tienen medias diferentes. Dada la ubicuidad de la distribución normal o gausiana el test puede aplicarse en numerosos contextos, para comprobar si la modificación en las condiciones de un proceso (humano o natural) esencialmente aleatorio producen una elevación o disminución de la media poblacional. El test opera decidiendo si una diferencia en la media muestral entre dos muestras es estadÃsticamente significativa, y entonces poder afirmar que las dos muestras corresponden a distribuciones de probabilidad de media poblacional distinta, o por el contrario afirmar que la diferencia de medias puede deberse a oscilaciones estadÃsticas azarosas.
La eficacia del test aumenta con el número de datos del que constan las dos muestras, en concreto del número de grados de libertad conjunto de las dos muestras, este número viene dado por GL = N1 + N2 − 2 (siendo Ni el tamaño muestral, es decir, el número de datos en cada muestra i). La prueba consiste en examinar el estadÃstico t obtenido a partir de la dos muestras como:
Y este valor se compara con un valor de referencia basado en el número de grados de libertad y el nivel de significación. Dicho valor de referencia se obtiene a partir de la distribución t de Student.
Al comparar las 2 medias, frecuentemente siempre se supone que el nivel de signigicación α sea menor que 0,05.






