miércoles, 26 de septiembre de 2018

EVIDENCIAS DE CURSOS MOC


T-STUDENT


Supóngase que se toma una muestra de una población normal con media  y varianza . Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución  es una distribución normal estándar. Supóngase que la varianza de la población 2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza  por s? La distribución t proporciona la respuesta a esta pregunta.

La media y la varianza de la distribución t son  = 0 y  para >2, respectivamente.
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media  = 0. Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la distribución normal estándar.

Propiedades de las distribuciones t

  1. Cada curva t tiene forma de campana con centro en 0.


  2. Cada curva t, está más dispersa que la curva normal estándar z.

  3. A medida que  aumenta, la dispersión de la curva t correspondiente disminuye.

  4. A medida que  , la secuencia de curvas t se aproxima a la curva normal estándar, por lo que la curva z recibe a veces el nombre de curva t con gl = 


La distribución de la variable aleatoria t está dada por:
Esta se conoce como la distribución t con  grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media  y desviación estándar . Entonces la variable aleatoria  tiene una distribución t con  = n-1 grados de libertad.

La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de "Student". En consecuencia, la distribución t normalmente se llama distribución t de Student, o simplemente distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.

La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.

Se acostumbra representar con el valor t por arriba del cual se encuentra un área igual a . Como la distribución t es simétrica alrededor de una media de cero, tenemos; es decir, el valor t que deja un área de  a la derecha y por tanto un área de  a la izquierda, es igual al valor t negativo que deja un área de  en la cola derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.

Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.

Ejemplo:
El valor t con  = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un área de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145


DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE PROPORCIONES

DIFERENCIA DE PROPORCIONES 

El estadístico de prueba que permite contrastar frente a  a partir de dos muestras aleatorias e independientes es  siendo p la estimación de  obtenida del total de observaciones.
Si se consideran las proporciones como medias y se aplica la prueba t utilizada para comparar medias poblacionales los resultados no son fiables ya que la estimación del error típico que realiza el programa no coincide con la del estadístico de prueba. Para resolver el problema con el programa SPSS se deberá cruzar la variable analizada con la que define los grupos (obtener la tabla de contingencia) y realizar el contraste de independencia Chi-cuadrado.
El estadístico de prueba Chi-cuadrado se define:  y presenta una distribución Chi-cuadrado con (I-1)(J-1) grados de libertad. Las Eij se calculan multiplicando las frecuencias marginales y dividendo el producto por n. Estas Eij son estimaciones de las frecuencias absolutas que cabría esperar en cada casilla bajo el supuesto de que la proporción de éxitos es la obtenida a partir del total de observaciones muestrales sin considerar diferencias entre los dos grupos.
La secuencia es:
Analizar
Estadísticos Descriptivos
Tablas de contingencia

En el cuadro de diálogo se indica la variable que se quiere contrastar (filas), la variable que define los dos grupos (columnas) y se selecciona la opción Chi-cuadrado en Estadísticos.

EJEMPLO
Con referencia a la encuesta Enctrans.sav se quiere comprobar si la proporción de alumnos con vehículo difiere significativamente entre los grupos definidos según el género.
La hipótesis nula del contraste es ; siendo  la proporción poblacional de hombres con vehículo y  la proporción poblacional de mujeres con vehículo.
Con la secuencia Analizar > Estadísticos Descriptivos > Tablas de contingencia se accede al cuadro de diálogo donde se indica que la variable a contrastar es Vehículo y que la variable de agrupación es el Género, y se selecciona la opción Chi-cuadrado en Estadísticos. Al aceptar se obtiene el siguiente cuadro de resultados.
Si es cierto que la proporción de propietarios de vehículo es la misma en los dos grupos,  , la estimación de  es la proporción de propietarios de vehículo para el total de alumnos de la muestra, es decir, 39/114=0,3421. La frecuencia esperada de hombres con vehículo se obtendrá multiplicando esta proporción por el total de hombres en la muestra, o sea, 0,3421·54=18,5; y de la misma forma se obtendrá la frecuencia esperada de mujeres con vehículo: 0,3421·60=20,5 (veáse que estas frecuencias esperadas coinciden con las que cabría esperar en el caso de que las variables Género y Vehículo fueran independientes).
El estadístico Chi-cuadrado toma el valor 0,998 y el nivel de significación crítico es 0,318, por lo tanto no se rechaza la hipótesis nula para los niveles de significación habituales y se puede aceptar que no hay diferencia entre la proporción de hombres y mujeres propietarios de vehículos.

jueves, 13 de septiembre de 2018

distribución Muestral de Proporciones

Las proporciones muestrales de tamaño n \geq 30 extraídas de una población con probabilidad de éxito p, se ajustan a una distribución normal de parámetros:
N\left(p,  \sqrt{\frac{p\cdot(1-p)}{n}}  \right)
- Se basa en la Aproximación de la Binomial a la Normal, por tanto, se considera una buena aproximación cuando se cumplan las condiciones n \geq 30 , n\cdot p \geq 5 y n\cdot (1-p) \geq 5
- En la práctica la proporción de la población (p) suele ser desconocida y se usa la proporción de la muestra (\overline{p})
Una fábrica de pasteles fabrica, en su producción habitual, un 3 \% de pasteles defectuosos. Un cliente recibe un pedido de 500 pasteles de la fábrica. Calcula la probabilidad de que encuentre más del 5 \% de pasteles defectuosos

SOLUCIÓN

Estamos tomando una muestra de tamaño n=500, de una población donde la proporción de pasteles defectuosos es de p=0.03. Podemos usar las Distribución Muestral de Proporciones, que se ajusta a una normal N\left(p,  \sqrt{\frac{p\cdot(1-p)}{n}}  \right)
En nuestro ejemplo, si sustituimos los valores de p y n y calculamos, sería N(0.03 , 0.0076)
- a) P(\overline{p}>0.05) = P\left(Z>\frac{0.05-0.03}{0.0076}\right) = P(Z>2.63)=
=1 - P(Z \leq 2.63) = 1 - 0.9957 = \fbox{0.0043}
Se ha tipificado la variable y se ha hecho uso de la tabla de la N(0,1)