Articles

supuestos clave de OLS: Econometrics Review

Posted by admin

atención: este post fue escrito hace unos años y puede no reflejar los últimos cambios en el programa AP®. Estamos actualizando gradualmente estas publicaciones y eliminaremos esta exención de responsabilidad cuando se actualice esta publicación. Gracias por su paciencia!

Introducción

los modelos de regresión lineal encuentran varios usos en problemas de la vida real., Por ejemplo, una corporación multinacional que desea identificar los factores que pueden afectar las ventas de su producto puede ejecutar una regresión lineal para averiguar qué factores son importantes. En econometría, el método de mínimos cuadrados ordinarios (OLS) es ampliamente utilizado para estimar el parámetro de un modelo de regresión lineal. Los estimadores OLS minimizan la suma de los errores al cuadrado (una diferencia entre los valores observados y los valores predichos). Si bien OLS es computacionalmente factible y se puede usar fácilmente mientras se realiza cualquier prueba econométrica, es importante conocer los supuestos subyacentes de la regresión OLS., Esto se debe a que la falta de conocimiento de los supuestos de la operación supervivencia en el Sudán daría lugar a su uso indebido y daría resultados incorrectos para la prueba de econometría completada. La importancia de OLS supuestos no se puede exagerar. La siguiente sección describe los supuestos de regresión OLS.

supuestos de regresión OLS

los supuestos OLS necesarios, que se utilizan para derivar los estimadores OLS en modelos de regresión lineal, se discuten a continuación.

suposición OLS 1: el modelo de regresión lineal es » lineal en parámetros.,»

Cuando la variable dependiente (y) es una función lineal de variables independientes (X) y el término de error, la regresión es lineal en parámetros y no necesariamente lineal en X. por ejemplo, considere lo siguiente:

A1. El modelo de regresión lineal es » lineal en parámetros.»

A2. Hay un muestreo aleatorio de observaciones.

A3. La media condicional debe ser cero.

A4. No hay colinealidad múltiple (o colinealidad perfecta).

A5., Errores esféricos: hay homoscedasticidad y no autocorrelación

A6: Asunción opcional: los Términos de Error deben distribuirse normalmente.,

a)quad Y={ beta }_{ 0 }+{ beta }_{ 1 }{ X }_{ 1 }+{ beta }_{ 2 }{ X }_{ 2 }+varepsilon

b)quad Y={ beta }_{ 0 }+{ beta }_{ 1 }{ X }_{ { 1 }^{ 2 } }+{ beta }_{ 2 }{ X }_{ 2 }+varepsilon

c)quad Y={ beta }_{ 0 }+{ beta }_{ { 1 }^{ 2 } }{ X }_{ 1 }+{ beta }_{ 2 }{ X }_{ 2 }+varepsilon

En los tres ejemplos, para a) y b) OLS la hipótesis 1 es satisfecho. Para c) la suposición 1 de OLS no se cumple porque no es lineal en el parámetro {beta }_{ 1 }.,

suposición OLS 2: hay un muestreo aleatorio de observaciones

esta suposición de regresión OLS dice que:

  • La muestra tomada para el modelo de regresión lineal debe ser extraída aleatoriamente de la población. Por ejemplo, si tiene que ejecutar un modelo de regresión para estudiar los factores que afectan las puntuaciones de los estudiantes en el examen final, debe seleccionar estudiantes al azar de la universidad durante el proceso de recopilación de datos, en lugar de adoptar un procedimiento de muestreo conveniente.,
  • El número de observaciones tomadas en la muestra para hacer el modelo de regresión lineal debe ser mayor que el número de parámetros a estimar. Esto también tiene sentido matemáticamente. Si un número de parámetros a estimar (incógnitas) es mayor que el número de observaciones, entonces la estimación no es posible. Si un número de parámetros a estimar (incógnitas) es igual al número de observaciones, entonces no se requiere OLS. Simplemente puedes usar álgebra.
  • Las X deben ser fijas (e. las variables independientes deben afectar a las variables dependientes)., No debe darse el caso de que las variables dependientes afecten a las variables independientes. Esto se debe a que, en los modelos de regresión, se estudia la relación causal y no hay una correlación entre las dos variables. Por ejemplo, si ejecuta la regresión con la inflación como su variable dependiente y el desempleo como la variable independiente, es probable que los estimadores OLS sean incorrectos porque con la inflación y el desempleo, esperamos correlación en lugar de una relación causal.
  • Los términos de error son aleatorios. Esto hace que la variable dependiente sea aleatoria.,

OLS supuesto 3: la media condicional debe ser cero.

el valor esperado de la media de los Términos de error de la regresión OLS debe ser cero dados los valores de las variables independientes.

matemáticamente, Eleft ({varepsilon } / {X } Derecha) = 0. Esto a veces se escribe como Eleft ({varepsilon } derecha) = 0 .

En otras palabras, la distribución de términos de error tiene Media cero y no depende de las variables independientes X. Por lo tanto, no debe haber relación entre las X Y el término de error. ,

suposición 4 de OLS: no hay colinealidad múltiple (o colinealidad perfecta).

en un modelo de regresión lineal simple, solo hay una variable independiente y, por lo tanto, por defecto, esta suposición se mantendrá. Sin embargo, en el caso de modelos de regresión lineal múltiple, hay más de una variable independiente. La suposición de OLS de que no hay multicolinealidad dice que no debe haber una relación lineal entre las variables independientes. Por ejemplo, supongamos que usted pasa sus 24 horas en un día en tres cosas: dormir, estudiar o jugar., Ahora, si se ejecuta una regresión con variable dependiente como puntuación/rendimiento del examen y variables independientes como el tiempo dedicado a dormir, el tiempo dedicado a estudiar y el tiempo dedicado a jugar, entonces esta suposición no se mantendrá.

esto se debe a que existe una colinealidad perfecta entre las tres variables independientes.

tiempo dedicado a dormir = 24 – tiempo dedicado a estudiar – tiempo dedicado a jugar.

En tal situación, es mejor colocar una de las tres variables independientes del modelo de regresión lineal., Si la relación (correlación) entre variables independientes es fuerte (pero no exactamente perfecta), todavía causa problemas en los estimadores OLS. Por lo tanto, esta suposición de OLS dice que debe seleccionar variables independientes que no estén correlacionadas entre sí.

una implicación importante de esta suposición de regresión OLS es que debe haber suficiente variación en las X. más la variabilidad en las X, mejores son las estimaciones de OLS para determinar el impacto de las X en Y.

suposición OLS 5: errores esféricos: hay homoscedasticidad y no autocorrelación. ,

de acuerdo con esta suposición de OLS, los Términos de error en la regresión deben tener la misma varianza.

matemáticamente, Varleft ({varepsilon } / {X } right) = {sigma} ^ { 2 }.

si esta varianza no es constante (es decir, dependiente de X), entonces el modelo de regresión lineal tiene errores heterocedásticos y es probable que dé estimaciones incorrectas.

esta suposición OLS de no autocorrelación dice que los Términos de error de diferentes observaciones no deben correlacionarse entre sí.,

matemáticamente, Covleft( { { varepsilon }_{ I }{ varepsilon }_{ j}}/{X } derecha) =0enspace forensspace ineq j

por ejemplo, cuando tenemos datos de series temporales (por ejemplo, datos anuales de desempleo), entonces la regresión es probable que sufra de autocorrelación porque el desempleo el próximo año ciertamente dependerá del desempleo de este año. Por lo tanto, los Términos de error en diferentes observaciones seguramente estarán correlacionados entre sí.

en términos simples, esta suposición de OLS significa que los Términos de error deben ser IID (independientes e idénticamente distribuidos).,

fuente de la imagen: Laerd Statistics

el diagrama anterior muestra la diferencia entre Homoscedasticidad y Heteroscedasticidad. La varianza de los errores es constante en caso de homoscedasticidad, mientras que no es el caso si los errores son heteroscedásticos.

suposición 6 de OLS: los Términos de Error deben distribuirse normalmente.

esta suposición establece que los errores se distribuyen normalmente, condicionados a las variables independientes., Esta suposición de OLS no es necesaria para la validez del método OLS; sin embargo, se vuelve importante cuando se necesita definir algunas propiedades de muestra finita adicionales. Tenga en cuenta que solo los Términos de error deben distribuirse normalmente. La variable dependiente Y no necesita ser distribuida normalmente.

el uso de supuestos OLS

los supuestos OLS son extremadamente importantes. Si las suposiciones OLS 1 a 5 se mantienen, entonces de acuerdo con el Teorema de Gauss-Markov, el estimador OLS es el mejor Estimador lineal imparcial (azul). Estas son propiedades deseables de los estimadores OLS y requieren una discusión separada en detalle., Sin embargo, a continuación, el enfoque se centra en la importancia de las suposiciones de OLS al discutir lo que sucede cuando fallan y cómo se puede buscar posibles errores cuando las suposiciones no se describen.

  1. La suposición de linealidad (suposición OLS 1): Si ajusta un modelo lineal a un dato que no está relacionado linealmente, el modelo será incorrecto y, por lo tanto, no confiable. Cuando se utiliza el modelo para la extrapolación, es probable que obtenga resultados erróneos. Por lo tanto, siempre debe trazar un gráfico de los valores predichos observados., Si este gráfico está distribuido simétricamente a lo largo de la línea de 45 grados, entonces puede estar seguro de que la suposición de linealidad se mantiene. Si las suposiciones de linealidad no se sostienen, entonces necesita cambiar la forma funcional de la regresión, lo que se puede hacer tomando transformaciones no lineales de variables independientes (es decir, puede tomar log { X } en lugar de X como su variable independiente) y luego verificar la linealidad.
  2. La suposición de Homoscedasticidad (suposición OLS 5) – Si los errores son heteroscedásticos (i. e., Suposición de OLS se viola), entonces será difícil confiar en los errores estándar de las estimaciones de OLS. Por lo tanto, los intervalos de confianza serán demasiado estrechos o demasiado amplios. Además, la violación de esta suposición tiene una tendencia a dar demasiado peso a alguna parte (subsección) de los datos. Por lo tanto, es importante corregir esto si las variaciones de error no son constantes. Puede comprobar fácilmente si las variaciones de error son constantes o no. Examine la gráfica de residuos valores predichos o residuos vs. tiempo (para modelos de series temporales)., Típicamente, si el conjunto de datos es grande, entonces los errores son más o menos homoscedásticos. Si su conjunto de datos es pequeño, verifique esta suposición.
  3. La suposición de Independencia/No autocorrelación (suposición 5 de OLS) – como se discutió anteriormente, esta suposición es más probable que se viole en modelos de regresión de series temporales y, por lo tanto, la intuición dice que no hay necesidad de investigarla. Sin embargo, aún puede verificar la autocorrelación viendo la gráfica de series temporales residuales., Si la autocorrelación está presente en el modelo, puede intentar tomar retardos de variables independientes para corregir el componente de tendencia. Si no corrige la autocorrelación, las estimaciones de OLS no serán azules y no serán lo suficientemente confiables.
  4. La suposición de normalidad de los errores (suposición 6 de OLS) – si los Términos de error no son normales, entonces los errores estándar de las estimaciones de OLS no serán confiables, lo que significa que los intervalos de confianza serían demasiado amplios o estrechos. Además, los estimadores OLS no tendrán la propiedad Azul deseable., Se puede usar una gráfica de probabilidad normal o una gráfica de cuantil normal para verificar si los Términos de error están normalmente distribuidos o no. Un patrón desviado en forma de arco en estas gráficas revela que los errores no se distribuyen normalmente. A veces los errores no son normales porque la suposición de linealidad no se sostiene. Por lo tanto, vale la pena comprobar la asunción de linealidad de nuevo si esta suposición falla.,
  5. suposición de no multicolinealidad (suposición OLS 4) – puede verificar la multicolinealidad haciendo una matriz de correlación (aunque hay otras formas complejas de verificarlas como el Factor de inflación de varianza, etc.). Casi una indicación segura de la presencia de multicolinealidad es cuando obtienes signos opuestos (inesperados) para tus coeficientes de regresión (e. si esperas que la variable independiente impacte positivamente en tu variable dependiente, pero obtienes un signo negativo del coeficiente del modelo de regresión)., Es muy probable que la regresión sufra de multicolinealidad. Si la variable no es tan importante intuitivamente, entonces eliminar esa variable o cualquiera de las variables correlacionadas puede solucionar el problema.
  6. las suposiciones OLS 1, 2 y 4 son necesarias para la configuración del problema OLS y su derivación. El muestreo aleatorio, las observaciones que son mayores que el número de parámetros y la regresión lineal en los parámetros son parte de la configuración de la regresión OLS. La suposición de que no existe una colinealidad perfecta permite resolver las condiciones de primer orden en la derivación de las estimaciones de OLS.,

conclusión

los modelos de regresión lineal son extremadamente útiles y tienen una amplia gama de aplicaciones. Cuando los use, tenga cuidado de que todas las suposiciones de la regresión OLS se cumplan mientras hace una prueba de econometría para que sus esfuerzos no se desperdicien. Estas suposiciones son extremadamente importantes, y uno no puede simplemente descuidarlas. Dicho esto, muchas veces estas suposiciones de OLS serán violadas. Sin embargo, eso no debería impedirle realizar su prueba econométrica., Más bien, cuando se viola la suposición, aplicar las correcciones correctas y luego ejecutar el modelo de regresión lineal debe ser la salida para una prueba econométrica confiable.

¿cree que puede ejecutar una regresión OLS de manera confiable? Háganoslo saber en la sección de comentarios a continuación!

¿busca la práctica de Econometría?

puedes encontrar miles de preguntas de práctica en Albert.io. Albert.io le permite personalizar su experiencia de aprendizaje para prácticas de tiro donde necesite más ayuda. Le daremos preguntas prácticas desafiantes para ayudarlo a lograr el dominio de la Econometría.,

empieza a practicar aquí.

¿Es usted un profesor o administrador interesado en mejorar los resultados de los estudiantes de Biología de AP®?

Obtenga más información sobre nuestras licencias escolares aquí.

Leave A Comment