Articles

Ipoteze Cheie ale OLS: Econometrie Review

Posted by admin

Atenție: Acest post a fost scris cu câțiva ani în urmă și nu poate reflecta cele mai recente modificări în AP® program. Actualizăm treptat aceste postări și vom elimina această renunțare la răspundere atunci când această postare este actualizată. Vă mulțumim pentru răbdare!

Introducere

modelele de regresie liniară găsesc mai multe utilizări în problemele din viața reală., De exemplu, o corporație multinațională care dorește să identifice factorii care pot afecta vânzările produsului său poate rula o regresie liniară pentru a afla care sunt factorii importanți. În econometrie, metoda obișnuită a celor mai mici pătrate (OLS) este utilizată pe scară largă pentru a estima parametrul unui model de regresie liniară. Estimatorii OLS minimizează suma erorilor pătrate (o diferență între valorile observate și valorile prezise). În timp ce OLS de calcul este fezabil și poate fi ușor de utilizat în timp ce faci orice econometrie test, este important să se cunoască ipotezele de regresie OLS., Acest lucru se datorează faptului că o lipsă de cunoaștere a ipotezelor OLS ar duce la utilizarea necorespunzătoare a acestuia și ar da rezultate incorecte pentru testul econometric finalizat. Importanța ipotezelor OLS nu poate fi subliniată. Următoarea secțiune descrie ipotezele regresiei OLS.

ipotezele regresiei OLS

ipotezele OLS necesare, care sunt utilizate pentru a deriva estimatorii OLS în modelele de regresie liniară, sunt discutate mai jos.

OLS ipoteza 1: modelul de regresie liniară este ” liniar în parametri.,”

atunci Când variabila dependentă (Y) este o funcție liniară de variabile independente (X i) și termenul de eroare, regresie este liniar în parametri și nu neapărat liniară în X. De exemplu, luați în considerare următoarele:

A1. Modelul de regresie liniară este ” liniar în parametri.”

A2. Există o eșantionare aleatorie a observațiilor.

A3. Media condiționată ar trebui să fie zero.

A4. Nu există o coliniaritate multiplă (sau o coliniaritate perfectă).

A5., Erori sferice: există homoscedasticitate și nu autocorelație

A6: ipoteza opțională: Termenii de eroare ar trebui distribuiți în mod normal.,

un)quad Y={ beta }_{ 0 }+{ beta }_{ 1 }{ X }_{ 1 }+{ beta }_{ 2 }{ X }_{ 2 }+varepsilon

b)quad Y={ beta }_{ 0 }+{ beta }_{ 1 }{ X }_{ { 1 }^{ 2 } }+{ beta }_{ 2 }{ X }_{ 2 }+varepsilon

c)quad Y={ beta }_{ 0 }+{ beta }_{ { 1 }^{ 2 } }{ X }_{ 1 }+{ beta }_{ 2 }{ X }_{ 2 }+varepsilon

În cele de mai sus trei exemple, pentru a) și b) OLS ipoteza 1 este satisfăcută. Pentru c) ipoteza OLS 1 nu este satisfăcută deoarece nu este liniară în parametrul { beta }_{ 1 }.,

ipoteza OLS 2: există o eșantionare aleatorie a observațiilor

această ipoteză a regresiei OLS spune că:

  • eșantionul prelevat pentru modelul de regresie liniară trebuie să fie extras aleatoriu din populație. De exemplu, dacă trebuie să executați un model de regresie pentru a studia factorii care influențează scorurile studenților la examenul final, atunci trebuie să selectați studenții la întâmplare din universitate în timpul procesului de colectare a datelor, mai degrabă decât să adoptați o procedură convenabilă de eșantionare.,
  • numărul de observații luate în eșantion pentru realizarea modelului de regresie liniară ar trebui să fie mai mare decât numărul de parametri care trebuie estimați. Acest lucru are sens matematic prea. Dacă un număr de parametri care trebuie estimați (necunoscuți) sunt mai mult decât numărul de observații, atunci estimarea nu este posibilă. Dacă un număr de parametri care trebuie estimați (necunoscuți) este egal cu numărul de observații, atunci OLS nu este necesar. Puteți utiliza pur și simplu algebra.
  • x-urile ar trebui să fie fixate (e. variabilele independente ar trebui să influențeze variabilele dependente)., Nu ar trebui să fie cazul ca variabilele dependente să influențeze variabilele independente. Acest lucru se datorează faptului că, în modelele de regresie, relația cauzală este studiată și nu există o corelație între cele două variabile. De exemplu, dacă executați regresia cu inflația ca variabilă dependentă și șomajul ca variabilă independentă, estimatorii OLS sunt probabil incorecți, deoarece cu inflația și șomajul, ne așteptăm la o corelație mai degrabă decât la o relație cauzală.
  • termenii de eroare sunt aleatorii. Acest lucru face ca variabila dependentă să fie aleatorie.,

OLS ipoteza 3: media condiționată ar trebui să fie zero.

valoarea așteptată a mediei termenilor de eroare ai regresiei OLS ar trebui să fie zero, având în vedere valorile variabilelor independente.

matematic, Eleft ({ varepsilon } / {x } dreapta) = 0. Acest lucru este uneori doar scris ca Eleft ({ varepsilon } dreapta) = 0.cu alte cuvinte, distribuția termenilor de eroare are medie zero și nu depinde de variabilele independente X. Astfel, nu trebuie să existe nicio relație între X și termenul de eroare.,

OLS ipoteza 4: nu există nici o multi-colinearitate (sau colinearitate perfectă).

într-un model de regresie liniară simplă, există o singură variabilă independentă și, prin urmare, în mod implicit, această ipoteză va rămâne adevărată. Cu toate acestea, în cazul modelelor de regresie liniară multiplă, există mai multe variabile independente. Ipoteza OLS a lipsei de multi-colinearitate spune că nu ar trebui să existe o relație liniară între variabilele independente. De exemplu, să presupunem că vă petreceți cele 24 de ore într – o zi pe trei lucruri-Dormind, studiind sau jucând., Acum, dacă executați o regresie cu variabilă dependentă ca scor examen / performanță și variabile independente ca timpul petrecut de dormit, timpul petrecut studiind, și timpul petrecut de joc, atunci această ipoteză nu va deține.acest lucru se datorează faptului că există o colinearitate perfectă între cele trei variabile independente.timpul petrecut Dormind = 24-timpul petrecut studiind-timpul petrecut jucând.într-o astfel de situație, este mai bine să renunți la una dintre cele trei variabile independente din modelul de regresie liniară., Dacă relația (corelația) dintre variabilele independente este puternică (dar nu chiar perfectă), aceasta provoacă încă probleme în estimatorii OLS. Prin urmare, această presupunere OLS spune că ar trebui să selectați variabile independente care nu sunt corelate între ele.

O implicație importantă a acestei ipoteze de regresie OLS este că nu ar trebui să fie suficientă variație a lui X. Mai variabilitatea X e, mai sunt estimatorii OLS în determinarea impactului X pe Y.

OLS Ipoteza 5: Sferice erori: Nu este omoscedasticitate și nu autocorelație.,conform acestei presupuneri OLS, termenii de eroare din regresie ar trebui să aibă aceeași variație.

matematic, Varleft ({varepsilon }|{ x } dreapta) ={ sigma }^{ 2 }.dacă această variație nu este constantă (adică dependentă de X), atunci modelul de regresie liniară are erori heteroscedastice și este probabil să dea estimări incorecte.această presupunere OLS a lipsei de autocorelație spune că termenii de eroare ai diferitelor observații nu ar trebui să fie corelați unul cu celălalt.,

din punct de vedere Matematic, Covleft( { { varepsilon }_{ i }{ varepsilon }_{ j } }|{ X } dreapta) =0enspace forenspace ineq j

De exemplu, atunci când avem date serii de timp (de exemplu, datele anuale de șomaj), atunci regresia este susceptibile de a suferi de autocorelație pentru șomaj anul viitor va fi cu siguranță depinde de șomaj în acest an. Prin urmare, termenii de eroare din diferite observații vor fi cu siguranță corelați între ei.

în termeni simpli, această presupunere OLS înseamnă că termenii de eroare ar trebui să fie IID (independenți și distribuiți identic).,

Sursa Imaginii: Laerd Statistici

diagrama De mai sus arată diferența între Omoscedasticitate și Heteroscedasticitatea. Varianța erorilor este constantă în cazul homoscedasticității, în timp ce nu este cazul dacă erorile sunt heteroscedastice.

OLS ipoteza 6: Termenii de eroare ar trebui să fie distribuite în mod normal.această presupunere afirmă că erorile sunt distribuite în mod normal, condiționate de variabilele independente., Această presupunere OLS nu este necesară pentru validitatea metodei OLS; cu toate acestea, devine important atunci când trebuie să se definească unele proprietăți suplimentare ale eșantionului finit. Rețineți că numai termenii de eroare trebuie distribuiți în mod normal. Variabila dependentă Y nu trebuie distribuită în mod normal.

utilizarea ipotezelor OLS

ipotezele OLS sunt extrem de importante. Dacă ipotezele OLS de la 1 la 5 dețin, atunci conform teoremei Gauss-Markov, Estimatorul OLS este cel mai bun Estimator liniar imparțial (albastru). Acestea sunt proprietățile dorite ale estimatorilor OLS și necesită discuții separate în detaliu., Cu toate acestea, mai jos se pune accentul pe importanța ipotezelor OLS, discutând ce se întâmplă atunci când acestea nu reușesc și cum puteți privi erorile potențiale atunci când ipotezele nu sunt prezentate.

  1. ipoteza Linearității (ipoteza OLS 1) – Dacă încadrați un model liniar la date care nu sunt legate liniar, modelul va fi incorect și, prin urmare, nesigur. Când utilizați modelul pentru extrapolare, este posibil să obțineți rezultate eronate. Prin urmare, ar trebui să trasați întotdeauna un grafic al valorilor prezise observate., Dacă acest grafic este distribuit simetric de-a lungul liniei de 45 de grade, atunci puteți fi sigur că ipoteza linearității este valabilă. Dacă ipotezele de liniaritate nu se mențin, atunci trebuie să schimbați forma funcțională a regresiei, care se poate face luând transformări neliniare ale variabilelor independente (adică puteți lua log { x } în loc de X ca variabilă independentă) și apoi verificați liniaritatea.
  2. ipoteza Homoscedasticității (ipoteza OLS 5) – dacă erorile sunt heteroscedastice (adică., Este încălcată), atunci va fi dificil să aveți încredere în erorile standard ale estimărilor OLS. Prin urmare, intervalele de încredere vor fi fie prea înguste, fie prea largi. De asemenea, încălcarea acestei ipoteze are tendința de a da prea multă greutate pe o anumită porțiune (subsecțiune) a datelor. Prin urmare, este important să remediați acest lucru dacă variațiile de eroare nu sunt constante. Puteți verifica cu ușurință dacă variațiile de eroare sunt constante sau nu. Examinați graficul valorilor estimate ale reziduurilor sau reziduurilor vs. timp (pentru modelele de serii de timp)., De obicei, dacă setul de date este mare, atunci erorile sunt mai mult sau mai puțin homoscedastice. Dacă setul dvs. de date este mic, verificați această presupunere.
  3. ipoteza independenței / fără autocorelație – ipoteza OLS 5) – așa cum s-a discutat anterior, această ipoteză este cel mai probabil să fie încălcată în modelele de regresie în serii de timp și, prin urmare, intuiția spune că nu este nevoie să o investigăm. Cu toate acestea, puteți verifica în continuare autocorelația vizualizând graficul seriei de timp reziduale., Dacă autocorelația este prezentă în model, puteți încerca să luați decalaje de variabile independente pentru a corecta componenta de tendință. Dacă nu corectați autocorelația, atunci estimările OLS nu vor fi albastre și nu vor fi suficient de fiabile.
  4. asumarea normalității erorilor (ipoteza OLS 6) – dacă termenii de eroare nu sunt normali, atunci erorile standard ale estimărilor OLS nu vor fi fiabile, ceea ce înseamnă că intervalele de încredere ar fi prea largi sau înguste. De asemenea, estimatorii OLS nu vor avea proprietatea albastră dorită., Un complot normal de probabilitate sau un complot cuantil normal poate fi folosit pentru a verifica dacă termenii de eroare sunt distribuiți în mod normal sau nu. Un model deviat în formă de arc în aceste parcele arată că erorile nu sunt distribuite în mod normal. Uneori erorile nu sunt normale, deoarece ipoteza liniarității nu se menține. Deci, merită să verificați din nou ipoteza linearității dacă această ipoteză nu reușește.,
  5. ipoteza no Multicolinearity (OLS ipoteza 4) – puteți verifica pentru multicolinearity prin a face o matrice de corelație (deși există alte modalități complexe de a le verifica ca factor de inflație varianță, etc.). Aproape un indiciu sigur de prezența multi-colinearității este atunci când vei ajunge opus (neașteptată) semne pentru coeficienții de regresie (de exemplu. dacă estimați că variabila independentă are un impact pozitiv asupra ta variabilă dependentă, dar veți obține un semn negativ al coeficientului de modelul de regresie)., Este foarte probabil ca regresia să sufere de multi-coliniaritate. Dacă variabila nu este atât de importantă intuitiv, atunci scăderea acelei variabile sau oricare dintre variabilele corelate poate rezolva problema.
  6. ipotezele OLS 1, 2 și 4 sunt necesare pentru configurarea problemei OLS și derivarea acesteia. Eșantionarea aleatorie, observațiile fiind mai mari decât numărul de parametri, iar regresia fiind liniară în parametri fac parte din configurarea regresiei OLS. Presupunerea că nu există o colinearitate perfectă permite rezolvarea condițiilor de prim ordin în derivarea estimărilor OLS.,

concluzie

modelele de regresie liniară sunt extrem de utile și au o gamă largă de aplicații. Când le folosiți, aveți grijă ca toate ipotezele regresiei OLS să fie satisfăcute în timp ce faceți un test de econometrie, astfel încât eforturile dvs. să nu fie irosite. Aceste ipoteze sunt extrem de importante și nu le putem neglija. Acestea fiind spuse, de multe ori aceste ipoteze OLS vor fi încălcate. Totuși, acest lucru nu ar trebui să vă împiedice să efectuați testul econometric., Mai degrabă, atunci când ipoteza este încălcată, aplicarea corecțiilor corecte și apoi rularea modelului de regresie liniară ar trebui să fie calea de ieșire pentru un test econometric fiabil.credeți că puteți rula în mod fiabil o regresie OLS? Spuneți-ne în secțiunea de comentarii de mai jos!

Privind pentru practica Econometrie?

puteți găsi mii de întrebări practică pe Albert.io. Albert.io vă permite să personalizați experiența de învățare cu țintă practică în cazul în care ai cel mai mult nevoie de ajutor. Vă vom oferi întrebări practice provocatoare pentru a vă ajuta să obțineți stăpânirea econometriei.,începeți să practicați aici.

sunteți un profesor sau administrator interesat de stimularea rezultatelor studenților la biologie AP®?aflați mai multe despre licențele noastre școlare aici.

Leave A Comment