Hlavní » algoritmické obchodování » Vícenásobná lineární regrese - definice MLR

Vícenásobná lineární regrese - definice MLR

algoritmické obchodování : Vícenásobná lineární regrese - definice MLR
Co je vícenásobná lineární regrese - MLR?

Vícenásobná lineární regrese (MLR), také známá jednoduše jako vícenásobná regrese, je statistická technika, která používá několik vysvětlujících proměnných k predikci výsledku proměnné odezvy. Cílem vícenásobné lineární regrese (MLR) je modelovat lineární vztah mezi vysvětlujícími (nezávislými) proměnnými a odezvou (závislou) proměnnou.

V podstatě je vícenásobná regrese rozšířením běžné regrese nejmenších čtverců (OLS), která zahrnuje více než jednu vysvětlující proměnnou.

Vzorec pro vícenásobnou lineární regresi je

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ, kde i = n pozorování: yi = závislá proměnná xi = expanzivní proměnnéβ0 = y-zastavení (konstanta) βp = koeficienty sklonu pro každou vysvětlující proměnnouϵ = chybový termín modelu (také známé jako zbytky) \ begin {zarovnané} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {where, for} i = n \ textbf {pozorování:} \\ & y_i = \ text {závislá proměnná} \\ & x_i = \ text {rozšiřující proměnné} \\ & \ beta_0 = \ text {y-intercept (konstanta) term)} \\ & \ beta_p = \ text {koeficienty sklonu pro každou vysvětlující proměnnou} \\ & \ epsilon = \ text {chybový termín modelu (známý také jako zbytky)} \\ \ end {zarovnaným} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ, kde i = n pozorování: yi = závislá proměnná xi = expanzivní proměnnéβ0 = y-zastavení (konstantní člen) βp = Koeficienty sklonu pro každou vysvětlující proměnnouϵ = chybový termín modelu (známý také jako zbytky)

Vysvětlení vícenásobné lineární regrese

Jednoduchá lineární regrese je funkce, která umožňuje analytikovi nebo statistikovi vytvářet předpovědi o jedné proměnné na základě informací, které jsou známy o jiné proměnné. Lineární regrese lze použít pouze tehdy, má-li jedna souvislá proměnná - nezávislá proměnná a závislá proměnná. Nezávislá proměnná je parametr, který se používá pro výpočet závislé proměnné nebo výsledku. Vícenásobný regresní model zahrnuje několik vysvětlujících proměnných.

Model vícenásobné regrese je založen na následujících předpokladech:

  • Mezi závislými proměnnými a nezávislými proměnnými existuje lineární vztah.
  • Nezávislé proměnné nejsou vzájemně příliš korelované.
  • Pozorování jsou vybrána nezávisle a náhodně z populace.
  • Zbytky by měly být normálně distribuovány s průměrnou hodnotou 0 a rozptylem σ.

Koeficient determinace (na druhou mocninu) je statistická metrika, která se používá k měření toho, jak velkou odchylku ve výsledku lze vysvětlit změnou nezávislých proměnných. R2 se vždy zvyšuje, když je do MLR modelu přidáno více prediktorů, i když prediktory nemusí souviset s výslednou proměnnou.

Samotný R2 tedy nemůže být použit k identifikaci, které prediktory by měly být zahrnuty do modelu a které by měly být vyloučeny. R2 může být pouze mezi 0 a 1, kde 0 znamená, že výsledek nemůže být předpovídán žádnou z nezávislých proměnných a 1 označuje, že výsledek může být predikován bez chyby z nezávislých proměnných.

Při interpretaci výsledků vícenásobné regrese jsou beta koeficienty platné, zatímco všechny ostatní proměnné zůstávají konstantní („všechny ostatní jsou stejné“). Výstup z vícenásobné regrese lze zobrazit vodorovně jako rovnici nebo svisle ve formě tabulky.

Příklad použití vícenásobné lineární regrese

Například analytik může chtít vědět, jak pohyb trhu ovlivňuje cenu Exxon Mobil (XOM). V tomto případě bude mít jeho lineární rovnice hodnotu indexu S&P 500 jako nezávislou proměnnou nebo prediktorem a cenu XOM jako závislou proměnnou.

Ve skutečnosti existuje mnoho faktorů, které předpovídají výsledek události. Například pohyb cen Exxon Mobil závisí více než jen na výkonu celého trhu. Další prediktory, jako je cena ropy, úrokové sazby a cenový pohyb ropných futures, mohou ovlivnit cenu XOM a ceny akcií jiných ropných společností. K pochopení vztahu, ve kterém jsou přítomny více než dvě proměnné, se používá vícenásobná lineární regrese.

Vícenásobná lineární regrese (MLR) se používá k určení matematického vztahu mezi množstvím náhodných proměnných. Jinými slovy MLR zkoumá, jak více nezávislých proměnných souvisí s jednou závislou proměnnou. Jakmile je každý z nezávislých faktorů určen k predikci závislé proměnné, lze informace o více proměnných použít k vytvoření přesné predikce úrovně účinku, který mají na výslednou proměnnou. Model vytváří vztah ve formě přímky (lineární), která nejlépe aproximuje všechny jednotlivé datové body.

S odkazem na MLR rovnici výše, v našem příkladu:

  • y i = závislá proměnná: cena XOM
  • x i1 = úrokové sazby
  • x i2 = cena ropy
  • x i3 = hodnota indexu S&P 500
  • x i4 = cena futures na ropu
  • B 0 = průnik y v čase nula
  • B 1 = regresní koeficient, který měří jednotkovou změnu závislé proměnné při změně x i1 - změna ceny XOM při změně úrokových sazeb
  • B 2 = hodnota koeficientu, která měří jednotkovou změnu závislé proměnné při změně x i2 - změna ceny XOM při změně ceny ropy

Odhady nejmenších čtverců, Bo, Bi, B2 ... Bp, jsou obvykle počítány statistickým softwarem. Do regresního modelu může být zahrnuto mnoho proměnných, ve kterých je každá nezávislá proměnná diferencována číslem - 1, 2, 3, 4 ... p. Model vícenásobné regrese umožňuje analytikům předpovídat výsledek na základě informací poskytnutých o více vysvětlujících proměnných.

Model však není vždy dokonale přesný, protože každý datový bod se může mírně lišit od výsledku předpovídaného modelem. Zbytková hodnota E, což je rozdíl mezi skutečným a předpokládaným výsledkem, je zahrnuta do modelu, aby se zohlednily takové nepatrné odchylky.

Za předpokladu, že spustíme náš regresní model XOM cen pomocí softwaru pro výpočet statistiky, který vrací tento výstup:

Analytik by interpretoval tento výstup tak, že pokud budou jiné proměnné drženy konstantní, cena XOM vzroste o 7, 8%, pokud cena ropy na trzích vzroste o 1%. Model také ukazuje, že cena XOM se sníží o 1, 5% po zvýšení úrokových sazeb o 1%. R2 znamená, že 86, 5% z cen akcií společnosti Exxon Mobil lze vysvětlit změnami úrokové sazby, ceny ropy, futures na ropu a indexu S&P 500.

Klíč s sebou

  • Vícenásobná lineární regrese (MLR), také známá jednoduše jako vícenásobná regrese, je statistická technika, která používá několik vysvětlujících proměnných k predikci výsledku proměnné odezvy.
  • Vícenásobná regrese je rozšíření lineární (OLS) regrese, která používá pouze jednu vysvětlující proměnnou.
  • MLR je široce používán v ekonometrii a finanční inference.

Rozdíl mezi lineární a vícenásobnou regresí

Lineární (OLS) regrese porovnává odpověď závislé proměnné na změnu některé vysvětlující proměnné. Je však vzácné, že závislá proměnná je vysvětlena pouze jednou proměnnou. V tomto případě analytik používá vícenásobnou regresi, která se pokouší vysvětlit závislou proměnnou pomocí více než jedné nezávislé proměnné. Více regresí může být lineární a nelineární.

Více regresí je založeno na předpokladu, že existuje lineární vztah mezi závislými i nezávislými proměnnými. Rovněž nepředpokládá žádnou větší korelaci mezi nezávislými proměnnými.

Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.

Související termíny

What Regression Measures Regression je statistické měření, které se pokouší určit sílu vztahu mezi jednou závislou proměnnou (obvykle označenou Y) a řadou dalších měnících se proměnných (známých jako nezávislé proměnné). více Co je chybový termín "> Chybový termín je definován jako proměnná ve statistickém modelu, který je vytvořen, když model plně nepředstavuje skutečný vztah mezi nezávislými a závislými proměnnými. více Jak funguje metoda nejmenších čtverců nejméně metoda čtverců je statistická technika, která určuje linii nejvhodnější pro daný model, specifikovanou rovnicí s určitými parametry pro pozorovaná data. více Econometrics: Co to znamená a jak se používá Ekonometrics je aplikace statistických a matematických modelů na ekonomické data za účelem testování teorií, hypotéz a budoucích trendů více R-Squared R-squared je statistická míra, která představuje poměr rozptylu závislé proměnné, který je vysvětlen nezávislou proměnnou. více Jak funguje koeficient determinace Koeficient určení je měřítkem používaným ve statistické analýze k posouzení toho, jak dobře model vysvětluje a předpovídá budoucí výsledky rtner Odkazy
Doporučená
Zanechte Svůj Komentář