Hlavní » algoritmické obchodování » Základy regrese pro obchodní analýzu

Základy regrese pro obchodní analýzu

algoritmické obchodování : Základy regrese pro obchodní analýzu

Pokud jste někdy přemýšleli o tom, jak se dva nebo více údajů vztahují k sobě navzájem (např. Jak je HDP ovlivněn změnami nezaměstnanosti a inflace), nebo zda jste někdy nechali svého šéfa požádat o vytvoření prognózy nebo analýzu předpovědí na základě pokud jde o vztahy mezi proměnnými, pak by se učení regresní analýzy stálo za váš čas.

V tomto článku se naučíte základy jednoduché lineární regrese, někdy nazývané „obyčejné nejmenší čtverce“ nebo OLS regrese - nástroj běžně používaný v prognózování a finanční analýze. Začneme tím, že se naučíme základní principy regrese, nejprve se seznámíme s kovariancí a korelací a poté se přesuneme k budování a interpretaci regresního výstupu. Populární obchodní software, jako je Microsoft Excel, dokáže provádět všechny regresní výpočty a výstupy, ale je stále důležité se naučit základní mechanice.

Proměnné

Jádrem regresního modelu je vztah mezi dvěma různými proměnnými, nazývanými závislé a nezávislé proměnné. Předpokládejme například, že chcete předpovídat tržby vaší společnosti a vy jste dospěli k závěru, že tržby vaší společnosti rostou a klesají v závislosti na změnách HDP.

Prodej, který předpovídáte, by byl závislou proměnnou, protože jeho hodnota „závisí“ na hodnotě HDP a HDP by byla nezávislá proměnná. Poté budete muset určit sílu vztahu mezi těmito dvěma proměnnými, abyste mohli předpovídat tržby. Pokud se HDP zvýší / sníží o 1%, o kolik se zvýší nebo sníží váš prodej?

Covariance

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {zarovnané} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {zarovnáno} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Vzorec pro výpočet vztahu mezi dvěma proměnnými se nazývá kovariance. Tento výpočet ukazuje směr vztahu. Pokud se jedna proměnná zvýší a druhá proměnná má tendenci se také zvyšovat, kovariance by byla pozitivní. Pokud jedna proměnná stoupá a druhá má tendenci klesat, pak by kovariance byla záporná.

Skutečné číslo, které získáte výpočtem, může být obtížné interpretovat, protože není standardizováno. Například kovariance pěti může být interpretována jako pozitivní vztah, ale sílu vztahu lze označit pouze za silnější, než kdyby bylo číslo čtyři nebo slabší, než kdyby bylo číslo šest.

Korelační koeficient

Korelace = ρxy = Covxysxsy \ begin {Zarovnáno} & Korelace = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {Zarovnáno} Korelace = ρxy = sx sy Covxy Cvičení

Musíme standardizovat kovarianci, abychom mohli lépe interpretovat a používat ji v prognózování, a výsledkem je korelační výpočet. Korelační výpočet jednoduše vezme kovarianci a rozdělí ji součinem standardní odchylky dvou proměnných. Tím bude vázána korelace mezi hodnotou -1 a +1.

Korelaci +1 lze interpretovat tak, aby naznačovala, že obě proměnné se pohybují dokonale pozitivně navzájem a -1 znamená, že jsou dokonale negativně korelovány. V našem předchozím příkladu, pokud je korelace +1 a HDP vzroste o 1%, pak by se tržby zvýšily o 1%. Pokud je korelace -1, zvýšení HDP o 1% by mělo za následek snížení prodeje o 1% - přesně naopak.

Regresní rovnice

Nyní, když víme, jak se počítá relativní vztah mezi těmito dvěma proměnnými, můžeme vyvinout regresní rovnici pro předpovídání nebo předpovídání proměnné, kterou chceme. Níže je uveden vzorec pro jednoduchou lineární regresi. "Y" je hodnota, kterou se snažíme předpovídat, "b" je sklon regresní přímky, "x" je hodnota naší nezávislé hodnoty a "a" představuje přestávku y. Regresní rovnice jednoduše popisuje vztah mezi závislou proměnnou (y) a nezávislou proměnnou (x).

y = bx + a \ begin {zarovnané} & y = bx + a \\ \ end {zarovnané} y = bx + a

Zachycení nebo „a“ je hodnota y (závislá proměnná), pokud je hodnota x (nezávislá proměnná) nula, a proto je někdy jednoduše označována jako „konstanta“. Takže pokud by nedošlo k žádné změně HDP, vaše společnost by stále provedla nějaké tržby - tato hodnota, když je změna HDP nulová, je přestávkou. Podívejte se na níže uvedený graf a uvidíte grafické znázornění regresní rovnice. V tomto grafu je pouze pět datových bodů reprezentovaných pěti tečkami v grafu. Lineární regrese se pokouší odhadnout čáru, která nejlépe odpovídá datům (linie nejvhodnějšího) a rovnice této linie vede k regresní rovnici.

Obrázek 1: Nejvhodnější linie

Zdroj: Investopedia

Regrese v Excelu

Nyní, když pochopíte některé pozadí, které jde do regresní analýzy, udělejme jednoduchý příklad pomocí regresních nástrojů Excelu. Budeme stavět na předchozím příkladu pokusu předpovídat příští rok tržby na základě změn HDP. Následující tabulka uvádí některé umělé datové body, ale tato čísla mohou být snadno dostupná v reálném životě.

RokOdbytGDP
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Pouhým okem do stolu vidíte, že mezi prodejem a HDP bude pozitivní korelace. Oba mají tendenci jít spolu nahoru. V Excelu stačí kliknout na rozbalovací nabídku Nástroje, vybrat Analýza dat a odtud zvolit Regrese . Vyskakovací okno se odtud snadno vyplní; váš rozsah vstupů Y je sloupec „tržby“ a rozsah vstupů X je změna sloupce HDP; vyberte výstupní rozsah, ve kterém se mají data zobrazit v tabulce, a stiskněte OK. Měli byste vidět něco podobného tomu, co je uvedeno v následující tabulce:

Koeficienty regresní statistiky

Více R0, 8292243Intercept34, 58409

R náměstí


0, 687613HDP88, 1552
Upraveno
R náměstí


0, 583484

-


-


Standardní chyba51, 021807-

-


Pozorování5

-


-


Tlumočení

Hlavními výstupy, které je třeba se zabývat jednoduchou lineární regresí, jsou R-kvadrát, intercept (konstanta) a koeficient beta (b) GDP. R-kvadrát číslo v tomto příkladu je 68, 7% - to ukazuje, jak dobře náš model předpovídá nebo předpovídá budoucí prodeje, což naznačuje, že vysvětlující proměnné v modelu předpovídaly 68, 7% variace závislé proměnné. Dále máme zastavit 34, 58, což nám říká, že pokud by se předpokládalo, že změna HDP bude nulová, náš prodej by byl asi 35 jednotek. A konečně, koeficient beta beta nebo korelační koeficient 88, 15 nám říká, že pokud se HDP zvýší o 1%, tržby pravděpodobně vzrostou asi o 88 jednotek.

Sečteno a podtrženo

Jak byste tedy tento jednoduchý model použili ve své firmě ">

Jde samozřejmě o jednoduchou regresi a existují modely, které můžete sestavit pomocí několika nezávislých proměnných zvaných více lineárních regresí. Několik lineárních regresí je však složitějších a má několik otázek, které by vyžadovaly diskusi jiného článku.

Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.
Doporučená
Zanechte Svůj Komentář