Hlavní » algoritmické obchodování » Součet čtverců

Součet čtverců

algoritmické obchodování : Součet čtverců
Co je součet čtverců?

Součet čtverců je statistická technika používaná v regresní analýze pro stanovení rozptylu datových bodů. V regresní analýze je cílem určit, jak dobře může být datová řada vybavena funkcí, která by mohla pomoci vysvětlit, jak byla generována datová řada. Součet čtverců se používá jako matematický způsob, jak najít funkci, která nejlépe odpovídá datům.

Vzorec pro součet čtverců je

Pro množinu X n položek: Součet čtverců = ∑i = 0n (Xi − X‾) 2where: Xi = ith položka v sadě X‾ = Průměr všech položek v sadě (Xi − X‾) = Odchylka každé položky od střední hodnoty \ begin {zarovnání} & \ text {Pro sadu} X \ text {of} n \ text {items:} \\ & \ text {Součet čtverců} = \ sum_ {i = 0} ^ {n} \ left (X_i- \ overline {X} \ right) ^ 2 \\ & \ textbf {kde:} \\ & X_i = \ text {The} i ^ {th} \ text {položka v set} \\ & \ overline {X} = \ text {Průměr všech položek v sadě} \\ & \ left (X_i- \ overline {X} \ right) = \ text {Odchylka každé položky od znamenat} \\ \ end {zarovnanost} Pro sadu X z n položek: Součet čtverců = i = 0∑n (Xi −X) 2where: Xi = ith položka v sadě X = Průměr všech položky v sadě (Xi-X) = odchylka každé položky od střední hodnoty

Součet čtverců je také známý jako variace.

Co vám říká součet čtverců?

Součet čtverců je míra odchylky od průměru. Ve statistice je průměr průměrem z množiny čísel a je nejčastěji používaným měřítkem centrální tendence. Aritmetický průměr se jednoduše vypočítá sčítáním hodnot v sadě dat a vydělením počtem hodnot.

Řekněme, že závěrečné ceny společnosti Microsoft (MSFT) za posledních pět dní byly 74, 01, 74, 77, 73, 94, 73, 61 a 73, 40 v amerických dolarech. Součet celkových cen je 369, 73 $ a průměrná nebo průměrná cena učebnice by tedy byla 369, 73 / 5 = 73, 95 $.

Ale znát průměr sady měření není vždy dostačující. Někdy je užitečné vědět, kolik variací je v sadě měření. Jak daleko od sebe jsou jednotlivé hodnoty od průměru, může dát nějaký vhled do toho, jak jsou pozorování nebo hodnoty vhodné pro regresní model, který je vytvořen.

Například, pokud analytik chtěl vědět, zda se cena akcií MSFT pohybuje společně s cenou Apple (AAPL), může uvést seznam pozorování pro proces obou akcií za určité období, řekněme 1, 2 nebo 10 let a vytvořte lineární model s každým zaznamenaným pozorováním nebo měřením. Pokud vztah mezi oběma proměnnými (tj. Cena AAPL a cena MSFT) není přímka, existují v souboru dat variace, které je třeba prozkoumat.

Ve statistice se hovoří o tom, že pokud vytvořená linie v lineárním modelu neprochází všemi měřeními hodnoty, pak je některá z variability pozorovaná v cenách akcií nevysvětlitelná. Součet čtverců se používá k výpočtu, zda existuje lineární vztah mezi dvěma proměnnými a jakákoli nevysvětlitelná variabilita se označuje jako zbytkový součet čtverců.

Součet čtverců je součet čtverce variace, kde variace je definována jako rozpětí mezi každou jednotlivou hodnotou a průměrem. Pro určení součtu čtverců je vzdálenost mezi každým datovým bodem a řádkem nejvhodnějšího tvaru na druhou a pak sečtena. Řádek nejvhodnější minimalizuje tuto hodnotu.

Jak vypočítat součet čtverců

Nyní můžete vidět, proč se měření nazývá součet čtvercových odchylek nebo krátce součet čtverců. S použitím našeho příkladu MSFT výše lze součet čtverců vypočítat jako:

  • SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2
  • SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
  • SS = 1, 0942

Sčítání součtu odchylek bez kvadratury bude mít za následek číslo rovné nebo blízké nule, protože záporné odchylky téměř dokonale vykompenzují kladné odchylky. Abychom získali realističtější číslo, musí být součet odchylek na druhou. Součet čtverců bude vždy kladné číslo, protože čtverec libovolného čísla, ať už kladného nebo záporného, ​​je vždy kladný.

Příklad použití součtu čtverců

Na základě výsledků výpočtu MSFT vysoký součet čtverců naznačuje, že většina hodnot je dále od střední hodnoty, a proto je v datech velká variabilita. Nízký součet čtverců označuje nízkou variabilitu v souboru pozorování.

Ve výše uvedeném příkladu 1.0942 ukazuje, že variabilita ceny akcií MSFT za posledních pět dní je velmi nízká a investoři, kteří chtějí investovat do akcií charakterizovaných cenovou stabilitou a nízkou volatilitou, se mohou rozhodnout pro MSFT.

Klíč s sebou

  • Součet čtverců měří odchylku datových bodů od střední hodnoty.
  • Výsledek vyššího součtu čtverců naznačuje velký stupeň variability v datové sadě, zatímco nižší výsledek znamená, že se data výrazně liší od střední hodnoty.

Omezení použití součtu čtverců

Investiční rozhodnutí o tom, jaké akcie ke koupi vyžaduje mnohem více pozorování, než jaké jsou zde uvedeny. Analytik možná bude muset pracovat s roky údajů, aby věděl s vyšší jistotou, jak vysoká nebo nízká variabilita aktiva je. Když se do množiny přidá více datových bodů, součet čtverců se zvětšuje, protože hodnoty budou rozprostřeny.

Nejčastěji používanými změnami variací jsou standardní odchylky a rozptyly. Pro výpočet jedné z těchto dvou metrik je však třeba nejprve spočítat součet čtverců. Rozptyl je průměr součtu čtverců (tj. Součet čtverců dělený počtem pozorování). Standardní odchylka je druhá odmocnina rozptylu.

Součet čtverců používá dvě metody regresní analýzy: metoda lineárních nejmenších čtverců a metoda nelineárních nejmenších čtverců. Metoda nejmenších čtverců odkazuje na skutečnost, že regresní funkce minimalizuje součet čtverců rozptylu od skutečných datových bodů. Tímto způsobem je možné nakreslit funkci, která statisticky nejlépe odpovídá datům. Všimněte si, že regresní funkce může být buď lineární (přímá čára) nebo nelineární (zakřivená čára).

Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.

Související termíny

Jak funguje metoda nejmenších čtverců Metoda nejmenších čtverců je statistická technika, která určuje linii nejvhodnější pro model specifikovanou rovnicí s určitými parametry pro pozorovaná data. více Jak funguje metoda nejmenších čtverců Kritérium nejmenších čtverců je metoda měření přesnosti čáry při zobrazování dat, která byla použita k jejich vygenerování. To znamená, že vzorec určuje nejvhodnější linii. více Definice standardní odchylky Standardní odchylka je statistika, která měří rozptyl datového souboru vzhledem k jeho střední hodnotě a je počítána jako druhá odmocnina rozptylu. Vypočítá se jako druhá odmocnina rozptylu stanovením změny mezi každým datovým bodem vzhledem ke střední hodnotě. více Použití rovnice Variance Variance je měření rozpětí mezi čísly v sadě dat. Investoři používají k vyhodnocení alokace aktiv portfolia rovnici rozptylu. více Jak zbytková směrodatná odchylka funguje Zbytková směrodatná odchylka je statistický pojem, který se používá k popisu rozdílu směrodatných odchylek pozorovaných hodnot oproti předpovězeným hodnotám, jak ukazují body v regresní analýze. více Jak funguje koeficient determinace Koeficient determinace je měřítkem používaným ve statistické analýze k posouzení toho, jak dobře model vysvětluje a předpovídá budoucí výsledky. více partnerských odkazů
Doporučená
Zanechte Svůj Komentář