Hlavní » algoritmické obchodování » Testování hypotéz ve financích: koncept a příklady

Testování hypotéz ve financích: koncept a příklady

algoritmické obchodování : Testování hypotéz ve financích: koncept a příklady

Váš investiční poradce vám navrhuje měsíční investiční plán příjmů, který slibuje variabilní návratnost každý měsíc. Investujete do něj pouze tehdy, pokud máte jistotu průměrného měsíčního příjmu 180 USD. Váš poradce vám také říká, že za posledních 300 měsíců měl systém investiční návratnost s průměrnou hodnotou 190 USD a standardní odchylkou 75 USD. Měli byste investovat do tohoto systému? Pomáhá při takovém rozhodování testování hypotéz.

Tento článek předpokládá obeznámenost čtenářů s pojmy normální distribuční tabulky, vzorce, p-hodnoty a souvisejících základů statistiky.

Co je testování hypotéz?

Testování hypotéz nebo významnosti je matematický model pro testování tvrzení, nápadu nebo hypotézy o parametru, který je předmětem zájmu v dané populační sadě, za použití dat měřených v sadě vzorků. Výpočty se provádějí na vybraných vzorcích, aby se získaly rozhodující informace o charakteristikách celé populace, což umožňuje systematický způsob testování tvrzení nebo představ o celém datovém souboru.

Zde je jednoduchý příklad: Ředitel školy uvádí, že studenti v její škole dosahují průměrně 7 z 10 na zkouškách. Abychom tuto „hypotézu“ otestovali, zaznamenáváme známky asi 30 studentů (vzorek) z celé studentské populace školy (řekněme 300) a vypočítáme průměr tohoto vzorku. Potom můžeme porovnat (vypočtený) průměr vzorku s průměrem (hlášeným) populace a pokusit se potvrdit hypotézu.

V dalším příkladu je roční výnos konkrétního podílového fondu 8%. Předpokládejme, že vzájemný fond existuje již 20 let. Vezmeme náhodný vzorek ročních výnosů podílového fondu například za pět let (vzorek) a vypočítáme jeho průměr. Potom porovnáme (vypočtený) průměr vzorku s (nárokovaným) průměrem populace, abychom ověřili hypotézu.

Kritéria rozhodování musí být založena na určitých parametrech datových sad.

Pro testování hypotéz existují různé metodologie, jedná se však o stejné čtyři základní kroky:

Krok 1: Definujte hypotézu

Hlášená hodnota (nebo statistika reklamací) je obvykle uváděna jako hypotéza a předpokládá se, že je pravdivá. Pro výše uvedené příklady bude hypotéza:

  • Příklad A: Studenti ve škole dosáhli průměrně 7 z 10 na zkouškách.
  • Příklad B: Roční výnos podílového fondu je 8% ročně.

Tento uvedený popis představuje „ nulovou hypotézu (H 0 ) “ a předpokládá se, že je to pravda - způsob, jakým je obžalovaný v soudním řízení považován za nevinný, dokud není důkazem předloženým u soudu prokázán vina. Podobně testování hypotéz začíná stanovením a převzetím „nulové hypotézy“ a poté proces určí, zda je předpoklad pravdivý nebo nepravdivý.

Důležité je poznamenat, že testujeme nulovou hypotézu, protože existuje pochybnost o její platnosti. Jakékoli informace, které jsou proti uvedené nulové hypotéze, jsou zachyceny v Alternativní hypotéze (H 1 ). Pro výše uvedené příklady bude alternativní hypotéza:

  • Studenti získají průměr, který se nerovná 7.
  • Roční výnos podílového fondu se nerovná 8% ročně.

Jinými slovy, alternativní hypotéza je přímým rozporem s nulovou hypotézou.

Stejně jako v soudním řízení, porota předpokládá nevinnost obžalovaného (nulová hypotéza). Státní zástupce musí prokázat opak (alternativní hypotéza). Podobně musí vědec prokázat, že nulová hypotéza je pravdivá nebo nepravdivá. Pokud státní zástupce neprokáže alternativní hypotézu, musí porota nechat obžalovaného jít (rozhodnutí založí na nulové hypotéze). Podobně, pokud výzkumný pracovník neprokáže alternativní hypotézu (nebo jednoduše nedělá nic), předpokládá se, že neplatná hypotéza je pravdivá.

Krok 2: Nastavte kritéria

Kritéria pro rozhodování musí být založena na určitých parametrech datových sad, a to je místo, kde přichází do obrazu připojení k normální distribuci.

Podle standardní statistiky postuluje o distribuci vzorkování: „Pro jakoukoli velikost vzorku n je distribuce vzorkování X̅ normální, pokud je populace X, ze které je vzorek odebrán, normálně rozložena.“ Pravděpodobnost všech ostatních možných vzorků tedy znamená, že jeden by mohl vybrat jsou normálně distribuovány.

Například určete, zda je průměrný denní výnos jakékoli akcie kótované na XYZ akciovém trhu kolem nového roku větší než 2%.

H 0 : Nulová hypotéza: průměr = 2%

H 1 : Alternativní hypotéza: průměr> 2% (to je to, co chceme prokázat)

Odebrat vzorek (řekněme 50 zásob z celkových 500) a vypočítat průměr vzorku.

Pro normální rozdělení leží 95% hodnot ve dvou směrodatných odchylkách průměrné populace. Toto normální rozdělení distribuce a předpoklad centrálního limitu pro vzorek datového souboru nám tedy umožňuje stanovit 5% jako hladinu významnosti. Dává to smysl, protože za tohoto předpokladu je méně než 5% pravděpodobnost (100–95), že se budou objevovat odlehlé hodnoty, které jsou nad dvěma standardními odchylkami od průměrné populace. V závislosti na povaze datových sad lze vzít další úrovně významnosti na 1%, 5% nebo 10%. Pro finanční výpočty (včetně behaviorálního financování) je 5% obecně přijímaný limit. Pokud najdeme nějaké výpočty, které přesahují obvyklé dvě standardní odchylky, pak máme silný případ odlehlých hodnot, které odmítají nulovou hypotézu.

Graficky je znázorněno takto:

Ve výše uvedeném příkladu, pokud je průměr vzorku mnohem větší než 2% (řekněme 3, 5%), odmítáme nulovou hypotézu. Je akceptována alternativní hypotéza (průměr> 2%), což potvrzuje, že průměrný denní výnos akcií je skutečně nad 2%.

Pokud však průměr vzorku pravděpodobně nebude významně větší než 2% (a zůstane na, řekněme, kolem 2, 2%), pak NEMŮŽEM odmítnout nulovou hypotézu. Výzva spočívá v tom, jak rozhodnout o takových případech s blízkým dosahem. Aby bylo možné učinit závěr z vybraných vzorků a výsledků, musí být stanovena úroveň významnosti, která umožňuje učinit závěr o nulové hypotéze. Alternativní hypotéza umožňuje stanovit úroveň významnosti nebo koncept „kritické hodnoty“ pro rozhodování o takových případech s blízkým dosahem.

Podle standardní definice učebnice „Kritická hodnota je mezní hodnota, která definuje hranice, za které lze získat méně než 5% prostředků vzorku, pokud je neplatná hypotéza pravdivá. Vzorové prostředky získané za kritickou hodnotou povedou k rozhodnutí odmítnout nulovou hypotézu. “Pokud jsme ve výše uvedeném příkladu definovali kritickou hodnotu jako 2, 1% a vypočtený průměr je 2, 2%, pak nulovou hypotézu odmítneme. Kritická hodnota stanoví jasné vymezení ohledně přijetí nebo odmítnutí.

Krok 3: Vypočítejte statistiku

Tento krok zahrnuje výpočet požadované hodnoty, známé jako statistika testu (jako průměr, z-skóre, p-hodnota atd.) Pro vybraný vzorek. (K těmto se dostaneme později.)

Krok 4: Dosáhněte závěru

S vypočítanou hodnotou (hodnotami) rozhodněte o nulové hypotéze. Pokud je pravděpodobnost získání průměrné hodnoty vzorku menší než 5%, pak je závěr zamítnut nulovou hypotézu. Jinak přijměte a zachovejte nulovou hypotézu.

Typy chyb

Při rozhodování na základě vzorku mohou být čtyři možné výsledky, pokud jde o správnou použitelnost na celou populaci:

Rozhodnutí ponechat


Rozhodnutí o odmítnutí


Platí pro celou populaci


Opravit


Nesprávný

(Chyba typu 1 - a)


Nevztahuje se na celou populaci


Nesprávný

(Chyba TYPU 2 - b)


Opravit


„Správné“ případy jsou případy, kdy se rozhodnutí učiněná na vzorcích skutečně vztahují na celou populaci. K chybám dochází, když se člověk rozhodne ponechat (nebo odmítnout) nulovou hypotézu na základě výpočtů vzorku, ale toto rozhodnutí se ve skutečnosti nevztahuje na celou populaci. Tyto případy představují chyby typu 1 (alfa) a typu 2 (beta), jak je uvedeno v tabulce výše.

Výběr správné kritické hodnoty umožňuje eliminovat chyby typu 1 alfa nebo je omezit na přijatelný rozsah.

Alfa označuje chybu na úrovni významnosti a je určována výzkumníkem. Pro udržení standardní 5% významnosti nebo úrovně spolehlivosti pro výpočty pravděpodobnosti je tato hodnota ponechána na 5%.

Podle použitelných rozhodovacích kritérií a definic:

  • „Toto (alfa) kritérium je obvykle nastaveno na 0, 05 (a = 0, 05) a porovnáváme alfa hladinu s p-hodnotou. Pokud je pravděpodobnost chyby typu I menší než 5% (p <0, 05), rozhodneme se zamítnout nulovou hypotézu; jinak si ponecháme nulovou hypotézu. “
  • Technický termín používaný pro tuto pravděpodobnost je p-hodnota . Je definována jako „pravděpodobnost získání výsledku vzorku, vzhledem k tomu, že hodnota uvedená v nulové hypotéze je pravdivá. Hodnota p pro získání výsledku vzorku se porovná s úrovní významnosti. “
  • Chyba typu II nebo chyba beta je definována jako „pravděpodobnost nesprávného zachování nulové hypotézy, i když ve skutečnosti není použitelná pro celou populaci.“

Několik dalších příkladů předvede tento a další výpočty.

Příklad 1

Existuje měsíční investiční plán, který slibuje variabilní měsíční výnosy. Investor do něj bude investovat, pouze pokud bude mít průměrný měsíční příjem 180 USD. Má vzorek výnosů z 300 měsíců, což je průměrně 190 $ a standardní odchylka 75 $. Pokud by do tohoto systému investoval ">

Pojďme vyřešit problém. Investor bude investovat do systému, bude-li mít jistotu, že jeho očekávaný průměrný výnos je 180 USD.

H 0 : Nulová hypotéza: průměr = 180

H 1 : Alternativní hypotéza: průměr> 180

Metoda 1: Přístup kritické hodnoty

Určete kritickou hodnotu X L pro střední hodnotu vzorku, která je dostatečně velká, aby odmítla nulovou hypotézu - tj. Zamítněte nulovou hypotézu, pokud průměr vzorku> = kritická hodnota X L

P (identifikovat alfa chybu typu I) = P (odmítnout H 0 za předpokladu, že H 0 je pravda),

Toho by bylo dosaženo, když průměr vzorku překročí kritické limity.

= P (za předpokladu, že H 0 je pravda) = alfa

Graficky to vypadá takto:

Vezmeme-li alfa = 0, 05 (tj. 5% hladinu významnosti), Z 0, 05 = 1, 645 (z tabulky Z nebo normální distribuční tabulky)

=> XL = 180 + 1, 645 * (75 / sqrt (300)) = 187, 12

Protože průměr vzorku (190) je větší než kritická hodnota (187, 12), je nulová hypotéza odmítnuta a dochází k závěru, že průměrný měsíční výnos je skutečně vyšší než 180 USD, takže investor může zvážit investování do tohoto schématu.

Metoda 2: Použití standardizovaných statistik testování

Lze také použít standardizovanou hodnotu z.

Statistický test, Z = (průměr vzorku - průměr populace) / (std-dev / sqrt (počet vzorků).

Poté se oblast odmítnutí stane následující:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Naše oblast odmítnutí při 5% hladině významnosti je Z> Z 0, 05 = 1, 645.

Protože Z = 2, 309 je větší než 1, 645, lze nulovou hypotézu s podobným závěrem uvedeným výše odmítnout.

Metoda 3: Výpočet hodnoty P

Naším cílem je identifikovat P (průměr vzorku> = 190, když průměr = 180).

= P (Z> = (190 - 180) / (75 / sqrt (300))

= P (Z> = 2, 309) = 0, 0084 = 0, 84%

Následující tabulka, ze které lze odvodit výpočty hodnoty p, dospěla k závěru, že existuje potvrzený důkaz průměrných měsíčních výnosů vyšších než 180:

p-hodnota


Odvození


méně než 1%


Potvrzený důkaz podporující alternativní hypotézu


mezi 1% a 5%


Silné důkazy podporující alternativní hypotézu


mezi 5% a 10%


Slabé důkazy podporující alternativní hypotézu


větší než 10%


Žádný důkaz podporující alternativní hypotézu


Příklad 2

Nový makléř (XYZ) tvrdí, že jeho poplatky za zprostředkování jsou nižší než poplatky vašeho současného makléře (ABC). Data dostupná od nezávislé výzkumné firmy naznačují, že průměr a std-dev všech klientů brokerů ABC jsou 18 USD a 6 USD.

Je odebrán vzorek 100 klientů ABC a vypočteny poplatky za zprostředkování s novými cenami zprostředkovatele XYZ. Pokud je průměr vzorku 18, 75 $ a std-dev je stejný (6 $), lze provést jakýkoli závěr o rozdílu v průměrném účtu za zprostředkování mezi ABC a XYZ brokerem ">

H 0 : Nulová hypotéza: průměr = 18

H 1 : Alternativní hypotéza: průměr 18 (To je to, co chceme dokázat.)

Rejekční oblast: Z <= - Z 2, 5 a Z> = Z 2, 5 (za předpokladu 5% úrovně významnosti, rozdělené po 2, 5 na každé straně).

Z = (průměr vzorku - průměr) / (std-dev / sqrt (počet vzorků))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Tato vypočtená hodnota Z leží mezi dvěma limity definovanými:

- Z 2, 5 = -1, 96 a Z 2, 5 = 1, 96.

Tím dochází k závěru, že neexistují dostatečné důkazy, které by naznačovaly, že existuje rozdíl mezi mírami vašeho stávajícího makléře a nového makléře.

Alternativně p-hodnota = P (Z1.25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, což je více než 0, 05 nebo 5%, což vede ke stejnému závěru.

Graficky se jedná o následující:

Kritické body pro metodu hypotetického testování:

  • Statistická metoda založená na předpokladech
  • Náchylné k chybám jsou podrobně popsány z hlediska chyb alfa a beta
  • Interpretace p-hodnoty může být nejednoznačná, což může vést k matoucím výsledkům

Sečteno a podtrženo

Testování hypotéz umožňuje matematickému modelu ověřit tvrzení nebo nápad s určitou úrovní spolehlivosti. Stejně jako většina statistických nástrojů a modelů je však vázána několika omezeními. Použití tohoto modelu pro finanční rozhodnutí by mělo být zvažováno s kritickým okem, přičemž je třeba mít na paměti všechny závislosti. Pro podobné analýzy stojí za prozkoumání také alternativní metody, jako je Bayesovská inference.

Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.
Doporučená
Zanechte Svůj Komentář