Overfitting

algoritmické obchodování : Overfitting
Co je overfitting?

Overfitting je chyba modelování, ke které dochází, když je funkce příliš blízko k omezené sadě datových bodů. Přeplnění modelu má obecně podobu vytvoření příliš složitého modelu, který vysvětluje idiosynkrasie ve studovaných datech.

Ve skutečnosti mají často studovaná data v sobě určitý stupeň chyb nebo náhodného šumu. Pokus o přizpůsobení modelu příliš úzce na mírně nepřesná data tedy může model infikovat podstatnými chybami a snížit jeho prediktivní sílu.

[Důležité: Finanční profesionálové si musí být vždy vědomi nebezpečí nadměrného přizpůsobení modelu založeného na omezených datech.]

Porozumění Overfitting

Například běžným problémem je použití počítačových algoritmů k prohledávání rozsáhlých databází historických tržních dat za účelem nalezení vzorců. Při dostatečném studiu je často možné vyvinout propracované věty, které podle všeho předpovídají věci, jako jsou výnosy na akciovém trhu, s přesnou přesností.

Pokud se však použijí na data mimo vzorek, mohou se tyto věty pravděpodobně ukázat jako pouhé přetvoření modelu na to, co ve skutečnosti bylo jen náhodným výskytem. Ve všech případech je důležité testovat model s údaji, které jsou mimo vzorek použitý k jeho vývoji.

Klíč s sebou

  • Overfitting je chyba modelování, ke které dochází, když je funkce příliš blízko k omezené sadě datových bodů.
  • Finanční profesionálové si musí být vždy vědomi nebezpečí nadměrného vybavení modelu založeného na omezených datech.
Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.

Související termíny

Proč je statistická významnost důležitá Statistická významnost se týká výsledku, který není pravděpodobný náhodně, nýbrž je pravděpodobně způsoben konkrétní příčinou. více Jak funguje vyhlazování dat Vyhlazování dat se provádí pomocí algoritmu k odstranění šumu ze sady dat. To umožňuje vyniknout důležitým vzorcům. Vyhlazení dat lze použít k předvídání trendů, jako jsou trendy zjištěné v cenách cenných papírů. více Ukázka Ukázka je menší, spravovatelná verze větší skupiny. Vzorky se používají při statistickém testování, jsou-li populace příliš velké. více Heteroskedasticity Ve statistikách, heteroskedasticity nastane, když standardní odchylky proměnné, monitorované přes specifickou dobu, být nonconstant. více Čtení do stratifikovaného náhodného vzorkování Stratifikovaný náhodný odběr je metoda vzorkování, která zahrnuje rozdělení populace do menších skupin známých jako strata. více Jak jednoduché náhodné vzorky fungují Jednoduchý náhodný vzorek je podmnožina statistické populace, ve které má každý člen podmnožiny stejnou pravděpodobnost, že bude vybrán. Jednoduchý náhodný vzorek je zamýšlen jako nestranná reprezentace skupiny. více partnerských odkazů
Doporučená
Zanechte Svůj Komentář