Overfitting
Co je overfitting?Overfitting je chyba modelování, ke které dochází, když je funkce příliš blízko k omezené sadě datových bodů. Přeplnění modelu má obecně podobu vytvoření příliš složitého modelu, který vysvětluje idiosynkrasie ve studovaných datech.
Ve skutečnosti mají často studovaná data v sobě určitý stupeň chyb nebo náhodného šumu. Pokus o přizpůsobení modelu příliš úzce na mírně nepřesná data tedy může model infikovat podstatnými chybami a snížit jeho prediktivní sílu.
[Důležité: Finanční profesionálové si musí být vždy vědomi nebezpečí nadměrného přizpůsobení modelu založeného na omezených datech.]
Porozumění Overfitting
Například běžným problémem je použití počítačových algoritmů k prohledávání rozsáhlých databází historických tržních dat za účelem nalezení vzorců. Při dostatečném studiu je často možné vyvinout propracované věty, které podle všeho předpovídají věci, jako jsou výnosy na akciovém trhu, s přesnou přesností.
Pokud se však použijí na data mimo vzorek, mohou se tyto věty pravděpodobně ukázat jako pouhé přetvoření modelu na to, co ve skutečnosti bylo jen náhodným výskytem. Ve všech případech je důležité testovat model s údaji, které jsou mimo vzorek použitý k jeho vývoji.
Klíč s sebou
- Overfitting je chyba modelování, ke které dochází, když je funkce příliš blízko k omezené sadě datových bodů.
- Finanční profesionálové si musí být vždy vědomi nebezpečí nadměrného vybavení modelu založeného na omezených datech.