Rušná korelace
Co je falešná korelaceVe statistice falešná korelace nebo falešnost odkazuje na spojení mezi dvěma proměnnými, které se jeví příčinné, ale není. Rušné vztahy mají často vzhled jedné proměnné ovlivňující druhou. Tato falešná korelace je často způsobena třetím faktorem, který není zřejmý v době vyšetření, někdy nazývaný matoucím faktorem.
Klíč s sebou
- Klamná korelace neboli falešnost je situace, kdy se dva faktory zdají ležetně související, ale nejsou.
- Vzhled příčinného vztahu je často způsoben podobným pohybem v grafu, který se ukáže jako náhodný nebo způsobený třetím „matoucím“ faktorem.
- Klamná korelace může být často způsobena malými velikostmi vzorků nebo libovolnými koncovými body.
Jak Falešná korelace funguje
Když se dvě náhodné proměnné navzájem úzce sledují v grafu, lze snadno předpokládat korelaci nebo vztah mezi těmito dvěma faktory, kde změna ovlivňuje ostatní. Kromě jiného „příčinného vztahu“ může toto pozorování vést čtenáře grafu k přesvědčení, že pohyb proměnné A je spojen s pohybem v proměnné B nebo naopak. ale někdy, při bližším statistickém zkoumání, zarovnané pohyby jsou náhodné nebo způsobené třetím faktorem, který ovlivňuje první dva. To je falešná korelace. Výzkum prováděný s malými velikostmi vzorků nebo libovolnými cílovými parametry je zvláštností, která je citlivá na podvodnost.
Příklad rušivých korelací
Není příliš náročné objevovat zajímavé korelace. Mnohé se však ukáží jako falešné. Pokud jde o samčí druhy na Wall Street, zahrnují dva populární falešné korelace ženy a sport. Teprve ve dvacátých letech 20. století je teorie délky sukně, která tvrdí, že délky sukně a směr akciového trhu jsou ve vzájemném vztahu. Pokud jsou sukně dlouhé, znamená to, že akciový trh klesá; pokud jsou krátké, trh stoupá. Kolem konce ledna se mluví o takzvaném ukazateli Super Bowl, který naznačuje, že vítězství týmu AFC pravděpodobně znamená, že akciový trh v příštím roce poklesne, zatímco vítězství týmu NFC předznamená nárůst trh. Od roku 1966 má ukazatel přesnost 80%. Je to zábavná konverzace, ale pravděpodobně to není něco, co by seriózní finanční poradce doporučil jako investiční strategii pro klienty.
Zde je několik dalších příkladů běžné falešné korelace:
- Když se prodej zmrzliny zvýší, topí se. Může se zdát, že zvýšený prodej zmrzliny způsobuje více utopení, ale ve skutečnosti může stoupající teplo způsobit, že více lidí bude plavat, a také si koupí více zmrzliny.
- Míra vražd v USA v letech 2006–2011 klesla stejným tempem jako používání aplikace Microsoft Internet Explorer.
- Vedoucí pracovníci, kteří říkají, prosím a děkuji, si častěji užívají lepší sdílení výkonu.
- Lidé, kteří nosí vybavení týmu Oakland Raiders, se častěji dopouštějí zločinů.
Jak najít falešné korelace
Statistici a další vědci, kteří analyzují data, musí neustále hledat falešné vztahy. Existuje mnoho metod, které používají, včetně:
- Zajištění správného reprezentativního vzorku.
- Získání odpovídající velikosti vzorku.
- Dávejte si pozor na svévolné koncové body.
- Ovládání co nejvíce vnějších proměnných, jak je to možné.
- Použití nulové hypotézy a kontrola silné p-hodnoty.