Hlavní » algoritmické obchodování » Jednoduchý náhodný vzorek

Jednoduchý náhodný vzorek

algoritmické obchodování : Jednoduchý náhodný vzorek
Co je jednoduchý náhodný vzorek?

Jednoduchý náhodný vzorek je podskupina statistické populace, ve které má každý člen podskupiny stejnou pravděpodobnost, že bude vybrán. Jednoduchý náhodný vzorek je zamýšlen jako nestranná reprezentace skupiny.

Příkladem jednoduchého náhodného vzorku by mohla být jména 25 zaměstnanců, kteří byli vybráni z klobouku z 250 zaměstnanců. V tomto případě je populace všech 250 zaměstnanců a vzorek je náhodný, protože každý zaměstnanec má stejnou šanci na výběr. Náhodné vzorkování se ve vědě používá k provádění náhodných kontrolních testů nebo pro slepé experimenty.

Neexistuje snadnější metoda pro extrakci výzkumného vzorku z větší populace než jednoduchý náhodný výběr. Při náhodném výběru jedinců z větší populace se získá vzorek, který je reprezentativní pro studovanou skupinu.

1:16

Jednoduchý náhodný vzorek

Pochopení jednoduchého náhodného vzorku

Vědci mohou vytvořit jednoduchý náhodný vzorek pomocí několika metod. U loterijní metody je každému členu populace přiřazeno číslo, po kterém jsou čísla náhodně vybrána.

Příklad, ve kterém jsou jména 25 zaměstnanců z 250 vybrána z klobouku, je příkladem loterijní metody v práci. Každému z 250 zaměstnanců by bylo přiděleno číslo mezi 1 a 250, po kterém by bylo 25 z těchto čísel vybráno náhodně.

Protože jednotlivci, kteří tvoří podskupinu větší skupiny, jsou vybíráni náhodně, každý jedinec ve velké populační sadě má stejnou pravděpodobnost, že bude vybrán. To ve většině případů vytváří vyváženou podmnožinu, která nese největší potenciál pro reprezentaci větší skupiny jako celku, bez jakéhokoli zkreslení.

U větších populací může být metoda ruční loterie docela obtížná. Výběr náhodného vzorku z velké populace obvykle vyžaduje počítačem generovaný proces, při kterém se používá stejná metodologie jako metoda loterie, počítač a ne lidé provádějí pouze přiřazení čísel a následný výběr.

Prostor pro chybu

U jednoduchého náhodného vzorku musí existovat prostor pro chybu reprezentovaný kladnou a zápornou odchylkou (chyba vzorkování). Například, pokud by na téže střední škole měl být proveden průzkum s cílem zjistit, kolik studentů je levotočivých, náhodný výběr může určit, že osm ze 100 vzorků je levotočivých. Závěr by byl takový, že 8% studentské populace na střední škole je levorukých, zatímco ve skutečnosti by byl globální průměr blíže 10%.

Totéž platí bez ohledu na předmět. Průzkum procenta studentské populace, která má zelené oči nebo je fyzicky nezpůsobilá, by měla za následek vysokou matematickou pravděpodobnost založenou na jednoduchém náhodném průzkumu, ale vždy s plus nebo mínus rozptyl. Jediným způsobem, jak dosáhnout 100% přesnosti, je průzkum všech 1 000 studentů, což by bylo nepraktické, i když je to možné.

Klíč s sebou

  • Jednoduchý náhodný vzorek bere malou, náhodnou část celé populace, aby reprezentoval celý soubor dat, kde každý člen má stejnou pravděpodobnost, že bude vybrán.
  • Vědci mohou vytvořit jednoduchý náhodný vzorek pomocí metod, jako jsou loterie nebo náhodné losování.
  • Chyba vzorkování může nastat u jednoduchého náhodného vzorku, pokud vzorek neskončí přesně podle populace, kterou má reprezentovat.

Jednoduchý náhodný versus stratifikovaný náhodný vzorek

Jednoduché náhodné vzorky i stratifikované náhodné vzorky jsou nástroje statistického měření. Jednoduchý náhodný vzorek se používá k reprezentaci celé datové populace. Vrstvený náhodný vzorek rozděluje populaci do menších skupin nebo vrstev na základě sdílených charakteristik.

Na rozdíl od jednoduchých náhodných vzorků se stratifikované náhodné vzorky používají s populacemi, které lze snadno rozdělit do různých podskupin nebo podskupin. Tyto skupiny jsou založeny na určitých kritériích a poté náhodně vyberou prvky z každého v poměru k velikosti skupiny versus populace.

Tato metoda vzorkování znamená, že budou vybrány z každé odlišné skupiny - jejíž velikost je založena na jejím poměru k celé populaci. Vědci však musí zajistit, aby se vrstvy nepřekrývaly. Každý bod v populaci musí patřit pouze do jedné vrstvy, takže každý bod se vzájemně vylučuje. Překrývající se vrstvy by zvýšily pravděpodobnost, že budou zahrnuta některá data, čímž se vzorek zkosí.

Výhody jednoduchých náhodných vzorků

Snadné použití představuje největší výhodu jednoduchého náhodného vzorkování. Na rozdíl od složitějších metod odběru vzorků, jako je stratifikovaný náhodný výběr vzorků a pravděpodobnostní odběr vzorků, není třeba rozdělovat populaci na subpopulace nebo provádět jakékoli další kroky před náhodným výběrem členů populace.

Jednoduchý náhodný vzorek je zamýšlen jako nestranná reprezentace skupiny. Je považováno za spravedlivý způsob, jak vybrat vzorek z větší populace, protože každý člen populace má stejnou šanci na výběr.

Ačkoli jednoduchý náhodný výběr je zamýšlen jako nestranný přístup k průzkumu, může dojít ke zkreslení výběru vzorku. Pokud soubor vzorků větší populace není dostatečně inkluzivní, reprezentace celé populace je zkosená a vyžaduje další techniky vzorkování.

Nevýhody jednoduchých náhodných vzorků

Chyba vzorkování může nastat u jednoduchého náhodného vzorku, pokud vzorek neskončí přesně podle populace, kterou má reprezentovat. Například v našem jednoduchém náhodném vzorku 25 zaměstnanců by bylo možné čerpat 25 mužů, i když by populace sestávala ze 125 žen a 125 mužů.

Z tohoto důvodu se běžně používá jednoduchý náhodný výběr, když vědec ví o populaci jen málo. Pokud by vědec věděl více, bylo by lepší použít jinou techniku ​​odběru vzorků, jako je stratifikovaný náhodný výběr vzorků, který pomáhá vysvětlit rozdíly v populaci, jako je věk, rasa nebo pohlaví. Mezi další nevýhody patří skutečnost, že pro odběr vzorků z velkých populací může být tento proces časově náročný a nákladný ve srovnání s jinými metodami.

Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.

Související termíny

Ukázka Ukázka je menší, spravovatelná verze větší skupiny. Vzorky se používají při statistickém testování, jsou-li populace příliš velké. více Čtení do stratifikovaného náhodného vzorkování Stratifikovaný náhodný odběr je metoda vzorkování, která zahrnuje rozdělení populace do menších skupin známých jako strata. více Vstupy a výstupy systematického vzorkování Systematické vzorkování je metoda vzorkování pravděpodobnosti, při které je vybrán náhodný vzorek z větší populace. více Reprezentativní vzorek se často používá k extrapolaci širšího sentimentu Reprezentativní vzorek je podmnožinou populace, která odráží charakteristiky celé populace. více Definice vzorkování Vzorkování je proces používaný ve statistické analýze, ve kterém je skupina pozorování extrahována z větší populace. více Jak fungují chyby vzorkování Chyba vzorkování je statistická chyba, ke které dochází, když analytik nevybere vzorek, který představuje celou populaci dat a výsledky nalezené ve vzorku nepředstavují výsledky, které by byly získány z celé populace. více partnerských odkazů
Doporučená
Zanechte Svůj Komentář