T-test

Co je T-test?

T-test je typ inferenciální statistiky, která se používá k určení, zda existuje významný rozdíl mezi prostředkem dvou skupin, který může souviset s určitými znaky. Většinou se používá, když soubory dat, stejně jako soubory dat zaznamenané jako výsledek 100násobného převrácení mince, budou sledovat normální rozdělení a mohou mít neznámé odchylky. T-test se používá jako nástroj pro testování hypotéz, který umožňuje testování předpokladů použitelných pro populaci.

T-test zkoumá t-statistiku, hodnoty t-distribuce a stupně volnosti pro stanovení pravděpodobnosti rozdílu mezi dvěma soubory dat. K provedení testu se třemi nebo více proměnnými je nutné použít analýzu rozptylu.

1:38

T-test

Vysvětlení T-testu

T-test nám v podstatě umožňuje porovnat průměrné hodnoty těchto dvou datových souborů a zjistit, zda pocházejí ze stejné populace. Ve výše uvedených příkladech, pokud bychom měli odebrat vzorek studentů ze třídy A a jiný vzorek studentů ze třídy B, neočekávali bychom, že budou mít přesně stejný průměr a standardní odchylku. Podobně by vzorky odebrané z kontrolní skupiny krmené placebem a vzorky odebrané ze skupiny předepsané lékem měly mít mírně odlišnou střední a standardní odchylku.

Matematicky t-test odebere vzorek z každé ze dvou sad a stanoví problémové prohlášení tím, že předpokládá nulovou hypotézu, že oba prostředky jsou stejné. Na základě příslušných vzorců jsou některé hodnoty vypočteny a porovnány se standardními hodnotami a předpokládaná nulová hypotéza je odpovídajícím způsobem akceptována nebo odmítnuta.

Pokud je nulová hypotéza způsobilá k odmítnutí, znamená to, že údaje jsou silné a nejsou náhodné. T-test je jen jedním z mnoha testů použitých pro tento účel. Statistici musí navíc použít jiné testy než t-test, aby prozkoumali více proměnných a testy s větší velikostí vzorku. Pro velkou velikost vzorku používají statistici z-test. Mezi další možnosti testování patří test chi-square a f-test.

Existují tři typy t-testů a jsou klasifikovány jako závislé a nezávislé t-testy.

Klíč s sebou

T-test je typ inferenciální statistiky, která se používá k určení, zda existuje významný rozdíl mezi prostředkem dvou skupin, který může souviset s určitými znaky.
T-test je jedním z mnoha testů používaných pro účely testování hypotéz ve statistice.
Výpočet t-testu vyžaduje tři klíčové hodnoty dat. Zahrnují rozdíl mezi středními hodnotami z každé sady dat (nazývané průměrný rozdíl), směrodatnou odchylkou každé skupiny a počtem hodnot dat každé skupiny.
Existuje několik různých typů t-testů, které lze provést v závislosti na požadovaných datech a typu analýzy.

Nejednoznačné výsledky testu

Uvažte, že výrobce léčiv chce testovat nově vynalezený lék. Sleduje standardní postup zkoušení léku na jedné skupině pacientů a podávání placeba jiné skupině, která se nazývá kontrolní skupina. Placebo, které se podává kontrolní skupině, je látkou bez zamýšlené terapeutické hodnoty a slouží jako měřítko k měření toho, jak reaguje druhá skupina, které je podáno skutečné léčivo.

Po drogové studii členové kontrolní skupiny krmené placebem hlásili zvýšení průměrné délky života o tři roky, zatímco členové skupiny, kterým byl nový lék předepsán, hlásí zvýšení průměrné délky života o čtyři roky. Okamžité pozorování může naznačovat, že droga skutečně funguje, protože výsledky jsou pro skupinu, která ji používá, lepší. Je však také možné, že pozorování může být způsobeno náhodným výskytem, zejména překvapením. T-test je užitečný k závěru, zda jsou výsledky skutečně správné a aplikovatelné na celou populaci.

Ve škole dosáhlo 100 studentů třídy A průměrně 85% se standardní odchylkou 3%. Dalších 100 studentů náležejících do třídy B dosáhlo v průměru 87% se standardní odchylkou 4%. Zatímco průměr třídy B je lepší než výkon třídy A, nemusí být správné přeskočit k závěru, že celkový výkon studentů ve třídě B je lepší než výkon studentů ve třídě A. Je to proto, že spolu s znamená, že standardní odchylka třídy B je také vyšší než odchylka třídy A. Znamená to, že jejich extrémní procenta, na spodních a vyšších stranách, byla mnohem rozprostřena ve srovnání s třídou A. T-test může pomoci určit která třída dopadla lépe.

Předpoklady T-testu

První předpoklad týkající se t-testů se týká rozsahu měření. Předpokladem t-testu je, že měřítko použité na shromážděná data následuje kontinuální nebo pořadové měřítko, jako jsou skóre pro IQ test.
Druhým provedeným předpokladem je jednoduchý náhodný vzorek, že data jsou shromažďována z reprezentativní, náhodně vybrané části celkové populace.
Třetím předpokladem jsou data, když jsou vynesena do grafu, výsledkem je normální distribuční křivka ve tvaru distribuce.
Čtvrtý předpoklad je přiměřeně velká velikost vzorku. Větší velikost vzorku znamená, že rozdělení výsledků by se mělo přiblížit k normální zvonovité křivce.
Konečným předpokladem je homogenita rozptylu. Homogenní nebo stejná variance existuje, když jsou standardní odchylky vzorků přibližně stejné.

Výpočet T-testů

Výpočet t-testu vyžaduje tři klíčové hodnoty dat. Zahrnují rozdíl mezi středními hodnotami z každé sady dat (nazývané průměrný rozdíl), směrodatnou odchylkou každé skupiny a počtem hodnot dat každé skupiny.

Výsledek t-testu vytváří t-hodnotu. Tato vypočtená t-hodnota je poté porovnána s hodnotou získanou z tabulky kritických hodnot (nazývané T-distribuční tabulka). Toto srovnání pomáhá určit, jak pravděpodobný je rozdíl mezi prostředky vyskytujícími se náhodou nebo zda datové soubory mají skutečně vnitřní rozdíly. T-test se ptá, zda rozdíl mezi skupinami představuje skutečný rozdíl ve studii, nebo zda je pravděpodobně bezvýznamný statistický rozdíl.

T-distribuční tabulky

Tabulka T-distribuce je k dispozici ve formátech s jedním ocasem a dvěma ocasy. První se používá k posouzení případů, které mají pevnou hodnotu nebo rozmezí s jasným směrem (kladným nebo záporným). Jaká je například pravděpodobnost, že výstupní hodnota zůstane pod -3, nebo se dostane více než sedm, když hodí kostkou? Ten se používá pro analýzu vázaného rozsahu, jako je dotaz, zda souřadnice klesnou mezi -2 a +2.

Výpočty lze provádět pomocí standardních softwarových programů, které podporují nezbytné statistické funkce, jako jsou funkce nalezené v MS Excel.

T-hodnoty a stupně svobody

Výsledkem t-testu jsou dvě hodnoty: t-hodnota a stupně volnosti. Hodnota t je poměr rozdílu mezi průměrem dvou sad vzorků a rozdílu, který existuje v sadách vzorků. Zatímco hodnota čitatele (rozdíl mezi průměrem dvou sad vzorků) je snadno vypočítatelná, jmenovatel (rozdíl, který existuje v sadách vzorků) se může stát trochu komplikovaným v závislosti na typu zahrnutých datových hodnot. Jmenovatelem poměru je měření rozptylu nebo variability. Vyšší hodnoty t-hodnoty, také nazývané t-skóre, znamenají, že mezi dvěma sadami vzorků existuje velký rozdíl. Čím menší je hodnota t, tím větší je podobnost mezi dvěma sadami vzorků.

Velké t-skóre znamená, že skupiny jsou různé.
Malé t-skóre naznačuje, že skupiny jsou podobné.

Stupně svobody se vztahují k hodnotám ve studii, která má svobodu měnit se a jsou zásadní pro posouzení důležitosti a platnosti nulové hypotézy. Výpočet těchto hodnot obvykle závisí na počtu datových záznamů dostupných ve vzorkové sadě.

Korelovaný (nebo spárovaný) T-test

Korelovaný t-test se provádí, když se vzorky obvykle skládají ze spárovaných párů podobných jednotek, nebo když se vyskytnou případy opakovaných měření. Například mohou existovat případy opakovaného testování stejných pacientů - před a po provedení konkrétní léčby. V takových případech je každý pacient používán jako kontrolní vzorek proti sobě.

Tato metoda se vztahuje také na případy, kdy jsou vzorky nějakým způsobem spřízněny nebo mají odpovídající vlastnosti, jako je srovnávací analýza zahrnující děti, rodiče nebo sourozence. Korelované nebo spárované t-testy jsou závislého typu, protože se jedná o případy, kdy jsou obě sady vzorků ve vzájemném vztahu.

Vzorec pro výpočet t-hodnoty a stupňů volnosti pro párový t-test je:

Průměr 1 a průměr 2 jsou průměrné hodnoty každé ze sad vzorků, zatímco var1 a var2 představují rozptyl každé ze sad vzorků.

Zbývající dva typy patří k nezávislým t-testům. Ukázky těchto typů jsou vybrány nezávisle na sobě - to znamená, že datové sady ve dvou skupinách neodkazují na stejné hodnoty. Zahrnují případy, jako je skupina 100 pacientů rozdělených do dvou sad po 50 pacientech. Jedna ze skupin se stane kontrolní skupinou a dostane placebo, zatímco druhá skupina dostává předepsanou léčbu. To představuje dvě nezávislé skupiny vzorků, které nejsou vzájemně spárovány.

T-test se stejnou variací (nebo sdruženou)

T-test se stejným rozptylem se používá, když je počet vzorků v každé skupině stejný nebo rozptyl obou datových souborů je podobný. Pro výpočet t-hodnoty a stupňů volnosti pro t-test se stejnými odchylkami se používá následující vzorec:

T-hodnota = průměr1 − průměr2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 kdekoli: průměr1 a průměr2 = průměrné hodnoty každé sady vzorkůvar1 a var2 = variace každé z sample setsn1 and n2 = Počet záznamů v každé vzorkové sadě \ begin {Zarovnání} & \ text {T-value} = \ frac {průměr1 - střední2} {\ sqrt {\ frac {(n1 - 1) \ krát var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { kde:} \\ & průměr1 \ text {a} průměr2 = \ text {Průměrné hodnoty každého} \\ & \ text {vzorových sad} \\ & var1 \ text {a} var2 = \ text {Variace každého z vzorové sady} \\ & n1 \ text {and} n2 = \ text {Počet záznamů v každé vzorkové sadě} \\ \ end {zarovnan} T-hodnota = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 průměr1 − průměr2 kde: průměr1 a průměr2 = průměrné hodnoty každého souboru vzorkůvar1 a var2 = odchylka každého souboru vzorkůn1 an2 = počet záznamů v každém vzorku set

Stupně svobody = n1 + n2−2kde: n1 a n2 = Počet záznamů v každé vzorkové sadě \ begin {Zarovnáno} & \ text {Stupně svobody} = n1 + n2 - 2 \\ & \ textbf {kde:} \\ & n1 \ text {and} n2 = \ text {Počet záznamů v každé sadě vzorků} \\ \ end {zarovnáno} Stupně svobody = n1 + n2−2 kdekoli: n1 a n2 = Počet záznamů v každé sadě vzorků Cvičení

T-test s nestejnou variací

Nerovnoměrný rozptylový t-test se používá, když je počet vzorků v každé skupině odlišný a rozptyl obou datových souborů je také odlišný. Tento test se také nazývá Welchův t-test. Pro výpočet t-hodnoty a stupňů volnosti pro t-test s nestejnou odchylkou se používá následující vzorec:

T-hodnota = průměr1 − průměr2var12n1 + var22n2kde: průměr1 a průměr2 = průměrné hodnoty každého souboru vzorkůvar1 a var2 = varianta každého souboru vzorkůn1 a n2 = počet záznamů v každé sadě vzorků \ begin {zarovnané} & \ text {T-hodnota} = \ frac {průměr1 - průměr2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {kde:} \ \ & mean1 \ text {and} mean2 = \ text {Průměrné hodnoty každého} \\ & \ text {vzorových sad} \\ & var1 \ text {a} var2 = \ text {Varianty jednotlivých vzorových sad} \ \ & n1 \ text {and} n2 = \ text {Počet záznamů v každé sadě vzorků} \\ \ end {zarovnání} T-hodnota = n1var12 + n2var22 průměr1 − průměr2 kde: průměr1 a průměr2 = průměrné hodnoty z každé sady vzorkůvar1 a var2 = Variace každé sady vzorkůnnn2 = počet záznamů v každé sadě vzorků

Stupně svobody = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1where: var1 a var2 = variace každé ze sady vzorkůnnn2 = počet záznamů v každé sadě vzorků \ begin {zarovnané } & \ text {Degrees of Freedom} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {where:} \\ & var1 \ text {and} var2 = \ text {Variace každé ze vzorových sad} \\ & n1 \ text {and} n2 = \ text {Počet záznamů v každé vzorové sadě } \\ \ end {zarovnání} Stupně svobody = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 kde: var1 a var2 = Variace každého of sample setsn1 an2 = počet záznamů v každé vzorkové sadě

Stanovení správného T-testu k použití

Následující vývojový diagram lze použít k určení, který t-test by měl být použit na základě charakteristik sad vzorků. Mezi klíčové položky, které je třeba zvážit, patří, zda jsou záznamy vzorků podobné, počet datových záznamů v každé sadě vzorků a rozptyl každé sady vzorků.

Příklad T-testu s nestejnou variací

Předpokládejme, že provádíme diagonální měření obrazů získaných v umělecké galerii. Jedna skupina vzorků zahrnuje 10 obrazů, zatímco druhá zahrnuje 20 obrazů. Datové soubory s odpovídajícími středními a rozptylovými hodnotami jsou následující:

	Sada 1	Sada 2
	19.7	28.3
	20.4	26.7
	19.6	20.1
	17.8	23.3
	18.5	25.2
	18.9	22.1
	18.3	17.7
	18.9	27.6
	19.5	20.6
	21, 95	13.7
		23.2
		17.5
		20.6
		18
		23.9
		21.6
		24.3
		20.4
		23.9
		13.3
Znamenat	19.4	21.6
Odchylka	1.4	17.1

Ačkoli průměr sady 2 je vyšší než průměr sady 1, nelze dojít k závěru, že všechny obrazy mají průměrnou délku kolem 21, 6 jednotek, protože rozptyl sady 2 je výrazně vyšší než sada 1. Je to náhodou nebo skutečně existují rozdíly v celkové populaci všech obrazů obdržených v galerii umění ">

Protože počet datových záznamů je odlišný (n1 = 10 a n2 = 20) a odchylka je také různá, pro výše uvedenou sadu dat se vypočte t-hodnota a stupně volnosti pomocí vzorce uvedeného v testu nestejné variace T sekce.

Hodnota t je -2, 24787. Protože znaménko mínus může být ignorováno při porovnání dvou t-hodnot, je vypočtená hodnota 2, 24787.

Hodnota stupňů volnosti je 24, 38 a je snížena na 24, protože definice vzorce vyžaduje zaokrouhlování hodnoty na nejnižší možnou celočíselnou hodnotu.

Kdykoli se předpokládá normální rozdělení, lze jako kritérium pro přijetí určit úroveň pravděpodobnosti (alfa úroveň, úroveň významnosti, p ). Ve většině případů lze předpokládat 5% hodnotu.

Při použití hodnoty stupně volnosti jako 24 a 5% úrovně významnosti poskytuje tabulka distribuce hodnot t hodnotu 2, 064. Porovnání této hodnoty s vypočtenou hodnotou 2, 247 znamená, že vypočtená t-hodnota je větší než hodnota tabulky při hladině významnosti 5%. Proto je bezpečné odmítnout nulovou hypotézu, že neexistuje žádný rozdíl mezi prostředky. Soubor populace má vnitřní rozdíly a nejsou náhodou.

Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.

Související termíny

Jak funguje analýza rozptylu (ANOVA) Analýza rozptylu (ANOVA) je statistický analytický nástroj, který rozděluje celkovou variabilitu nalezenou v datovém souboru na dvě složky: náhodné a systematické faktory. více Porozumění distribuci T Distribuce AT je typ pravděpodobnostní funkce, která je vhodná pro odhad parametrů populace pro malé velikosti vzorku nebo neznámé odchylky. více Definice stupňů svobody Stupně svobody označuje maximální počet logicky nezávislých hodnot, což jsou hodnoty, které se mohou volně měnit, ve vzorku dat. více Jak zbytková směrodatná odchylka funguje Zbytková směrodatná odchylka je statistický pojem, který se používá k popisu rozdílu směrodatných odchylek pozorovaných hodnot oproti předpovězeným hodnotám, jak ukazují body v regresní analýze. více Jak funguje statistika Chi Square Statistika chi square (χ2) je test, který měří, jak se očekávání porovnávají se skutečnými pozorovanými údaji (nebo výsledky modelu). Data použitá při výpočtu statistiky čtverců chi musí být náhodná, nezpracovaná, vzájemně se vylučující, čerpaná z nezávislých proměnných a čerpaná z dostatečně velkého vzorku. více Jak se používá Wilcoxonův test Wilcoxonův test, který odkazuje na test Rank Sum nebo Test Signed Rank, je neparametrický test, který porovnává dvě spárované skupiny. více partnerských odkazů

← Riziko vypořádání

Jumbo CD →

Doporučená

Zanechte Svůj Komentář