Kvartil

algoritmické obchodování : Kvartil
Co je kvartil?

Kvartil je statistický pojem popisující rozdělení pozorování do čtyř definovaných intervalů na základě hodnot dat a jejich porovnání s celou sadou pozorování.

Porozumění kvartilům

Abychom porozuměli kvartilu, je důležité chápat medián jako měřítko centrální tendence. Medián ve statistice je střední hodnota množiny čísel. Je to bod, ve kterém přesně polovina dat leží pod a nad centrální hodnotou.

Takže, vzhledem k sadě 13 čísel, bude medián sedmé číslo. Šest čísel předcházejících této hodnotě jsou nejnižší čísla v datech a šest čísel po mediánu jsou nejvyšší čísla v daném datovém souboru. Protože střední hodnota není ovlivněna extrémními hodnotami nebo odlehlými hodnotami v distribuci, je někdy upřednostňována před střední hodnotou.

Medián je robustní odhadce polohy, ale neříká nic o tom, jak jsou data na obou stranách jeho hodnoty rozptýlena nebo rozptýlena. To je místo, kde kvartil vstoupí. Kvartil měří šíření hodnot nad a pod průměrem rozdělením distribuce do čtyř skupin.

Klíč s sebou

  • Kvartil měří šíření hodnot nad a pod průměrem rozdělením rozdělení do čtyř skupin.
  • Kvartil rozděluje data do tří bodů - dolní kvartil, střední a horní kvartil, aby vytvořily čtyři skupiny datových sad.
  • Kvartily se používají k výpočtu mezikvartilového rozmezí, což je míra variability kolem mediánu.

Jak kvartily fungují

Stejně jako medián rozděluje data na polovinu, takže 50% měření leží pod mediánem a 50% leží nad ním, kvartil rozdělí data na čtvrtiny, takže 25% měření je menší než dolní kvartil, 50 % jsou menší než průměr a 75% jsou nižší než horní kvartil.

Kvartil rozděluje data do tří bodů - dolní kvartil, střední a horní kvartil, aby vytvořily čtyři skupiny datových sad. Dolní kvartil nebo první kvartil se označuje jako Q1 a je prostředním číslem, které spadá mezi nejmenší hodnotu sady dat a střední hodnotu. Druhý kvartil, Q2, je také mediánem. Horní nebo třetí kvartil, označený jako Q3, je středním bodem, který leží mezi střední a nejvyšší hodnotou distribuce.

Nyní můžeme zmapovat čtyři skupiny vytvořené z kvartilů. První skupina hodnot obsahuje nejmenší číslo do Q1; druhá skupina zahrnuje Q1 ke střední hodnotě; třetí sada je střední hodnota pro Q3; čtvrtá kategorie zahrnuje Q3 k nejvyššímu datovému bodu celé sady.

Každý kvartil obsahuje 25% z celkových pozorování. Obecně jsou data uspořádána od nejmenších po největší:

  1. První kvartil: nejnižší 25% čísel
  2. Druhý kvartil: mezi 25, 1% a 50% (do střední hodnoty)
  3. Třetí kvartil: 51% až 75% (nad střední hodnotou)
  4. Čtvrtý kvartil: nejvyšší 25% čísel

Příklad kvartilu

Pojďme pracovat s příkladem. Předpokládejme, že rozdělení matematických skóre ve třídě 19 studentů ve vzestupném pořadí je:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Nejprve označte medián Q2, což je v tomto případě desátá hodnota: 75.

Q1 je středním bodem mezi nejmenším skóre a středem. V tomto případě Q1 spadá mezi první a páté skóre: 68. [Všimněte si, že střední hodnota může být také zahrnuta při výpočtu Q1 nebo Q3 pro lichou sadu hodnot. Pokud bychom měli zahrnout střední hodnotu na obou stranách středního bodu, pak Q1 bude střední hodnota mezi prvním a desátým skóre, což je průměr pátého a šestého skóre - (pátý + šestý) / 2 = (68 + 69) / 2 = 68, 5].

Q3 je střední hodnota mezi Q2 a nejvyšším skóre: 84. [Nebo pokud uvedete střední hodnotu, Q3 = (82 + 84) / 2 = 83].

Nyní, když máme naše kvartily, interpretujme jejich počet. Skóre 68 (Q1) představuje první kvartil a je 25. percentil. 68 je střední hodnota spodní poloviny skóre stanoveného v dostupných údajích, tj. Střední hodnota skóre od 59 do 75.

Q1 nám říká, že 25% skóre je méně než 68 a 75% skóre třídy je vyšší. Q2 (medián) je 50. percentil a ukazuje, že 50% skóre je méně než 75 a 50% skóre je nad 75. Nakonec Q3, 75. percentil, ukazuje, že 25% skóre je více a 75% je méně než 84.

Zvláštní úvahy

Pokud je datový bod pro Q1 dále od mediánu než Q3 od mediánu, pak můžeme říci, že mezi menšími hodnotami sady dat je větší rozptyl než mezi většími hodnotami. Stejná logika platí, pokud je Q3 dále od Q2 než Q1 od střední hodnoty.

Alternativně, pokud existuje sudý počet datových bodů, bude medián průměrem středních dvou čísel. V našem příkladu výše, pokud bychom měli 20 studentů místo 19, bude medián jejich skóre aritmetickým průměrem desátého a jedenáctého čísla.

Kvartily se používají k výpočtu mezikvartilového rozmezí, což je míra variability kolem mediánu. Mezikvartilový rozsah se jednoduše vypočítá jako rozdíl mezi prvním a třetím kvartilem: Q3 - Q1. Ve skutečnosti je to rozsah střední poloviny dat, který ukazuje, jak jsou data rozprostřena.

Pro velké sady dat má aplikace Microsoft Excel funkci QUARTILE pro výpočet kvartilů.

Porovnat poskytovatele investičních účtů Jméno Popis Zveřejnění inzerenta × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu.

Související termíny

Jak funguje kvantitativní metoda Decile Decile je kvantitativní metoda rozdělení souboru seřazených dat do 10 stejně velkých podsekcí. Tento typ klasifikace dat se provádí jako součást mnoha akademických a statistických studií v oblasti financí a ekonomiky. více Deskriptivní statistika Deskriptivní statistika je soubor stručných popisných koeficientů, které shrnují daný soubor údajů představující celou populaci nebo vzorek. více Definice kvintilů Kvintil je statistická hodnota sady dat, která představuje 20% dané populace. více Jak používat průměr Winsorized Průměrný průměr Winsorized je metoda průměrování, která zpočátku nahrazuje nejmenší a největší hodnoty pozorováním nejblíže k nim. To se provádí za účelem omezení účinku abnormálních extrémních hodnot nebo odlehlých hodnot na výpočet. více Limity tří sigma: Co potřebujete vědět Limity tří sigma je statistický výpočet, který odkazuje na data v rámci tří standardních odchylek od průměru. více Definice standardní odchylky Standardní odchylka je statistika, která měří rozptyl datového souboru vzhledem k jeho střední hodnotě a je počítána jako druhá odmocnina rozptylu. Vypočítá se jako druhá odmocnina rozptylu stanovením změny mezi každým datovým bodem vzhledem ke střední hodnotě. více partnerských odkazů
Doporučená
Zanechte Svůj Komentář