Centrální měření trendů pro seskupená data



měření centrální tendence seskupených dat ve statistikách se používají k popisu určitých chování skupiny poskytnutých údajů, jako je to, k čemu jsou blízké, jaký je průměr získaných údajů, mimo jiné.

Když je přijato velké množství dat, je užitečné seskupit je tak, aby měly lepší pořadí a mohli tak vypočítat určitá měřítka centrální tendence.

Mezi nejpoužívanějšími měřidly jsou aritmetický průměr, medián a režim. Tato čísla uvádějí určité kvality údajů shromážděných v určitém experimentu.

Pro využití těchto opatření je nejprve nutné vědět, jak seskupit soubor dat.

Seskupená data

Pro seskupení dat musíte nejprve vypočítat rozsah dat, který se získá odečtením nejvyšší hodnoty mínus nejnižší hodnota dat.

Potom zvolte číslo "k", což je počet tříd, ve kterých chcete data seskupit.

Rozdělíme rozsah mezi „k“, abychom získali amplitudu tříd, které mají být seskupeny. Toto číslo je C = R / k.

Nakonec je spuštěno seskupení, pro které je zvoleno menší číslo než nejmenší hodnota získaných dat..

Toto číslo bude dolní mez první třídy. K tomu se přidá C. Získaná hodnota bude horní limit první třídy.

Potom se k této hodnotě přidá C a získá se horní limit druhé třídy. Tímto způsobem postupujete, dokud nedosáhnete horní hranice poslední třídy.

Po seskupení dat můžete vypočítat střední, medián a mód.

Pro ilustraci, jak se vypočítá aritmetický průměr, medián a režim, budeme pokračovat příkladem.

Příklad

Proto při seskupování dat získáte tabulku jako následující:

3 hlavní centrální tendence

Nyní budeme pokračovat v výpočtu aritmetického průměru, mediánu a režimu. Výše uvedený příklad bude použit pro ilustraci tohoto postupu.

1- Aritmetický průměr

Aritmetický průměr se skládá z násobení každé frekvence průměrem intervalu. Pak se přidají všechny tyto výsledky a nakonec se vydělí celkovými údaji.

Pomocí předchozího příkladu bychom získali, že aritmetický průměr se rovná:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

To znamená, že průměrná hodnota dat v tabulce je 5.11111.

2- Médium

Pro výpočet mediánové sady dat jsou nejprve všechna data uspořádána od nejmenších po největší. Mohou být předloženy dva případy:

- Pokud je datové číslo liché, pak je medián dat, která se nachází přímo ve středu.

- Pokud je datové číslo sudé, pak je střední hodnota průměru dvou dat, která zůstala ve středu.

Pokud jde o seskupená data, výpočet mediánu se provádí následujícím způsobem:

- N / 2 se vypočítá, kde N je celková hodnota.

- První interval je prohledáván tam, kde je akumulovaná frekvence (součet frekvencí) větší než N / 2 a je vybrán dolní limit tohoto intervalu, nazývaný Li..

Medián je dán následujícím vzorcem:

Me = Li + (Ls-Li) * (N / 2 - Akumulovaná frekvence před Li) / Frekvence [Li, Ls]

Ls je horní hranice výše uvedeného rozsahu.

Pokud je použita výše uvedená datová tabulka, máme N / 2 = 18/2 = 9. Akumulované frekvence jsou 4, 8, 14 a 18 (jeden pro každý řádek tabulky).

Proto by měl být vybrán třetí interval, protože akumulovaná frekvence je větší než N / 2 = 9.

Takže Li = 5 a Ls = 7. Při použití výše uvedeného vzorce musíte:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3 - Móda

Móda je hodnota, která má nejvíce frekvencí mezi všemi seskupenými daty; to je, to je hodnota, která je opakována nejvíce časy v počátečním souboru dat.

Pokud máte velké množství dat, pro výpočet režimu seskupených dat se použije následující vzorec:

Mo = Li + (Ls-Li) * (Li frekvence - Frekvence L (i-1)) / ((Li-Frekvence frekvence L (i-1)) + (Li-Frequency frekvence L ( i + 1)))

Interval [Li, Ls] je interval, ve kterém se nachází nejvyšší frekvence. Pro příklad uvedený v tomto článku máme, že móda je dána:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4) = 5 + 2 * 2/4 = 5 + 1 = 6.

Další vzorec, který se používá k získání přibližné hodnoty módy, je následující:

Mo = Li + (Ls-Li) * (frekvence L (i + 1)) / (frekvence L (i-1) + frekvence L (i + 1)).

S tímto vzorcem jsou účty následující:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

Odkazy

  1. Bellhouse, D. R. (2011). Abraham De Moivre: Nastavení etapy pro klasickou pravděpodobnost a její aplikace. CRC Stiskněte.
  2. Cifuentes, J. F. (2002). Úvod do teorie pravděpodobnosti. Univ., Národnostní, o, kolumbie.
  3. Daston, L. (1995). Klasická pravděpodobnost v osvícení. Princeton University Press.
  4. Larson, H. J. (1978). Úvod do teorie pravděpodobnosti a statistické dedukce. Editorial Limusa.
  5. Martel, P. J., & Vegas, F. J. (1996). Pravděpodobnost a matematická statistika: aplikace v klinické praxi a zdravotnictví. Ediciones Díaz de Santos.
  6. Vázquez, A. L., & Ortiz, F. J. (2005). Statistické metody měření, popisu a kontroly variability. Ed. University of Cantabria.
  7. Vázquez, S. G. (2009). Matematický manuál pro přístup na univerzitu. Redakční centrum studií Ramon Areces SA.