Značka třídy pro co to slouží, jak to je přijato a příklady



třídy, také známý jako střední bod, je hodnota, která je ve středu třídy, která představuje všechny hodnoty, které jsou v této kategorii. Značka třídy se v zásadě používá pro výpočet určitých parametrů, jako je aritmetický průměr nebo směrodatná odchylka.

Značka třídy je pak středem libovolného intervalu. Tato hodnota je také velmi užitečná k nalezení rozptylu sady dat, které jsou již seskupeny ve třídách, což nám umožňuje pochopit, jak daleko od centra tyto zjištěné údaje naleznou..

Index

  • 1 Rozložení frekvence
    • 1.1 Kolik tříd zvážit?
  • 2 Jak se dostanete?
    • 2.1 Příklad
  • 3 Na co to je??
    • 3.1 Příklad
  • 4 Odkazy

Rozložení frekvence

Abychom pochopili, co je to třída tříd, je nutná koncepce distribuce frekvencí. Vzhledem k datovému souboru je distribuce kmitočtů tabulkou, která tyto údaje rozděluje do několika kategorií nazvaných třídy.

V této tabulce je uveden počet prvků, které patří do každé třídy; druhý je známý jako frekvence.

V této tabulce je obětována část informací, které získáváme z dat, protože místo individuální hodnoty každého prvku víme pouze to, že patří do dané třídy.

Na druhé straně získáváme lepší porozumění souboru dat, protože tímto způsobem je snazší ocenit zavedené vzory, které usnadňují manipulaci s uvedenými daty..

Kolik kurzů zvážit?

Abychom dosáhli rozložení frekvencí, musíme nejprve určit počet tříd, které chceme vzít, a zvolit jejich třídní limity.

Volba počtu vyučovacích hodin by měla být výhodná, s ohledem na to, že malý počet tříd může skrýt informace o údajích, které chceme studovat, a velmi velký počet může vytvářet příliš mnoho podrobností, které nemusí být nezbytně užitečné..

Faktory, které musíme vzít v úvahu při výběru toho, kolik tříd je třeba vzít, je několik, ale mezi těmito dvěma body: první je vzít v úvahu, kolik dat musíme zvážit; druhá je vědět, jaká velikost je rozsah distribuce (tj. rozdíl mezi největším a nejmenším pozorováním).

Po již definovaných třídách budeme počítat, kolik dat existuje v každé třídě. Toto číslo se nazývá kmitočet třídy a označuje se fi.

Jak jsme již dříve řekli, máme, že distribuce frekvencí ztratí informace, které přicházejí individuálně z každého data nebo pozorování. Proto je hledána hodnota, která představuje celou třídu, do které patří; tato hodnota je značkou tříd.

Jak se dostanete?

Značka třídy je centrální hodnota, kterou třída reprezentuje. Získává se přidáním mezí intervalu a dělením této hodnoty dvěma. To bychom mohli vyjádřit matematicky takto:

xi= (Dolní mez + horní mez) / 2.

V tomto výrazu xi označuje značku ith třídy.

Příklad

Vzhledem k následujícímu datovému souboru uveďte reprezentativní distribuci frekvence a získejte odpovídající třídu.

Protože data s nejvyšší číselnou hodnotou je 391 a nejmenší hodnota je 221, máme rozsah 391 -221 = 170.

Vybereme si 5 tříd, všechny se stejnou velikostí. Jeden způsob, jak si vybrat třídy, je následující:

Všimněte si, že všechna data jsou ve třídě, jsou nesouvislá a mají stejnou hodnotu. Dalším způsobem, jak si vybrat třídy, je považovat data za součást spojité proměnné, která by mohla dosáhnout jakékoli reálné hodnoty. V tomto případě můžeme uvažovat třídy formuláře:

205-245, 245-285, 285-325, 325-365, 365-405

Tento způsob seskupování dat však může představovat určité nejasnosti s hranicemi. Například v případě 245 vyvstává otázka: ke které třídě patří, první nebo druhé??

Aby se předešlo těmto zmatkům, je učiněna konvence extrémních bodů. Tímto způsobem bude první třída interval (205,245), druhý (245,285) atd..

Jakmile jsou třídy definovány, přistoupíme k výpočtu frekvence a máme následující tabulku:

Po získání kmitočtového rozložení dat přistoupíme k nalezení třídních značek každého intervalu. Ve skutečnosti musíme:

x1= (205+ 245) / 2 = 225

x2= (245+ 285) / 2 = 265          

x3= (285 + 325) / 2 = 305

x4= (325+ 365) / 2 = 345

x5= (365+ 405) / 2 = 385

Můžeme to reprezentovat následujícím grafem:

Na co to je??

Jak již bylo zmíněno, značka třídy je velmi funkční pro nalezení aritmetického průměru a rozptylu skupiny dat, které již byly seskupeny do různých tříd..

Můžeme definovat aritmetický průměr jako součet pozorování získaných mezi velikostí vzorku. Z fyzického hlediska je jeho interpretace jako rovnovážný bod datového souboru.

Identifikace celého souboru dat jedním číslem může být riskantní, takže musíme také vzít v úvahu rozdíl mezi tímto bodem rovnováhy a skutečnými daty. Tyto hodnoty se označují jako odchylka od aritmetického průměru, a proto se snažíme zjistit, jak moc se aritmetický průměr dat liší..

Nejběžnějším způsobem, jak najít tuto hodnotu, je rozptyl, což je průměr čtverců odchylek od aritmetického průměru.

Pro výpočet aritmetického průměru a rozptylu sady dat seskupených do třídy používáme následující vzorce, resp.

V těchto výrazech xi  je značka i-té třídy, fi představuje odpovídající frekvenci a počet tříd, ve kterých byla data seskupena.

Příklad

Pomocí údajů uvedených v předchozím příkladu můžeme rozšířit data tabulky frekvenčního rozložení o něco více. Získáte následující:

Při nahrazení dat ve vzorci jsme ponechali, že aritmetický průměr je:

Jeho rozptyl a směrodatná odchylka jsou:

Z toho můžeme vyvodit, že původní data mají aritmetický průměr 306,6 a směrodatnou odchylku 39,56.

Odkazy

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Popisná statistika. Esic Editorial.
  2. Jhonson Richard A.Miller a Freund pravděpodobnost a státníci pro Engineers.Pearson vzdělání.
  3. Miller I & Freund J. Pravděpodobnost a státníci pro inženýry. REVERTE.
  4. Sarabia A. Jose Maria, Pascual Marta. Základní kurz statistiky pro firmy
  5. Llinás S. Humberto, Rojas A. Carlos Popisné statistiky a rozdělení pravděpodobnosti.Universidad del Norte Editorial