Gradiva nauk.si zahtevajo za pravilen prikaz sodoben brskalnik. Preverjeno delujejo
z brskalniki Mozilla Firefox 3.5+, Google Chrome 4.0+, Safari 4.0+, Internet Explorer 8.0+ ali Opera 10.50+.
V primeru, da uporabljate Internet Explorer 8, preverite, če imate vklopljen združljivostni način
(Compatibility view), ki ga lahko izklopite s klikom na ikono, ki jo vidite na spodnji sliki.
Veseli bomo vaših komentarjev. Obiščite nas na www.nauk.si.
Uporabljeni viri
http://www.inter-es.si/met/
Uvod v srednje vrednosti
Pri opisovanju lastnosti populacije, poleg znanih parametrov, ki ste jih spoznali v prejšnjih e-gradivih, uporabljamo tudi parametre, ki jih imenujemo srednje vrednosti.
Najpogostejša je aritmetična sredina, ki pa ne zadošča vedno za opisovanje populacije, zato uporabljamo tudi druge srednje vrednosti.
V nadaljevanju si boste ogledali primer analize podatkov o plačah.
Devet zaposlenih zasluži več od 820 €, drugih devet pa zasluži manj od 820 €. Obarvani vrednosti pravimo mediana, to je tista vrednost enote populacije, od katere ima polovica enot manjšo, druga polovica pa večjo vrednost.
Poglejte še tretje merilo: to je tista plača, ki jo prejme največ zaposlenih, v tem primeru 720 €. Znesek, ki se najpogosteje ponavlja se imenuje modus in kar dobro predstavlja povprečno plačo v podjetju.
Vsak od zgoraj navedenih parametrov nekaj pove o plačni politiki v podjetju X. Same številke pa običajno ne zadoščajo, ampak so potrebna dodatna pojasnila, npr.:
V podjetju X je povprečna plača 1234,20 €, vendar kar 50 % delavcev prejme manj kot 850 €, največ delavcev pa le 720 €.
Izračun aritmetrične sredine iz posameznih vrednosti
Aritmetična sredina (M) je najbolj znana in uporabljena srednja vrednost. V praksi največkrat uporabljamo za to izraz povprečje. Če razpolagate s posameznimi vrednostmi statistične spremenljivke, izračunate aritmetično sredino tako, da vsoto vrednosti statistične spremenljivke delite s številom enot populacije.
V številnih populacijah boste podatke grupirali v razrede. V tem primeru ne poznate posameznih vrednosti statistične spremenljivke, pač pa za vsak razred le število enot oziroma frekvenco in veste, da se vrednosti statistične spremenljivke enot posameznega razreda gibljejo med spodnjo in zgornjo mejo razreda.
V tem primeru pri izračunu aritmetične sredine najprej določite sredino razreda kot reprezentančno vrednost statistične spremenljivke vseh enot razreda in jo pomnožite s frekvenco razreda. Produkte seštejete in vsoto delite s številom vseh enot populacije.
Naslednji primer prikazuje izračun povprečnega časa trajanja preizkusa, kjer so podatki razvrščeni v frekvenčno porazdelitev.
Ker imate opravka z računanjem aritmetične sredine frekvenčne porazdelitve, uporabite kot reprezentančno vrednost sredino razreda - x. Sredina prvega razreda je 75, drugega pa 85 itn.
Sredine razredov pomnožite s številom dijakov - f, rezultate pa vpišete v 4. stolpec tabele. Produkte seštejete, ter vsoto (7680) delite s številom vseh enot, v tem primeru s številom dijakov.
Podatke o statistični spremenljivke devetih enot populacije imate urejene po velikosti od najmanjšega do največjega. Vsaka enota ima svoje zaporedno mesto ali rang.
Rang mediane je zaporedno mesto, od katerega ima polovica enot manjšo vrednost, polovica pa večjo vrednost. Izračunate ga tako, da številu vseh enot prištejete ena in vsoto delite z dva. Temu mestu ustreza vrednost statistične spremenljivke, ki se imenuje mediana.
V primeru sodega števila enot izračunani rang ni celo število. Tedaj izračunate mediano tako, da izračunate povprečje iz vrednosti statističnih spremenljivk, ki ustrezata sosednjima rangoma.
Podatke o statistični spremenljivki osmih enot populacije imate urejene po velikosti. Izračunajte rang po obrazcu . Dobili stre rezultat 4,5, kar pomeni, da se mediana nahaja med 4. in 5. mestom. Četrtemu mestu ustreza vrednost statistične spremenljivke 23, petemu pa 27. Izračunajte aritmetično sredino teh dveh vrednosti. Rezultat, ki ga dobite, je mediana.
Računanje madiane z razvrčanjem podatkov po velikosti je zamudno, če gre za veliko število podatkov. Že pri računanju aritmetične dredine ste v takem primeru podatke grupirali v razrede. Tako boste uredili podatke tudi, ko boste morali izračunati mediano številčne populacije. Pa si oglejte nasledenji primer izračuna mediane podatkov o številu ur uporabe račuanlnika na delovnem mestu.
Tabela prikazuje porazdelitev zaposlenih po mesečnem številu ur uporabe računalnika na delovnem mestu. Ne poznate posameznih vrednosti statistične spremenljivke, to je števila ur za posameznega delavca, pač pa število zaposlenih, to je frekvenco fj, ki kaže uporabo računalnika v mejah posameznega razreda.
V prvem razredu so delavci, ki uporabljajo računalnik manj kot 10 ur na mesec. Takih je 5. Od 10 do 20 ur mesečno uporablja računalnik 15 delavcev, itd. To nam povedo frekvence posameznega razreda.
Manj kot 20 ur mesečno uporablja računalnik 20 delavcev, manj kot 30 ur mesečno uporablja računalnik 46 delavcev, itd. To nam povedo kumulativne frekvence razreda.
Rang delavca, od katerega polovica zaposlenih uporablja računalnik manj ur in polovica več ur mesečno, kot je vrednost mediane, izračunate po iste obrazcu kot ste to naredili pri računanju ranga mediane iz posameznih vrednosti: .
Dobili ste 165,5. Mediani torej pripada zaporedno mesto 165,5. To ni celo število, ker je število enot populacije sodo število.
Sedaj določite razred, v katerem se nahaja zaposleni z izračunanim rangom. V 6. razredu se nahajajo zaposleni od 131. do 186. mesta. To povedo kumulativne frekvence. V 6. razredu je torej mediana, zato ga imenujemo medialni razred.
Zaposleni, ki so razvrščeni v šesti razred, uporabljajo računalnik od 50 do manj kot 60 ur mesečno. Torej bo tudi vrednost mediane med 50 in 60. Izračunate pa jo po naslenjem obrazcu:
Modus (gostiščnica Mo) je vrednost podatka, ki se v množici vseh vrednosti najpogosteje ponavlja. Če se zgodi, da se v neki populaciji dve vrednosti enako pogosto pojavljata, rečemo, da je porazdelitev bimodalna.
Najprej morate ugotoviti kateri razred ima največjo frekvenco. To je razred, v katerem se nahajajo tisti zaposleni, ki uporabljajo računalnik od 60 do 70 ur na mesec. Razred imenujemo modalni razred, njegova frekvenca je 68.
Za računanje modusa potrebujete še dva podatka. To sta frekvenci predhodnega in naslednjega razreda. Predhodni razred ima frekvenco 55, naslednji pa 42.
Poraba goriva na 100 km za avtomobile določenega tipa je porazdeljena na intervalu od 6 do 14 litrov in je podana za 130 avtomobilov v naslednji frekvenčni porazdelitvi. Izračunajte aritmetično sredino, mediano in modus frekvenčne porazdelitve!
Odnosi med aritmetično sredino, mediano in modusom
Razlike med srednjimi vrednostmi so majhne. Vse tri se nahajajo v istem razredu, kar pomeni, da je aritmetična sredina verodostojen podatek povprečne porabe goriva.
Vas mogoče zanima oblika grafikona te frekvenčne porazdelitve?
Histogram in linijski grafikon sta zvonaste oblike, skoraj simetrična glede na medialni oziroma modalni razred (obarvan vijolično) kot kaže spodnja slika.
Če bi bile vse tri vrednosti enake (M = Me = Mo), bi bil grafikon simetričen glede na srednjo vrednost. Tako porazdelitev se imenuje simetrična porazdelitev, kar pomeni, da je v populaciji največ enot, ki imajo vrednost statistične spremenljivke enako srednji vrednosti ter da se ostale enote po vrednosti statistične spremenljivke porazdelijo simetrično glede na srednjo vrednost.
Največ je letal, ki imajo zamudo od 20 do manj kot 30 minut. Na grafu je to modalni razred, ki mu pripada največja frekvenca. Največ letal, ki so razvrščena v modalni razred, zamuje 27 minut, zato je modus primernješa srednja vrednost za izražanje povprečja zamud kot aritmetična sredina. Polovica letal je zamujala manj kot 38,18 minut.
Tudi pri levo asimetručni porazdelitvi je večje število enot, ki ima vrednost statistične spremenljivke bliže modusu oziroma mediani kot aritmetični sredini, zato velja:
Za simetrične porazdelitve je za izražanje srednje vrednosti primerna aritmetična sredina, medtem ko sta za asimetrične primernejši modus oziroma mediana, ker sta bliže vrednosti večine opazovanih enot.
Računanje povprečja po postopku , ki ste ga spoznali pri aritmetični sredini posameznih vrednosti statistične spremenljivke ni primerno, ko morate računati povprečja relativnih števil kot so: strukture, statistični koeficienti, indeksi, koeficienti rasti, stopnje rasti.
Za povprečje parametrov kot so indeksi, koeficienti rasti in stopnje rasti je primerna geometrijska sredina, ki je enaka N-temu korenu produkta N vrednosti spremenljivke: ali indeksov, ali koeficientov rasti, ali stopenj rasti.
Ker so stopnje rasti lahko tudi negativna števila, ne računate povprečnje stopnje rasti kot N-ti koren produkta stopenj rasti, pač pa iz povprečnega koeficienta rasti po obrazcu:
V našem primeru:
V obdobju 2000-2004 je bila povprečna letna rast cen življenskih potrebščin (stopnja inflacije) 6,8 %.