Statistika - Srednje vrednosti

Statistika - Srednje vrednosti

Avtor: inter-es (vsebinsko), Katja Markovič (tehnično)

Uvod v srednje vrednosti

Pri opisovanju lastnosti populacije, poleg znanih parametrov, ki ste jih spoznali v prejšnjih e-gradivih, uporabljamo tudi parametre, ki jih imenujemo srednje vrednosti.

Najpogostejša je aritmetična sredina, ki pa ne zadošča vedno za opisovanje populacije, zato uporabljamo tudi druge srednje vrednosti.

V nadaljevanju si boste ogledali primer analize podatkov o plačah.

Primer

V tabeli so zbrani podatki o plačah zaposlenih v podjetju X.

(place.png)

Naprej

Vsi skupaj so mesečno zaslužili 23.450 €.

Če to delite s številom zaposlenih, dobite aritmetično sredino.

Naprej

Čeprav lahko mirno rečemo, da je to povprečna plača, se postavi vprašanje korektnosti take informacije, saj je večina delavcev zaslužila le 720 €.

Naprej

Uvod v srednje vrednosti

Lahko bi analizirali plače na drugačen način. Plače razvrstite po velikosti od najmanjše do največje.

(place2.png)

Katera plača leži na sredini tega zaporedja (polovica zaposlenih zasluži manj, duga polovica pa več)?

Odgovor

(place3.png)

Devet zaposlenih zasluži več od 820 €, drugih devet pa zasluži manj od 820 €. Obarvani vrednosti pravimo mediana, to je tista vrednost enote populacije, od katere ima polovica enot manjšo, druga polovica pa večjo vrednost.

Naprej

Uvod v srednje vrednosti

Poglejte še tretje merilo: to je tista plača, ki jo prejme največ zaposlenih, v tem primeru 720 €. Znesek, ki se najpogosteje ponavlja se imenuje modus in kar dobro predstavlja povprečno plačo v podjetju.

(place4.png)

Naprej

Vsak od zgoraj navedenih parametrov nekaj pove o plačni politiki v podjetju X. Same številke pa običajno ne zadoščajo, ampak so potrebna dodatna pojasnila, npr.:

V podjetju X je povprečna plača 1234,20 €, vendar kar 50 % delavcev prejme manj kot 850 €, največ delavcev pa le 720 €.

Naprej

Izračun aritmetrične sredine iz posameznih vrednosti

Aritmetična sredina (M) je najbolj znana in uporabljena srednja vrednost. V praksi največkrat uporabljamo za to izraz povprečje. Če razpolagate s posameznimi vrednostmi statistične spremenljivke, izračunate aritmetično sredino tako, da vsoto vrednosti statistične spremenljivke delite s številom enot populacije.

Naprej

Izračun aritmetrične sredine iz posameznih vrednosti

Program Excel lahko sam izračuna aritmetično sredino s pomočjo statistične funkcije Average.

Naprej

Aritmetična sredina frekvenčne porazdelitve

V številnih populacijah boste podatke grupirali v razrede. V tem primeru ne poznate posameznih vrednosti statistične spremenljivke, pač pa za vsak razred le število enot oziroma frekvenco in veste, da se vrednosti statistične spremenljivke enot posameznega razreda gibljejo med spodnjo in zgornjo mejo razreda.

Naprej

V tem primeru pri izračunu aritmetične sredine najprej določite sredino razreda kot reprezentančno vrednost statistične spremenljivke vseh enot razreda in jo pomnožite s frekvenco razreda. Produkte seštejete in vsoto delite s številom vseh enot populacije.

Naslednji primer prikazuje izračun povprečnega časa trajanja preizkusa, kjer so podatki razvrščeni v frekvenčno porazdelitev.

Naprej

(dijaki.png)

Ker imate opravka z računanjem aritmetične sredine frekvenčne porazdelitve, uporabite kot reprezentančno vrednost sredino razreda - x. Sredina prvega razreda je 75, drugega pa 85 itn.

Sredine razredov pomnožite s številom dijakov - f, rezultate pa vpišete v 4. stolpec tabele. Produkte seštejete, ter vsoto (7680) delite s številom vseh enot, v tem primeru s številom dijakov.

Naprej

Mediana

Mediana (središčnica Me) je tista vrednost statistične spremenljivke, od katere ima polovica enot manjšo vrednost in polovica enot večjo vrednost.

Naprej

Zaporedno mesto mediane oziroma rang R mediane v populaciji z N enotami izračunate po obrazcu:

V naslednjih primerih se boste naučili izračunati rang mediane v populaciji z lihim oziroma sodim številom enot.

Primer

Mediana

  • Izračun mediane, če je N liho število

    Podatke o statistični spremenljivke devetih enot populacije imate urejene po velikosti od najmanjšega do največjega. Vsaka enota ima svoje zaporedno mesto ali rang.

    Rang mediane je zaporedno mesto, od katerega ima polovica enot manjšo vrednost, polovica pa večjo vrednost. Izračunate ga tako, da številu vseh enot prištejete ena in vsoto delite z dva. Temu mestu ustreza vrednost statistične spremenljivke, ki se imenuje mediana.

    (rang.png)

    Mediana je torej 27.

    Naprej

  • Izračun mediane, če je N sodo število

    V primeru sodega števila enot izračunani rang ni celo število. Tedaj izračunate mediano tako, da izračunate povprečje iz vrednosti statističnih spremenljivk, ki ustrezata sosednjima rangoma.

    Podatke o statistični spremenljivki osmih enot populacije imate urejene po velikosti. Izračunajte rang po obrazcu . Dobili stre rezultat 4,5, kar pomeni, da se mediana nahaja med 4. in 5. mestom. Četrtemu mestu ustreza vrednost statistične spremenljivke 23, petemu pa 27. Izračunajte aritmetično sredino teh dveh vrednosti. Rezultat, ki ga dobite, je mediana.

    (rang2.png)

    Mediana je torej 25.

    Naprej

    Primer

Mediana

Program Excel lahko s pomočjo fukcije Median izračuna mediano podatkov, ki ste jih vnesli v tabelo.

V naslednjem primeru boste določili mediano izbranih podatkov o časih reševanja testa.

Naprej

Izračunavanje mediane iz frekvenčne porazdelitve

Računanje madiane z razvrčanjem podatkov po velikosti je zamudno, če gre za veliko število podatkov. Že pri računanju aritmetične dredine ste v takem primeru podatke grupirali v razrede. Tako boste uredili podatke tudi, ko boste morali izračunati mediano številčne populacije. Pa si oglejte nasledenji primer izračuna mediane podatkov o številu ur uporabe račuanlnika na delovnem mestu.

Primer

Tabela prikazuje porazdelitev zaposlenih po mesečnem številu ur uporabe računalnika na delovnem mestu. Ne poznate posameznih vrednosti statistične spremenljivke, to je števila ur za posameznega delavca, pač pa število zaposlenih, to je frekvenco fj, ki kaže uporabo računalnika v mejah posameznega razreda.

(ure.png)

Naprej

Izračunavanje mediane iz frekvenčne porazdelitve

Interpretacija tabele:

(ure.png)

V prvem razredu so delavci, ki uporabljajo računalnik manj kot 10 ur na mesec. Takih je 5. Od 10 do 20 ur mesečno uporablja računalnik 15 delavcev, itd. To nam povedo frekvence posameznega razreda.

Manj kot 20 ur mesečno uporablja računalnik 20 delavcev, manj kot 30 ur mesečno uporablja računalnik 46 delavcev, itd. To nam povedo kumulativne frekvence razreda.

Naprej

Rang mediane:

Rang delavca, od katerega polovica zaposlenih uporablja računalnik manj ur in polovica več ur mesečno, kot je vrednost mediane, izračunate po iste obrazcu kot ste to naredili pri računanju ranga mediane iz posameznih vrednosti: .

Dobili ste 165,5. Mediani torej pripada zaporedno mesto 165,5. To ni celo število, ker je število enot populacije sodo število.

Naprej

Določitev medialnega razreda

Sedaj določite razred, v katerem se nahaja zaposleni z izračunanim rangom. V 6. razredu se nahajajo zaposleni od 131. do 186. mesta. To povedo kumulativne frekvence. V 6. razredu je torej mediana, zato ga imenujemo medialni razred.

Naprej

Izračunavanje mediane iz frekvenčne porazdelitve

Izračun mediane

(ure.png)

Zaposleni, ki so razvrščeni v šesti razred, uporabljajo računalnik od 50 do manj kot 60 ur mesečno. Torej bo tudi vrednost mediane med 50 in 60. Izračunate pa jo po naslenjem obrazcu:

Uporaba simbolov:

  • spodnja meja medialnega razreda
  • širina medialnega razreda
  • rang mediane
  • kumulativna frekvenca pred medialnim razredom

Vstavite podatke in izračunajte.

Naprej

Interpretacija rezultata: Polovica zaposlenih uporablja računalnik manj kot 56,27 ure mesečno.

Naprej

Modus

Modus (gostiščnica Mo) je vrednost podatka, ki se v množici vseh vrednosti najpogosteje ponavlja. Če se zgodi, da se v neki populaciji dve vrednosti enako pogosto pojavljata, rečemo, da je porazdelitev bimodalna.

Naprej

Naprej

Modus

V programu Excel je pri računanju s podatki na voljo funkcija Mode, ki nam izračuna modus zbranih podatkov.

Poglejte si simulacijo, ki vsa nauči računanja modusa v Excelu. Podatki so enaki kot v prejšnji simulaciji.

Naprej

Modus iz frekvenčne porazdelitve

V frekvenčni porazdelitvi modus pripada frekvenčnemu razredu z največjo frekvenco - modalnemu razredu.


Izračunate ga po obrazcu:

spodnja meja modalnega razreda

širina modalnega razreda

in frekvenci prehodnega in naslednjega razreda

frekvenca modalnega razreda

Naprej

Modus iz frekvenčne porazdelitve

Tabela prikazuje, koliko ur na mesec zaposleni uporabljajo računalnik. Izračunajte modus uporabe računalnika pri zaposlenih.

(ureModus.png)

Naprej

Najprej morate ugotoviti kateri razred ima največjo frekvenco. To je razred, v katerem se nahajajo tisti zaposleni, ki uporabljajo računalnik od 60 do 70 ur na mesec. Razred imenujemo modalni razred, njegova frekvenca je 68.

Naprej

Nato morate razbrati podatke o mejah modalnega razreda. Spodnja meja je 60, zgornja meja pa 70 ur na mesec. Nato izračunate širino modalnega razreda.

Naprej

Za računanje modusa potrebujete še dva podatka. To sta frekvenci predhodnega in naslednjega razreda. Predhodni razred ima frekvenco 55, naslednji pa 42.

Naprej

Izračunajte modus po obrazcu za računanje modusa.

Naprej

Odnosi med aritmetično sredino, mediano in modusom

Pri naslednjih frekvenčnih porazdelitvah, ki jih bomo tudi grafično prikazali, boste proučevali, kako srednje vrednosti vplivajo na obliko grafikona.

Primer

Poraba goriva na 100 km za avtomobile določenega tipa je porazdeljena na intervalu od 6 do 14 litrov in je podana za 130 avtomobilov v naslednji frekvenčni porazdelitvi. Izračunajte aritmetično sredino, mediano in modus frekvenčne porazdelitve!

(poraba.png)

Naprej

Odnosi med aritmetično sredino, mediano in modusom

(poraba.png)
  • aritmetična sredina frekvenčne porazdelitve

    Naprej

  • mediana frekvenčne porazdelitve

    Naprej

  • modus frekvenčne porazdelitve

    Naprej

Odnosi med aritmetično sredino, mediano in modusom

Razlike med srednjimi vrednostmi so majhne. Vse tri se nahajajo v istem razredu, kar pomeni, da je aritmetična sredina verodostojen podatek povprečne porabe goriva.

Vas mogoče zanima oblika grafikona te frekvenčne porazdelitve?

Naprej

Histogram in linijski grafikon sta zvonaste oblike, skoraj simetrična glede na medialni oziroma modalni razred (obarvan vijolično) kot kaže spodnja slika.

(porabaGraf.png)

Naprej

Če bi bile vse tri vrednosti enake (M = Me = Mo), bi bil grafikon simetričen glede na srednjo vrednost. Tako porazdelitev se imenuje simetrična porazdelitev, kar pomeni, da je v populaciji največ enot, ki imajo vrednost statistične spremenljivke enako srednji vrednosti ter da se ostale enote po vrednosti statistične spremenljivke porazdelijo simetrično glede na srednjo vrednost.

Naprej

Odnosi med aritmetično sredino, mediano in modusom

Kdaj pa je porazdelitev antisimetrična?

Primer

Letalska družba je zbrala podatke o zamudah letal in jih grupirala v razrede s širino po 10 minut.

Zamude v desetminutnih intervalih prikazuje tabela:

(zamude.png)

Izračunajte aritmetično sredino, mediano in modus!

Pravilno

Pravilno!

Naprej

Napačno

To pa ni prav!

(zamudeA.png)

Odnosi med aritmetično sredino, mediano in modusom

(zamude.png)
  • mediana

    Pravilno izpolni manjkajoča polja:

    Preveri

Pravilno

Pravilno!

Naprej

Napačno

To pa ni prav!

  • spodnja meja medialnega razreda
  • širina medialnega razreda
  • rang mediane
  • kumulativna frekvenca pred medialnim razredom

Odnosi med aritmetično sredino, mediano in modusom

(zamude.png)
  • modus

    Pravilno izpolni manjkajoča polja:

    Preveri

Pravilno

Pravilno!

Naprej

Napačno

To pa ni prav!

spodnja meja modalnega razreda

širina modalnega razreda

in frekvenci prehodnega in naslednjega razreda

frekvenca modalnega razreda

Odnosi med aritmetično sredino, mediano in modusom

Če primerjate srednje vrednosti, ugotovite, da je

Vas morda zanima oblika grafikona te frekvenčne porazdelitve?

Naprej

Grafikon asimetrične porazdelitve

(zamudeGraf.png)

Graf je asimetrično porazdeljen v desno, ko je:

Kakšne so značilnosti populacije?

Največ je letal, ki imajo zamudo od 20 do manj kot 30 minut. Na grafu je to modalni razred, ki mu pripada največja frekvenca. Največ letal, ki so razvrščena v modalni razred, zamuje 27 minut, zato je modus primernješa srednja vrednost za izražanje povprečja zamud kot aritmetična sredina. Polovica letal je zamujala manj kot 38,18 minut.

Naprej

Odnosi med aritmetično sredino, mediano in modusom

Če bi proučevali asimetrično porazdelitev v levo, bi ugotovili, da je

(zamudeLevo.png)

Naprej

Tudi pri levo asimetručni porazdelitvi je večje število enot, ki ima vrednost statistične spremenljivke bliže modusu oziroma mediani kot aritmetični sredini, zato velja:

Za simetrične porazdelitve je za izražanje srednje vrednosti primerna aritmetična sredina, medtem ko sta za asimetrične primernejši modus oziroma mediana, ker sta bliže vrednosti večine opazovanih enot.

Naprej

Izračunavanje povprečij iz relativnih števil

Računanje povprečja po postopku , ki ste ga spoznali pri aritmetični sredini posameznih vrednosti statistične spremenljivke ni primerno, ko morate računati povprečja relativnih števil kot so: strukture, statistični koeficienti, indeksi, koeficienti rasti, stopnje rasti.

Naprej

Za povprečje parametrov kot so indeksi, koeficienti rasti in stopnje rasti je primerna geometrijska sredina, ki je enaka N-temu korenu produkta N vrednosti spremenljivke: ali indeksov, ali koeficientov rasti, ali stopenj rasti.

Geometrijska sredina N vrednosti spremenljivke x:

Primer

Indeksi cen življenjskih potrebščin za petletno obdobje so po podatkih Statističnega urada RS naslednji:

(potrebscine.png)

Izračunajte povprečni indeks, povprečni koeficient rasti in povprečno stopnjo rasti.

Primer

Povprečni indeks izračunate tako, da izračunate peti koren produkta posameznih vrednosti verižnih indeksov:

Primer

Pripeli smo tabelo v Excelu. Z uporabo funkcije GEOMEAN izračunajte geometrijsko sredino verižnega indeksa.

Naprej

Izračunavanje povprečij iz relativnih števil

Izračunajte še povprečni koeficient rasti po istem obrazcu kot predhodno.

(potrebscine1.png)

Povprečni koeficient rasti:

Preveri

Pravilno

Pravilno.

Naprej

Napačno

To pa ni prav! Izračunajte z uporabo obrazca:

Izračunavanje povprečij iz relativnih števil

Ker so stopnje rasti lahko tudi negativna števila, ne računate povprečnje stopnje rasti kot N-ti koren produkta stopenj rasti, pač pa iz povprečnega koeficienta rasti po obrazcu:

V našem primeru:

(potrebscine2.png)

V obdobju 2000-2004 je bila povprečna letna rast cen življenskih potrebščin (stopnja inflacije) 6,8 %.

0%
0%