Srednje vrednosti podatkov

Srednje vrednosti podatkov

Avtor: E-um (vsebinsko), Skupina NAUK (tehnično)

Aritmetična sredina

Imamo statistično populacijo in opazujemo vrednosti neke statistične spremenljivke na tej populaciji. Naboru vrednosti bi radi priredili neko število, ki bi najbolje povzelo celotni nabor in s tem podalo neko sežeto informacijo o populaciji.

Najbolj znana tovrstna sredina je aritmetična sredina.

Aritmetična sredina nabora podatkov je število, ki ga izračunamo tako, da podatke seštejemo in vsoto delimo s številom podatkov.

Naloga:

  1. Denimo, da imajo Primož, Veno, Tomi in Gregor v svojih denarnicah , , in evrov. Izračunaj aritmetično sredino tega nabora podatkov!
    Aritmetična sredina:
    Prikaži odgovor
  2. Kateri odgovor o pomenu aritmetične sredine v zgornjem primeru se ti zdi najbliže resnice?

Preveri

Aritmetične sredine ni težko izračunati. Nekaj več previdnosti je potrebne, če imamo veliko podatkov ali če so ti podani s pomočjo frekvenc.

V prvem primeru si lahko pomagamo tudi z računalnikom.

Ogdovor

Pravilno!

Napačno si odgovoril na 1. vprašanje.

Napačno si ogovoril na 2. vprašanje.

Napačno si ogovoril na obe vprašanji.

Povprečna poraba goriva

V raziskavi o porabi goriva modela Alfa Romeo so izbrali voznikov (označili smo jih s črkami , , , ...), ki so skozi cel mesec spremljali količino porabljenega bencina in število prevoženih kilometrov. V spodnji tabeli so podatki o povprečni porabi vsakega od voznikov v tem enomesečnem obdobju (v litrih na km). Izračunaj aritmetično sredino tega nabora podatkov!

ABCDEFGHIJKLMNOPQ
7,68,410,47,28,17,78,36,87,57,28,58,27,67,29,07,07,9

Rezultat preveri pod spodnjim gumbom. Tam smo aritmetično sredino nabora izračunali z Microsoftovim programom Excel, kjer smo uporabili funkcijo AVERIGE, ki je angleška beseda za povprečje, torej za aritmetično sredino.

Rezultat

Rzultat

(poraba31.JPG)

Naprej

Povprečna ocena filma

Določene spletne strani, namenjene filmskim gledalcem, omogočajo gledalcem, da filme ocenijo. Potem te ocene uredijo in predstavijo. Ena od znanih tovrstnih spletnih strani je IMDB, International Movie Data Base. Slika (klikni gumb "slika" na desni) prinaša podatke o tem, kako je 43.548 gledalcev ocenilo film Babilon (Babel) (stanje z dne 28.7.2007).

Statistična populacija je v našem primeru množica gledalcev, ko so do 28.7.2007 na spletni strani IMDB ocenili film Babilon. Statistična spremenljivka je ocena gledalca.

Izračunaj aritmetično sredino vrednosti statistične spremenljivke, torej aritmetično sredino tega nabora podatkov!
(Rezultat zaokroži na 1 decimalko natančno)

Pomagaj si s kalkulatorjem. Če imaš težave, se rešitev skriva pod spodnjim gumbom.

Aritmetična sredina:

Preveri

Mimogrede omenimo, da na omenjenih spletnih straneh poleg aritmetične sredine in mediane (ki jo bomo obravnavali v nadaljevanju), objavijo tudi uteženo aritmetično sredino (weighted averige), kjer filmom z velikim številom glasov izboljšajo položaj v primerjavi s filmi z manjšim številom glasov.

Povprečna ocena filma

Podobno kot v obravnavanem primeru lahko premislimo, kako se v splošnem izračuna aritmetična sredina nabora podatkov, ki je podan z absolutnimi frekvencami.

Denimo, da imamo statistično populacijo z statističnimi enotami, na kateri statistična spremenljivka zavzame vrednosti , pri čemer je vrednost zavzeta krat, . Potem je aritmetična sredina vrednosti statistične spremenljivke enaka

O prednostih in pomanjkljivostih aritmetične sredine kot srednje vrednosti podatkov se bomo pogovorili ob koncu gradiva. Zdaj pa spoznajmo še, kaj sta to modus in mediana nabora podatkov.

Zanimivost

Če je absolutna frekvenca in število vseh podatkov, smo kvocient imenovali relativna frekvenca; označimo jo z . Če pogledamo zgornjo formulo, lahko opazimo, da se aritmetična sredina izraža tudi takole:

Premisli, kako bi v primeru povprečne ocene filma Babilon iz slike razbral relativne frakvence in potem izračunaj aritmetično sredino še na ta način.

Pravilno!

Narobe.

Odgovor

Zamislimo si, da imamo izpisanih vseh ocen. Najprej je desetk, potem devetk itd. Vsa ta števila moramo sešteti in deliti s številom ocen, torej s .

Izračunajmo najprej vsoto:

in jo delimo s številom glasov:

To je iskana aritmetična sredina.

Slika

(babel.JPG)

V desnem stolpcu so ocene, v levem pa absolutne frekvence teh ocen. Število npr. pomeni, da je gledalcev filmu prisodilo oceno . Na samih stolpcih so zapisane relativne frekvence v procentih. Tako je filmu oceno prisodilo sodelujočih.

Modus

Modus nekega nabora podatkov je tista vrednost, ki se v naboru največkrat ponovi.

Modus izračunamo še preprosteje kot aritmetično sredino. Za vajo poišči modus naborov podatkov iz zgornjih dveh primerov, povezanih s povprečno porabo goriva in z ocenami filma Babilon.

Primer porabe goriva: Primer filma Babilon:

Odgovor Preveri

Ena od večjim pomanjkljivosti modusa je, da sploh ni nujno en sam. Premisli, kolikšen bi bil modus nabora povprečnih porab bencina v zgornjem primeru, če podatek voznika ne bi znašal , pač pa ?

Odgovor

Zdaj pa se posvetimo še mediani.

Pravilno!

Narobe

1. odgovor je napačen.

Narobe

2. odgovor je napačen.

Narobe

Oba odgovora sta napačna.

Odgovor

V tem primeru se noben podatek ne bi pojavil trikrat, bi se pa trije podatki pojavili po dvakrat: ; in . V tem primeru bi torej imeli tri moduse.

Primer poraba goriva

V raziskavi o porabi goriva modela Alfa Romeo so izbrali voznikov (označili smo jih s črkami , , , ...), ki so skozi cel mesec spremljali količino porabljenega bencina in število prevoženih kilometrov. V spodnji tabeli so podatki o povprečni porabi vsakega od voznikov v tem enomesečnem obdobju (v litrih na km). Izračunaj aritmetično sredino tega nabora podatkov!

ABCDEFGHIJKLMNOPQ
7,68,410,47,28,17,78,36,87,57,28,58,27,67,29,07,07,9

Primer filma Babilon

Določene spletne strani, namenjene filmskim gledalcem, omogočajo gledalcem, da filme ocenijo. Potem te ocene uredijo in predstavijo. Ena od znanih tovrstnih spletnih strani je IMDB, International Movie Data Base. Spodnja slika prinaša podatke o tem, kako je gledalcev ocenilo film Babilon (Babel) (stanje z dne 28.7.2007).

(babel.JPG)

Odgovor

V primeru porabe goriva je modus enak , saj je to edini podatek, ki se pojavi trikrat, ostali se pojavijo enkrat ali dvakrat.

V primeru filma Babilon je modus enak , saj se je te ocena pojavila največkrat, to je krat.

Mediana

Pri določanju mediane je pomembno, ali je število podatkov v naboru liho ali sodo. Preprostejši je "lihi" primer, zato začnimo z njim.

Denimo, da imamo nabor naslednjih devetih podatkov: Podatke najprej uredimo od največjega do najmanjšega: Nato podčrtamo največje in najmanjše število v naboru in ostane nam le še števil. Postopek nadaljujemo, dokler nam ne ostane le še eno število. To število je potem mediana našega nabora:
Mediana

Mediana nabora je torej enaka . V urejenem naboru podatkov je to vrednost, ki nastopa točno na sredini: štiri števila v naboru so manjša in štiri so večja.

Če bi na podoben način postopali v primeru, ko bi v naboru imeli sodo mnogo podatkov, bi nam po zaporednem podčrtovanju v nekem trenutku ostali dve števili. Po dogovoru je mediana aritmetična sredina teh dveh.

Oglejmo si to na primeru nabora podatkov: .
Mediana

Mediana tega nabora podatkov je torej . Zapomnimo si:

Če imamo nabor liho mnogo podatkov, jih uredimo od največjega do najmanjšega. Podčrtamo največje in najmanjše število in postopek nadaljujemo s preostalimi števili, dokler nam ne ostane le še eno število. To je mediana našega nabora. Če je podatkov sodo, izvajamo isti postopek, dokler nam ne ostaneta dve števili. Mediana je v tem primeru aritmetična sredina teh dveh števil.

Mediana

(mediana0.gif)

Mediana

(sodo.gif)

Mediana

Vaja

Za vajo izračunaj mediano naborov podatkov, obravanavanih v zgoraj obravnavanih primerih: v zvezi s porabo bencina in z ocenami filma Babilon.

Če si v težavah, pokukaj pod ustrezni spodnji gumb.

Primer porabe goriva:
Odgovor

Primer filma Babilon:
Odgovor

Odgovor

Imamo , torej liho podatkov. Razvrstimo jih od najmanjšega do največjega ter zaporedoma podčrtujemo najmanjše in največje število. Po osmih črtanjih parov nam ostane število . To število leži točno na sredi: podatkov je od njega manjših in večjih.

Odgovor

Tokrat imamo , torej sodo podatkov. Razvrstimo jih od najmanjšega do največjega in zaporedoma podčrtujemo najmanjše in največje število, dokler nam ne ostaneta le še dve števili. To moramo stroriti krat. Prečrtali bomo torej najmanjših in prav toliko največjih števil. Kateri števili nam bosta ostali?

Osredotočimo se na podčrtana največja števila: najprej prečrtamo desetk, potem devetk, kar je skupaj števil. Prečrtati moramo še največjih od preostalih števil. Ker imamo več kot osmic, je jasno, da nam bosta po podčrtovanju ostali dve osmici, torej je mediana enaka .

Pravilno!

Narobe

1. odgovor je napačen.

Narobe

2. odgovor je napačen.

Narobe

Oba odgovora sta napačna.

Mediana

Izpeljava lastnosti mediane

Manj pogumnim predlagam, da delo nadaljujejo v naslednjem poglavju z naslovom Nobena srednja vrednost ni brez napak.

Z bolj pogumnimi pa bomo na podlagi obravnavanih dveh primerov v splošnem izpeljali eno ključnih lastnosti mediane. Ločeno bomo obravnavali možnosti, ko imamo v naboru liho oz. sodo podatkov.

Če je v naboru liho, recimo podatkov, v postopku podčrtovanja podčrtamo najmanjših in največjih števil, ostane nam tisto na sredi, ki je mediana. V tem primeru v naboru je števil, ki so manjša ali enaka mediani (podčrtana manjša števila in mediana sama) in prav tako števil, ki so večja ali enaka mediani. Ob tem opazimo, da je podatkov več kot polovica vseh podatkov.

Če je v naboru sodo, recimo števil, podčrtujemo tako dolgo, da nam ostanete le še dve števili in mediana je aritmetična sredina preostalih dveh števil. V tem primeru je števil manjših ali enakih mediani in prav tako števil večjih ali enakih.

Na ta način pridemo do naslednjega sklepa:

Mediana nabora podatkov je tako število, od katerega je vsaj polovica elementov v naboru manjša ali enaka; prav tako pa je vsaj polovica podatkov v naboru večja ali enaka.

Mediana in komulativa relativnih frekvenc

Oglejmo si relativne frekvence in komulativo relativnih frekvenc v primeru ocen za film Babilon. Podatki so zbrani v naslednji tabeli: ocena rel. frek.

ocenarel. frek.komul. rel frek.
10,0360,000
20,0150,036
30,0190,051
40,0260,070
50,0420,096
60,0770,138
70,1640,215
80,2410,379
90,1950,620
100,1850,815

Spomnimo se, kaj komulativa relativnih frekvenc sploh pomeni. Podatek pri oceni pomeni, da je gledalcev filmu prisodilo oceno, manjšo od .

Premislimo, kako bi na podlagi te tabele takoj uganili, da je mediana tega nabora enaka .

Mediana

Dopolni mankajoča polja

(Decimalna števila zaokroži na 3 decimalna mesta, odstotke pa na eno decimalno mesto)

Procent gledalcev, ki je filmu prisodil oceno, manjšo ali enako , je enak procentu gledalcev, ki je filmu prisodil oceno, strogo manjšo od naravnega števila . Ta delež znaša ali . To je manj več kot polovica vseh. Zato število ni mediana nabora. Število je za mediano premajhno preveliko .

Kaj pa število ? Procent gledalcev, ki je filmu prisodil oceno, manjšo ali enako , je enak procentu gledalcev, ki je filmu prisodil oceno, strogo manjšo od naravnega števila . Ta delež znaša . To je več manj kot polovica vseh. Procent gledalcev, ki so filmi prisodili oceno, večjo ali enako , je enak - procent gledalcev, ki so filmu prisodili oceno, strogo manjšo od , torej - = . Tudi to je več manj kot polovica vseh. Zato je mediana našega nabora.

Preveri Prikaži odgovore

Ključno pri tem, da je mediana , je bilo torej to, da je komulativa relativnih frekvenc pri vrednosti znašala manj kot , pri naslednji vrednosti pa že več kot . Prvi podatek zagotavlja, da je vsaj pol podatkov večjih ali enakih , drugi pa, da jih je vsaj pol manjših ali enakih .

Na podlagi tabele kumulativ relativnih frekvenc mediano lahko najdemo takole: Najprej poiščemo vrednost, pri kateri je komulativa relativnih frekvenc prvič večja od . Mediana je potem enaka prvi manjši vrednosti.

Rezultat

Tvoj rezultat je /12.

Odgovori

Procent gledalcev, ki je filmu prisodil oceno, manjšo ali enako , je enak procentu gledalcev, ki je filmu prisodil oceno, strogo manjšo od naravnega števila 8. Ta delež znaša 0,379 ali 37,9. To je manj kot polovica vseh. Zato število ni mediana nabora. Število je za mediano premajhno.

Kaj pa število ? Procent gledalcev, ki je filmu prisodil oceno, manjšo ali enako , je enak procentu gledalcev, ki je filmu prisodil oceno, strogo manjšo od naravnega števila 9 . Ta delež znaša 62. To je več kot polovica vseh. Procent gledalcev, ki so filmi prisodili oceno, večjo ali enako , je enak - procent gledalcev, ki so filmu prisodili oceno, strogo manjšo od 8, torej - 37,9 = 62,1. Tudi to je več kot polovica vseh. Zato je mediana našega nabora.

Nobena od srednjih vrednosti ni brez napak

Nabor podatkov skušamo povzeti z enim samim številom, zato ne smemo biti presenečeni, če to število ne bo uspelo sporočiti vsega. Nekaj informacije o naboru se zagotovo izgubi. Na spodnjih treh primerih bomo spoznali ključne pomanjkljivosti vsake od treh srednjih vrednosti.

Glavni očitek aritmetični sredini

Pri aritmetični sredini aktivno nastopajo vsi podatki iz nabora, zato en sam podatek lahko aritmatično sredino bistveno spremeni. To včasih zamegli situacijo.

Primer 1: Denimo, dnevni zaslužek v neki afriški vasici znaša 1 dolar za vsakega od 99 običajnih vaščanov, lokalni mogotec pa zasluži 1001 dolar dnevno. Kolikšen je povprečni dnevni dohodek? Poleg aritmetične sredine izračunaj tudi modus in mediano.

Aritmetična sredina:
Modus:
Mediana:

Prikaži odgovor Preveri

En sam visok podatek je izrazito dvignil povprečje in s tem zameglil informacijo o stanju v afriški vasici.

Glavni očitek aritmetični sredini

Primer 2: Na tekmovanju za Miss tropic člani žirije ocenjujejo dekleta z ocenami od do . Od šestih članov komisije sta dva podkupljena in želita doseči, da bi namesto dekleta zmagalo dekle . Ocene sodnikov za omenjeni dve dekleti so naslednje:

A109101044
D88981010

Izračunaj aritmetično sredino ocen za vsako od deklet. Določi tudi mediano in modus.
(Rezultat zaokroži na 2 decimalni mesti.)

Dekle A:

  • aritmetična sredina =
  • modus =
  • mediana =

Dekle D:

  • aritmetična sredina =
  • modus =
  • mediana =

Prikaži odgovor Preveri

Rezultat

Tvoj rezultat je .

Odgovor

Dekle A:

  • aritmetična sredina = 7,83
  • modus = 10
  • mediana = 9,5

Dekle D

  • aritmetična sredina = 8,83
  • modus = 8
  • mediana = 8,5

Glavni očitek aritmetični sredini

Primer 2: Na tekmovanju za Miss tropic člani žirije ocenjujejo dekleta z ocenami od do . Od šestih članov komisije sta dva podkupljena in želita doseči, da bi namesto dekleta zmagalo dekle . Ocene sodnikov za omenjeni dve dekleti so naslednje:

A109101044
D88981010

Kakšen bi bil izid tekmovanja, če bi za kriterij končne ocene uporabili vsako od treh mer srednjih vrednosti?

Če bi bil kriterij aritmetična sredina:

prva
druga
Dekle D
Dekle A

Če bi bi kriterij mediana:

prva
druga
Dekle A
Dekle D

Če bi bi kriterij modus:

prva
druga
Dekle A
Dekle D

Prikaži odgovor Preveri

Če bi bil kriterij aritmetična sredina, bi bilo dekle D boljše od dekleta A. Pristranska sodnika sta bistveno vplivala na aritmetično sredino.

Če bi bi kriterij mediana ali modus, bi bilo boljše dekle A.

Odgovor

Aritmetična sredina znaša dolarjev.

Modus in mediana znašata dolar.

Rezultat

Tvoj rezultat je .

Rezultat

Tvoj rezultat je .

Odgovor

Če bi bil kriterij aritmetična sredina, bi bilo dekle boljše od dekleta . Pristranska sodnika sta bistveno vplivala na aritmetično sredino.

Če bi bi kriterij mediana ali modus, bi bilo boljše dekle .

Težave z modusom

Tudi modus ni brezhiben. Že zgoraj smo omenili, da včasih modus sploh ni en sam. Zlahka tudi najdemo primer, ko nam modus ne prinaša kakega zelo informativnega podatka o naboru.

Primer 3: Določi modus nabora . Določi tudi aritmetično sredino in mediano tega nabora. (Rezultat zaokroži na 2 decimalni mesti.)

Modus =

Aritmetična sredina =

Mediana =

Prikaži odgovor Preveri

Dejstvo, da se je podatek kot edini dvakrat ponovil, nam o naboru kor celoti ne sporoča kaj prida.

Rezultat

Tvoj rezultat je .

Odgovor

Modus = 1

Aritmetična sredina = 5,09

Mediana = 5

Težave z mediano

Tudi mediana nam včasih sporoči rezultat, ki utegne biti zavajajoč.

Primer 4: Določi mediano nabora podatkov, v katerem krat nastopa število in krat število . Absolutna frekvenca vrednosti je torej enaka , absolutna frekvenca vrednosti pa . Določi tudi aritmetično sredino in mediano.
(Rezultat zaokroži na 2 decimalni mesti.)

Prikaži odgovor Preveri

Mediana =

Aritmetična sredina =

Modus =

Rezultat

Tvoj rezultat je .

Odgovor

Mediana = 5

Aritmetična sredina = 3,00

Modus = 5

Povzetek

Povzemimo:

Aritmetična sredina, modus in mediana so trije poskusi, kako bi z enim samim podatkom povzeli cel nabor podatkov. Včasih nam to uspe, včasih pa tudi ne. Ob tem ne smemo pa biti presenečeni: en sam podatek pač ne zmore sporočiti vsega in del informacije se v vsakem primeru izgubi... Malo na boljšem bomo v naslednjem gradivu, ko si bomo lahko privoščili dva podatka...

Dodatne naloge

1. Naloga

Komisija na gledališkem festivalu je sestavljena iz osmih članov. Vsak od njih je ocenil gledališko predstavo z oceno v razponu od do . Ocene so naslednje: . Izračunaj modus, aritmetično sredino in mediano tega nabora podatkov.
(Rezultat zaokroži na eno decimalno mesto.)

Mediana =

Aritmetična sredina =

Modus =

Preveri

Kateri od teh se ti zdi najbolj smiselna končna ocena celotne komisije?

Prikaži odgovor

Rezultat

Tvoj rezultat je .

Odgovor

Vsekakor modus ni primerna skupna ocena. O tem, ali je primernejša aritmetična sredina ali mediana, je na splošno težko kaj reči. Vsekakor bi bilo v razmerah, ko se ocene zelo razlikujejo, nujno soočenje in usklajevanje ocenjevalcev. Tovrstna zahteva je npr. v pravilih ocenjevanja v gimnastiki.

Dodatne naloge

2. Naloga

Spodnji niz podatkov prinaša informacijo s spletne strani IMDB o tem, kako so filmski gledalci ocenili film Večno sonce brezmadežnega uma. števila zaporedoma pomenijo koliko od gledalcev, ki so do ocenili film, je filmu namenilo posamezno oceno:

12345678910
3.4808199541.1401.8673.7198.46917.78428.12947.919

a) Izračunaj:
(Rezultat zaokroži na eno decimalno mesto.)

  • Aritmetična sredina =
  • Modus =
  • Mediana =

Preveri

Nalogi, označeni z (*) sta zahtevnejši in namenjeni samo bolj ”pogumnim”.

Tvoj rezultat je .

Dodatne naloge

2. Naloga

Spodnji niz podatkov prinaša informacijo s spletne strani IMDB o tem, kako so filmski gledalci ocenili film Večno sonce brezmadežnega uma. števila zaporedoma pomenijo koliko od gledalcev, ki so do ocenili film, je filmu namenilo posamezno oceno:

b) Izračunaj: relativne frekvence vsake od ocen v procentih.
(Rezultat zaokroži na eno decimalno mesto.)

12345678910
3.4808199541.1401.8673.7198.46917.78428.12947.919
Rel.frekv. :

Preveri

Nalogi, označeni z (*) sta zahtevnejši in namenjeni samo bolj ”pogumnim”.

Tvoj rezultat je .

Dodatne naloge

2. Naloga

Spodnji niz podatkov prinaša informacijo s spletne strani IMDB o tem, kako so filmski gledalci ocenili film Večno sonce brezmadežnega uma. števila zaporedoma pomenijo koliko od gledalcev, ki so do ocenili film, je filmu namenilo posamezno oceno:

12345678910
3.4808199541.1401.8673.7198.46917.78428.12947.919

c) Aritmetično sredino izračunaj tudi s pomočjo relativnih frekvenc. (*)

Aritmetična sredina =

Preveri

Nalogi, označeni z (*) sta zahtevnejši in namenjeni samo bolj ”pogumnim”.

Pravilno

Narobe

Dodatne naloge

2. Naloga

Spodnji niz podatkov prinaša informacijo s spletne strani IMDB o tem, kako so filmski gledalci ocenili film Večno sonce brezmadežnega uma. števila zaporedoma pomenijo koliko od gledalcev, ki so do ocenili film, je filmu namenilo posamezno oceno:

d) Izračunaj komulativo relativnih frekvenc.
(Rezultat zaokroži na 3 decimalna mesta.)

12345678910
3.4808199541.1401.8673.7198.46917.78428.12947.919
Rel.frekv. :

Preveri

Po vzoru primera iz gradiva na tej podlagi znova določi mediano.(*)

Odgovor

Nalogi, označeni z (*) sta zahtevnejši in namenjeni samo bolj ”pogumnim”.

Odgovor

Komulativa relativnih frekvenc prvič preseže pri vrednosti , zato je mediana enaka .

Tvoj rezultat je .

Dodatne naloge

3. Naloga

Naboru dodaj eno število tako, da bo:

a) modus novega nabora enak 7;
Dodano število =

b) aritmetična sredina novega nabora enaka 5; Dodano število =

c) mediana novega nabora enaka 5; Dodano število =

d) modus novega nabora en sam in bo enak mediani novega nabora. Dodano število =

Preveri

Tvoj rezultat je .

0%
0%