Mere variabilnosti

Mere variabilnosti

Avtor: E-um (vsebinsko), Skupina NAUK (tehnično)

Uvod

Opazili smo že, da aritmetična sredina ne poda celovite informacije o naboru podatkov. Če bi imeli še informacijo o razpršenosti, bi bila slika že popolnejša. Najprej o razpršenosti razmišljajmo na intuitivni ravni, v nadaljevanju pa bomo mero zanjo natančno definirali.

Fantje gredo na pico

Primož, Luka in Veno želijo oditi na pico in ugotovijo, da imajo v denarnicah povprečno 8 evrov.

(./datoteke/pica.jpg)

Ugotovi pravilnost naslednjih izjav!

  • Skupni znesek, s katerim razpolagajo, je 24 evrov.

    Pravilno
    Nepravilno
  • Zneski, ki jih imajo v denarnicah trije fantje, so najbolj razpršeni v primeru, ko ima eden v denarnici 8 evrov, drugi 16 evrov , tretji pa nič.

    Pravilno
    Nepravilno
  • Zneski v denarnici so najmanj razpršeni, če imajo vsi v denarnici enak znesek, torej 8 evrov.

    Pravilno
    Nepravilno
  • Glede na dane podake je čisto možno, da imajo fantje v denarnicah 5, 8 oz. 11 evrov.

    Pravilno
    Nepravilno
  • Nabori zneskov v denarnicah: 0, 0, 24; 8, 8, 8 in 5, 8, 11 imajo enako razpršenost, pa različno aritmetično sredino.

    Pravilno
    Nepravilno

Pravilno.

Zneske, ki jih imajo v denarnici Primož, Veno in Luka označimo s P, V in L. Vemo, da je (P+V+L)/3=8, zato je skupni znesek res enak 24.

Nepravilno.

Zneske, ki jih imajo v denarnici Primož, Veno in Luka označimo s P, V in L. Vemo, da je (P+V+L)/3=8, zato je skupni znesek res enak 24.

Pravilno.

Največja bo razpršenost podatkov v primeru, ko ima eden ves denar, druga dva pa nič.

Nepravilno.

Največja bo razpršenost podatkov v primeru, ko ima eden ves denar, druga dva pa nič.

Pravilno.

V opisanem primeru lahko upravičeno pričakujemo, da bo razpršenost enaka 0.

Nepravilno.

V opisanem primeru lahko upravičeno pričakujemo, da bo razpršenost enaka 0.

Pravilno.

Aritmetična sredina tega nabora je 8, kar ustreza edinemu podatku, ki ga imamo.

Nepravilno.

Aritmetična sredina tega nabora je 8, kar ustreza edinemu podatku, ki ga imamo.

Pravilno.

Velja ravno obratno: Aritmetična sredina je v vseh treh primerih enaka 8, razlika je v razpršenosti.

Videli smo torej, da imata nabora 0, 0, 24 in 8, 8, 8 isto aritmetično sredino, razlikujeta pa se v razpršenosti. O tem smo se strinjali, čeprav še ni čisto jasno, kako bomo to razpršenost sploh merili. V nadaljevanju se bomo temu posvetili natančneje.

Nepravilno.

Velja ravno obratno: Aritmetična sredina je v vseh treh primerih enaka 8, razlika je v razpršenosti.

Videli smo torej, da imata nabora 0, 0, 24 in 8, 8, 8 isto aritmetično sredino, razlikujeta pa se v razpršenosti. O tem smo se strinjali, čeprav še ni čisto jasno, kako bomo to razpršenost sploh merili. V nadaljevanju se bomo temu posvetili natančneje.

Varianca

Če v obravnavanem primeru treh naborov podatkov izračunamo odklon, ki ga ima vsak od podatkov v naboru (označimo ga z ) od aritmetične sredine (oznaka , v našem primeru ), dobimo naslednje tri tabele:

0-8
0-8
2416
80
80
80
5-3
80
113

To so odmiki od srednje vrednosti. Prva misel bi bila, da bi razpršenost izmerili tako, da bi te odmike sešteli.
Kolikšno vsoto dobimo v vsakem od primerov, če to zares storimo?

Vsakič dobimo vsoto odmikov enako 0.

(P-8)+(L-8)+(V-8)=(P+L+V)-24=0.

Varianca

Izkaže se, da ta lastnost ne velja le za naše nabore treh podatkov z aritmetično sredino 8, pač pa tudi splošneje, za vsak nabor podatkov. Vsota vseh odmikov od aritmetične sredine je vedno enaka 0.

To se zgodi zato, ker imamo pozitivne in negativne odmike, katerih vpliv se na koncu izniči.

Da bi odštevanje pozitivnih in negativnih odmikov preprečili, te odmike kvadriramo. Zdaj so vsi prispevki pozitivni, zato do izničenja ne pride več. Povprečen kvadrat odmika imenujemo varianca in to bo naša mera za razpršenost podatkov.

 

Imejmo nabor podatkov . Aritmetično sredino tega nabora označimo z .

Varianca tega nabora podatkov je število:

To je povprečen kvadrat odmika od aritmetične sredine.

Vaja - 1

Izračunaj varianco naborov podatkov 0, 0, 24; 8, 8, 8 in 5, 8, 11.

Pomoč: tri tabele in namig

0-864
0-864
2416256
800
800
800
5-39
800
1139

Namig:
Varianca je povprečen kvadrat odmika, torej povprečna vrednost zadnjega stolpca.

Rezultat:

  • prvi nabor:
  • drugi nabor:
  • tretji nabor:

Preveri

Odlično!

Naprej

Nekje si se zmotil.

Rešitev:

  • prvi nabor: (64 + 64 + 256)/3 = 384/3 = 128
  • drugi nabor: 0
  • tretji nabor: (9 + 0 + 9)/3 = 6

Naprej

Vaja - 2

Na testu iz matematike so dijaki od možnih 40 dosegli naslednje število točk:

10, 12, 15, 18, 19, 23, 24, 24, 25, 27, 27, 30, 32, 34, 34, 35, 36, 38, 40, 40.

Izračunaj aritmetično sredino in varianco tega nabora podatkov.

Rezultat:

  • Aritmetična sredina:
  • Varianca:

Preveri

Odlično!

Opomba:
Glede na naše formule uporabimo v Excelu za izračuna obeh vrednosti funkciji AVERAGE (za aritmetično sredino) in VARP (za varianco).

Naprej

Nekje si se zmotil.

Aritmetična sredina nabora je enaka 27,15, varianca pa 78,83.

Opomba: Glede na naše formule uporabimo v Excelu za izračuna obeh vrednosti funkciji AVERAGE (za aritmetično sredino) in VARP (za varianco).

Naprej

Standardni odklon

Še bolj kot varianca nas bo zanimal kvadratni koren iz variance, ki ga imenujemo standardni odklon.

 

Kvadratni koren iz variance označimo z malo grško črko sigma in imenujemo standardni odklon ali s tujko standardna deviacija.

Za nabor n podatkov z aritmetično sredino a je torej standardni odklon enak:

Vaja - 3

Izračunaj standardne odklone iz spodnjih dveh primerov.

  • Izračunaj standardni odklon naborov podatkov 0, 0, 24; 8, 8, 8 in 5, 8, 11. Rešitev:

  • Na testu iz matematike so dijaki od možnih 40 dosegli naslednje število točk:
    10, 12, 15, 18, 19, 23, 24, 24, 25, 27, 27, 30, 32, 34, 34, 35, 36, 38, 40, 40.
    Izračunaj standardni odklon tega nabora: .

Preveri

Odlično!

Naprej

Pri 1. nalogi so standardni odkloni zaporedoma enaki: 11,31, 0 in 2,45.

Pri 2. nalogi je standardni odklon enak 8,88.

Naprej

Računanje z računalnikom

Če imamo veliko podatkov, je računanje standardnega odklona zamudno. V tem primeru si pomagamo s katerim od računalniških programov. Na sliki pod spodnjim gumbom vidimo, kako je s standardnim odklonom pri 2. nalogi opravil program Excel. V tem programu standardni odklon po naši formuli izračunamo z ukazom STDEVP (standardna deviacija na populaciji), v oklepaju pa navedemo, v katerih poljih so zapisani podatki iz našega nabora.

(./datoteke/Excel STDEVP.jpg)

Še malo o pomenu standardnega odklona

Kot vidimo, z uporabo računalnika standardnega odklona nabora podatkov ni težko izračunati, tudi če je nabor kar zajeten. Zato se v nadaljevanju ne bomo več ukvarjali z računanjem, pač pa bomo poskusili zaslutiti, kaj na ta podatek sporoča.

Temperature v šestih mestih sveta

V spodnji tabeli so vpisani podatki o povprečnih najvišjih dnevnih temperaturah v mesecih januarju, aprilu, juliju in oktobru v petih različnih krajih na svetu. Podatki so pridobljeni s spletnih strani Agencije za okolje RS in spletne strani infoplease.com.

Za vsak kraj posebej izračunamo aritmetično sredino nabora štirih podatkov in standardni odklon tega nabora. Večina podatkov je že vnešenih, manjkajoče pa izračunaj in vstavi (pomagaš si lahko npr. z Excelom). Rezultate zaokroži na dve decimalki.

janaprjuloktar. sredinast. odklon
Ljubljana31628168,84
Atene1219322321,50
Moskva-682488,50
Nairobi2524212523,75
Acapulco31313232
Vancouver61322145,67

Odlično!

Naprej

Odgovori so napačni.

Rešitev:

janaprjuloktar. sredinast. odklon
Ljubljana316281615.758,84
Atene1219322321,507.23
Moskva-682488,5010.62
Nairobi2524212523,751.64
Acapulco3131323231.500.50
Vancouver613221413.755,67

Naprej

Nekje si se zmotil.

Ponovno

Preizkusi svoje razumevanje prejšnjih podatkov

Ugotovi pravilnost naslednjih izjav. Pri tem si pomagaj z rešeno tabelo iz prejšnje naloge.

  • Najmanjši standardni odklon opazimo pri Acapulcu, drugi najmanjši pa pri Nairobiju.

    Pravilno
    Nepravilno
  • Zgornje dejstvo pomeni, da so temperature v Acapulcu in Nairobiju med vsemi navedenimi mesti v povprečju najnižje.

    Pravilno
    Nepravilno
  • Standardi odklon za Ljubljano je manjši od tistega v Moskvi, kar kaže na to, da temperature v Moskvi skozi leto bolj nihajo kot temperature v Ljubljani.

    Pravilno
    Nepravilno

Na podlagi izkušnje s tem primerom, pa tudi razmislekov v teku same vpeljave standardnega odklona, lahko zaključimo naslednje:

 

Standardni odklon je mera za razpršenost podatkov. Majhen standardni odklon pomeni, da so podatki blizu skupaj, velik pa, da so bolj razmetani.

Če imamo podana dva podatka: aritmetično sredino in standardni odklon, je slika o naboru podatkov jasnejša, kot če bi imeli samo prvi podatek.

Tako npr. podatka iz zgornjega primera za Atene (21,50; 7,23) in Nairobi (23,75; 1,64) sporočata, da sta povprečni temperaturi v mestih sorazmerno podobni, da pa v Atenah lahko pričakujemo tudi bistveno drugačne temperature od povprečne; v Nairobiju pa bi bila bistveno drugačna temperatura večje presenečenje.

janaprjuloktar. sredinast. odklon
Ljubljana316281615.758,84
Atene1219322321,507.23
Moskva-682488,5010.62
Nairobi2524212523,751.64
Acapulco3131323231.500.50
Vancouver613221413.755,67

Odlično!

Narobe!

Odlično!

Narobe!

Odlično!

Narobe!

Dodatne naloge - 1

Določi aritmetično sredino in standardni odklon naslednjih naborov podatkov. Rezultate zaokrožuj na tri decimalke.

  • 1,1,1,2,3,4,5,6:
    Aritmetična sredina:
    Standardni odklon:
  • 1,3,5,7,8,9,9:
    Aritmetična sredina:
    Standardni odklon:

Preveri

Odlično!

Naprej

Odgovori so napačni.

Rešitev:

  • 1,1,1,2,3,4,5,6:
    Aritmetična sredina:
    Standardni odklon:
  • 1,3,5,7,8,9,9:
    Aritmetična sredina:
    Standardni odklon:

Naprej

Nekje si se zmotil.

Ponovno

Dodatne naloge - 2

Spodnji nabori podatkov prinašajo število golov, ki so jih po 20 krogih tek- movanja dosegle ekipe v španski, italijanski, angleški in slovenski nogometni ligi.

Državašt. golovaritmetična sredinastd. odklon
Španija11, 16, 17, 18, 18, 21, 21, 21, 21, 23, 25, 26, 26, 28, 29, 30, 38, 40.
Italija15, 16, 16, 16, 18, 20, 21, 21, 22, 23, 27, 27, 27, 28, 30, 32, 33, 35, 40, 43.
Anglija12, 13, 15, 15, 18, 21, 21, 21, 22, 22, 22, 23, 24, 25, 27, 30, 30, 35, 36, 47.
Slovenija20, 21, 24, 27, 27, 28, 31, 31, 34, 38.

Izračunaj aritmetične sredine in standardne odklone teh naborov. Rezultate zaokrožuj na dve decimalki.

V kateri ligi imajo največjo aritmetično sredino?

V kateri ligi imajo največji standardni odklon?

V kateri ligi imajo najmanjši standardni odklon?

Pomagaš si lahko tudi s katerim od računalniških programov, recimo s programom Excel. Aritmetično sredino izračunamo z ukazom AVERAGE, standardni odklon pa z ukazom STDEVP. Kako ju prikličeš, lahko vidiš na sliki v gradivu. Najdeš jo na prosojnici z naslovom Računanje z računalnikom.

Preveri

Odlično!

Konec

Odgovori so napačni.

Rešitev:

Državašt. golovaritmetična sredinastd. odklon
Španija11, 16, 17, 18, 18, 21, 21, 21, 21, 23, 25, 26, 26, 28, 29, 30, 38, 40.
Italija15, 16, 16, 16, 18, 20, 21, 21, 22, 23, 27, 27, 27, 28, 30, 32, 33, 35, 40, 43.
Anglija12, 13, 15, 15, 18, 21, 21, 21, 22, 22, 22, 23, 24, 25, 27, 30, 30, 35, 36, 47.
Slovenija20, 21, 24, 27, 27, 28, 31, 31, 34, 38.

Konec

Nekje si se zmotil.

Ponovno

Rezultati

0%
0%