Mere variabilnosti

Mere variabilnosti

Avtor: E-um (vsebinsko), Skupina NAUK (tehnično)

Uvod

V nekaterih naborih so podatki zelo strnjeni okrog aritmetične sredine nabora in so si zato med seboj zelo blizu. V drugih naborih so razlike med podatki velike, prav tako pa tudi odstopanja podatkov od srednje vrednosti. V drugem primeru rečemo, da so podatki zelo razpršeni, v prvem primeru pa rečemo, da je ta razpršenost majhna.

V tem gradivu se bomo si bomo ogledali eno od možnosti, kako tovrstno razpršenost izmerimo.

Opazili smo že, da aritmetična sredina ne poda celovite informacije o naboru podatkov. Če bi imeli še informacijo o razpršenosti, bi bila slika že popolnejša. Najprej o razpršenosti razmišljajmo na intuitivni ravni, v nadaljevanju pa bomo mero zanjo natančno definirali.

Uvod

Fantje gredo na pico

Primož, Luka in Veno želijo oditi na pico in ugotovijo, da imajo v denarnicah povprečno evrov.

(pica.jpg)

Ugotovi pravilnost naslednjih izjav!

1. Skupni znesek s katerim razpolagajo je evrov.

Pravilno
Napačno

Preveri

To pa ne bo držalo! Zneske, ki jih imajo v denarnici Primož, Veno in Luka označimo s P, V in L. Vemo, da je (P+V+L)/3=8, zato je skupni znesek res enak 24.

Odlično! Zneske, ki jih imajo v denarnici Primož, Veno in Luka označimo s P, V in L. Vemo, da je , zato je skupni znesek res enak .

Naprej

Uvod

Fantje gredo na pico

Primož, Luka in Veno želijo oditi na pico in ugotovijo, da imajo v denarnicah povprečno evrov.

(pica.jpg)

Ugotovi pravilnost naslednjih izjav!

2. Zneski, ki jih imajo v denarnicah trije fantje, so najbolj razpršeni v primeru, ko ima eden v denarnici evrov, drugi evrov , tretji pa nič.

Pravilno
Napačno

Preveri

To pa ne bo držalo!
Največja bo razpršenost podatkov v primeru, ko ima eden ves denar, druga dva pa nič.

Odlično!
Največja bo razpršenost podatkov v primeru, ko ima eden ves denar, druga dva pa nič.

Naprej

Uvod

Fantje gredo na pico

Primož, Luka in Veno želijo oditi na pico in ugotovijo, da imajo v denarnicah povprečno evrov.

(pica.jpg)

Ugotovi pravilnost naslednjih izjav!

3. Zneski v denarnici so najmanj razpršeni, če imajo vsi v denarnici enak znesek, torej evrov.

Pravilno
Napačno

Preveri

To pa ne bo držalo!
V opisanem primeru lahko upravičeno pričakujemo, da bo razpršenost enaka .

Odlično!
V opisanem primeru lahko upravičeno pričakujemo, da bo razpršenost enaka .

Naprej

Uvod

Fantje gredo na pico

Primož, Luka in Veno želijo oditi na pico in ugotovijo, da imajo v denarnicah povprečno evrov.

(pica.jpg)

Ugotovi pravilnost naslednjih izjav!

4. Glede na dane podake je čisto možno, da imajo fantje v denarnicah , oz. evrov.

Pravilno
Napačno

Preveri

To pa ne bo držalo!
Aritmetična sredina tega nabora je , kar ustreza edinemu podatku, ki ga imamo.

Odlično!
Aritmetična sredina tega nabora je , kar ustreza edinemu podatku, ki ga imamo.

Naprej

Uvod

Fantje gredo na pico

Primož, Luka in Veno želijo oditi na pico in ugotovijo, da imajo v denarnicah povprečno evrov.

(pica.jpg)

Ugotovi pravilnost naslednjih izjav!

5. Nabori zneskov v denarnicah: , , ; , , in , , imajo enako razpršenost, pa različno aritmetično sredino.

Pravilno
Napačno

Preveri

To pa ne bo držalo!
Velja ravno obratno: Aritmetična sredina je v vseh treh primerih enaka , razlika je v razpršenosti.

Odlično!
Velja ravno obratno: Aritmetična sredina je v vseh treh primerih enaka , razlika je v razpršenosti.

Naprej

Uvod

Videli smo torej, da imata nabora , , in , , isto aritmetično sredino, razlikujeta pa se v razpršenosti. O tem smo se strinjali, čeprav še ni čisto jasno, kako bomo to razpršenost sploh merili. V nadaljevanju se bomo temu posvetili natančneje.

Varianca

Uvod

Če v obravnavanem primeru treh naborov podatkov izračunamo odklon, ki ga ima vsak od podatkov v naboru (označimo ga z ) od aritmetične sredine (oznaka , v našem primeru ), dobimo naslednje tri tabele:

0-8
0-8
2416
80
80
80
5-3
80
113

To so odmiki od srednje vrednosti. Prva misel bi bila, da bi razpršenost izmerili tako, da bi te odmike sešteli. Kolikšno vsoto dobimo v vsakem od primerov, če to zares storimo?

Preveri odgovor

Varianca

Odgovor

Vsakič dobimo vsoto odmikov enako .

To ni slučaj, radovedni bralec lahko pod naslednjim gumbom preveri, da je pri vsakem naboru zneskov v denarnici , , ta vsota vedno enaka .


Utemeljitev

Izkaže se, da ta lastnost ne velja le za naše nabore treh podatkov z aritmetično sredino , pač pa tudi splošneje, za vsak nabor podatkov. Vsota vseh odmikov od aritmetične sredine je vedno enaka .

To se zgodi zato, ker imamo pozitivne in negativne odmike, katerih vpliv se na koncu izniči.

Vsota je vedno enaka .

Varianca

Definicija

Da bi odštevanje pozitivnih in negativnih odmikov preprečili, te odmike kvadriramo. Zdaj so vsi prispevki pozitivni, zato do izničenja ne pride več. Povprečen kvadrat odmika imenujemo varianca in to bo naša mera za razpršenost podatkov.

Imejmo nabor podatkov . Aritmetično sredino tega nabora označimo z .

Varianca tega nabora podatkov je število:

To je povprečen kvadrat odmika od aritmetične sredine.

Varianca

1. Naloga

Izračunaj varianco naborov podatkov , , ; , , in , , .
(Rezultate zaokroži na dve decimalki.)

  1. Nabor (, , ) =
  2. Nabor (, , ) =
  3. Nabor (, , ) =

Prikaži izračun Preveri

Pravilno si odgovoril na od treh vprašanj.

Prikaži izračun Naprej

Prikaži izračun

V prvem primeru je varianca enaka

V drugem primeru je varianca enaka .

V tretjem primeru je varianca enaka

Namig

0-8
0-8
2416
80
80
80
5-3
80
113

Varianca je povprečen kvadrat odmika, torej povprečna vrednost zadnjega stolpca.

Varianca

2. Naloga

Na testu iz matematike so dijaki od možnih dosegli naslednje število točk:

Izračunaj aritmetično sredino in varianco tega nabora podatkov.
(Rezultate zaokroži na dve decimalki.)
Aritmetična sredina:
Varianca:

Rešitev Preveri

Za radovedne

Glede na naše formule uporabimo v Excelu za izračuna obeh vrednosti funkciji AVERAGE (za aritmetično sredino) in VARP (za varianco).

Rešitev

Aritmetična sredina nabora je enaka , varianca pa .

Pravilno si odgovoril na od dveh vprašanj.

Kazalo po Varianci

Uvod

Odgovor

Definicija

1.naloga

2.naloga

Standardni odklon

Še bolj kot varianca nas bo zanimal kvadratni koren iz variance, ki ga imenujemo standardni odklon.

Kvadratni koren iz variance označimo z malo grško črko sigma ()in imenujemo standardni odklon ali s tujko standardna deviacija.

Za nabor podatkov z aritmetično sredino je torej standardni odklon enak:

Izračunaj standardne odklone iz 1. in 2. naloge.
(Rezultate zaokroži na dve decimalki.)

  1. Naloga:

    1. Nabor:
    2. Nabor:
    3. Nabor:
      Prikaži 1. Nalogo
  2. Naloga:
    Prikaži 2. Nalogo

Preveri

Računanje z računalnikom

Če imamo veliko podatkov, je računanje standardnega odklona zamudno. V tem primeru si pomagamo s katerim od računalniških programov. Na sliki pod spodnjim gumbom vidimo, kako je s standardnim odklonom pri 2. nalogi opravil program Excel. V tem programu standardni odklon po naši formuli izračunamo z ukazom STDEVP (standardna deviacija na populaciji), v oklepaju pa navedemo, v katerih poljih so zapisani podatki iz našega nabora.

(Excel STDEVP.jpg)

Pravilno si odgovoril na od štirih vprašanj.

Naprej

1. Naloga

Izračunaj varianco naborov podatkov , , ; , , in , , .
(Rezultat zaokroži na dve decimalki.)

2. Naloga

Na testu iz matematike so dijaki od možnih dosegli naslednje število točk:

Izračunaj aritmetično sredino in varianco tega nabora podatkov.
(Rezultat zaokroži na dve decimalki.)

Pomen standardnega odklona

Kot vidimo, z uporabo računalnika standardnega odklona nabora podatkov ni težko izračunati, tudi če je nabor kar zajeten. Zato se v nadaljevanju ne bomo več ukvarjali z računanjem, pač pa bomo poskusili zaslutiti, kaj na ta podatek sporoča.

Pomen standardnega odklona

Temperature v šestih mestih sveta

V spodnji tabeli so vpisani podatki o povprečnih najvišjih dnevnih temperaturah v mesecih januarju, aprilu, juliju in oktobru v petih različnih krajih na svetu. Podatki so pridobljeni s spletnih strani Agencije za okolje RS in spletne strani infoplease.com.

Za vsak kraj posebej izračunamo aritmetično sredino nabora štirih podatkov in standardni odklon tega nabora. Večina podatkov je že vnešenih, manjkajoče pa izračunaj in vstavi (pomagaš si lahko npr. z Excelom). Rezultate zaokroži na dve decimalki.

janaprjuloktar. sredinast. odklon
Ljubljana31628168,84
Atene1219322321,50
Moskva-682488,50
Nairobi2524212523,75
Alcapulco31313232
Vancouver61322145,67

Prikaži odgovor Preveri

Tvoj rezultat je

Odgovor

janaprjuloktar. sredinast. odklon
Ljubljana316281615,758,84
Atene1219322321,507,23
Moskva-682488,5010,62
Nairobi2524212523,751,64
Alcapulco3131323231,500,50
Vancouver613221413,755,67

Poskusi ponovno

Pomen standardnega odklona

Preizkusi svoje razumevanje podatkov

Ugotovi pravilnost naslednjih izjav.

  1. Najmanjši standardni odklon opazimo pri Acapulcu, drugi najmanjši pa pri Nairobiju.

  2. Zgornje dejstvo pomeni, da so temperature v Acapulcu in Nairobiju med vsemi navedenimi mesti v povprečju najnižje.

  3. Standardi odklon za Ljubljano je manjši od tistega v Moskvi, kar kaže na to, da temperature v Moskvi skozi leto bolj nihajo kot temperature v Ljubljani.

Preveri


Temperature v 6. mestih sveta

janaprjuloktar. sredinast. odklon
Ljubljana316281615,758,84
Atene1219322321,507,23
Moskva-682488,5010,62
Nairobi2524212523,751,64
Alcapulco3131323231,500,50
Vancouver613221413,755,67

Pravilno!

Naprej

Ponovno preveri 1. izjavo.

Ponovno preveri 2. izjavo.

Ponovno preveri 3. izjavo.

Ponovno preveri 1. in 2. izjavo.

Ponovno preveri 1. in 3. izjavo.

Ponovno preveri 2. in 3. izjavo.

Ponovno preveri vse tri izjave.

Pomen standardnega odklona

Povzetek

Na podlagi izkušnje s tem primerom, pa tudi razmislekov v teku same vpeljave standardnega odklona, lahko zaključimo naslednje:

Standardni odklon je mera za razpršenost podatkov. Majhen standardni odklon pomeni, da so podatki blizu skupaj, velik pa, da so bolj razmetani.

Če imamo podana dva podatka: aritmetično sredino in standardni odklon, je slika o naboru podatkov jasnejša, kot če bi imeli samo prvi podatek.

Tako npr. podatka iz zgornjega primera za Atene in Nairobi sporočata, da sta povprečni temperaturi v mestih sorazmerno podobni, da pa v Atenah lahko pričakujemo tudi bistveno drugačne temperature od povprečne; v Nairobiju pa bi bila bistveno drugačna temperatura večje presenečenje.

Dodatne naloge

1. Naloga

Določi aritmetično sredino in standardni odklon naslednjih naborov podatkov. Rezultate zaokrožuj na tri decimalke.

a)

Aritmetična sredina:
Standardni odklon:

b)

Aritmetična sredina:
Standardni odklon:

Rešitev Preveri

Rešitev

a) Aritmetična sredina: 2,875
Standardni odklon: 1,833

b) Aritmetična sredina: 6
Standardni odklon: 2,878

Rezultat

Pravilno si odgovoril na od štirih vprašanj.

Dodatne naloge

2. Naloga

Spodnji nabori podatkov prinašajo število golov, ki so jih po 20 krogih tekmovanja dosegle ekipe v španski, italijanski, angleški in slovenski nogometni ligi.

Španija:
Italija:
Anglija:
Slovenija:

Izračunaj aritmetične sredine in standardne odklone teh naborov. Rezultate zaokrožuj na dve decimalki.
V kateri ligi imajo največjo aritmetično sredino? V kateri ligi imajo največji in v kateri najmanjši standardni odklon?

Pomagaš si lahko tudi s katerim od računalniških programov, recimo s programom Excel. Aritmetično sredino izračunamo z ukazom AVERAGE, standardni odklon pa z ukazom STDEVP. Kako ju prikličeš, lahko vidiš na sliki v gradivu. Najdeš jo pod gumbom z napisom Računanje z računalnikom. Izvedbo projekta

Španija:

Aritmetična sredina: Standardni odklon:

Italija:

Aritmetična sredina: Standardni odklon:

Anglija:

Aritmetična sredina: Standardni odklon:

Slovenija:

Aritmetična sredina: Standardni odklon:

Rešitev Preveri

Rešitev

Španija:

Aritmetična sredina: 23,83
Standardni odklon: 7,18

Italija:

Aritmetična sredina: 25,50
Standardni odklon: 7,95

Anglija:

Aritmetična sredina: 23,95
Standardni odklon: 8,30

Slovenija:

Aritmetična sredina: 28,10
Standardni odklon: 5,34

Največjo aritmetično sredino imamo v Sloveniji. Največji standardni odklon imajo v Angliji, najmanjšega pa v Sloveniji.

Rezultat

Pravilno si odgovoril na od šestih vprašanj.

0%
0%