Temeljni statistični pojmi - Urejanje in prikazovanje podatkov

Temeljni statistični pojmi - Urejanje in prikazovanje podatkov

Avtor: inter-es (vsebinsko), Katja Markovič (tehnično)

Statistične vrste

Za pojav, ki je predmet proučevanja, morate najprej zbrati podatke. S tem lahko začnete, ko je:

  • znan namen proučevanja in je
  • populacija točno opredeljena (krajevno, časovno in vsebinsko).

Naprej

Zbrane podatke morate urediti in prikazati v pregledni obliki. Če jih ni veliko, zadošča, da jih uredite po velikosti. Tako dobite urejene statistične vire, ki ste jih že spoznali - ranžirne vrste.

Naprej

Razvrčanje in urejanje je odvisno od vrste spremenljivke, števila podatkov in namena proučevanja.

Statistične vrste poimenujemo glede na vsebino proučevanja in vrsto spremenljivke. Statistiki uporabljajo naslednja poimenovanja:

Seveda so tudi podatki v teh vrstah urejeni po velikosti. Ni pa nujno.

Naprej

Časovne vrste

Zelo pogosto nas zanima gibanje pojavov v času, kot je n.pr. gibanje tečaja neke valute, plač, števila zaposlenih,... Zbrani podatki o vrednosti opazovane lastnosti enote populacije v določen času tvorijo časovno vrsto.

Pri primerjanju podatkov v različnih časih je zelo pomembno, da veste, ali se podatki nanašajo na določen trenutek ali na intervalno obdobje.

Naprej

Časovne vrste, ki prikazujejo podatke o vrednosti spremenljivke v določenem trenutku (na določen dan), se imenujejo trenutne ali momentne časovne vrste.

Časovne vrste, ki prikazujejo podatke o vrednosti spremenljivke v določenem obdobju - intervalu, se imenujejo razmične ali intervalne časovne vrste.

Naprej

Časovne vrste

Časovne vrste pogosto prikazujemo z grafikoni, saj na nazoren način posredujemo informacijo o proučevanem pojavu. Običajno uporabljamo

  • linijski ali

    (linijski.png)
  • stolpični grafikon.

    (stolpicni.png)

Naprej

Proučujete število zaposlenih v podjetju X v preteklih petih letih. Zbrali ste podatke o številu zaposlitev na dan 31. december za posamezna leta. Podatke ste vpisali v tabelo. Razmislite ali je časovna vrsta momentna ali intervalna in narišite graf.

Naprej

Ker ste opazovali število zaposlenih na dan 31. december - torej le en določen trenutek - govorimo o momentni oziroma trenutni časovni vrsti. Zaradi boljšega prikazovanja boste uporabili stolpični grafikon. Na abcisni osi boste zapisali leta opazovanja, na ordinatni osi pa število zaposlenih. Prvo leto je bilo v podjetju zaposlenih 185 ljudi, drugo leto 201 človek, tretje leto 192 ljudi in tako naprej.


Leto1.2.3.4.5.
Število zaposlenih185201192210215


(zaposleniLeto.png)
Stolpični grafikon

Naprej

Krajevne vrste

Pojave lahko proučujete po krajevni opredelitvi: občine, države, turistični kraji,... Zbrani podatki po krajevni opredelitvi tvojijo krajevno vrsto.

Naprej

Tako kot časovne vrste lahko tudi krajevne vrste prikazujete z linijskimi in stolpičnimi grafikoni. Lahko pa so v določenih primerih nazornejši kartogrami, mora piktogrami.

Lahko pa podatke razvrščamo tudi po drugih kriterijih, odvisno od namena proučevanja.

Primer

Primer krajevne vrste so podatki o številu prebivalcev v članicah EU:

(krajevneVrste.png)

Naprej

Stvarne vrste

Z razvrščanjem enot po vsebinski opredelitvi (po spolu, starosti, izobrazbi, kupcih, dobaviteljih, ...) dobimo stvarne vrste.

Primer

V tabeli so prikazani podatki, ki jih je pekarsko podjetje X izbralo o prodaji kruha kupcem - trgovinskim družbam za prodajo na drobno.

(prodajaKruha.png)
*Prirejeni podatki

Naprej

(prodajaKruha2.png)
Stolpični grafikon prodaje kruha po kupcih

Naprej

Frekvenčne porazdelitve

Včasih je zaradi velikega števila enot populacije potrebno podatke razvrščati v skupine - razrede, da dosežemo večjo preglednost in poenostavimo obdelavo. V razred zajamemo niz vrednosti numerične spremenljivke med dvema vrednostima, mejama razreda.

Primer

V mestni četrti A se je v kratkem zgodilo več prometnih nesreč. Policija je želela analizirati pojav z večč vidikov. Med drugim jo je zanimala starost ponesrečencev. Zbrali so podatke o starosti ponesrečencev v zadnjih dveh letih.

(ponesrecenci.png)

Naprej

Tako urejeni podatki so za obdelavo neprimerni, zato so se odločili, da jih bodo grupirali v razrede.

Naprej

Frekvenčne porazdelitve

Ko boste opravljali statistične raziskave, boste verjetno v zadregi, ko se boste odločali za definiranje razredov. Kolikšna naj bo širina razreda in posledično tudi število razredov? Opredeljeni morajo biti tako, da vsako enoto lahko razvrstite le v en razred. Zato razrede razmejite tako, da določite spodnjo in zgornjo mejo razreda.

Naprej

Razrede lahko razmejite s pomočjo Sturgesovega pravila, po katerem je približno število razredov , pri čemer je N število enot populacije.

Naprej

Razlika med spodnjo in zgornjo mejo razreda je širina razreda.

Naprej

Proučujemo starost ponestrečencev, kar pomeni, da jih bomo uvrstili v razrede po starosti. Razvrstili jih bomo v razrede po 10 let. Prešteli smo število ponestrečencev in podatke vpisali v dugi stolpec.


(ponesrecenci2.png)

Naprej

Frekvenca

Že v tabeli v prejšnjem primeru smo videli, da število ponesrečencev v posameznem razredu imenujemo frekvenca.

Število enot v posameznem razredu imenujemo frekvenca in jo označujemo z .

Naprej

Če seštejemo frekvence v vseh razredih, dobimo število enot proučevane populacije N.

Naprej

Relativna frekvenca

Grupiranje podatkov v frekvenčne razrede je veliko primernejše za opisovanje lastnosti populacije. Hitro lahko ugotovite, v kateri skupini je največ ponesrečencev.

Naprej

Lahko pa izračunate tudi deleže enot po posameznih razredih, ki vam podajo odgovor na naslednje vprašanje:

Naprej

Delež izračunate tako, da frekvenco delite s številom enot populacije.

Tako pridobljene podatke imenujemo relativne frekvence. Ker gre za deleže celotne populacije, jih lahko izrazimo v odstotkih.

Tako je bilo med ponesrečenci 14,3 % starih do 9 let, 26,2& % od 10 do 19 let, ...


(ponesrecenci3.png)

Naprej

Kumulativna in relativna frekvenca

Zanimivo je tudi naslednje vprašanje:

  • Koliko ponesrečencev je bilo starih manj od 10 let, 20 let, ... (izraženo v številu enot ali v odstotkih)?

Naprej

Na vprašanje boste odgovorili z računanjem kumulativne frekcvence - , ki nam pove število enot z enako ali manjšo vrednostjo od zgornje meje razreda j.

Kumulativno frekvenco izračunamo tako, da kumulativni frekvenci predhodnega razreda prištejete frekvenco razreda . V našem primeru je kumulativna frekvenca prvega razreda enaka 12.

Kumulativno frekvenco drugega razreda izračunamo tako, da kumulatini frekvenci predhodnega, to je prvega razreda, prištejemo frekvenco drugega razreda itn.



(ponesrecenci4.png)

Naprej

Kumulativna in relativna frekvenca

Če kumulativne frekvence delite s številom enot populacije, dobite relativne kumulativne frekvence , ki povedo delež enot z enako ali manjšo vrednostjo od zgornje meje razreda j.

Naprej

Da dobite relativno kumulativno frekvenco za prvi razred, morate torej deliti kumulativno frekvenco prvega razreda, to je 12, s številom enot populacije, to je 84. Dobite rezultat 0.143, kar je 14,3 odstotka.

(ponesrecenci5.png)

Naprej

Grafično prikazovanje frekvenčnih porazdelitev

Tako kot za statistične vrste so tudi za grafični prikaz frekvenčne porazdelitve primeren stolpični, kot tudi linijski grafikon.


Lahko prikažete frekvence (v primeru število ponesrečencev) po frekvenčnih razredih (v primeru po starostnih razredih - os x).


(ponesrecenci6.png)

Naprej

Lahko pa prikažete relativne frekvence po frekvenčnih ratredih. V tem primeru so na osi y relativne frekvence izražene v deležih (decimalno število ali odstotek).


(ponesrecenci7.png)
0%
0%