|
SREDNJE VREDNOSTI
Obrada rezultata pedagoškog eksperimenta pocinje statistickom analizom,
u kojoj se istrauje statisticka masa (osnovni skup ili populacija)
u stanju mirovanja, odnosno struktura staticke mase u datom momentu, ili
odredenom vremenskom periodu, u kome je ona posmatrana, s tim što
se vreme kao faktor uticanja ne uzima u obzir.
Srednji statisticki podaci koji su tabelarno ili graficki prikazani slue
za statisticku analizu, s ciljem istraivanja pravilnosti i zakonitosti
posmatranih masovnih pojava. Statisticka analiza i ima taj zadatak da
primenom razlicitih metoda i postupaka rašclani i uporedi podatke,
otkrije i formuliše zakonitosti koje vladaju u posmatranoj masovnoj
pojavi
Koristeci relativne brojeve i raspodelu frekvencija moe se steci
izvestan globalni utisak o posmatranoj pojavi i posmatranom statistickom
skupu. Ipak za dalju i svrsishodniju analizu potebne su nam preciznije
metode kojima cemo masu statistickih podataka obraditi tako da postane
upotrebljiva u procesu donošenja odluka.
Analizu statistickih podataka moemo vršiti tako što cemo
definisati izvesne pokazatelje ili parametre cije ce nam vrednosti izraavati
odredene sumarne karakteristike datih podataka. Vrednost sumarnih parametara
omogucice donošenje zakljucaka o odredenoj pojavi ili procesu koji
su izraeni posmatranim podacima.
Prva grupa takvih parametara su tzv. srednje vrednosti ili proseci. Veoma
cesto se koriste i u svakodnevnom ivotu (npr. prosecan licni dohodak
ili prosecna produktivnost itd.). Ovi parametri pokazuju neku centralnu
vrednost posmatranog obeleja X na elementima statistickog skupa.
Srednje vrednosti ili mere centralne tendencije prezentuju sredinu statisticke
serije. Najcešce se oko te srednje vrednosti grupiše najveci
broj jedinica. Srednje vrednosti se nalaze izmedu najmanje i najvece vrednosti
obeleja.
Sednja vrednost je reprezentativna vrednost, koja po datim merilima,
zamenjuje sve vrednosti obeleja u datoj seriji. U statistickoj literaturi
dobila je naziv reprezentativna vrednost zato što predstavlja i zameljuje
sve vrednosti serije, jer iz njih proistice i nosi njihove zajednicke
karakteristike.
Kao reprezentativni pokazatelj serije srednja vrednost karakteriše
statisticki skup. Ako se posmatra jedan statisticki skup po jednom numerickom
obeleju i pode se od individualnih vrednosti tog obeleja,
teško ce se uociti bitna i zajednicka karakteristika cak i kad su
pojedinacni podaci, grupisanjem u serije, svedeni na manji broj. Zato
se nastoji da se ta serija zameni jednim brojem koji omogucava da se uoci
karakteristika posmatranog skupa.
Srednje vrednosti: aritmeticka, harmonijska i geometrijska sredina, zatim
modus i medijana.
U zavisnosti od nacina definisanja, srednje vrednosti se dele na izracunate
i pozicione.
2. SREDNJE VREDNOSTI
Srednje vrednosti su vrednosti obeleja koje na specifican nacin
reprezentuju citavu statisticku masu, odnosno zamenjuju sve vrednosti
u statistickoj seriji i karakterišu statisticku masu u celini.
Srednje vrednosti ili mere centralne tendencije zauzimaju u statistici
vrlo znacajno mesto i vrlo se cesto primenjuju. Centralna tendencija je
tenja ka okupljanju podataka skupa oko jedne centralne vrednosti,
koja je opšta i reprezentativna za celu distribuciju. Znacaj mera
centralne tendencije je u tome što one sintetizuje citav niz pojedinacnih
vrednosti jednog skupa i njihova uloga je da, zanemarujuci individualne
razlike izmedu podataka skupa, istaknu onu velicinu koja je za sve njih
karakteristicna i koja moe da slui kao sredstvo za uporedivanje
raznih serija.
Neophodno je da se srednja vrednost odreduje iz homogenog skupa da bi
imala znacaj reprezentativne i tipicne vrednosti. U slucaju da je skup
heterogen, potrebno je najpre izvršiti podelu skupa u homogene delove,
a zatim ce se posebno odrediti srednje vrednosti za svaki od tih delova.
Moguce je naci srednju vrednost i u heterogenom skupu i racunarski i formalno,
ali takva vrednost nema znacaj statisticke srednje vrednosti kao reprezentativnog
pokazatelja. Pri odredivanju i primeni srednjih vrednosti mora biti zadovoljen
princip homogenosti statistickog skupa.
Prema tome da li se izracunavaju ili odreduju prema poloaju pojedinih
vrednosti obeleja, srednje vrednosti se mogu podeliti u dve grupe:
potpune srednje vrednosti i poloajne srednje vrednosti.
Potpune srednje vrednosti, racunaju se upotrebom svih podataka u statistickom
nizu. Potpune srednje vrednosti su: aritmeticka sredina, harmonijska sredina
i geometrijska sredina.
Poloajne srednje vrednosti odreduju se poloajem podataka u
nizu. Najvanije poloajne srednje vrednosti su: modus i medijana.
Svaka od pomenutih srednjih vrednosti odreduje se posebnim statisticko-matematickim
metodama i ima odredene karakteristike. Srednje vrednosti se ne mogu izracunati
kod svih serija. One se izracunavaju, odnosno odreduju samo kod numerickih
(rasporeda frekvencija), a mogu se izracunati iz vremenskih serija. Za
utvrdivanje karakteristika pasporeda frekvencija one predstavljaju polaznu
osnovu.
Srednja vrednost jedne serije ne moe biti manja od najmanje vrednosti
obeleja, niti veca od najvece vrednosti obeleja. Srednja vrednost
moe biti i neka vrednost koja uopšte ne postoji u seriji. Srednja
vrednost moe imati i decimalan broj, i ako se vrednosti obeleja
izracunavaju u celim brojevima (na primer: prosecan broj clanova domacinstva
moe biti 3,4).
Poeljno je da srednje vrednosti imaju sledece osobine:
1. Ako su sve vrednosti posmatranog obeleja X na statistickom
skupu medusobno jednake onda i njihova srednja vrednost treba da je jednaka
toj vrednosti.
2. U datom statistickom skupu postoji najmanja i najveca vrednost posmatranog
obeleja X. Srednja vrednost treba da je veca od najmanje a manja
od najvece vrednosti obeleja X.
3. Srednja vrednost treba da zavisi od svih vrednosti obeleja X
na celim statistickom skupu.
2.1.ARITMETICKA SREDINA
Ovo je najpoznatija srednja vrednost. U svakodnevnom ivotu najviše
se koristi aritmeticka sredina kao srednja vrednost. Zato se pod pojmom
prosek misli na aritmeticku sredinu. Aritmeticka sredina niza brojeva
je broj koji se dobije kada se njihov zbir podeli sa ukupnim brojem clanova
tog niza.
Aritmeticka srednja vrednost ili prosecna srednja vrednost ili samo srednja
vrednost ima najširu primenu u statistici. Ponaša se kao ”ravnotena
tacka” u skupu, a nedostatak joj je što na njenu vrednost uticu
ekstremne vrednosti (”outliers”). Srednja vrednost se izraava
u istim jedinicama kao i osnovni podaci.
Najcešce upotrebljivana mera centralne tendencije jeste aritmeticka
sredina. Ona je ujedno i najlakša za razumevanje obzirom da se neretko
koristi u svakodnevnom ivotu (najcece koristimo rec ‘prosek’
da izrazimo upravo aritmeticku sredinu). Aritmeticka sredina predstavlja
prosecnu vrednost nekog kontinuiranog niza brojeva.
U statistickoj analizi aritmeticka sredina najcešce se izracunava
za vrednosti numerickog obeleja, pa je polazna velicina za izracunavanje
aritmeticke sredine je zbir vrednosti numerickog obeleja elemenata
osnovnog skupa.
Neophodan uslov za pravilnu primenu aritmeticke sredine jeste da podaci
u seriji pokazuju dovoljan stepen homogenosti a kriterijum za odredivanje
te homogenosti zavisi od prirode i vrste pojave koja je prikazana u seriji
kao i da znamo suštinu i smisao rezultata kojeg elimo da dobijemo.
Aritmeticka sredina ima dva osnovna nacina izracunavanja.
Prema tome da li su podaci grupisani ili ne, razlikuju se:
• prosta aritmeticka sredina ,
• ponderisana (sloena, vagana) aritmeticka sredina.
Prvi nacin odnosi se na izracunavanje iz prostih serija, tj. iz onih
serija u kojima se svaki podatak javlja samo po jedanput. Ako se aritmeticka
sredina odreduje za jedan obican statisticki niz, onda se ona naziva prosta
ili jednostavna aritmeticka srednja vrednost. Jednostavna aritmeticka
srednja vrednost izracunava se tako što se zbir svih podataka podeli
njihovim brojem.
Drugi nacin izracunava aritmeticke sredine primenjuje se kod sredenih
serija (serije distribucije frekvencija), tj. kod onih serija u kojima
se pojedini podaci (modaliteti) javljaju u nejednakim frekvencijama, i
tu se uzima i obzir velicina frekvencije svakog modaliteta. Svaki modalitet
se ponderiše, vaga, svojom frekvencijom pa se ova aritmeticka sredina
naziva ponderisana (vagana) aritmeticka sredina.
Ponderisana aritmeticka srednja vrednost izracunava se tako što se
zbir svih proizvoda numerickih podataka i odgovarajucih frekvencija podeli
ukupnim zbirom frekvencija,odnosno ukupnim brojem podataka.
Aritmeticka sredina moe se racunati i za više skupova i to
je aritmeticka sredina aritmetickih sredina.
Najširu upotrebu u statistickoj analizi, a i šire, ima aritmeticka
sredina. Izracunava se tako što se zbir svih vrednosti obeleja
podeli njihovim brojem. Ako posmatrano obeleje oznacimo sa X, njegove
vrednosti sa x1 ,x2,.... xi,.... xn, imacemo:
µ = x1+ x2 +...+ xn = 1 ?x i ili prostije µ = ? x
N N i=1 N
Ako, primera radi, pet slucajno anketiranih turista dnevno troše:
320, 330, 360, 380 i 410 dinara, prosecna dnevna potrošnja, odnosno
aritmeticka sredina iznosice:
µ = ? x = 320 + 330 + 360 + 380 + 410 = 1800 = 360
N 5 5
U ovom prostom primeru uocljivo je da se svaka vrednost javlja jedanput
(sa frekvencijom 1). Za sve ovakve negrupisane serije prosek se, kao što
vidimo, utvrduje jednostavno, rec je o tzv.prostoj aritmetickoj sredini.
Znatno cešce imamo posla sa grupisanim podacima u vidu rasporeda
frekvencija, tj.sa skupovima unutar kojih se svaka vrednost obeleja
moe javiti više puta. Ako, u opštem slucaju, vrednosti
obeleja oznacimo sa x1, x2,.... xi,.... xn, a odgovarajuce frekvencije
sa f1, f2, ... fi, ... fn , aritmeticka sredina ce biti:
µ = f1 x1 + f2 x2 + ... + fn xn , tj.
N
n
µ = 1 ? fi xi ili prostije
N i=1
µ = ? f x , gde je
N
n
N = f1 + f2 + ... + fn = ? fi = ? f.
i=1
Ovako utvrdena prosecna vrednost poznata je kao ponderisana aritmeticka
sredina jer se sve vrednosti uzimaju u zbir onoliko puta koliko se one
i javljaju unutar rasporeda. Ponderacioni faktor je, dakle, frekvencija
( f ).
Posmatrajmo, na primer, dnevnu potrošnju jednog skupa slucajno anketiranih
domacih turista. Rezultat ankete u vidu rasporeda frekvencija dat je u
tabeli 1.
Tabela 1. Struktura skupa stranih turista prema iznosu dnevne potrošnje
( u dolarima)
Dnevna potrošnja Broj turista (f) X fx
1 2 3 4
Do 220 5 200 1000
220-260 15 240 3600
260-300 45 280 12600
300-340 25 320 8000
340-380 8 360 2880
380 i više 2 400 800
? 100 28880
U ovom rasporedu vidimo još jednu mogucnost razgranicenja grupisanih
intervala. Umesto decimalnim brojem (na primer 220 - 259,9), ono je, kao
što vidimo, izvršeno opisno. Radi izracunavanja prosecne dnevne
potrošnje (ponderisane aritmeticke sredine) za posmatrani skup turista,
moraju se utvrditi sredine grupnih intervala (kolona 3 u tabeli 1.) i
pomnoiti odgovarajucim frekvencijama (kolona 2). Imacemo, dakle:
n
µ = 1 ? fi xi = ? f x = 28880 = 288,80.
N i=1 N 100
Ponderisana aritmeticka sredina, tj.prosecna dnevna potrošnja za
posmatrani skup turista, iznosi 288,80 dolara, koliko, u proseku, svaki
od posmatranih turista troši dnevno, pri cemu stvarna potrošnja
svakog pojedinacno po pravilu odstupa od ovog proseka.
Aritmeticka sredina, uz osobine koje karakterišu svaku srednju vrednost,
ima i izvesne karakteristike (analiticke i matematicke prirode) znacajne
za njeno izracunavanje i primenu u statistickom radu.
Aritmeticka sredina, jedan broj koji reprezentuje ceo skup podataka,
ima vane prednosti. Prvo, ona je odomacena i intuitivno jasna vecini
ljudi. Drugo, svi podaci imaju aritmeticku sredinu i to samo jednu. Aritmeticka
sredina je pogodna za korišcenje u vecini statistickih procedura.
Nedostatak aritmeticke sredine je što na njenu vrednost uticu ekstremne,
jako male i jako velike, vrednosti. Drugi problem što svaki podatak
iz serije ulazi u obracun što nije pogodno za serije sa velikim brojem
podataka. Treci problem je što ne moe da se izracuna za otvorene
klasne intervale tipa "vece od" ili "manje od".
2.2.GEOMETRIJSKA SREDINA
U analizama vremenskih serija najpogodnija srednja vrednost je geometrijska
sredina. Njeno izracunavanje je malo komplikovanije od izracunavanja aritmeticke
sredine jer zahteva i operacije mnoenja i korenovanja realnih brojeva.
Geometrijska sredina niza brojeva je N-ti koren iz proizvoda njegovih
clanova. Da bi odredili geometrijsku sredinu za svako N vrednosti obeleja
X moraju biti pozitivne. Zato je i upotreba geometrijske sredine ogranicena
samo na ona obeleja koja su pozitivna.
Geometrijska sredina je izracunata srednja vrednost ali se razlikuje od
aritmeticke sredine i po svojim karakteristikama i po nacinu izracunavanja.
Geometrijska sredina dobija se kada se iz proizvoda pojedinih vrednosti
obeleja date serije izvadi koren ciji je izloilac ravan broju
svih clanova serije. Geometrijska sredina je N-ti koren proizvoda svih
vrednosti negrupisanog numerickog obeleja jednog niza.
Geometrijska sredina primjenjuje se u analizi vremenskih nizova. Pomocu
nje izracunava se prosecna stopa promene pojave. Geometrijska sredina,
kao i svaka srednja vrednost, nalazi se izmedu najvece i najmanje vrednosti
niza za koji se izracunava. Brojcano se razlikuje od aritmeticke sredine,
osim ako svi clanovi niza nisu jednaki. Geometrijska sredina je uvek manja
od aritmeticke.
To je srednja vrednost koja izracunava proporcionalne promene izmedu podataka
posmatrane serije, za razliku od aritmeticke koja izravnava apsolutne
razlike izmedu podataka. Ona se, dobija kada se iz proizvoda pojedinacnih
vrednosti obeleja date serije izracunava koren ciji je izloitelj
jednak broju clanova te serije.
Ako posmatrano obeleje oznacimo sa x , njegove pojedinacne vrednosti
sa x1, x2,... xn, a njihov broj sa N, onda ce po prethodno datoj definiciji
geometrijska sredina biti:
N
G = v x1 * x2 ...* xi... xn*
Izracunavanje geometrijske sredine ima smisla samo za ona obeleja
cije su vrednosti vece od nule. Polazeci od ove predpostavke, logaritmovanjem
prethodnog izraza dobijamo:
n
log G = 1 ( log x1 + log x2 +... + log xn) = 1 ? log x i , odnosno
N N i=1
Antilogaritmovanjem:
n
G = v1 ? fi log xi
N i=1
Dobijamo obrazac za izracunavanje proste geometrijske sredine, slucaj
kada se svaka vrednost u seriji javlja samo po jedanput.
Za razliku od negrupisanih podataka (prosta geometrijska sredina), kod
rasporeda frekvencija izracunavamo ponderisanu geometrijsku sredinu prema
sledecem obrascu:
G = x1 f1 * x2 f2* ... * xn fn
n
Gde je: N = f1 + f2 + ... fi + ... fn = 1 ? fi log xi ,
N i=1
Logoritmovanjem dobijamo:
Log G = fi log xi
Odnosno antilogoritmovanjem:
G =
Uzmimo za primer, podatke iz tabele 2. na osnovu kojih ce ponderisana
geometrijska sredina dnevne potrošnje turista, odnosno logaritam
geometrijske sredine biti:
Tabela 2. Obracun geometrijske sredine
Sredine grup.intervala Broj turista
x f log x f log x
200 5 2,30103 11,50515
240 15 2,38021 34,70315
280 45 2,44716 110,1220
320 25 2,50515 62,62875
360 8 2,55630 20,45040
400 2 2,60206 5,20412
? 100 245,61377
n
Log G = 1 ? f log x = 1 (5 * log 200 + 15 * log 240 + ... + 2 * log 400)
=
N i=1 100
= 245,61377 = 2,45614.
100
Pošto je nama potrebna geometrijska sredina a ne njen logoritam
treba izvršiti antilogoritmovanje, pa ce odavde geometrijska sredina
iznositi:
G = v2,45614 = 285,8.
Ovo pokazuje da je za izracunavanje ponderisane geometrijske sredine
potrebno logaritme vrednosti x pomnoiti sa odgovarajucim frekvencijama
i te proizvode sabrati.
Kao što vidimo, geometrijska sredina dnevne potrošnje turista
u našem primeru manja je od aritmeticke sredine (288,8 dolara). Opšte
je pravilo da je geometrijska sredina manja od aritmeticke za svaki raspored
(izuzimajuci slucaj kada su sve vrednosti jednake), mada treba istaci
da se geometrijska sredina, zbog svojih osobina, retko koristi kao pokazatelj
centralne tendencije rasporeda frekvencija.
Geometrijska sredina je, kao i aritmeticka, veca od najmanje i manja
od najvece vrednosti u posmatranoj seriji, odnosno:
x1 < G < xn,
a u slucaju jednakosti ovih vrednosti i ona se sa njima izjednacuje:
x1 = x2 = ... = xn = a = G.
Kao i aritmeticka srednja vrednost i geometrijska ima izvesna specificna
svojstva koja odreduju njenu primenu:
1) izracunavanje geometrijske sredine ima znacaja samo za seriju pozitivnih
vrednosti u kojoj ni jedan clan nije nula;
2) na njenu velicinu uticu svi clanovi serije, sa tim što manje vrednosti
dobijaju srazmerno veci uticaj nego vece;
3) geometrijska sredina je, za istu seriju podataka, manja od aritmeticke
sredine i
4) dok aritmeticka sredina izravnava razlike izmedu vrednosti obeleja,
dotle geometrijska sredina izravnava razlike izmedu vrednosti obeleja,
dotle geometrijska sredina izravnava njihove odnose.
Ako je neki od podataka u seriji jednak nuli, onda se ne izracunava geometrijska,
kao ni harmonijska sredina (u tom slucaju je G = H = 0). Osim toga, ako
serija sadri neparan broj negativnih vrednosti obeleja, njen
prosek ne moe da se izracuna primenom geometrijske sredine.
Najvanija osobina geometrijske sredine, narocito u ekonomskim istraivanjima,
ta je da izracunava odnose, tj.proporcionalne promene podataka, zbog cega
je proizvod odnosa geometrijske sredine prema manjim vrednostima posmatrane
serije jednak proizvodu odnosa vecih vrednosti prema geometrijskoj sredini.
Ovo svojstvo je cini narocito korisnom u istraivanju dinamike, gde
su vanije razlike u odnosima nego u apsolutnim velicinama.
Ako se, na primer, cena jednog turistickog aranmana udvostruci,
kaemo da se index cene povecao od 100 na 200. ako se suprotno, cena
smanji za polovinu, onda je index opao od 100 na 50. Jasno je da sredina
ova dva indeksa treba da bude 100, a geometrijska sredina upravo daje
tu vrednost:
G = v200 * 50 = 100
Aritmeticka sredina bi u ovom slucaju dala pogrešnu vrednost (125),
zbog cega se geometrijska sredina i koristi za izravnavanje indeksnih
brojeva, tj.kao njihova srednja vrednost.
Tabela 3. Promet stranih turista u Evropi od 1990 -1999. godine
(u milionima)
Godina Broj turista Lancani indeksi (tempo razvitka u %) log x
1 2 3 4
1990 188,173 - -
1991 206,339 109,65 2,04001
1992 217,947 105,63 2,02379
1993 235,540 108,07 2,03371
1994 245,567 104,26 2,01812
1995 257,684 104,93 2,02090
1996 279,685 108,54 2,03559
1997 289,893 103,65 2,01557
1998 301,191 103,90 2,01662
1999 325,444 108,05 2,03362
2000 347,232 106,69 2,02812
20,26605
Geometrijska sredina se najcešce primenjuje za izracunavanje srednjeg
tempa razvitka. Primenimo sada geometrijsku sredinu za izracunavanje srednjeg
tempa razvitka prometa stranih turista u Evropi od 1990. do 1999. godine,
prema podacima iz tabele 3. Da bi se izracunao srednji tempo razvitka
prometa stranih turista u posmatranom periodu, potrebno je da se izracuna
geometrijska sredina iz tempa razvitka, odnosno, da se izracuna geometrijska
sredina lancanih indeksa. To znaci da se najpre mora naci tempo razvitka
u procentima – lancani indeksi, a zatim odgovarajuci logaritmi za
lancane indekse ove serije, koje unosimo u cetvrtu kolonu tabele 3.
Lancani indeks se dobija kao odnos vrednosti date pojave u posmatranom
vremenskom intervalu (godini, kvartalu, mesecu) prema njenoj vrednosti
u prethodnom intervalu. Za ilustraciju postupka izracunavanja stope rasta
posluicemo se podacima tabele 3., cija poslednja kolona sadri
lancane indekse.
Podaci u tabeli pokazuju da je turisticki promet u 1991.godini za 9,65%
veci nego u 1990.godini, u 1992.godini za 5,63% veci nego u 1991.godini
itd. To ukazuje da je turisticki promet nekad rastao više, a nekad
manje u odnosu na predhodnu godinu. Na osnovu ovih podataka izracunace
se koliko procenata je promet turista u proseku rastao, i to pomocu geometrijske
sredine po radnom obrascu:
G = v? log x ,
N
sa tim što je obeleje x tempo razvitka. Prema tome, srednji
tempo razvitka iznosi:
G = v? log x = v20,26605 = v2,026605 = 106,32%
N 10
a srednji tempo rasta, ili stopa rasta, iznosi 6,32%. To znaci da je
promet turista svake godine u proseku bio 6,32% veci od turistickog prometa
prethodne godine. Sa druge strane, izracunata geometrijska sredina lancanih
indeksa pokazuje da je relativan rast prometa turista u periodu od 1990.
do 1999.godine, iznosio 106,32, što znaci da se broj turista u posmatranom
periodu svake godine povecavao prosecno za 6,32% (racunato kao geometrijska
sredina lancanih indeksa).
2.3.HARMONIJSKA SREDINA
Za analizu onih pojava ciji je intenzitet obrnuto proporcionalan vrednostima
posmatranog obeleja najpogodnija srednja vrednost je harmonijska
sredina. Na primer, pri ispitivanju produktivnosti meri se vreme potrebno
za izradu nekog proizvoda ali je produktivnost obrnuto proporcionalna
tom vremenu pa je zato harmonijska sredina najpogodnija srednja vrednost
za razmatranje.
Harmonijska sredina niza brojeva je reciprocna vrednost aritmeticke sredine
reciprocnih vrednosti clanova tog niza.
Mada u daleko manjoj upotrebi nego što su aritmeticka i geometrijska
sredina, harmonijska sredina nalazi svoju primenu u istraivanju
proseka u slucajevima kada se radi o obrnuto proporcionalnim velicinama.
Definiše se kao reciprocna vrednost aritmeticke sredine reciprocnih
vrednosti obeleja.
Upotreba harmonijske sredine (H) još je ogranicenija od upotrebe
geometrijske sredine. Ona se koristi samo u specijalnim slucajevima gde
se problem moe postaviti i u obrnutom, reciprocnom vidu.
U zavisnosti od toga da li su podaci negrupisani ili grupisani, moe
se izracunati prosta ili ponderisana (sloena) harmonijska sredina.
Prosta harmonijska sredina je reciprocna vrednost proste aritmeticke sredine
odredene iz reciprocnih vrednosti obeleja.
Ako se sa x1, x2, x3 ... xn oznace vrednosti obeleja, a sa N njihov
broj, obrazac za utvrdivanje proste harmonijske sredine bice:
H = N .
N
? 1
i=1 xi
Harmonijsku srednju vrednost, kao i geometrijsku, ima smisla izracunati
samo za ona obeleja cije su vrednosti razlicite od nule. Ova mera
proseka osetljiva je na male vrednosti clanova serije.
Za ilustraciju postupka izracunavanja proste harmonijske sredine neka
poslui serija od tri clana: x1 = 4, x2 = 8, x3 = 16.
H = 3 = 3 = 48 = 6,86
1/4+1/8+1/16 4 + 2 + 1 7
16
Za ukazivanje na smisao njene primene moe se uzeti sledeci primer:
u procesu proizvodnje jedan radnik utoši za izradu jednog proizvoda
3 minuta, a drugi radnik 5 minuta. Koje prosecno vreme troše oba
radnika?
Aritmeticka sredina utrošenog radnog vremena je: (3+5)/2 = 4 minuta.
Ako je za jedinicu proizvoda utrošeno prosecno 4 minuta, kao što
se vidi na osnovu izracunate aritmeticke sredine, onda ce se u jednom
casu proizvesti 15 proizvoda (60/4 = 15), a za jedan radni dan 105 proizvoda
(7*17 = 105). Oba radnika proizvešce 210 proizvoda. Ako se ovaj obracun
sprovede prema individualno utrošenom radnom vremenu, prvi radnik
sa utroškom od 3 minuta u sedmocasovnom radnom danu proizvešce
140 proizvoda (60/3 = 20*7 = 140). Drugi koji troši 5 minuta proizvešce
84 proizvoda (60/5 = 12*7 = 84). To znaci da ce oba radnika prema individualno
utrošenom vremenu izraziti 224 proizvoda u toku jednog radnog dana.
Kako objasniti razliku izmedu rezultata rada ocenjenog pomocu aritmeticke
sredine i stvarnog? Obracun proseka na osnovu aritmeticke sredine ne moe
da se koristi u ovom primeru, njemu odgovara prosek obracunat po harmonijskoj
sredini:
H = 1+1 = 2 = 30 = 3,75.
1/3 + 1/5 5 + 3 8
15
Sa ovako utvrdenim prosekom za jedan radni cas radnik proizvode 16 proizvoda,
a za sedam casova 112 proizvoda, što znaci da dva radnika proizvedu
224 proizvoda, što odgovora obracunu na osnovu stvarnih podataka.
Prosecna produktivnost ova dva radnika iznosi 16 proizvoda za 1 cas, ili
reciprocno, potrebno je 3,75 minuta za izradu jednog komada.
Kod serija ciji podaci pokazuju reciprocne odnose ili njihove frekvencije
nisu iste izracunava se ponderisana harmonijska sredina. Ona ce tada biti
reciprocna vrednost aritmeticke sredine reciprocnih vrednosti obeleja
pomnoenih odgovarajucim frekvencijama.
2.4.MODUS
Kako se i iz naziva moe videti, pozicione srednje vrednosti, za
razliku od izracunatih, odreduju se na osnovu mesta – pozicije,
koju zauzimaju u seriji. Najcešce korišcene medu njima su modus
i medijana.
Svaka srednja vrednost, izracunata ili poziciona, ima svoje mesto, kako
sa aspekta njenog znacaja, tako i sa aspekta njenog izracunavanja, odnosno
odredivanja. Koju od njih odabrati kao najpodesniju karakteristiku odgovarajuceg
rasporeda frekvencija zavisi, u krajnjoj liniji, od cilja istraivanja.
Od pozicionih srednjih vrednosti najcešce se primenjuje modus (??).
Modus je vrednost statistickog obeleja koje se najcešce javlja
u nekom nizu, tj.vrednost obeleja kojoj pripada najveca frekvencija.
Modus ili modalna vrednost (obeleava se sa Mo) ne zavisi od same
pozicije u statistickom nizu vec od frekvencije. To je ona vrednost koja
ima najvecu frekvenciju i to je cesto jedina informacija o skupu koja
se dobija modusom. Statisticke grupe mogu biti unimodalne, odnosno da
imaju samo jedan modus, bimodalne sa dva modusa ili multimodalne - sa
više modusa, ali je isto tako moguce da u jednom statistickom skupu
ne moe uopšte da se odredi modus.
Kod negrupisanih podataka modus se ne izracunava, vec se samo posmatranjem
niza iz njega izdvaja ona vrednost koja ima najvecu frekvenciju. Na isti
nacin se odreduje modus kod podataka koji su grupisani kao numericke vrednosti
sa odgovarajucim frekvencijama.
Modus je ona vrednost obeleja X koji ima najvecu frekvenciju u posmatranom
statistickom skupu ili ona vrednost u cijoj se okolini najcešce pojavljuju
izmerene vrednosti obeleja X na statistickom skupu. Kad je obeleje
x grupisano i dato raspodelom frekvencija za modus se uzima sredina onog
grupnog intervala koji ima najvecu frekvenciju.
Modus je vrednost obeleja koja se najcešce javlja u seriji,
tj. vrednost klase sa najvecom frekvencijom. Ukoliko se svaki podatak
u seriji javlja samo jedanput modus ne postoji. Serije koje imaju jedan
modus nazivaju se unimodalne, serije sa dva modusa nazivaju se bimodalne
i ako imaju više od dva modusa nazivaju se polimodalne. Dakle, na
modus ne uticu ostale vrednosti obeleja, vec se jednostavno odreduje
na osnovu najvece koncentracije jedinica. Modus se oznacava sa Mo.
Modus je vrednost obeleja koja u posmatranoj seriji ima najvecu
frekvenciju – najcešce se javlja. To je, dakle, vrednost oko
koje se koncentriše najveci broj clanova serije i zato se smatra
najtipicnijom vrednosti u seriji.
Ako se u posmatranoj seriji samo jedna vrednost javlja najviše puta
(ima najvecu frekvenciju), kaemo da je unimodalna, a ako postoje
dve ili više vrednosti sa istom – najvecom frekvencijom, serija
je bimodalna, odnosno multimodalna. Takode, moe se dogoditi da neka
distribucija frekvencije uopšte nema modusa.
Za rasporede frekvencija po neprekidnim vrednostima obeleja modus
nije tako uocljiv. Treba ga traiti u intervalu sa najvecom frekvencijom,
tzv. modalnom intervalu. Odreduje se tzv.interpolacijom kroz modalni interval
pomocu obrasca:
Mo = L1 + f 2 - f1 * i
(f2 - f1) + (f2 - f3)
Gde je Mo vrednost modusa, L1 donja granica modalnog intervala, i velicina
grupnog intervala a f1, f 2 i f3 frekvencije predmodalnog, modalnog i
poslemodalnog intervala respektivno.
Za raspored dat u tabeli 3.modalni interval bice treci po redu (260-300)
jer je njegova frekvencija f 2 = 45 najveca. Donja granica tog intervala,
L1 je 260, frekvencija predmodalnog intervala, f1 = 15, poslemodalnog,
f3 = 25, a velicina grupnog intervala, i = 40, pa ce modus, po prethodno
datom obrascu:
Mo = L1 + f 2 - f1 * i = 260 + 45 – 15 * 40 = 284.
(f2 - f1) + (f2 - f3) (45-15)+(45-25)
Znaci, za posmatrani skup turista najcešci iznos dnevne potrošnje
je 284 dolara.
Modus kao srednja vrednost pogodan je pokazatelj za unimodalne rasporede,
i to posebno ako je frekvencija modalne vrednosti velika. U tom slucaju
modus je tipicna vrednost koja pokazuje u pravom smislu centralnu tendenciju
posmatrane serije.
Iako se znatno rede primenjuje od aritmeticke sredine, modus je za neke
vrste istraivanja pogodniji, jer daje jasniju informaciju o tendenciji
okupljanja vrednosti obeleja oko srednje vrednosti. Tako, na primer,
za sagledavanje turisticke tranje jasniju konkretnu informaciju
daje broj aranmana koji se najcešce trai, nego prosecan
broj koji moe biti i decimalan pa samim tim i nedovoljno informativan.
Isto tako, najcešca cena, cena po kojoj se proda najveci broj aranmana,
predstavlja znacajnu karakteristiku turistickog trišta i neophodnu
dopunu prosecne cene.
Modus se, za razliku od izracunatih srednjih vrednosti, moe koristiti
i kao mera centralne tendencije atributivnih serija. Na primer, ako je
medu licima koja trae zaposlenje u preduzecima turisticke privrede
najveci broj onih koji imaju diplomu Više turisticke škole,
onda se završena Viša turisticka škola kao modalitet obeleja
školske spreme moe smatrati modusom.
Pri korišcenju modusa treba imati u vidu, sa obzirom na postupak
obracuna, da na njegovu velicinu utice nacin grupisanja podataka. Naime,
promenom velicine grupnih intervala ili njihovih granica, pri istim intervalima,
mogu se dobiti razlicite vrednosti modusa. Sa druge strane modus je potpuno
neosetljiv na promene frekvencija raznih vrednosti obeleja, ukoliko
frekvencija obeleja, koja je jednaka modusu, ostaje i dalje najveca.
2.5.MEDIJANA
Medijana (??) je poziciona srednja vrednost i nalazi se u sredini serije,
ciji su clanovi rasporedeni po velicini vrednosti obeleja. Medijana
je vrednost statistickog obeleja koja statisticki skup deli na dva
jednaka dela.
Medijana predstavlja drugaciju meru centralne tendencije u odnosu na
aritmeticku sredinu. Medijana, takode, jeste neka vrsta prosecne vrednosti.
Medijana nekog kvatnitativnog skupa podataka jeste srednji broj u situaciji
kada se sve vrednosti poredaju od najnie do najviše ili obrnuto.
Ukoliko je niz brojeva neparan, onda je medijana broj u sredini. Ukoliko
je broj paran, onda je medijana srednja vrednost srednja dva broja. U
nekim situacijama medijana je bolja mera centralne tendencije u odnosu
na aritmeticku sredinu. Ovo zato što je medijana manje senzitivna
na ekstremno male i ekstremno velike vrednosti.
Medijana je ona vrednost obeleja koja se nalazi u sredini serije
ciji su podaci sredeni po velicini od najmanje do najvece vrednosti, odnosno
vrednosti koja citav skup podataka serije deli na dva jednaka dela, tako
da jedna polovina ima manju, a druga polovina vecu vrednost od medijane.
Za razliku od aritmeticke sredine koja se definiše kao tipicna vrednost
obeleja, medijana je vrednost obeleja za tipicnu jedinicu.
Zbog ove specificnosti medijana je poziciona mera centralne tendencije.
Prakticno, ona zavisi od broja clanova u jednoj distribuciji, a ne od
njihove velicine. Na iznos ove srednje vrednosti ne uticu ekstremne vrednosti
obeleja, pa je zbog toga pogodna kao srednja vrednost u rasporedima
frekvencije sa otvorenim intervalima. Generalno, svuda gde vrednosti obeleja
u distribuciji znatnije variraju, medijana je bolja mera centralne tendencije
od aritmeticke sredine. Smisao ove mere nije teško shvatiti. Medijana
jednog rasporeda bice vrednost koja odgovara tacki apcise jednog histograma
frekvencija iz koje povucena vertikala deli površinu histograma na
dva jednaka dela.
Pri odredivanju medijane treba razlikovati slucajeve kada je, prvo, broj
jedinica neparan, i, drugo, paran. Ako je u pitanju negrupisana serija
sa neparnim brojem podataka, tada je njen srednji clan deli na dva jednaka
dela. Tako ce u seriji podataka o starosti zaposlenih u jednoj turistickoj
agenciji, sredenih po velicini:
24, 26, 28, 30, 35
Medijana biti 28, jer se ta vrednost nalazi u sredini ove serije. Dakle,
za neparne nizove negrupisanih podataka medijana se odreduje jednostavno
traenjem srednjeg clana niza ciji su podaci sredeni po velicini.
Ako je u pitanju negrupisana serija sa parnim brojem podataka, tada se
dve vrednosti nalaze u njenoj sredini, pa se njihov prosek (aritmeticka
sredina) uzima kao vrednost medijane. Ako predhodnoj seriji dodamo, na
primer, još jednu vrednost (38) dobicemo novu seriju podataka o starosti
zaposlenih:
24, 26, 28, 30, 35, 38,
u kojoj ce medijana biti 29, tj.aritmeticka sredina dva središna
podatka (28 i 30).
Za serije grupisanih podataka, raspored frekvencija po neprekidnim obelejima,
medijana se utvrduje interpolacijom izmedu donje i gornje granice intervala
(medijalni interval) u kome se medijana nalazi:
N - ? f1 N - ? f2
Me = L1 + 2 * i ili Me = L2 + 2 * i
fme fme
gde je Me vrednost medijane, L1 i L2 donja i gornja granica medijalnog
intervala, N broj vrednosti u seriji, ? f1 zbir frekvencija (kumulirana
frekvencija „ispod“) predmedijalnog intervala, ? f2 zbir frekvencija
(kumulirana frekvencija „iznad“) posle medijalnog intervala
fme frekvencija medijalnog intervala, a i velicina intervala.
Za seriju podataka tabele 3., koja pokazuje dnevnu potrošnju 100
stranih turista (N = 100), središnji clan (50-ti) se nalazi u trecem
grupnom intervalu (260-300). Njegova donja granica, L1 iznosi 260, gornja,
L = 300, širina intervala i = 40, a frekvencija fme = 45. kumulirana
frekvencija predmodalnog intervala, tj.frekvencija vrednosti manjih (ispod)
od 260 iznosi (5+15) 20. medijana ce, prema tome biti:
N - ? f1
Me = L1 + 2 * i = 260 + 50 – 20 * 40 = 286,6 ˜287.
fme 45
Istu vrednost bismo dobili i po dugom obrascu, pri cemu treba istaci da
se u oba slucaja polazi od pretpostavke o ravnomernom rasporedu vrednosti
serije unutar svakog grupnog intervala, što nije uvek slucaj. Apcisa
tacke preseka kumulante „ispod“ i kumulante „iznad“,
predstavlja graficki odedenu vrednost medijane. Medijana se moe
odrediti graficki i na osnovu samo jedne kumulante, bilo „ispod“
ili „iznad“, kao apcisa tacke cija ordinata odgovara sredini
serije (N/2). Vrednost medijane u našem primeru, odredena na osnovu
kumulativa „ispod“, iznosi 287 dolara.
Pošto vrednost medijane u najvecoj meri zavisi od broja i redosleda
vrednosti u seriji, za njeno utvrdivanje nije neophodno raspolagati svim
vrednostima, ako su one poredane po velicini. Ovo svojstvo dozvoljava
mogucnost da se, na primer, srednji vek trajanja odredene vrste sredstava
za prevoz turista (brodova, autobusa i sl.) odredi i pre rashodovanja
svih raspoloivih sredstava, tako što se medijana nade cim broj
rashodovanih sredstava prede polovinu njihovog broja. Isto tako, u slucajevima
kada je teško pribaviti tacne numericke vrednosti za sve clanove
serije ali ih je lako rangirati, moguce je naci središnji clan i
tacno izmeriti njegovu numericku vrednost, koja onda predstavlja celu
seriju u smislu medijane. Medijana se ne moe odrediti kada otvoreni
grupni interval sadri više od polovine svih jedinica. U praksi
takvi su slucajevi retki jer je za pravilno grupisanje uslov da otvoreni
grupni interval ima što manju frekvenciju. Takode, ona nece biti
podesan pokazatelj rasporeda ako su krajnje vrednosti obeleja ekstremne
i karakteristicne da posmatranu pojavu.
U pogledu svojstava koje ima medijana treba primetiti da na nju ne uticu
promene vrednosti obeleja što moe da se tumaci i kao
odlika i kao nedostatak. Kao odliku treba shvatiti u tom smislu što
je ona neosetljiva na ekstremne vrednosti, a što joj je jedna od
znacajnih odlika u odnosu na druge mere centralne tendencije. I ona se
moe utvrditi za svaki raspored frekvencija, ona je jedinstvena mera
centra i u svom odredivanju zahteva minimum racunskih operacija. Otvoreni
grupni intervali za nju ne predstavljaju problem. Jedini zahtev koji ona
podrazumeva je da su vrednosti obeleja u rasporedu sredene po velicini.
Kada se govori o srednjim vrednostima bilo izracunatim ili pozicionim,
mora se imati u vidu da u praksi svaka od njih ima svoje mesto, kako sa
stanovišta znacaja tako i sa stanovišta izracunavanja. Koju
cemo srednju vrednost odabrati kao najpovoljniju karakteristiku rasporeda
frekvencija zavisi, u krajnjoj liniji, od cilja istraivanja.
Medijana ima neke prednosti u odnosu na aritmeticku sredinu. Naprimer,
na vrednost medijane ne uticu ekstremne vrednosti, lako se razume i moe
se izracunati na osnovu bilo kojih podataka, moe se racunati i za
otvorene intervale. Nedostaci medijane su što su procedure u kojima
se ona koristi kompleksnije od onih u kojima se koristi aritmeticka sredina,
podaci se moraju pre odredivanja medijane srediti u rastuci niz itd.
ZAKLJUCAK
Statistika istrauje pojave koje su po svojoj prirodi varijabilne,
koje imaju masovne karakteristike i cije ponašanje u masi, na našem
nivou intelektualnog razvoja, nije unapred odredeno egzaktnim uzrocno-posledicnim
zakonitostima. Posmatranjem i analiziranjem pojava na velikom broju slucajeva,
statistika donosi odredene zakljucke o masovnom ponašanju tih pojava,
te se najcešce i predstavlja kao naucni metod kvantitativnog istraivanja
masovnih pojava.
Kada govorimo o srednjim vrednostima, bilo izracunatim, bilo pozicionim,
moramo imati u vidu da svaka od njih u praksi ima svoje mesto, kako sa
stanovišta znacaja tako i sa stanovišta izracunavanja. Koju
srednju vrednost odabrati kao najpodesniju karakteristiku distribucije
frekvencija zavisice, u krajnjoj liniji, od cilja istraivanja.
LITERATURA:
• Dr Goran Kvrgic „OSNOVI FINANSIJSKE STATISTIKE“,
Visoka poslovna škola strukovnih studija, Cacak, 2008.god.
• Dr Vladislav Ðolevic, Dr Violeta Tošic „STATISTIKA“
sa primenom u turizmu, BMG-NM, Beograd, 2007.god.
Internet adrese:
• www.crnarupa.singidunum.ac.yu
• www.eccf.su.ac.yu
• www.foi.hr
• www.fpn.cg.yu
• www.knowledge-bank.org
• www.mfk.ba
• www.statlab0.fon.bg.ac.yu
• www.supa.pharmacy.bg.ac.rs
PROCITAJ
/ PREUZMI I DRUGE SEMINARSKE RADOVE IZ OBLASTI:
|
|
preuzmi
seminarski rad u wordu » » »
Besplatni Seminarski
Radovi
SEMINARSKI RAD
|
|