|
Средње вредности
Кад споменемо реч „статистика“, прво се помисли на скуп нумеричких података
о стању неке појаве или на државну статистику.Као порекло речи „статистика“наводи
се латинска реч статус, што значи стање а статистика описивање стања.
Треба узети у обзир да статистичке анализе датирај неколико векова пре
наше ере. Прва позната пребројавања спроведена су у Кини око 4000 година
пре нове ере и у Египту око 3000 година пре нове ере, док су први организовани
пописи вршени у старом веку у Римској републици. У почетку, основни задатак
статистичког истраживања сводио се на прикупљање података о бројном стању
становника и војске, пописи земљишта и стоке. Обрада ових података се
изводила да би држава имала увид у своју војну и финансијску моћ. У XVI
веку установљени су у неким европским земљама и регистри рођњних, умрлих
и венчаних, из којих се касније развила статистика природног кретанја
становништва.
Зачеци статистике као науке настали су у Немачкој и Енглеској у VXII веку.
Немачка школа статистике развила је методе за дескрипцију појаве. Енглеска
школа уводи у статистику математичке методе и анализу података чиме је
отворен пут брзом развоју статистике. Коришћенје теорије вероватноће у
статистици, које датира од XIX века, омогућило је развој теоријске статистике.
Такође, развој и коришћење теори вероватноће омогућили су и развитак нових
статистичких теорија као што је статистичка теорија одлучивања.
Данас је статистика посебна научна дисциплина која, за реализацију постављених
циљева истраживања на организован начин прикупља, врши одабир и груписање
података, презентује и врши анализу податак, те интерпретира резултате
спроведене анализе. Из изложеног изводимо дефиницију да статистика као
наука се бави прикупљањем, обрадом и анализирањем података о масовним
појавама.
У овом раду ће мо посветити пажњу појму среднје вредности која се у литератури
среће под називом мера централне тенденције.
2. Појам, значај и врсте средњих вредности
Средња вредност је репрезентативна вредност, која, по датим мерилима,
замењује све вредности обележја у датој серији. У статистичкој литетарури
добила је назив репрезентативна вредност зато што представља и замењује
све вредности серије, јер из њих проистиче и носи њихове заједничке карактеристике.
Као репрезентативни показатељ серије средња вредност карактерише статистички
скуп. Ако се посматра један статистички скуп по једном нумеричком обележју
и пође се од индивидуалних вредности тог обележја, тешко ће се уочити
битна и заједничка карактеристика чак и кад су појединачни подаци, груписањем
у серије, сведени на мањи број. Зато се настоји да се та серија замени
једним бројем који омогућава да се уочи карактеристика посматраног скупа.
Значај средње вредности састоји се у томе што као информација може да
замени низ вредности серије; полазећи од посебних и појединачних одлика
појаве, доводи до опште и заједничке одлике као правилности појаве. Средња
вредност на уопштен и једноставан начин омогућава да се из променљивих
вредности (варијабилности) појаве открије у њима оно што је битно и типично.
Она се употребљава како за сажимање података у скупу, тако и за карактерисање
његове динамике. То је вредност која омогућава упоређење карактеристика
разних скупова. Средња вредност, као синтетички и репрезентативни показатељ,
налази примену у свим областима статистичке анализе.
Да би средња вредност имала значај репрезентативне и типиче вредности,
неопходно је да се одређује из хомогеног статистичког скупа. Под хомогеним
скупом подразумева се скуп истоврсних јединица посматрања. У случају да
је скуп хетероген (састављен од различитих јединица), потребно је најпре
извршити поделу скупа у хомогене делове, а затим ће се посебно одредити
средње вредности за сваки од тих делова. Рачунски и формално могуће је
наћи средњу вредност и у хетерогеном скупу, али таква вредност нема значај
статистичке средње вредности као репрезентативног показатеља. Узмимо,
као пример, одређивање просечне плате у једном предузећу на основу плате
директора, производног квалификованог радника, психолога и спремачице.
Рачунски, то је једноставан поступак јер су све плате у динарима, па их
можемо сабрати и поделити са четири. Међутим, шта такав просек значи и
чију плату представља? Из вредности таквих хетерогених јединица не може
се добити репрезентативна вредност у статистичком смислу. Сасвим други
случај је ако израчунамо просечну плату свих спремачица.
Исто тако, и приликом упоређивања средњих вредности два статистичка скупа
води се рачуна о хомогености тих скупова. Значи, при одређивању и примени
средњих вредности мора бити задовољен принцип хомогености статистичког
скупа.
Средња вредност датог обележја у статистичком скупу може се одредити по
разним мерилима: као вредност која се израчунава на основу свих вредности
посматраног обележја или изабрати између конкретних вредности обележја
према положају који заузима у серији. Према томе да ли се израчунавају
или одређују према положају појединих вредности обележја, средње вредности
се могу поделити у две групе: потпуне средње вредности и положајне средње
вредности.
Потпуне среднје вредности, рачунају се употребом свих података у статистичком
низу. Потпуне средње вредности су: аритметичка средина, хармонијска средина
и геометриска средина
Положајне средње вредности одређују се положајемподатака у ниизу. Најважније
положајне средње вредностису: модус и медијана .
Свака од поменутих средњих вредности одређује се посебним статистичко-математичким
методама и има одређене карактеристике.
Средње вредности се не могу израчинати (односно одредити) код свих серија.
Оне се израчунавају, односно одређују само код нумеричких (распореда фреквенција),
а могу се израчунати из временских серија. За утврђивање карактеристика
распореда фреквенција оне представљају полазну основу.
Средња вредност једне серије не може бити мања од најмање вредности обележја,
нити већа од највеће вредности обележја. Средња вредност може бити и нека
вредност која уопште не постоји у серији (на пример, у једном предузећу
може бити просечна плата 557 динара а да нико у том предузећу такву плату
нема). Средња вредност може имати и децималан број, и ако се вредности
обележја изражавају у целим бројевима (на пример: просечан број чланова
домаћинства може бити 3,4 ).
2.1. Аритметичка средина
Најширу употребу у статистичким истраживањима, као и у свакодневном животу,
стекла је аритметичка средина или, како се популарно назива, просек. У
практичном животу често се говори о просечној производњи, просечној заради,
просечној потрошњи млека, просечној тежини и тако даље. Аритметичку средину
добијамо кад збир свих вредности обележја поделимо њиховим бројевима .
Аритметичка средина може се израчунати из груписаних и негруписаних података.
2.1.1. Аритметичка средина из негруписаних података
Кад су подаци негруписани, то јест сваки податак се јавља само једанпут
(са фреквенцијим 1), аритметичка средина се израчунава тако што се збир
вредности обележја подели њиховим бројем. Ако се поједине вредности обележја
означе са x1, x2, x3,..., xn, њихов број са n (који представља број јединица
посматрања), а аритметичка средина са x (икс са цртом чита се: иск бар),
израчунавање аритметичке средине из негруписаних података може се изразити
следећим обрасцем:
x =x1+x2+x3+...+xn или ако збир означимо са ∑ (сигма)
n
x = ∑x
n
На пример, у неком одељењу одабрали смо узорак од 5 ученика и посматрали
их по броју оправданих изостанака: 24, 25, 27, 30, 34. Аритметичка средина
израчунаће се применом датог обрасца на следећи начин:
x = ∑x = 24+25+27+30+34 = 140 = 28
n 5 5
Аритметичка средина у датом примеру значи да је просечан број изостанака
по ученику 28.
2.1.2. Аритметичка средина из груписаних података
У статистичким истраживањима често се појављује већи број података и
њихових различитих фреквенција, наиме груписани подаци у виду распореда
фреквенција. У таквим случајевима вредности обележја се најпре множе одговарајућим
фреквенцијама, затим се тако добијени производи саберу и тај збир се,
најзад, подели збиром фреквенција, односно укупним бројем свих јединица
посматрања.
За израчунавање аритметичке средине може се, према томе, написати следећи
образац:
x = x1f1+x2f2+...+xifi+...+xnfn
f1+f2+...+fi+...+fn
или, упрошћено:
x = Σxf
Σf
Ова аритметичка средина добила је назив пондерисана аритметичка средина
према самом поступку израчунавања, који се састоји у пондерисању вредности
датог обележја. Множење појединачних вредности одговарајућим фреквенцијама
(x1*f1; x2*f2; и тако даље) назива се пондерисање вредности, што у ствари
значи давање одговарајућег значаја свакој вредности или одмеравање важности
сваке вредности обележја. Мерило значаја, или важности, назива се пондер,
у овом случају то су фреквенције. Уколико нека вредност има већу фреквенцију,
утолико јој је и значај већи, јер јаче утиче на величину аритметичке средине.
Пондерисањем вредности обележја обухватају се све вредности датог обележја,
јер множење појединачних вредности њиховом фреквенцијом представља узимање
те вредности толико пута колико се јавља. Код аритметичке средине за негруписане
податке узимају се све вредности обележја, али пондерисања нема, зато
што се свака вредност једном јавља и према томе све вредности су подједнако
значајне или важне.
За израчунавање пондерисане аритметичке средине узећемо као пример податак
о броју радника омладинаца иноватора (запослених у највећим индустријским
предузећима Србије) и о броју њихових проналазака којим су допринели савременој
и економичној производњи. Подаци груписани у виду серије расподела фреквенција
приказани су у табели 1. На основу ових података и датог обрасца за израчунавање
пондерисане аритметичке средине, поступак израчунавања може се лакше и
прегледније обавити помоћу радне табеле, као што је табела 2.
Табела 1. Распоред радника иноватора према броју проналазака
Број проналазака Број радника
3 2
5 8
8 5
10 3
12 2
Укупно 20
Табела 2. Поступак израчунавања пондерисане аритметичке средине
Број проналазака (x) Број радника – иноватора (f) x . f
3 2 6
5 8 40
8 5 40
10 3 30
12 2 24
∑ 20 140
Узмимо коначан образац: x = Σxf
Σf
Из обрасца се види поступак рада:
- помножити вредности обележја фреквенцијама (x * f), при чему се вредности
пондеришу;
- сабрати добијене производе (∑xf),
- сабрати фреквенције (∑f) и
- поделити збир производа вредности обележја и фреквенција збиром фреквенција
Σxf
Σf
Израчунате величине увршћују се у образац и добија се понерисана аритметичка
средина:
x = Σxf = 140 = 7
Σf 20
што значи да је просечан број проналазака по раднику – иноватору 7. Аритметичка
средина, као израчуната вредност на основу свих вредности обележја, по
свом апсолутном износу може, али не мора, да се поклапа са једном од вредности
у серији. Међутим, она је најчешће блиска вредностима обележја чије су
фреквенције највеће, јер су те вредности и највише утицале на њен износ.
У датом примеру највећи значај има вредност 5 и 8, чије су фреквенције
највеће, па је због тога и аритметичка средина 7 блиска тим вредностима.
Ово својство аритметичке средине омогућава да се орјентационо провери
тачност израчунате аритметичке средине. Ако се аритметичка средина приближава
некој од вредности серије са малом фреквенцијом, потребно је проверити
исправност рачунског поступка, а то треба учинити и ако је она мања од
најмање вредности или већа од највеће вредности обележја у серији.
У статистичком истраживањима често се оперише са континуираним вредностима
груписаним у виду интервалних серија. Због тога се јавља потреба да се
при израчунавању аритметичке средине води рачуна о томе да су вредности
дате у виду групних интервала. Правило је да се за сваки интервал одреди
једна вредност која ће представљати или замењивати све вредности у оквиру
групног интервала. Обично се узима средина групног интервала, која се
одређује као просек доње и горње границе сваког интервала.
Кад је интервал отворен (на доњој или горњој граници, у нашем примеру
у табели 3 на доњој – до 20), узима се за дужину интервела дужина који
имају остали интервали (у нашем примеру 10). Зато смо код одређивања средине
интервала узели за доњу границу првог (отвореног) интервал 10. Исто би
се поступило да је отворена горња граница последњег интервала.
Интервалне средине представњају вредности обележја (x) у датој серији
и на основу њих и одговарајућих фреквенција израчунава се аритметичка
средина за груписане податке. Узмимо, као пример, да на основу података
из табеле 3. и радне табеле 4. израчунамо пондерисану аритметичку средину
вредности које су релативни бројеви и које су груписане у виду интервалне
серије распореда фреквенција.
Табела 3. – Распоред неколико приватих ресторана према % добити у Београду
1997.год.
% добит Број ресторана
до 20 9
20 – 30 12
30 – 40 12
40 - 50 9
50 – 60 6
60 -70 2
Укупно 50
Табела 4. – Радна табела за обрачун пондерисане аритметичке средине из
интервалне серије
Средина интервала (x) ƒ x . ƒ
10 + 20 = 15
2 9 135
20 + 30 = 25
2 12 300
30 + 40 = 35
2 12 420
40 + 50 = 45
2 9 405
50 + 60 = 55
2 6 330
60 + 70 = 65
2 2 130
Укупно ∑ 50 1720
На основу података из радне табеле 4. аритметичка средина ће износити:
x = Σxf = 1720 = 34,4
Σf 50
Добијени резултат показује да је 34,4% просечан % добити у пословању
приватних ресторана у Београду.
2.1.3. Особине аритметичке средине
Употреба аритметичке средине распрострањена је у свим областима статистичке
анализе. За практичну примену аритметичке средине и теоријска истраживања
важно је познавати и најважније особине које има аритметичка средина:
1. сви подаци серије улазе у обзир за израчунавање аритметичке средине,
тако да све вредности обележја утичу на величину аритметичке средине зависно
од величине и фреквенције;
2. аритметичка средина се увек налази између најмање и највеће вредности
обележја, што се математички може преставити изразом:
xmin < x < xmax
3. кад се замени свака вредност у серији аритметичком средином, збир мора
остати исти. У нашем примеру збир изостанака свих пет ученика износи:
24 + 25 + 27 + 30 + 34 = 140. Ако би сваки ученик имао исти број изостанака
(28) укупан број изостанака био би: 28 + 28 + 28 + 28 +28 = 140;
4. збир позитивних одступања од аритметичке средине једнак је збиру негативних
одступања, тако да је алгебарски збир свих одступања раван нули. За разумевање
ове особине потребно је нешто знати о одступањима од аритметичке средине.
Одступања се рачунају ако се од сваке поједине вредности обележја одузима
аритметичка средина (x- x).
На основу ознаке за збир (∑) и израза за одступање, може се математички
изразом приказати да је сума одступања свих вредности обележја од аритметичке
средине једнака нули:
Σ(x-x ) = 0
5. збир квадрата одступања појединих вредности обележја од аритметичке
средине дају најмању могућу суму. То значи да збир квадратних одступања
обележја од неке друге вредности различите од аритметичке средине дају
већу суму:
∑ (x- x)2 = min.
2.2. Геометријска средина
Геометријска средина је, такође, израчуната средња вредност, али се разликује
од аритметичке средине и по својим карактеристикама и по начину израчунавања.
Геометријска средина добија се када се из производа појединих вредности
обележја дате серије извади корен чији је изложилац раван броју свих чланова
серије. Геометријска средина је N-ти корен производа свих вредности негруписаног
нумеричког обележја једног низа.
Ако поједине вредности обележја означимо са x1,x2,...,xn, а њихов број
са n, образац за израчунавање геометријске средине биће
G = x1*x2 *... хί ...*xn
Пошто се овде јављају корени са великим изложиоцима, за израчунавање
геометријске средине морају се користити и логаритми, тј. логаритмоваће
се најпре лева а затим и десна страна обрасца:
log G = logx1 + logx2 +...+ logxi +...+ logxn n
Користећи ∑ као знак за збир, образац за израчунавање геометријске средине
може се написати у облику:
log G = Σ logx
n
На овај начин добија се логаритам геометријске средине. Пошто нам треба
геометријска средина, а не њен логаритам, морамо извршити антилогаритмовање,
па ће упрошћен образац за израчунавање геометријске средине бити:
G = Σ logx
n
Њена употреба у статистичким истраживањима је знатно мања. Геометријска
средина се најчешће примењује за истраживање, тј. израчунавање средњег
темпа развоја који се добија као геометријска средина ланчаних индекса
временске серије.
Темпо развоја је релативна вредност која се добија када се узастопни чланови
временске серије ставе у однос, тј. поделе претходним члановима. Они се
могу изразити и у процентима, ако се помножимо са 100. То су ланчани индекси.
Применимо сада геометријску средину за израчунавање средњег темпа развоја
производње хлеба и пецива у нашој земљи од 1991. до 1996. године (датих
података у табели 5). Да бисмо израчунали средњи темпо развоја производње
хлеба и пецива за дати период, потребно је да израчунамо геометријску
средину ланчаних индекса. То значи да најпре морамо наћи ланчане индексе,
а затим одговарајуће логаритме за ланчане индексе ове серије, које уносимо
у четврту колону табеле 5.
Табела 5. – Темпо развоја производње хлеба и пецива у СР Југославији
1991-1996. године
Година Производња у
хиљадама тона Израчунавање
ланчаних индекса (x) log x
1991.
320 ...
1992. 324 324 . 100 =101
320 2,00432
1993. 387 387 . 100 = 119
324 2,07554
1994. 364 364 . 100 = 94
387 1,97314
1995. 366 366 . 100 = 101
364 2,00432
1996. 340 340 . 100 = 93
366 1,96848
Извор: СГЈ 1997, стр.25
Збир логаритама износи 10,02580. Када га поделимо са 5, колико износи
број чланова серије (ланчаних индекса) и нађемо антилогаритам, добијамо
тражену геометријску средину. Конкретно то значи:
Σlogx 10,02580
G = n = 5 = 2,005160 = 101,2
Средњи темпо развоја, према томе, износи 101,2 односно производња хлеба
и пецива у датом периоду повећавала се из године у годину у просеку за
1,2 % (G – 100 = 101,2 -100= 1,2).
2.3. Хармонијска средина
Употреба хармонијске средине (Н) још је ограниченија од употребе геометријске
средине. Она се користи само у специјалним случајевима где се проблем
може поставити и у обрнутом, реципрочном виду. Продуктивност рада, на
пример, може се мерити (изразити) на два начина: као број произведених
производа у јединици времена или, реципрочно, као време потребно за производњу
јединицe производа. Исто се тако може посматрати обрт капитала у јединици
времена и, реципрочно, потребно време да би се извршио обрт јединице капитала
итд. Хармонијска средина је реципрочна вредност аритметичке средине реципрочних
вредности нумеричког обележја у једном низу.
Најчешће се користи за израчунавање: средњег времена израде јединице производа,
средњих цена, куповне снаге новца и средњег времена пређене јединице пута.
Зависно од тога да ли су подаци негруписани или груписани, може се израчунати
проста хармонијска средина за негруписане податке или пондерисана за груписане
податке.
2.3.1. Хармонијска средина за негруписане податке
Проста хармонијска средина је реципрочна вредност просте аритметичке
средине одређене из реципрочних вредности обележја. Ако се са x1,x2,..
xί..,xn означе вредности обележја, а са n њихов број, образац за израчунавање
хармонијске средине биће:
Н = 1*n .= n .
1/x1+1/x2+…+1/xi+…+1/xn 1/x1+1/x2+…+1/xi+…+1/xn
или
Н = n .
Σ1/x
Ради илустрације поступка израчунавања просте хармонијске средине узећемо
податке из табеле бр.6., која садржи седмочасовни учинак пет радника.
Табела 6. – Седмочасовни учинак пет радника
Радник Производња ком.
за 1 час Време израде по ком. у минутама (x)
А 6 10 (60/ 6)
Б 10 6 (60/10)
Ц 12 5 (60/12)
Д 15 4 (60/15)
Е 30 2 (60/30)
73 27
Аритметичка средина 73/5 =14,6 27/5 = 5,4
Просечна продуктивност ових пет радника, израженa бројем произведених
комада у јединици времена, може се исправно приказати простом аритметичком
средином која износи 14,6 комада за један час. Међутим, ако се просечна
продуктивност исте ове групе радника изрази утрошеним временом за јединицу
производа, помоћу просте аритметичке средине у износу 5,4, неће се добити
одговарајући резултат, јер то није реципрочна вредност просечне продуктивности
изражене бројем произведених комада за један минут.
Да проверимо: 60 : 14,6 = 4,10958, а не 5,4.
Израчунајомо хармпонијску средину:
Н = 5 .= 5 . = 300 = 4,10958
1/10+1/6+1/5+1/4+1/2 6+10+12+15+30 . 73
60
Добијена је одговарајућа реципрочна вредност. Према томе, просечна продуктивност
ове групе радника износи 14,6 произведених комада за час или, реципрочно,
потребно је 4,10958 минута за израду једног комада.
2.3.2. Хармонијска средина за груписане податке
Када се ради о груписаним подацима, израчунава се пондерисана хармонијска
средина. Она ће тада бити реципрочна вредност аритметичке средине реципрочних
вредности обележја помножених (пондерисаних) одговарајућим фреквенцијама.
Према томе, образац за израчунавање пондерисане хармонијске средине гласи:
Н = 1 . =
1/x1*f1+1/x2*f2+…+1/xi*fi +…+1/xn*fn
f1+f2+…+fi+…+fn
= f1+f2+…+fi+…+fn .
1/x1*f1+1/x2*f2+…+1/xi*fi+…+1/xn*fn
или Н= Σf .
Σf/x
Ако би у примеру из табеле 6. било:
5 радника којима за израду јединице производа треба 10 минута,
20 радника којима за израду јединице производа треба 6 минута,
10 радника којима за израду јединице производа треба 5 минута,
10 радника којима за израду јединице производа треба 4 минута,
5 радника којима за израду јединице производа треба 2 минута,
просечно време потребно за израду јединице производа израчунаћемо помоћу
пондерисане хармонијске средине овако:
Н= 50 . = 50 . = 3000 = 4,61538
5/10+20/6+10/5+5/2+10/4 30+200+120+150+150 650
60
Хармонијска, као и геометријска средина не могу се израчунати ако су
неке вредности обележја једнaке нули.
2.4. Медијана
Медијана (Ме) је позициона средња вредност и налази се у средини серије,
чији су чланови распоређени по величини вредности обележја. Медијана је
вредност статистичког обележја која статистиччки скуп дели на два једнака
дела.
Медијана, као и модус, није израчуната средња вредност, већ вредност обележја
одређена по положају који заузима у низу података.
Медијана зависи од броја чланова у серији а не од њихове величине. Медијана
је погодна за средње вредности код серија са отвореним интервалима и у
серијама где вредности обележја варирају. У случајевима где вредности
чланова у серији знатније варирају, медијана је боља средња вредност од
аритметичке средине.
2.4.1. Медијана за негруписане податке
Ако је број података чланова сeрије непаран, медијана се одређује једноставно
тражећи средњи члан уређеног низа по величини података.
Тако ће за низ података о броју лежајева у пет туристичких објеката који,
уређени по величини, износе: 98, 102, 106, 112, 118, медијана бити 106.
У овој серији медијана је вредност трећег члана, јер он заузима средишњи
положај, док су два члана (50 % серије) испред и два члана (50 %) иза
вредности медијане.
За серију негруписаних података медијана се одређује на тај начин што
се укупан броj чланова серије, сређених по величини, повећа за један
(n + 1) и подели са 2, тј. n + 1 .
2
Вредност података која се налази на том месту је медијана. Код серије
са непарним бројем података то је, вредност централног податка. Међутим,
ако је број података паран, у средини се налазе две вредности обележја.
У том случају се као медијана узима њихова аритметичка средина.
Ако у овом примеру имамо податак о броју лежаја и за шести туридстички
објекат који износи 120, серрија ће бити парна: 98, 102, 106, 112, 118,
120. Одредићемо медијану:
n+ 1 = 6 + 1 = 7 = 3,5,
2 2 2
тј. она је на средини између трећег и четвртог члана серије, пошто се
оба броја налазе у средишту серије, а то значи :
Ме = 106 + 112 = 218 = 109.
2 2
2.4.2. Медијана неинтервалних серија дистрибуције фреквенција
У досадашњим примерима медијану смо врло једноставно одредили, јер су
били у питању негруписани подаци и врло мали број података. У пракси се,
међутим, сусрећу често серије са великим бројем података, па се поставља
питање како код таквих серија одредити медијану за неинтервалне и интервалне
серије.
Узмимо, најпре, туристичке објекте према броју ноћења туриста, приказане
у табели 7. серија је неинтервална и непарна.
Табела7. –Распоред туристичких објеката према броју ноћења туриста
Број ноћења Број туристичких објеката Кумулација“испод“
1700 5 5
1800 12 17
2000 15 32
2100 35 67
2500 20 87
2800 10 97
3000 2 99
Укупно 99 -
Медијана се и овде одређује на принципијелно исти начин као и код серија
са негруписаним подацима, тј. она је централни члан серије:
n + 1 = 99 + 1 = 100 = 50.
2 2 2
Значи, медијана је вредност педесетог члана серије. Да би смо утврдили
која је то вредност, кумулираћемо фреквенције „испод“ и унети кумулативне
фреквенције у последњу колону табеле. Идући колоном кумулације „испод“,
видимо да се педесети објекат налази у четвртом реду и да је, према томе,
његова вредност 2100 ноћења.
За медијану неинтервалне серије са парним бројем података узећемо као
пример табелу број 8.
Табела 8. – Распоред општина према броју рекреативних туристичких центара
у Војводини 1997. године
Број рекреативних
туристичких центара Број општина Кумулација“испод“
0 1 1
1 10 11
2 12 23
3 11 34
4 4 38
5 6 44
Укупно 44 -
Медијана код серије са парним бројем података једнака је аритметичкој
средини два средишна податка. Формулом би се то могло изразити овако:
n + 1 = 44 + 1 = 45 = 22,5.
2 2 2
Значи, медијана се налази између 22. и 23. члана серије. У последњој
колони табеле 8. – кумулација „испод“, коју смо овде извели, показује
да се тај члан налази у трећем реду, медијана је вредност обележја 2.
То значи да је 50% општина у Војводини имало 2 или више од два рекреативна
туристичка центра.
Ако се средишњи чланови серије налазе између два броја кумулативне серије,
медијана ће бити аритметичка средина два одговарајућа податка. Предпоставимо
да треба да одредимо медијану 23. и 24. члана. У том случају 23.члану
би одговарао податак 2, а члану 24. податак 3, и тако би вредност медијане
била:
Ме = 2 + 3 =2,5.
2
2.4.3. Медијана интервалне серије дистрибуције фреквенција
Ако су подаци сређени у интервалној серији као, на пример, у табели
9, медијана се одређује на тај начин што се најпре помоћу кумулације
фреквенција
нађе интервал у коме налази медијана, а затим се одређује помоћу следећег
образца:
Ме = l + ί (n/2 + cumƒ1 )
ƒm
где су :
l - доња граница интервала у коме се налази медијана,
ƒm - фреквенција тог интервала,
ί – дужина групног интервала,
n – укупан број чланова серије и
cumƒ1 - кумулирана фреквенција интервалне групе која предходи интервалу
у коме се налази медијана.
Да би смо наведени образац применили на податке из табеле 9 одредићемо
најпре интервал у коме се налази медијана. Како серија има паран број
података (44), то ће средишњи чланови, према раније изложеној формули,
бити:
44 + 1 = 22,5, односно 22. и 23.
2
Ови чланови се налазе у збирној фреквенцији 27, а медијана, према томе,
у интервалу 350,1 – 400,0. доња граница тог интервала (l) је 350,1 а његова
фреквенција (ƒm ) је 21; дужина интервала (ί) је 50; кумулирана фреквенција
(cumƒ1) интервала који предходи (300-350,0) је 6, збир свих чланова (n)
износи 44.
Заменом у датој формули добија се:
Ме = 350 + 50 ( 44/2 - 6) = 350 + 800/21 = 388,09
2
Медијана је, дакле, 388,09, што значи да је половина посматраних судских
спорова имала ту или већу вредност.
Табела 9. – Радна табела за одређивање медијане
Вредност судских решених спорова
утаје пореза грађана у динарима Број спорова утаје пореза Кумулација
„испод“
до 300,0 1 1
300 – 350,0 5 6
350 – 400,0 21 27
400 – 450,0 14 41
450 – више 3 44
Укупно 44 -
Ако је број података чланова серије паран, тако да се у средини низа уређених
података налазе две вредности обележја, медијана је једнака аритметичкој
средини та два средишна члана.
2.5. Модус
Од позиционих средњих вредности најчешће се примењује модус (Мо). Модус
је вредност статистичког обележја које се најчешће јавља у неком низу,
тј. вредност обележја којој припада највећа фрекфренција. Не израчунава
се из свих вредности једне серије већ се узима као вредност обележја која
се у статистичком скупу најчешће јавља. Пошто вредност модуса има највећи
број јединица датог скупа, сматра се да је модус типична вредност која
може да окарактерише читаву серију.
За серије са прекидним вредностима обележја, модус се одређује једноставно
проналажењем вредности обележја чија је фрекфренција највећа.
Одредићемо модус за податке продаје мушких кошуља по величини, у току
јануара 1995. године, у једној робној кући у Београду (табела 10).
Табела 10. – Распоред продатих кошуља по величини у једној робној кући
у јануару 1995.године
Величина кошуље Број продатих кошуља(Ф)
37 50
38 59
39 94
40 108
41 85
42 50
43 5
Укупно 451
Видимо да величина (број кошуља) 40 има највећу фреквенцију; према томе,
модус је 40. Модус се обично обележава са Мо, па ћемо написати Мо= 40.
То значи да је највише продато мушких кошуља величине број 40, односно
да се та величина кошуље најчешће купује.
За серију чији су подаци груписани у виду груписаних интервала одређивање
модуса је сложеније и постоје две могућности:
- да се одреди приближан модус, као средина групног интервала са највећом
фреквенцијом или
- прецизније, помоћу одређеног образца.
За прецизније одређивање модуса код интервалних серија груписаних података
полази се од чињенице да се модус налази у интервалној групи са највећом
фреквенцијом, и то између доње и горње границе тог интервала, па се може
одредити помоћу обрасца:
f2
Мо = l + *i
f1 + f2
Где је:
- l – доња граница модалног интервала или интервала са највећом фрекфренцијом
у коме се налази модус,
- f1 – фрекфренција интервала који се налази испред модалног интервала,
- f2 – фрекфренција интервала иза модалног интервала и
- i – дужина групног интервала
За дистрибуцију фреквенција (табела 11.) одредићемо модус полазећи од
модалног интервала.
Табела 11. – Старост делегата у једној основној заједници за запошљавање
у Србији 1994. године
Старост у годинама Број делегата
25 – 29 10
30 – 34 17
35 - 39 9
40 – 44 8
Укупно Σ 44
Модални интервал је 30 – 34 зато што тај интервал има највећу фреквенцију.
Можемо рећи, приближно, да је модус средина тог интервала, тј.32,5 (Мо
= 32,5 ). Тачније ћемо одредити његов износ применом обрасца
f2
Мо = l + *i
f1 + f2
Пошто је l = 30; f1 = 10; f2 = 9; i = 5, имаћемо да је:
Мo = 30 + 9 *5= 32,4
10+9
Овако добијени модус, у износу од 32,4 године, показује да је највећи
број делегата у овој основној интересној заједници за запошљавање толико
стар. При коришћењу модуса треба имати у виду да на његову величину утиче
начин груписања података. Како се формирање груписаних интервала може
исвести на разне начине, то се променом величине групних интервала, или
групних граница при истим интервалима, могу добити различите вредности
модуса.
Модус је погодан показатељ за оне серије код којих само једна вредност
обележја има највећу фреквенцију, и то нарочито ако је фреквенција модалне
вредности велика. Такве серије називају се унимодалним (са једним модусом)
и у тим случајевима модус је карактеристична вредност.
Постоји могућност да у једној серији има више модуса или да се модус не
може одредити. Ево и таквих примера. У одељењу трећег разреда економско-комерцијалне
струке на основу оцена из статистике и матетматике саставили смо две серије
и приказали једну у виду табеле 12., а другу у виду табеле 13.
Табела 12. – Распоред ученика по оценама из статистике
Оцене Број ученика
1 2
2 9
3 9
4 3
5 2
Укупно 25
Табела 13. – Распоред ученика по оценама из математике
Оцене Број ученика
1 5
2 5
3 5
4 5
5 5
Укупно 25
У распореду ученика по оценама из статистике имамо два модуса оцене 2
и 3, јер обе имају исту највећу фреквенцију. У распореду ученика по оценама
из математике нема модуса. Све оцене имају једну фреквенцију, ни једна
оцена није најчешћа. Према томе, модус се не може одредити у серијама
чије све вредности имају једну фреквенцију.
Иако се модус ређе примењује од аритметичке средине, за нека статистичка
истраживања је погоднији, јер даје потпуну информацију о тенденцији окупљања
вредности обелажја око средње вредности. Тако се, на пример, употребљава
за утврђивање најчешће цене на тржишту, за сагледавање тражње појединих
бројева обуће или одеће и слично, када је прикладније конкретно обавештавање
него просечан број, који може бити и децималан, па самим тим недовољно
информативан.
Закључак
Статистика истражује појаве које су по својој природи варијабилне, које
имају масовне карактеристике и чије понашање у маси, на нашем нивоу интелектуалног
развоја, није унапред одређено егзактним узрочно-последичним законитостима.
Посматрањем и анализирањем појава на великом броју случајева, статистика
доноси одређене закључке о масовном понашању тих појава, те се најчешће
и представља као научни метод квантитативног истраживања масовних појава.
Кaда говоримо о средњим вредностима, било израчунатим, било позиционим,
морамо имати у виду да свака од њих у пракси има своје место, како са
становишта значаја тако и са становишта израчунавања. Коју средњу вредност
одабрати као најподеснију карактеристику дистрибуције фреквенција зависи
ће, у крајњој линији, од циља истраживања.
Литература
1. Квргић Горан, „Основи финансијске статистике“. Чачак: Висока пословна
школа струковних студија, 2008.
2. Јоксимовић Душан, „Пословна статистика“. Београд: Мегатренд универзитет
примењених наука, 2006.
3. Марковић Т Миланка, Петковић Д Симка, „Послован статистика“. Београд:
Виша послован школа, 2000.
PROCITAJ
/ PREUZMI I DRUGE SEMINARSKE RADOVE IZ OBLASTI:
|
|
preuzmi
seminarski rad
u wordu » » »
Besplatni Seminarski Radovi
SEMINARSKI RAD
|
|