Metódy výpočtu aritmetického priemeru (jednoduchý a vážený aritmetický priemer, podľa metódy momentov). Vlastnosti aritmetického priemeru

Vlastnosti aritmetického priemeru. Výpočet aritmetického priemeru metódou "momentov"

Na zníženie zložitosti výpočtov sa používajú hlavné vlastnosti priemerného aritmu:

  • 1. Ak sa všetky varianty spriemerovaného znamienka zvýšia/znížia o konštantnú hodnotu A, potom sa aritmetický priemer zodpovedajúcim spôsobom zvýši/zníži.
  • 2. Ak sa všetky varianty určovaného atribútu zvýšia/znížia n-krát, potom sa priemerný aritmus zvýši/zníži n-krát.
  • 3. Ak sa všetky frekvencie spriemerovaného atribútu zvyšujú/znižujú konštantným počtom krát, potom aritmetický priemer zostane nezmenený.
  • 18. Priemerná harmonická jednoduchá a vážená

Harmonický priemer - používa sa vtedy, keď štatistické informácie neobsahujú údaje o váhach pre jednotlivé možnosti populácie, ale sú známe súčiny hodnôt premennej vlastnosti a zodpovedajúcich váh.

Všeobecný vzorec pre harmonický vážený priemer je nasledujúci:

x je hodnota premennej funkcie,

w je súčin hodnoty premenného prvku a jeho váh (xf)

Napríklad za rôzne ceny (20, 25 a 40 rubľov) sa kúpili tri šarže produktu A. Celková cena prvej šarže bola 2 000 rubľov, druhej šarže - 5 000 rubľov a tretej šarže - 6 000 rubľov. Je potrebné určiť priemernú cenu za jednotku tovaru A.

Priemerná cena je definovaná ako podiel celkových nákladov vydelený celkovým množstvom zakúpeného tovaru. Použitím harmonického priemeru dostaneme požadovaný výsledok:


V prípade, že celkový objem javov, t.j. súčin hodnôt vlastností a ich váhy sú rovnaké, potom sa použije harmonický jednoduchý priemer:

x - jednotlivé hodnoty atribútu (možnosti),

n je celkový počet možností.

Príklad. Dve autá išli po rovnakej trase: jedno rýchlosťou 60 km/h a druhé rýchlosťou 80 km/h. Dĺžku cesty, ktorú prešlo každé auto, berieme ako jednu. Potom bude priemerná rýchlosť:

Harmonický priemer má zložitejšiu štruktúru ako aritmetický priemer. Harmonický priemer sa používa na výpočty, keď sa ako váhy nepoužívajú jednotky populácie - nositelia atribútu, ale súčin týchto jednotiek hodnotami atribútu (t.j. m = Xf). Priemerný harmonický prestoj by sa mal použiť v prípadoch určovania napríklad priemerných nákladov na prácu, čas, materiál na jednotku výkonu, na diel pre dva (tri, štyri atď.) podniky, pracovníkov zaoberajúcich sa výrobou rovnaký typ produktu, rovnaký diel, produkt.

Pri veľkom počte pozorovaní alebo pri veľkej číselnej hodnote sa používa možnosť

Zjednodušený spôsob výpočtu aritmetického priemeru je metóda momentov.

M = A+ iSap

kde M je aritmetický priemer; A - podmienený priemer; i - možnosť intervalu medzi skupinami;

S - sumačný znak.; a - podmienená odchýlka každej možnosti od podmieneného priemeru;

p je frekvencia výskytu variantu; n je počet pozorovaní.

Príklad výpočtu aritmetického priemeru metódou momentov (priemerná telesná hmotnosť

chlapci do 18 rokov)

V(n v kg) R a (V-A) a. R
+2 +4
+1 +3
M o \u003d 62
-1 -6
-2 -8
-3 -3
n = 25 Sar \u003d - 10 kg

Etapy výpočtu priemeru metódou momentov:

2) určíme „a“ - podmienenú odchýlku možností od podmieneného priemeru, preto od každej možnosti odpočítame podmienený priemer: a \u003d V - A, (napríklad a \u003d 64 - 62 \u003d + 2 atď.).

3) vynásobíme podmienenú odchýlku „a“ frekvenciou „p“ každej možnosti a dostaneme súčin a p;

4) nájdite súčet Sa. p = - 10 kg

5) vypočítajte aritmetický priemer pomocou metódy momentov:

M = A + i SaP\u003d 62 – 1 × 0,4 \u003d 61,6 kg

Môžeme teda konštatovať, že v skupine nami skúmaných mladých mužov je priemerná telesná hmotnosť

Aritmetický priemer sám o sebe nehovorí nič o variačnom rade, z ktorého

bola vypočítaná. Jeho typickosť (spoľahlivosť) je ovplyvnená homogenitou uvažovaného

materiálová a sériová variabilita.

Príklad: sú uvedené dva variačné rady zhodné počtom pozorovaní, v ktorých

uvádza namerané údaje obvodu hlavy detí vo veku od 1 do 2 rokov

Séria má rovnaký počet pozorovaní a rovnaký aritmetický priemer (M = 46 cm).

majú rozdiely v distribúcii v rámci. Takže varianty prvého radu sa vo všeobecnosti odchyľujú od

aritmetický priemer s nižšou hodnotou ako možnosti druhého riadku, čo dáva

možnosť predpokladať, že aritmetický priemer (46 cm) je typickejší pre prvý

riadok ako pre druhý.

V štatistike, na charakterizáciu rôznorodosti variačných radov, používajú priemer

smerodajná odchýlka(s)

Existujú dva spôsoby výpočtu štandardnej odchýlky: aritmetický priemer

spôsob a spôsob okamihov. Pri metóde výpočtu aritmetického priemeru sa používa vzorec:

kde d je skutočná odchýlka každej možnosti od skutočného priemeru M. Vzorec sa používa, keď

malý počet pozorovaní (n<30)

Vzorec na určenie s metódou momentov:

kde a je podmienená odchýlka opcií od podmieneného priemeru;

Moment druhého stupňa a moment prvého stupňa, na druhú.

Bolo teoreticky aj prakticky dokázané, že ak pri veľkom počte pozorovaní k priemeru

aritmeticky sčítajte a odčítajte od neho 1s (M ± 1s), potom v rámci získaných hodnôt

Nájde sa 68,3 % všetkých variantov variačnej série. Ak k aritmetickému priemeru

pripočítajte a odčítajte 2 s (M ± 2 s), potom 95,5 % bude v rámci získaných hodnôt

všetky možnosti. M ±3s zahŕňa 99,7 % všetkých variantov variačnej série.

Na základe tohto ustanovenia je možné kontrolovať typickosť aritmetického priemeru pre

variačný rad, z ktorého bol vypočítaný. Na to je potrebné priemer

pridajte aritmetiku a odpočítajte od nej trikrát s (M ± 3s). Ak v medziach

daný variačný rad vyhovuje, potom je typický aritmetický priemer, t.j. ona je

vyjadruje základnú pravidelnosť radu a dá sa použiť.

Toto ustanovenie sa široko používa pri vývoji rôznych noriem (odevy,

obuv, školský nábytok a pod.).

Stupeň rozmanitosti znak vo variačnom rade možno odhadnúť podľa koeficient

variácie(pomer štandardnej odchýlky k aritmetickému priemeru,

vynásobené 100%)

S v = s x 100

Pri Cv menej ako 10% je zaznamenaná slabá diverzita, pri Cv 10-20% - priemer a pri viac ako 20% -

silná rôznorodosť vlastností.

Posúdenie spoľahlivosti výsledkov štatistickej štúdie

Ako sme už povedali, najspoľahlivejšie výsledky možno dosiahnuť aplikáciou

kontinuálna metóda t.j. pri štúdiu bežnej populácie.

Štúdium bežnej populácie je medzitým spojené s výraznou prácnosťou.

Preto je v biomedicínskom výskume spravidla selektívny

pozorovania. Aby údaje získané štúdiom vzorky populácie mohli byť

bola prenesená do bežnej populácie, je potrebné posúdiť spoľahlivosť

výsledky štatistickej štúdie. Vzorkovací rámec nemusí stačiť

plne reprezentujú populáciu, takže pozorovania vzorky sú vždy

sprevádzaná chybou reprezentatívnosti. Podľa veľkosti strednej chyby (m) možno súdiť

ako sa zistený výberový priemer líši od všeobecného priemeru

agregátov. Malá chyba indikuje blízkosť týchto indikátorov, veľká chyba napr

nedáva dôveru.

Hodnotu priemernej chyby aritmetického priemeru ovplyvňujú nasledujúce dve okolnosti.

Po prvé, homogenita zozbieraného materiálu: čím menší je rozptyl variantu okolo

jeho priemer, tým menšia je chyba reprezentatívnosti. Po druhé, počet pozorovaní:

priemerná chyba bude tým menšia, čím väčší bude počet pozorovaní.

Priemerná chyba aritmetického priemeru sa vypočíta podľa tohto vzorca:

Priemerná chyba (chyba reprezentatívnosti) pre relatívne hodnoty je určená

vzorec:

kde m p je priemerná chyba indikátora;

p - ukazovateľ v% alebo v% o

q - (100 -p), (1000 -p)

n - celkový počet pozorovaní

Liečebný ústav opustilo 289 pacientov, 12 z nich zomrelo.

Relatívna hodnota (úmrtnosť) p = (12:289)x100 = 4,1 %; q=100-p=

100-4,1 \u003d 95,9, odkiaľ

mp = ±

Relatívna hodnota pri opätovnom preskúmaní teda bude zodpovedať

Hranice dôvery je maximálna a minimálna hodnota, v rámci ktorej

pre daný stupeň pravdepodobnosti bezchybnej predpovede môže existovať príbuzný

ukazovateľ alebo priemer v bežnej populácii

Hranice spoľahlivosti relatívnej hodnoty vo všeobecnej populácii sú určené

P gén = P vzorka ± tm m

Hranice spoľahlivosti aritmetického priemeru vo všeobecnej populácii sú určené vzorcom:

M gén = M select ± tm m

kde P gén a M gén sú relatívne a priemerné hodnoty získané pre všeobecné

agregátov.

P vyb a M vyb - hodnoty relatívnych a priemerných hodnôt získaných pre populáciu vzorky.

m p a m m - chyba reprezentatívnosti pre priemerné a relatívne hodnoty.

t - kritérium spoľahlivosti.

Je stanovené, že ak t = 1, spoľahlivosť nepresahuje 68 %; ak t = 2 - 95 %; ak t = 3-99 %

V lekárskom a biologickom výskume sa považuje za dostatočné kritérium

spoľahlivosť t ³ 2 (95 % spoľahlivosť)

Na nájdenie kritéria t pre počet pozorovaní £ 30 je potrebné použiť špeciálne

tabuľky

S klesajúcou veľkosťou chyby reprezentatívnosti sa limity spoľahlivosti znižujú.

priemerné a relatívne hodnoty, teda výsledky štúdie sú špecifikované, blížiace sa

zodpovedajúce hodnoty bežnej populácie. Ak chyba reprezentatívnosti

veľké, potom získate veľké medze spoľahlivosti, ktoré môžu byť v rozpore

logické posúdenie želanej hodnoty v bežnej populácii. Hranice dôvery

závisí aj od miery pravdepodobnosti bezchybnej prognózy, ktorú si výskumník zvolil. O

vysoký stupeň pravdepodobnosti bezchybnej predpovede rozsahu hraníc spoľahlivosti

4. Párne a nepárne.

V párnych variačných radoch je súčet frekvencií alebo celkový počet pozorovaní vyjadrený ako párne číslo, v nepárnych variačných radoch ako nepárne číslo.

5. Symetrické a asymetrické.

V symetrickom variačnom rade sa všetky typy priemerov zhodujú alebo sú si veľmi blízke (mód, medián, aritmetický priemer).

V závislosti od povahy skúmaných javov, od konkrétnych úloh a cieľov štatistickej štúdie, ako aj od obsahu východiskového materiálu v sanitárnej štatistike používajú sa tieto typy priemerov:

Štrukturálne priemery (režim, medián);

aritmetický priemer;

priemerná harmonická;

Geometrický priemer

stredne progresívny.

Móda (M o) - hodnota variabilného znaku, ktorý je bežnejší v skúmanej populácii, t.j. možnosť zodpovedajúca najvyššej frekvencii. Zisťuje sa priamo štruktúrou série variácií, bez použitia akýchkoľvek výpočtov. Zvyčajne je to hodnota veľmi blízka aritmetickému priemeru a v praxi je veľmi vhodná.

Medián (M e) - rozdelenie série variácií (zoradené, t.j. hodnoty opcie sú usporiadané vzostupne alebo zostupne) na dve rovnaké polovice. Medián sa vypočíta pomocou takzvaného nepárneho radu, ktorý sa získa postupným sčítavaním frekvencií. Ak súčet frekvencií zodpovedá párnemu číslu, potom sa medián zvyčajne berie ako aritmetický priemer dvoch priemerných hodnôt.

Modus a medián sa uplatňuje v prípade otvorenej populácie, t.j. keď najväčšie alebo najmenšie možnosti nemajú presnú kvantitatívnu charakteristiku (napríklad do 15 rokov, 50 a viac rokov atď.). V tomto prípade nie je možné vypočítať aritmetický priemer (parametrické charakteristiky).

Priemerná ja aritmetika - najbežnejšia hodnota. Aritmetický priemer sa zvyčajne označuje ako M.

Rozlišujte medzi jednoduchým aritmetickým priemerom a váženým priemerom.

jednoduchý aritmetický priemer vypočítané:

— v prípadoch, keď súhrn predstavuje jednoduchý zoznam vedomostí o atribúte pre každú jednotku;

— ak nie je možné určiť počet opakovaní každého variantu;

— ak sú počty opakovaní každého variantu blízko seba.

Jednoduchý aritmetický priemer sa vypočíta podľa vzorca:

kde V - jednotlivé hodnoty atribútu; n je počet jednotlivých hodnôt; - znak súhrnu.

Jednoduchý priemer je teda pomer súčtu variantu k počtu pozorovaní.

Príklad: určiť priemernú dĺžku pobytu na lôžku pre 10 pacientov so zápalom pľúc:

16 dní - 1 pacient; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

posteľný deň.

Aritmetický vážený priemer sa počíta v prípadoch, keď sa jednotlivé hodnoty charakteristiky opakujú. Dá sa vypočítať dvoma spôsobmi:

1. Priamo (aritmetický priemer alebo priama metóda) podľa vzorca:

kde P je frekvencia (počet prípadov) pozorovaní každej možnosti.

Vážený aritmetický priemer je teda pomer súčtu súčinov variantu podľa frekvencie k počtu pozorovaní.

2. Výpočtom odchýlok od podmieneného priemeru (podľa metódy momentov).

Základom pre výpočet váženého aritmetického priemeru je:

— zoskupený materiál podľa variantov kvantitatívneho znaku;

— všetky možnosti by mali byť usporiadané vo vzostupnom alebo zostupnom poradí podľa hodnoty atribútu (poradie podľa poradia).

Pre výpočet metódou momentov je predpokladom rovnaká veľkosť všetkých intervalov.

Podľa metódy momentov sa aritmetický priemer vypočíta podľa vzorca:

,

kde M o je podmienený priemer, ktorý sa často berie ako hodnota vlastnosti zodpovedajúcej najvyššej frekvencii, t.j. ktorý sa častejšie opakuje (Mode).

i - intervalová hodnota.

a - podmienená odchýlka od podmienok priemeru, čo je postupný rad čísel (1, 2 atď.) so znamienkom + pre možnosť veľkého podmieneného priemeru a so znamienkom - (-1, -2 atď. .) pre opciu, ktoré sú podpriemerné. Podmienená odchýlka od variantu braného ako podmienený priemer je 0.

P - frekvencie.

Celkový počet pozorovaní alebo n.

Príklad: určiť priemernú výšku 8-ročných chlapcov priamo (tabuľka 1).

stôl 1

Výška v cm

Chlapci P

Centrálne

možnosť V

Centrálny variant, stred intervalu, je definovaný ako polosúčet počiatočných hodnôt dvoch susedných skupín:

; atď.

Súčin VP sa získa vynásobením centrálnych variantov frekvenciami; atď. Potom sa výsledné produkty pridajú a získajú , ktorý sa vydelí počtom pozorovaní (100) a získa sa vážený aritmetický priemer.

cm.

Rovnaký problém vyriešime pomocou metódy momentov, pre ktoré je zostavená nasledujúca tabuľka 2:

Tabuľka 2

Výška v cm (V)

Chlapci P

122 berieme ako M o, pretože zo 100 pozorovaní malo 33 ľudí výšku 122 cm. Podmienené odchýlky (a) od podmieneného priemeru nájdeme v súlade s vyššie uvedeným. Potom získame súčin podmienených odchýlok podľa frekvencií (aP) a zhrnieme získané hodnoty (). Výsledok bude 17. Nakoniec údaje dosadíme do vzorca.

Rozsah variácií (alebo rozsah variácií) - je rozdiel medzi maximálnou a minimálnou hodnotou funkcie:

V našom príklade je rozsah variácie zmenového výkonu pracovníkov: v prvej brigáde R=105-95=10 detí, v druhej brigáde R=125-75=50 detí. (5 krát viac). To naznačuje, že výkon 1. brigády je „stabilnejší“, ale druhá brigáda má väčšie rezervy na rast výkonu, pretože. ak všetci pracovníci dosiahnu maximálny výkon pre túto brigádu, môže vyrobiť 3 * 125 = 375 dielov a v 1. brigáde len 105 * 3 = 315 dielov.
Ak extrémne hodnoty atribútu nie sú typické pre populáciu, použijú sa kvartilové alebo decilové rozsahy. Kvartilový rozsah RQ= Q3-Q1 pokrýva 50 % populácie, prvý decilový rozsah RD1 = D9-D1 pokrýva 80 % údajov, druhý decilový rozsah RD2= D8-D2 pokrýva 60 %.
Nevýhodou ukazovateľa variačného rozsahu je, že jeho hodnota neodráža všetky výkyvy vlastnosti.
Najjednoduchší zovšeobecňujúci ukazovateľ, ktorý odráža všetky výkyvy vlastnosti, je stredná lineárna odchýlka, čo je aritmetický priemer absolútnych odchýlok jednotlivých opcií od ich priemernej hodnoty:

,
pre zoskupené údaje
,
kde хi je hodnota atribútu v diskrétnom rade alebo stred intervalu v intervalovom rozdelení.
Vo vyššie uvedených vzorcoch sa rozdiely v čitateli berú modulo, inak podľa vlastnosti aritmetického priemeru bude čitateľ vždy rovný nule. Preto sa priemerná lineárna odchýlka v štatistickej praxi používa zriedka, iba v tých prípadoch, keď sčítanie ukazovateľov bez zohľadnenia znamienka dáva ekonomický zmysel. S jeho pomocou sa analyzuje napríklad zloženie zamestnancov, rentabilita výroby, obrat zahraničného obchodu.
Rozptyl vlastností je priemerná druhá mocnina odchýlok variantu od ich priemernej hodnoty:
jednoduchý rozptyl
,
vážený rozptyl
.
Vzorec na výpočet rozptylu možno zjednodušiť:

Rozptyl sa teda rovná rozdielu medzi priemerom druhých mocnín variantu a druhou mocninou priemeru variantu populácie:
.
V dôsledku súčtu kvadrátov odchýlok však rozptyl poskytuje skreslenú predstavu o odchýlkach, takže priemer sa vypočítava z neho. smerodajná odchýlka, ktorá ukazuje, ako veľmi sa konkrétne varianty atribútu v priemere odchyľujú od svojej priemernej hodnoty. Vypočítané pomocou druhej odmocniny rozptylu:
pre nezoskupené údaje
,
pre sériu variácií

Čím je hodnota rozptylu a smerodajnej odchýlky menšia, čím je populácia homogénnejšia, tým spoľahlivejšia (typickejšia) bude priemerná hodnota.
Stredná lineárna a stredná kvadratická odchýlka sú pomenované čísla, t. j. sú vyjadrené v merných jednotkách atribútu, sú obsahovo identické a svojou hodnotou blízke.
Absolútne ukazovatele variácie sa odporúča vypočítať pomocou tabuliek.
Tabuľka 3 - Výpočet variačných charakteristík (na príklade obdobia údajov o zmenovom výkone pracovných tímov)


Počet pracovníkov

Stred intervalu

Odhadované hodnoty

Celkom:

Priemerný zmenový výkon pracovníkov:

Priemerná lineárna odchýlka:

Výstupný rozptyl:

Smerodajná odchýlka výkonu jednotlivých pracovníkov od priemerného výkonu:
.

1 Výpočet rozptylu metódou momentov

Výpočet rozptylov je spojený s ťažkopádnymi výpočtami (najmä ak je priemer vyjadrený ako veľké číslo s niekoľkými desatinnými miestami). Výpočty je možné zjednodušiť použitím zjednodušeného vzorca a disperzných vlastností.
Disperzia má nasledujúce vlastnosti:

  1. ak sa všetky hodnoty atribútu znížia alebo zvýšia o rovnakú hodnotu A, potom sa rozptyl z tohto nezníži:

,

, potom alebo
Pomocou vlastností rozptylu a najprv zmenšením všetkých variantov populácie o hodnotu A a následným delením hodnotou intervalu h získame vzorec na výpočet rozptylu vo variačných radoch s rovnakými intervalmi. spôsob okamihov:
,
kde je rozptyl vypočítaný metódou momentov;
h je hodnota intervalu variačného radu;
– nové (transformované) hodnoty variantov;
A je konštantná hodnota, ktorá sa používa ako stred intervalu s najvyššou frekvenciou; alebo variant s najvyššou frekvenciou;
je druhá mocnina okamihu prvého rádu;
je momentom druhého rádu.
Vypočítajme rozptyl metódou momentov na základe údajov o zmenovom výkone pracovného kolektívu.
Tabuľka 4 - Výpočet rozptylu metódou momentov


Skupiny výrobných pracovníkov, ks.

Počet pracovníkov

Stred intervalu

Odhadované hodnoty

Postup výpočtu:


  1. vypočítajte rozptyl:

2 Výpočet rozptylu alternatívneho znaku

Medzi znakmi, ktoré študuje štatistika, sú tie, ktoré majú iba dva navzájom sa vylučujúce významy. Toto sú alternatívne znaky. Majú dve kvantitatívne hodnoty: možnosti 1 a 0. Frekvencia možností 1, ktorá je označená p, je podiel jednotiek, ktoré majú túto vlastnosť. Rozdiel 1-p=q je frekvencia možností 0.


xi

Aritmetický priemer alternatívneho znaku
pretože p+q=1.

Rozptyl vlastností
, pretože 1-p=q
Rozptyl alternatívneho atribútu sa teda rovná súčinu podielu jednotiek, ktoré tento atribút majú, a podielu jednotiek, ktoré tento atribút nemajú.
Ak sú hodnoty 1 a 0 rovnako časté, teda p=q, rozptyl dosahuje maximum pq=0,25.
Premenná rozptylu sa používa vo výberových prieskumoch, napríklad kvalita produktu.

3 Medziskupinový rozptyl. Pravidlo sčítania odchýlky

Disperzia, na rozdiel od iných charakteristík variácie, je aditívna veličina. Teda v súhrne, ktorý je rozdelený do skupín podľa faktorového kritéria X , výsledný rozptyl r možno rozložiť na rozptyl v rámci každej skupiny (v rámci skupiny) a rozptyl medzi skupinami (medzi skupinami). Potom, spolu so štúdiom variácií vlastnosti v celej populácii ako celku, je možné študovať variácie v každej skupine, ako aj medzi týmito skupinami.

Celkový rozptyl meria variáciu vlastnosti pri nad celou populáciou pod vplyvom všetkých faktorov, ktoré túto odchýlku (odchýlky) spôsobili. Rovná sa strednej štvorci odchýlok jednotlivých hodnôt vlastnosti pri celkového priemeru a možno ho vypočítať ako jednoduchý alebo vážený rozptyl.
Medziskupinový rozptyl charakterizuje variáciu efektívnej funkcie pri, spôsobené vplyvom znamenia-faktora X základom zoskupenia. Charakterizuje variáciu priemeru skupiny a rovná sa strednej štvorci odchýlok priemeru skupiny od celkového priemeru:
,
kde je aritmetický priemer i-tej skupiny;
– počet jednotiek v i-tej skupine (frekvencia i-tej skupiny);
je celkový priemer populácie.
Vnútroskupinový rozptyl odráža náhodnú variáciu, t. j. tú časť variácie, ktorá je spôsobená vplyvom nezohľadnených faktorov a nezávisí od atribútu-faktora, ktorý je základom zoskupenia. Charakterizuje variáciu individuálnych hodnôt vo vzťahu k skupinovým priemerom, rovná sa strednej štvorci odchýlok jednotlivých hodnôt vlastnosti. pri v rámci skupiny z aritmetického priemeru tejto skupiny (priemer skupiny) a vypočíta sa ako jednoduchý alebo vážený rozptyl pre každú skupinu:
alebo ,
kde je počet jednotiek v skupine.
Na základe vnútroskupinových rozptylov pre každú skupinu je možné určiť celkový priemer rozptylov v rámci skupiny:
.
Vzťah medzi tromi rozptylmi sa nazýva pravidlá sčítania rozptylu, podľa ktorého sa celkový rozptyl rovná súčtu medziskupinového rozptylu a priemeru vnútroskupinových rozptylov:

Príklad. Pri skúmaní vplyvu tarifnej kategórie (kvalifikácie) pracovníkov na úroveň produktivity ich práce boli získané nasledujúce údaje.
Tabuľka 5 - Rozdelenie pracovníkov podľa priemerného hodinového výkonu.



p/p

Pracovníci 4. kategórie

Pracovníci 5. kategórie

Cvičenie
pracovník, ks,

Cvičenie
pracovník, ks,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

V tomto príklade sú pracovníci rozdelení do dvoch skupín podľa faktora X- kvalifikácie, ktoré sa vyznačujú svojou hodnosťou. Efektívna vlastnosť – produkcia – sa mení ako pod jej vplyvom (medziskupinová variácia), tak aj v dôsledku iných náhodných faktorov (vnútroskupinová variácia). Úlohou je merať tieto variácie pomocou troch variácií: celkových, medzi skupinami a v rámci skupiny. Empirický koeficient determinácie ukazuje podiel variácie výsledného znaku pri pod vplyvom faktora X. Zvyšok celkovej variácie pri spôsobené zmenami iných faktorov.
V tomto príklade je empirický koeficient determinácie:
alebo 66,7 %,
To znamená, že 66,7 % variácií v produktivite práce pracovníkov je spôsobených rozdielmi v kvalifikácii a 33,3 % je spôsobených vplyvom iných faktorov.
Empirický korelačný vzťah ukazuje tesnosť vzťahu medzi zoskupením a efektívnymi znakmi. Vypočíta sa ako druhá odmocnina empirického koeficientu determinácie:

Empirický korelačný pomer, ako aj , môže nadobúdať hodnoty od 0 do 1.
Ak nie je spojenie, potom = 0. V tomto prípade = 0, to znamená, že priemery skupín sú navzájom rovnaké a neexistuje žiadna medziskupinová variácia. To znamená, že znak zoskupenia - faktor neovplyvňuje tvorbu všeobecnej variácie.
Ak je vzťah funkčný, potom =1. V tomto prípade sa rozptyl skupinových priemerov rovná celkovému rozptylu (), t.j. neexistuje žiadna vnútroskupinová variácia. To znamená, že znak zoskupenia úplne určuje variáciu výsledného znaku, ktorý sa skúma.
Čím je hodnota korelačného vzťahu bližšie k jednej, tým je vzťah medzi znakmi bližšie, bližšie k funkčnej závislosti.
Na kvalitatívne posúdenie blízkosti spojenia medzi označeniami sa používajú vzťahy Chaddock.

V príklade , čo naznačuje úzky vzťah medzi produktivitou pracovníkov a ich kvalifikáciou.

Nehnuteľnosť 1. Aritmetická stredná konštanta sa rovná tejto konštante: at

Nehnuteľnosť 2. Algebraický súčet odchýlok jednotlivých hodnôt atribútu od aritmetického priemeru je nula: pre nezoskupené údaje a pre distribučné riadky.

Táto vlastnosť znamená, že súčet kladných odchýlok sa rovná súčtu negatívnych odchýlok, t.j. všetky odchýlky spôsobené náhodnými príčinami sa navzájom rušia.

Nehnuteľnosť 3. Súčet štvorcových odchýlok jednotlivých hodnôt atribútu od aritmetického priemeru je minimálny počet: pre nezoskupené údaje a pre distribučné riadky. Táto vlastnosť znamená, že súčet štvorcových odchýlok jednotlivých hodnôt vlastnosti od aritmetického priemeru je vždy menší ako súčet odchýlok variantov vlastnosti od akejkoľvek inej hodnoty, aj keď sa od priemeru líši len málo.

Druhá a tretia vlastnosť aritmetického priemeru sa používa na kontrolu správnosti výpočtu priemernej hodnoty; pri štúdiu vzorcov zmien v úrovniach série dynamiky; nájsť parametre regresnej rovnice pri štúdiu korelácie medzi znakmi.

Všetky tri prvé vlastnosti vyjadrujú podstatné znaky priemeru ako štatistickej kategórie.

Nasledujúce vlastnosti priemeru sa považujú za výpočtové, pretože majú určitý praktický význam.

Nehnuteľnosť 4. Ak sa všetky váhy (frekvencie) vydelia nejakým konštantným číslom d, potom sa aritmetický priemer nezmení, pretože toto zníženie rovnako ovplyvní čitateľa aj menovateľa vzorca na výpočet priemeru.

Z tejto vlastnosti vyplývajú dva dôležité dôsledky.

Dôsledok 1. Ak sú všetky váhy rovnaké, výpočet váženého aritmetického priemeru možno nahradiť výpočtom jednoduchého aritmetického priemeru.

Dôsledok 2. Absolútne hodnoty frekvencií (váhy) je možné nahradiť ich špecifickými váhami.

Nehnuteľnosť 5. Ak sú všetky možnosti delené alebo vynásobené nejakým konštantným číslom d, potom sa aritmetický priemer zníži alebo zvýši o d krát.



Nehnuteľnosť 6. Ak sú všetky možnosti znížené alebo zvýšené o konštantné číslo A, potom nastanú podobné zmeny s priemerom.

Aplikované vlastnosti aritmetického priemeru možno ilustrovať aplikáciou metódy výpočtu priemeru od podmieneného začiatku (metóda momentov).

Aritmetický priemer v spôsobe momentov vypočítané podľa vzorca:

kde A je stred ľubovoľného intervalu (uprednostňuje sa stredný);

d je hodnota rovnakého intervalu alebo najväčšieho násobného deliteľa intervalov;

m 1 je moment prvého rádu.

Okamih prvej objednávky je definovaný nasledovne:

.

Techniku ​​aplikácie tejto metódy výpočtu si ukážeme na údajoch z predchádzajúceho príkladu.

Tabuľka 5.6

Pracovné skúsenosti, roky Počet pracovníkov Interval x
až 5 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 a vyššie 22,5 +10 +2 +22
Celkom X X X -3

Ako je možné vidieť z výpočtov uvedených v tabuľke. 5.6 sa od všetkých možností odpočíta jedna z ich hodnôt 12,5, ktorá sa rovná nule a slúži ako podmienený referenčný bod. V dôsledku delenia rozdielov hodnotou intervalu - 5 sa získajú nové varianty.

Podľa výsledkov tabuľky. 5.6 máme: .

Výsledok výpočtov metódou momentov je podobný výsledku, ktorý bol získaný pomocou hlavnej metódy výpočtu aritmetickým váženým priemerom.

Štrukturálne priemery

Na rozdiel od mocninových priemerov, ktoré sa počítajú na základe použitia všetkých variantov hodnôt atribútov, štrukturálne priemery pôsobia ako špecifické hodnoty, ktoré sa zhodujú s dobre definovanými variantmi distribučných radov. Modus a medián charakterizujú hodnotu variantu zaujímajúceho určitú pozíciu v rade variácií s rozsahom.

Móda je hodnota funkcie, ktorá sa v tejto populácii vyskytuje najčastejšie. V sérii variácií to bude variant s najvyššou frekvenciou.

Nájdenie režimu v diskrétnej sérii distribúcia nevyžaduje výpočty. Pri pohľade na stĺpec frekvencie nájdite najvyššiu frekvenciu.

Napríklad rozdelenie pracovníkov v podniku podľa kvalifikácie charakterizujú údaje v tabuľke. 5.7.

Tabuľka 5.7

Najvyššia frekvencia v tejto distribučnej sérii je 80, čo znamená, že režim sa rovná štvrtej číslici. Najčastejšie sa teda stretávame s pracovníkmi štvrtej kategórie.

Ak je distribučný rad intervalový, potom je nastavený iba modálny interval podľa najvyššej frekvencie a potom je režim už vypočítaný podľa vzorca:

,

kde je spodná hranica modálneho intervalu;

je hodnota modálneho intervalu;

je frekvencia modálneho intervalu;

je frekvencia premodálneho intervalu;

je frekvencia postmodálneho intervalu.

Režim vypočítame podľa údajov uvedených v tabuľke. 5.8.

Tabuľka 5.8

To znamená, že podniky majú najčastejšie zisk 726 miliónov rubľov.

Praktické využitie módy je obmedzené. Pri určovaní najobľúbenejších veľkostí obuvi a odevov pri plánovaní ich výroby a predaja, pri štúdiu cien na veľkoobchodných a maloobchodných trhoch (metóda hlavného poľa) sa riadia dôležitosťou módy. Pri výpočte možných zásob výroby sa namiesto priemeru používa režim.

Medián zodpovedá variantu v strede zoradeného distribučného radu. Toto je hodnota vlastnosti, ktorá rozdeľuje celú populáciu na dve rovnaké časti.

Poloha mediánu je určená jeho číslom (N).

kde je počet jednotiek obyvateľstva. Použijeme údaje z príkladu uvedeného v tabuľke. 5.7 na určenie mediánu.

, t.j. medián sa rovná aritmetickému priemeru 100. a 110. hodnoty atribútu. Na základe naakumulovaných frekvencií určíme, že 100. a 110. jednotka série má charakteristickú hodnotu rovnajúcu sa štvrtej číslici, t.j. medián je štvrtá číslica.

Medián v intervalovom rade distribúcie sa určuje v nasledujúcom poradí.

1. Akumulované frekvencie sú vypočítané pre tento zoradený distribučný rad.

2. Na základe akumulovaných frekvencií sa stanoví stredný interval. Nachádza sa tam, kde sa prvá kumulatívna frekvencia rovná alebo je väčšia ako polovica populácie (zo všetkých frekvencií).

3. Medián sa vypočíta podľa vzorca:

,

kde je spodná hranica stredného intervalu;

– hodnota intervalu;

je súčet všetkých frekvencií;

je súčet akumulovaných frekvencií predchádzajúcich strednému intervalu;

je frekvencia stredného intervalu.

Vypočítajte medián podľa tabuľky. 5.8.

Prvá akumulovaná frekvencia, ktorá sa rovná polovici populácie 30, znamená, že medián je v rozsahu 500-700.

To znamená, že polovica podnikov dosahuje zisk až 676 miliónov rubľov a druhá polovica viac ako 676 miliónov rubľov.

Medián sa často používa namiesto priemeru, keď je populácia heterogénna, pretože nie je ovplyvnená extrémnymi hodnotami atribútu. S praktickou aplikáciou mediánu súvisí aj jeho vlastnosť minimalizmu. Absolútny súčet odchýlok jednotlivých hodnôt od mediánu je najmenšia hodnota. Preto sa medián používa vo výpočtoch pri návrhu umiestnenia objektov, ktoré budú využívať rôzne organizácie a jednotlivci.