Aritmeettisen keskiarvon laskentamenetelmät (yksinkertainen ja painotettu aritmeettinen keskiarvo, momenttimenetelmän mukaan). Aritmeettisen keskiarvon ominaisuudet

Aritmeettisen keskiarvon ominaisuudet. Aritmeettisen keskiarvon laskeminen "hetkien" menetelmällä

Laskelmien monimutkaisuuden vähentämiseksi käytetään keskiarvon aritmin pääominaisuuksia:

  • 1. Jos kaikkia keskiarvotetun etumerkin muunnelmia suurennetaan/vähennetään vakioarvolla A, niin aritmeettinen keskiarvo kasvaa/pienenee vastaavasti.
  • 2. Jos määritettävän attribuutin kaikkia muunnelmia suurennetaan/vähennetään n-kertaisesti, keskimääräinen aritmi kasvaa/vähenee n-kertaisesti.
  • 3. Jos kaikkia keskiarvotetun attribuutin taajuuksia kasvatetaan/vähennetään vakiomäärällä, niin aritmeettinen keskiarvo pysyy muuttumattomana.
  • 18. Keskiharmoninen yksinkertainen ja painotettu

Harmoninen keskiarvo - käytetään, kun tilastotiedoissa ei ole tietoja yksittäisten populaatiovaihtoehtojen painoista, mutta vaihtelevan attribuutin arvojen tulot ja vastaavat painot ovat tiedossa.

Harmonisen painotetun keskiarvon yleinen kaava on seuraava:

x on muuttujan ominaisuuden arvo,

w on muuttujan ominaisuuden arvon ja sen painojen tulo (xf)

Esimerkiksi kolme erää tuotetta A ostettiin eri hinnoilla (20, 25 ja 40 ruplaa) Ensimmäisen erän kokonaiskustannukset olivat 2000 ruplaa, toisen erän - 5000 ruplaa ja kolmannen erän - 6000 ruplaa. On määritettävä tavarayksikön A keskihinta.

Keskihinta määritellään kokonaiskustannusten osamääränä jaettuna ostettujen tavaroiden kokonaismäärällä. Harmonista keskiarvoa käyttämällä saamme halutun tuloksen:


Siinä tapauksessa, että ilmiöiden kokonaismäärä, ts. piirrearvojen ja niiden painojen tulot ovat yhtä suuret, silloin käytetään harmonista yksinkertaista keskiarvoa:

x - attribuutin yksittäiset arvot (vaihtoehdot),

n on vaihtoehtojen kokonaismäärä.

Esimerkki. Kaksi autoa kulki samaa reittiä: toinen 60 km/h ja toinen 80 km/h. Otamme jokaisen auton kulkeman reitin pituuden yhtenä kokonaisuutena. Silloin keskinopeus on:

Harmonisella keskiarvolla on monimutkaisempi rakenne kuin aritmeettisella keskiarvolla. Harmonista keskiarvoa käytetään laskelmissa, kun painoina ei käytetä populaation yksiköitä - attribuutin kantajia, vaan näiden yksiköiden tuloja attribuutin arvoilla (eli m = Xf). Keskimääräistä harmonista seisonta-aikaa tulisi käyttää määritettäessä esimerkiksi keskimääräisiä työvoiman, ajan, materiaalien kustannuksia tuotantoyksikköä kohden, osaa kohden kahdelle (kolmelle, neljälle jne.) yritykselle, koneen valmistukseen osallistuville työntekijöille. samantyyppinen tuote, sama osa, tuote.

Kun havaintoja on paljon tai lukuarvo on suuri, vaihtoehtoa käytetään

Yksinkertaistettu tapa laskea aritmeettinen keskiarvo on momenttien menetelmä.

M = A+ iSap

jossa M on aritmeettinen keskiarvo; A - ehdollinen keskiarvo; i - intervalli ryhmien välillä -vaihtoehto;

S - summamerkki; a - kunkin vaihtoehdon ehdollinen poikkeama ehdollisesta keskiarvosta;

p on variantin esiintymistiheys; n on havaintojen lukumäärä.

Esimerkki aritmeettisen keskiarvon laskemisesta hetkien menetelmällä (keskimääräinen ruumiinpaino

pojat alle 18v)

V(n kg) R a (V-A) a. R
+2 +4
+1 +3
M o \u003d 62
-1 -6
-2 -8
-3 -3
n = 25 Sar \u003d - 10 kg

Keskiarvon laskemisen vaiheet momenttimenetelmällä:

2) määritämme "a" - vaihtoehtojen ehdollisen poikkeaman ehdollisesta keskiarvosta, tätä varten vähennämme ehdollisen keskiarvon kustakin vaihtoehdosta: a \u003d V - A, (esimerkiksi a \u003d 64 - 62 \u003d + 2 jne.).

3) kerrotaan ehdollinen poikkeama "a" kunkin vaihtoehdon taajuudella "p" ja saadaan tulo a p;

4) etsi summa Sa. p = -10 kg

5) laske aritmeettinen keskiarvo momenttimenetelmällä:

M = A + i Mahla\u003d 62 - 1 × 0,4 \u003d 61,6 kg

Siten voimme päätellä, että tutkimassamme nuorten miesten ryhmässä keskimääräinen ruumiinpaino

Aritmeettinen keskiarvo sinänsä ei kerro mitään variaatiosarjasta, josta

hän oli laskettu. Sen tyypillisyyteen (luotettavuuteen) vaikuttaa tarkastelun homogeenisuus

materiaalin ja sarjan vaihtelu.

Esimerkki: annetaan kaksi havaintojen lukumäärältään identtistä variaatiosarjaa, joissa

esittää 1-2-vuotiaiden lasten pään ympärysmitan mittaustiedot

Sarjalla on sama määrä havaintoja ja samat aritmeettiset keskiarvot (M = 46 cm).

sisällä on eroja jakautumisessa. Joten ensimmäisen rivin muunnelmat poikkeavat yleisesti

aritmeettinen keskiarvo pienemmällä arvolla kuin toisen rivin vaihtoehdot, mikä antaa

mahdollisuus olettaa, että aritmeettinen keskiarvo (46 cm) on tyypillisempi ensimmäiselle

rivillä kuin toisella.

Tilastoissa he käyttävät vaihtelusarjan monimuotoisuuden kuvaamiseksi keskiverto

keskihajonta(s)

Keskihajonnan laskemiseen on kaksi tapaa: aritmeettinen keskiarvo

hetkien tapa ja tapa. Aritmeettisen keskiarvon laskentamenetelmässä käytetään kaavaa:

missä d on kunkin vaihtoehdon todellinen poikkeama todellisesta keskiarvosta M. Kaavaa käytetään, kun

pieni määrä havaintoja (n<30)

Kaava s:n määrittämiseksi momenttimenetelmällä:

missä a on vaihtoehtojen ehdollinen poikkeama ehdollisesta keskiarvosta;

Toisen asteen momentti ja ensimmäisen asteen momentti neliöity.

On teoreettisesti ja käytännössä todistettu, että jos suurella määrällä havaintoja, keskiarvoon

aritmeettinen lisää ja vähennä siitä 1s (M ± 1s), sitten saatujen arvojen sisällä

Kaikista variaatiosarjan muunnelmista löytyy 68,3 %. Jos aritmeettiseen keskiarvoon

lisää ja vähennä 2s (M ± 2s), niin 95,5% on saatujen arvojen sisällä

kaikki vaihtoehto. M ±3s sisältää 99,7 % variaatiosarjan kaikista muunnelmista.

Tämän säännöksen perusteella on mahdollista tarkistaa aritmeettisen keskiarvon tyypillisyys for

vaihtelusarja, josta se laskettiin. Tätä varten se on välttämätöntä keskimäärin

lisää aritmetiikka ja vähennä siitä kolme kertaa s (M ± 3s). Jos rajoissa

annettu variaatiosarja sopii, niin aritmeettinen keskiarvo on tyypillinen, ts. hän on

ilmaisee sarjan perussäännöllisyyden ja sitä voidaan käyttää.

Tätä säännöstä käytetään laajalti erilaisten standardien (vaatteet,

kengät, koulukalusteet jne.).

Monimuotoisuuden aste ominaisuus variaatiosarjassa voidaan arvioida kerroin

muunnelmat(keskihajonnan suhde aritmeettiseen keskiarvoon,

kerrottuna 100 %:lla

Kun v = s x 100

Arvolla C v alle 10 % havaitaan heikko diversiteetti, arvolla C v 10-20 % - keskimäärin ja yli 20 % -

vahva piirteiden monimuotoisuus.

Tilastollisen tutkimuksen tulosten luotettavuuden arviointi

Kuten olemme sanoneet, luotettavimmat tulokset voidaan saada soveltamalla

jatkuva menetelmä ts. kun tutkitaan yleistä väestöä.

Samaan aikaan väestön tutkimiseen liittyy huomattavaa työlästä.

Siksi biolääketieteellisessä tutkimuksessa pääsääntöisesti valikoiva

havainnot. Jotta otospopulaation tutkimuksesta saadut tiedot voidaan

siirrettiin yleiseen väestöön, on tarpeen arvioida luotettavuus

tilastollisen tutkimuksen tuloksista. Näytteenottokehys ei ehkä riitä

edustavat täysin populaatiota, joten otantahavainnot ovat aina

johon liittyy edustavuusvirhe. Keskivirheen koon (m) perusteella voidaan arvioida

kuinka löydetty otoskeskiarvo eroaa yleisestä keskiarvosta

aggregaatteja. Pieni virhe osoittaa näiden indikaattoreiden läheisyyden, suuri virhe sellainen

ei anna luottamusta.

Aritmeettisen keskiarvon keskivirheen arvoon vaikuttavat seuraavat kaksi seikkaa.

Ensinnäkin kerätyn materiaalin homogeenisuus: mitä pienempi muunnelman hajonta ympärillä on

sen keskiarvo, sitä pienempi edustavuusvirhe. Toiseksi havaintojen määrä:

keskimääräinen virhe on sitä pienempi, mitä suurempi on havaintojen määrä.

Aritmeettisen keskiarvon keskimääräinen virhe lasketaan seuraavalla kaavalla:

Suhteellisten arvojen keskimääräinen virhe (edustavuusvirhe) määräytyy

kaava:

missä m p on indikaattorin keskimääräinen virhe;

p - indikaattori % tai % o

q - (100 -p), (1000 -p)

n - havaintojen kokonaismäärä

Lääkärilaitoksesta poistui 289 potilasta, joista 12 kuoli.

Suhteellinen arvo (kuolleisuus) p = (12:289) x 100 = 4,1 %; q = 100 -p =

100-4,1 \u003d 95,9, mistä

mp = ±

Siten suhteellinen arvo uudelleentarkastelun yhteydessä vastaa

Luottamuksen rajat on suurin ja pienin arvo, jonka sisällä

tietylle virheettömän ennusteen todennäköisyysasteelle voi olla suhteellinen

indikaattori tai väestön keskiarvo

Suhteellisen arvon luottamusrajat yleisväestössä määritetään

P-geeni = P-näyte ± tm m

Aritmeettisen keskiarvon luottamusrajat yleisessä populaatiossa määritetään kaavalla:

M geeni = M select ± tm m

jossa P-geeni ja M-geeni ovat yleisen suhteellisia ja keskiarvoja

aggregaatteja.

P vyb ja M vyb - näytepopulaatiolle saatujen suhteellisten ja keskiarvojen arvot.

m p ja m m - keskimääräisten ja suhteellisten arvojen edustavuusvirhe.

t - luotettavuuskriteeri.

Todetaan, että jos t = 1, luotettavuus ei ylitä 68 %; jos t = 2 - 95 %; jos t = 3-99 %

Lääketieteellisessä ja biologisessa tutkimuksessa katsotaan riittäväksi, jos kriteeri

luottamus t ³ 2 (95 % luottamus)

Kriteerin t löytämiseksi havaintojen lukumäärälle £ 30, on käytettävä erityistä

pöytä

Kun edustavuusvirheen koko pienenee, luottamusrajat pienenevät.

keskimääräiset ja suhteelliset arvot, eli tutkimuksen tulokset tarkentuvat, lähestyvät

väestön vastaavat arvot. Jos edustavuusvirhe

suuria, saat sitten suuret luottamusrajat, jotka voivat olla ristiriidassa

looginen arvio halutusta arvosta väestössä. Luottamuksen rajat

riippuvat myös tutkijan valitseman virheettömän ennusteen todennäköisyysasteesta. klo

suuri todennäköisyys virheettömälle luottamusrajojen ennustealueelle

4. Parillinen ja pariton.

Parillisissa vaihtelusarjoissa taajuuksien summa tai havaintojen kokonaismäärä ilmaistaan ​​parillisena lukuna, parittomissa variaatiosarjoissa parittomana lukuna.

5. Symmetrinen ja epäsymmetrinen.

Symmetrisessä variaatiosarjassa kaiken tyyppiset keskiarvot ovat yhteneväisiä tai ovat hyvin lähellä toisiaan (moodi, mediaani, aritmeettinen keskiarvo).

Riippuen tutkittavien ilmiöiden luonteesta, tilastollisen tutkimuksen erityistehtävistä ja tavoitteista sekä lähdemateriaalin sisällöstä terveystilastoissa käytetään seuraavan tyyppisiä keskiarvoja:

Rakenteelliset keskiarvot (moodi, mediaani);

aritmeettinen keskiarvo;

keskimääräinen harmoninen;

Geometrinen keskiarvo

keskipitkän progressiivinen.

Muoti (M o) - muuttujan ominaisuuden arvo, joka on tutkittavassa populaatiossa yleisempi, ts. korkeinta taajuutta vastaava vaihtoehto. Se löytyy suoraan variaatiosarjan rakenteesta turvautumatta mihinkään laskelmaan. Se on yleensä arvo, joka on hyvin lähellä aritmeettista keskiarvoa ja on erittäin kätevä käytännössä.

Mediaani (M e) - variaatiosarjan jakaminen (rankattu, eli vaihtoehdon arvot on järjestetty nousevaan tai laskevaan järjestykseen) kahteen yhtä suureen puolikkaaseen. Mediaani lasketaan käyttämällä ns. paritonta sarjaa, joka saadaan summaamalla taajuudet peräkkäin. Jos frekvenssien summa vastaa parillista lukua, niin mediaani otetaan tavanomaisesti kahden keskiarvon aritmeettiseksi keskiarvoksi.

Modea ja mediaania sovelletaan avoimen populaation tapauksessa, ts. kun suurimmalla tai pienimmällä vaihtoehdolla ei ole tarkkaa määrällistä ominaisuutta (esimerkiksi alle 15-vuotiaat, 50-vuotiaat ja sitä vanhemmat jne.). Tässä tapauksessa aritmeettista keskiarvoa (parametrisia ominaisuuksia) ei voida laskea.

Keskiverto minä aritmetiikkaa - yleisin arvo. Aritmeettinen keskiarvo on yleensä merkitty M.

Erota yksinkertainen aritmeettinen keskiarvo ja painotettu keskiarvo.

yksinkertainen aritmeettinen keskiarvo laskettu:

— niissä tapauksissa, joissa kokonaisuutta edustaa yksinkertainen luettelo kunkin yksikön attribuutista;

— jos kunkin muunnelman toistojen lukumäärää ei voida määrittää;

— jos kunkin muunnelman toistomäärät ovat lähellä toisiaan.

Yksinkertainen aritmeettinen keskiarvo lasketaan kaavalla:

missä V - attribuutin yksittäiset arvot; n on yksittäisten arvojen lukumäärä; - summausmerkki.

Siten yksinkertainen keskiarvo on muunnelman summan suhde havaintojen määrään.

Esimerkki: määritä 10 keuhkokuumepotilaan keskimääräinen vuoteessa oleskelun kesto:

16 päivää - 1 potilas; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

sänkypäivä.

Aritmeettinen painotettu keskiarvo lasketaan tapauksissa, joissa ominaisuuden yksittäiset arvot toistuvat. Se voidaan laskea kahdella tavalla:

1. Suoraan (aritmeettinen keskiarvo tai suora menetelmä) kaavan mukaan:

jossa P on kunkin vaihtoehdon havaintojen taajuus (tapausten lukumäärä).

Painotettu aritmeettinen keskiarvo on siis taajuuden tulojen summan suhde havaintojen määrään.

2. Laskemalla poikkeamat ehdollisesta keskiarvosta (momenttimenetelmän mukaan).

Painotetun aritmeettisen keskiarvon laskentaperuste on:

— ryhmitelty materiaali määrällisen ominaisuuden muunnelmien mukaan;

— Kaikki vaihtoehdot on järjestettävä nousevaan tai laskevaan järjestykseen attribuutin arvon mukaan (järjestetty sarja).

Momenttimenetelmällä laskemisen edellytyksenä on kaikkien intervallien sama koko.

Momenttimenetelmän mukaan aritmeettinen keskiarvo lasketaan kaavalla:

,

missä M o on ehdollinen keskiarvo, joka usein otetaan korkeinta taajuutta vastaavan ominaisuuden arvoksi, ts. joka toistetaan useammin (Mode).

i - intervalliarvo.

a - ehdollinen poikkeama keskiarvon ehdoista, joka on peräkkäinen numerosarja (1, 2 jne.), jossa on +-merkki suurelle ehdollisen keskiarvon vaihtoehdolle ja - (-1, -2 jne.) allekirjoittaa optiota, jotka ovat keskiarvon alapuolella. Ehdollinen poikkeama ehdollisena keskiarvona otetusta variantista on 0.

P - taajuudet.

Havaintojen kokonaismäärä tai n.

Esimerkki: määrittää suoraan 8-vuotiaiden poikien keskipituus (taulukko 1).

pöytä 1

Korkeus cm

Pojat P

Keski

vaihtoehto V

Keskivariantti, intervallin keskikohta, määritellään kahden vierekkäisen ryhmän alkuarvojen puolisummaksi:

; jne.

VP - tulo saadaan kertomalla keskeiset muunnelmat taajuuksilla ; jne. Sitten tuloksena olevat tuotteet lisätään ja saadaan , joka jaetaan havaintojen määrällä (100) ja saadaan painotettu aritmeettinen keskiarvo.

cm.

Ratkaisemme saman ongelman momenttimenetelmällä, jota varten on koottu seuraava taulukko 2:

Taulukko 2

Korkeus cm (V)

Pojat P

Otamme 122:n M o:na, koska 100 havainnosta 33 ihmisen pituus oli 122 cm. Löydämme ehdolliset poikkeamat (a) ehdollisesta keskiarvosta edellä olevan mukaisesti. Sitten saamme ehdollisten poikkeamien tulon taajuuksilla (aP) ja teemme yhteenvedon saaduista arvoista (). Tulos on 17. Lopuksi korvaamme tiedot kaavaan.

Vaihtelualue (tai vaihteluväli) - on ominaisuuden enimmäis- ja vähimmäisarvojen välinen ero:

Esimerkissämme työntekijöiden vuorotuotannon vaihteluväli on: ensimmäisessä prikaatissa R=105-95=10 lasta, toisessa prikaatissa R=125-75=50 lasta. (5 kertaa enemmän). Tämä viittaa siihen, että 1. prikaatin tuotanto on "vakaampaa", mutta toisella prikaatilla on enemmän reservejä tuotannon kasvuun, koska. jos kaikki työntekijät saavuttavat tämän prikaatin enimmäistehon, se voi tuottaa 3 * 125 = 375 osaa ja 1. prikaatissa vain 105 * 3 = 315 osaa.
Jos määritteen ääriarvot eivät ole tyypillisiä populaatiolle, käytetään kvartiili- tai desiilialueita. Kvartiilialue RQ= Q3-Q1 kattaa 50 % väestöstä, ensimmäinen desiilialue RD1 = D9-D1 kattaa 80 % tiedoista, toinen desiilialue RD2= D8-D2 kattaa 60 %.
Variaatioalueen indikaattorin haittana on, että sen arvo ei heijasta kaikkia piirteen vaihteluita.
Yksinkertaisin yleistävä indikaattori, joka heijastaa piirteen kaikki vaihtelut keskimääräinen lineaarinen poikkeama, joka on yksittäisten vaihtoehtojen absoluuttisten poikkeamien aritmeettinen keskiarvo niiden keskiarvosta:

,
ryhmitellyille tiedoille
,
missä хi on attribuutin arvo diskreetissä sarjassa tai intervallijakauman intervallin keskikohta.
Yllä olevissa kaavoissa osoittajan erot otetaan moduloiksi, muuten osoittaja on aritmeettisen keskiarvon ominaisuuden mukaan aina nolla. Siksi keskimääräistä lineaarista poikkeamaa käytetään tilastokäytännössä harvoin, vain niissä tapauksissa, joissa indikaattoreiden summaaminen ilman etumerkkiä on taloudellisesti järkevää. Sen avulla analysoidaan esimerkiksi henkilöstön kokoonpanoa, tuotannon kannattavuutta ja ulkomaankaupan liikevaihtoa.
Ominaisuuden varianssi on muunnelman keskiarvosta poikkeamien keskimääräinen neliö:
yksinkertainen varianssi
,
painotettu varianssi
.
Varianssin laskentakaavaa voidaan yksinkertaistaa:

Siten varianssi on yhtä suuri kuin muunnelman neliöiden keskiarvon ja populaation muunnelman keskiarvon neliön välinen ero:
.
Neliön poikkeamien summauksen vuoksi varianssi antaa kuitenkin vääristyneen kuvan poikkeamista, joten siitä lasketaan keskiarvo. keskihajonta, joka näyttää kuinka paljon määritteen tietyt muunnelmat poikkeavat keskimäärin keskiarvostaan. Lasketaan ottamalla varianssin neliöjuuri:
ryhmittelemättömille tiedoille
,
variaatiosarjalle

Mitä pienempi varianssin ja keskihajonnan arvo on, mitä homogeenisempi perusjoukko on, sitä luotettavampi (tyypillisempi) keskiarvo on.
Keskimääräinen lineaarinen ja keskimääräinen neliöpoikkeama ovat nimettyjä lukuja, eli ne ilmaistaan ​​attribuutin mittayksiköissä, ovat sisällöltään identtisiä ja arvoltaan lähellä toisiaan.
On suositeltavaa laskea absoluuttiset vaihteluindikaattorit taulukoiden avulla.
Taulukko 3 - Vaihtelun ominaisuuksien laskenta (esimerkiksi työryhmien vuorotuotannon tietojen ajanjaksosta)


Työntekijöiden määrä

Väliajan puoliväli

Arvioidut arvot

Kaikki yhteensä:

Työntekijöiden keskimääräinen työvuorotuotanto:

Keskimääräinen lineaarinen poikkeama:

Lähtödispersio:

Yksittäisten työntekijöiden tuotoksen keskihajonta keskimääräisestä tuotosta:
.

1 Dispersion laskenta momenttimenetelmällä

Varianssien laskemiseen liittyy hankalia laskelmia (varsinkin jos keskiarvo ilmaistaan ​​suurena lukuna useilla desimaaleilla). Laskelmia voidaan yksinkertaistaa käyttämällä yksinkertaistettua kaavaa ja dispersio-ominaisuuksia.
Dispersiolla on seuraavat ominaisuudet:

  1. jos attribuutin kaikkia arvoja pienennetään tai lisätään samalla arvolla A, niin varianssi ei pienene tästä:

,

, sitten tai
Käyttämällä varianssin ominaisuuksia ja vähentämällä ensin kaikki populaation variantit arvolla A ja jakamalla sitten välin h arvolla, saadaan kaava varianssin laskemiseksi yhtäläisin väliajoin olevissa variaatiosarjoissa hetkien tapa:
,
missä on momenttien menetelmällä laskettu dispersio;
h on vaihtelusarjan intervallin arvo;
– uudet (muunnetut) varianttiarvot;
A on vakioarvo, jota käytetään korkeimman taajuuden välin keskikohtana; tai vaihtoehto, jolla on korkein taajuus;
on ensimmäisen kertaluvun hetken neliö;
on toisen järjestyksen hetki.
Lasketaan varianssi momenttimenetelmällä työryhmän vuorotulon tietojen perusteella.
Taulukko 4 - Dispersion laskenta momenttimenetelmällä


Tuotantotyöläisten ryhmät, kpl.

Työntekijöiden määrä

Väliajan puoliväli

Arvioidut arvot

Laskentamenettely:


  1. laske varianssi:

2 Vaihtoehtoisen ominaisuuden varianssin laskenta

Tilastojen tutkimien merkkien joukossa on sellaisia, joilla on vain kaksi toisensa poissulkevaa merkitystä. Nämä ovat vaihtoehtoisia merkkejä. Niille annetaan vastaavasti kaksi kvantitatiivista arvoa: vaihtoehdot 1 ja 0. Vaihtoehtojen 1 taajuus, jota merkitään p:llä, on niiden yksiköiden osuus, joilla on tämä ominaisuus. Ero 1-p=q on vaihtoehtojen 0 taajuus.


xi

Vaihtoehtoisen ominaisuuden aritmeettinen keskiarvo
, koska p+q=1.

Ominaisuuden varianssi
, koska 1-p=q
Siten vaihtoehtoisen attribuutin varianssi on yhtä suuri kuin niiden yksiköiden osuus, joilla on tämä attribuutti, ja niiden yksiköiden osuus, joilla ei ole tätä attribuuttia.
Jos arvot 1 ja 0 ovat yhtä usein, eli p=q, niin varianssi saavuttaa maksiminsa pq=0,25.
Varianssimuuttujaa käytetään otantatutkimuksissa, esimerkiksi tuotteen laatu.

3 Ryhmien välinen hajautus. Varianssin lisäyssääntö

Dispersio, toisin kuin muut vaihtelun ominaisuudet, on additiivinen suure. Eli aggregaatissa, joka on jaettu ryhmiin tekijäkriteerin mukaan X , tuloksena oleva varianssi y voidaan jakaa varianssiksi kunkin ryhmän sisällä (ryhmän sisällä) ja varianssiksi ryhmien välillä (ryhmien välillä). Sitten, kun tutkitaan ominaisuuden vaihtelua koko populaatiossa, on mahdollista tutkia vaihtelua kussakin ryhmässä sekä näiden ryhmien välillä.

Kokonaisvarianssi mittaa piirteen vaihtelua klo koko väestössä kaikkien tämän vaihtelun aiheuttaneiden tekijöiden (poikkeamien) vaikutuksesta. Se on yhtä suuri kuin ominaisuuden yksittäisten arvojen poikkeamien keskineliö klo kokonaiskeskiarvosta ja se voidaan laskea yksinkertaisena tai painotettuna varianssina.
Ryhmien välinen varianssi luonnehtii tehokkaan ominaisuuden vaihtelua klo, joka johtuu merkkitekijän vaikutuksesta X ryhmittymän taustalla. Se kuvaa ryhmän keskiarvojen vaihtelua ja on yhtä suuri kuin ryhmän keskiarvojen poikkeamien keskineliö kokonaiskeskiarvosta:
,
missä on i:nnen ryhmän aritmeettinen keskiarvo;
– yksiköiden lukumäärä i:nnessä ryhmässä (i:nnen ryhmän esiintymistiheys);
on väestön kokonaiskeskiarvo.
Ryhmän sisäinen varianssi heijastaa satunnaista vaihtelua, eli sitä osaa vaihtelusta, joka johtuu huomioimattomien tekijöiden vaikutuksesta ja joka ei riipu ryhmittelyn taustalla olevasta attribuuttitekijästä. Se luonnehtii yksittäisten arvojen vaihtelua suhteessa ryhmän keskiarvoihin, se on yhtä suuri kuin ominaisuuden yksittäisten arvojen poikkeamien keskineliö klo ryhmän sisällä tämän ryhmän aritmeettisesta keskiarvosta (ryhmän keskiarvo) ja se lasketaan yksinkertaisena tai painotettuna varianssina jokaiselle ryhmälle:
tai ,
missä on ryhmän yksiköiden lukumäärä.
Kunkin ryhmän sisäisten varianssien perusteella on mahdollista määrittää ryhmän sisäisten varianssien kokonaiskeskiarvo:
.
Kolmen varianssin välistä suhdetta kutsutaan varianssien lisäyssäännöt, jonka mukaan kokonaisvarianssi on yhtä suuri kuin ryhmien välisen varianssin ja ryhmien sisäisten varianssien keskiarvon summa:

Esimerkki. Kun tutkitaan työntekijöiden tariffiluokan (pätevyyden) vaikutusta heidän työnsä tuottavuuden tasoon, saatiin seuraavat tiedot.
Taulukko 5 - Työntekijöiden jakautuminen keskimääräisen tuntituotannon mukaan.



p/n

4. luokan työntekijät

5. luokan työntekijät

Urheilla
työntekijä, kpl,

Urheilla
työntekijä, kpl,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

Tässä esimerkissä työntekijät on jaettu kahteen ryhmään tekijän mukaan X- pätevyydet, joille on tunnusomaista niiden arvo. Tehokas ominaisuus - tuotanto - vaihtelee sekä sen vaikutuksesta (ryhmien välinen vaihtelu) että muista satunnaisista tekijöistä johtuen (ryhmän sisäinen vaihtelu). Haasteena on mitata nämä vaihtelut käyttämällä kolmea varianssia: kokonaisvarianssia, ryhmien välistä ja ryhmän sisäistä vaihtelua. Empiirinen determinaatiokerroin osoittaa tuloksena olevan ominaisuuden vaihtelun osuuden klo tekijämerkin vaikutuksen alaisena X. Loput kokonaisvaihtelusta klo johtuu muiden tekijöiden muutoksista.
Esimerkissä empiirinen determinaatiokerroin on:
tai 66,7 %
Tämä tarkoittaa, että työntekijöiden työn tuottavuuden vaihtelusta 66,7 % johtuu pätevyyseroista ja 33,3 % muiden tekijöiden vaikutuksesta.
Empiirinen korrelaatiosuhde osoittaa ryhmittelyn ja vaikuttavien ominaisuuksien välisen suhteen tiukkuuden. Se lasketaan empiirisen determinaatiokertoimen neliöjuurena:

Empiirinen korrelaatiosuhde sekä , voivat ottaa arvoja välillä 0-1.
Jos yhteyttä ei ole, niin =0. Tässä tapauksessa =0, ​​eli ryhmän keskiarvot ovat keskenään yhtä suuret, eikä ryhmien välistä vaihtelua ole. Tämä tarkoittaa, että ryhmittelymerkki - tekijä ei vaikuta yleisen vaihtelun muodostumiseen.
Jos suhde on toimiva, niin =1. Tässä tapauksessa ryhmän keskiarvon varianssi on yhtä suuri kuin kokonaisvarianssi (), eli ryhmän sisäistä vaihtelua ei ole. Tämä tarkoittaa, että ryhmittelyominaisuus määrittää täysin tutkittavan tuloksena olevan ominaisuuden vaihtelun.
Mitä lähempänä korrelaatiorelaation arvo on yhtä, sitä lähempänä, lähempänä funktionaalista riippuvuutta on ominaisuuksien välinen suhde.
Merkkien välisen yhteyden läheisyyden laadulliseen arviointiin käytetään Chaddock-suhteita.

Esimerkissä , mikä osoittaa läheistä yhteyttä työntekijöiden tuottavuuden ja heidän pätevyytensä välillä.

Kiinteistö 1. Aritmeettinen keskivakio on yhtä suuri kuin tämä vakio: at

Kiinteistö 2. Attribuutin yksittäisten arvojen aritmeettisesta keskiarvosta poikkeamien algebrallinen summa on nolla: ryhmittämättömille tiedoille ja jakeluriveille.

Tämä ominaisuus tarkoittaa, että positiivisten poikkeamien summa on yhtä suuri kuin negatiivisten poikkeamien summa, ts. kaikki satunnaisista syistä johtuvat poikkeamat kumoavat toisensa.

Kiinteistö 3. Attribuutin yksittäisten arvojen neliöityjen poikkeamien summa aritmeettisesta keskiarvosta on pienin luku: ryhmittämättömille tiedoille ja jakeluriveille. Tämä ominaisuus tarkoittaa, että ominaisuuden yksittäisten arvojen neliöpoikkeamien summa aritmeettisesta keskiarvosta on aina pienempi kuin piirteen muunnelmien poikkeamien summa mistä tahansa muusta arvosta, vaikka se poikkeaisi vähän keskiarvosta.

Aritmeettisen keskiarvon toisella ja kolmannella ominaisuudella tarkistetaan keskiarvon laskennan oikeellisuus; kun tutkitaan dynamiikan sarjan tasojen muutosmalleja; löytää regressioyhtälön parametrit tutkittaessa ominaisuuksien välistä korrelaatiota.

Kaikki kolme ensimmäistä ominaisuutta ilmaisevat keskiarvon olennaiset piirteet tilastollisena kategoriana.

Seuraavia keskiarvon ominaisuuksia pidetään laskennallisina, koska niillä on käytännön merkitystä.

Kiinteistö 4. Jos kaikki painot (taajuudet) jaetaan jollain vakioluvulla d, aritmeettinen keskiarvo ei muutu, koska tämä vähennys vaikuttaa yhtä lailla sekä keskiarvon laskentakaavan osoittajaan että nimittäjään.

Tästä ominaisuudesta seuraa kaksi tärkeää seurausta.

Seuraus 1. Jos kaikki painot ovat yhtä suuret, painotetun aritmeettisen keskiarvon laskeminen voidaan korvata yksinkertaisen aritmeettisen keskiarvon laskennalla.

Seuraus 2. Taajuuksien absoluuttiset arvot (painot) voidaan korvata niiden ominaispainoilla.

Kiinteistö 5. Jos kaikki vaihtoehdot jaetaan tai kerrotaan jollain vakioluvulla d, niin aritmeettinen keskiarvo pienenee tai kasvaa d kertaa.



Kiinteistö 6. Jos kaikkia vaihtoehtoja vähennetään tai lisätään vakiolla A, samanlaisia ​​muutoksia tapahtuu keskiarvon kanssa.

Aritmeettisen keskiarvon sovellettuja ominaisuuksia voidaan havainnollistaa soveltamalla keskiarvon laskentamenetelmää ehdollisen alusta (momenttien menetelmä).

Aritmeettinen keskiarvo hetkien tiellä lasketaan kaavalla:

missä A on minkä tahansa välin keskikohta (etusija annetaan keskimmäiselle);

d on yhtäläisen välin arvo tai välien suurin moninkertainen jakaja;

m 1 on ensimmäisen tilauksen hetki.

Ensimmäisen tilauksen hetki määritellään seuraavasti:

.

Havainnollistamme tämän laskentamenetelmän soveltamistekniikkaa käyttämällä edellisen esimerkin tietoja.

Taulukko 5.6

Työkokemusta, vuosia Työntekijöiden määrä Väli x
5 asti 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 ja yli 22,5 +10 +2 +22
Kaikki yhteensä X X X -3

Kuten taulukossa annetuista laskelmista voidaan nähdä. 5.6 yksi niiden arvoista 12,5 vähennetään kaikista vaihtoehdoista, mikä on yhtä suuri kuin nolla ja toimii ehdollisena vertailupisteenä. Jakamalla erot intervallin arvolla - 5 saadaan uusia variantteja.

Taulukon tulosten mukaan. 5.6 meillä on: .

Momenttimenetelmällä suoritettujen laskelmien tulos on samanlainen kuin tulos, joka saatiin päälaskentamenetelmällä aritmeettisella painotetulla keskiarvolla.

Rakenteelliset keskiarvot

Toisin kuin potenssilain keskiarvot, jotka lasketaan käyttämällä attribuuttiarvojen kaikkia muunnelmia, rakenteelliset keskiarvot toimivat erityisinä arvoina, jotka ovat yhteneväisiä jakaumasarjan hyvin määriteltyjen muunnelmien kanssa. Tila ja mediaani kuvaavat vaihteluvälisarjassa tietyn sijainnin olevan muunnelman arvoa.

Muoti on tässä populaatiossa useimmin esiintyvän ominaisuuden arvo. Muunnelmasarjassa tämä on suurin taajuus.

Tilan löytäminen erillisestä sarjasta jakelu ei vaadi laskelmia. Etsi taajuussarakkeesta korkein taajuus.

Esimerkiksi yrityksen työntekijöiden jakautumista pätevyyden mukaan kuvaavat taulukon tiedot. 5.7.

Taulukko 5.7

Tämän jakelusarjan korkein taajuus on 80, mikä tarkoittaa, että tila on yhtä suuri kuin neljäs numero. Näin ollen neljänteen luokkaan kuuluvia työntekijöitä kohdataan useimmiten.

Jos jakaumasarja on intervalli, silloin vain modaaliväli asetetaan korkeimmalla taajuudella, ja sitten tila on jo laskettu kaavalla:

,

missä on modaalivälin alaraja;

on modaalivälin arvo;

on modaalivälin taajuus;

on premodaalisen intervallin taajuus;

on postmodaalisen intervallin taajuus.

Laskemme tilan taulukossa annettujen tietojen mukaan. 5.8

Taulukko 5.8

Tämä tarkoittaa, että useimmiten yritysten voitto on 726 miljoonaa ruplaa.

Muodin käytännön soveltaminen on rajallista. He ohjaavat muodin arvoa määritellessään suosituimpia kenkien ja vaatteiden kokoja suunniteltaessa niiden tuotantoa ja myyntiä, tutkiessaan hintoja tukku- ja vähittäismarkkinoilla (päätaulukkomenetelmä). Mahdollisia tuotantovaroja laskettaessa käytetään moodia keskiarvon sijaan.

Mediaani vastaa sijoitetun jakelusarjan keskellä olevaa varianttia. Tämä on ominaisuuden arvo, joka jakaa koko populaation kahteen yhtä suureen osaan.

Mediaanin sijainti määräytyy sen numeron (N) perusteella.

missä on väestöyksiköiden lukumäärä. Käytämme taulukon esimerkin tietoja. 5.7 mediaanin määrittämiseksi.

, eli mediaani on yhtä suuri kuin piirteen 100. ja 110. arvon aritmeettinen keskiarvo. Kertyneiden taajuuksien perusteella päätämme, että sarjan 100. ja 110. yksiköllä on ominaisarvo, joka on yhtä suuri kuin neljäs numero, ts. mediaani on neljäs numero.

Jakauman välisarjan mediaani määritetään seuraavassa järjestyksessä.

1. Kertyneet frekvenssit lasketaan tälle paremmuusjärjestetylle jakaumasarjalle.

2. Kerättyjen taajuuksien perusteella määritetään mediaaniväli. Se sijaitsee paikassa, jossa ensimmäinen kumulatiivinen taajuus on yhtä suuri tai suurempi kuin puolet väestöstä (kaikista taajuuksista).

3. Mediaani lasketaan kaavalla:

,

missä on mediaanivälin alaraja;

– intervalliarvo;

on kaikkien taajuuksien summa;

on mediaaniväliä edeltävien kumuloituneiden taajuuksien summa;

on mediaanivälin taajuus.

Laske mediaani taulukon mukaan. 5.8

Ensimmäinen kertynyt taajuus, joka on yhtä suuri kuin puolet väestöstä 30, tarkoittaa, että mediaani on alueella 500-700.

Tämä tarkoittaa, että puolet yrityksistä tekee voittoa jopa 676 miljoonaa ruplaa ja toinen puoli yli 676 miljoonaa ruplaa.

Mediaania käytetään usein keskiarvon sijasta, kun populaatio on heterogeeninen, koska attribuutin ääriarvot eivät vaikuta siihen. Mediaanin käytännön soveltaminen liittyy myös sen minimaalisuusominaisuuteen. Yksittäisten arvojen mediaanista poikkeamien absoluuttinen summa on pienin arvo. Siksi mediaania käytetään laskelmissa suunniteltaessa eri organisaatioiden ja henkilöiden käyttämien objektien sijaintia.