Korjaus Design Huonekalut

Tilastollinen otanta. Arvio yleisestä osuudesta

Usein tapahtuu, että on tarpeen analysoida tiettyä sosiaalista ilmiötä ja saada siitä tietoa. Tällaisia ​​tehtäviä esiintyy usein tilastoissa ja tilastollisissa tutkimuksissa. Usein on mahdotonta varmistaa täysin määritelty sosiaalinen ilmiö. Kuinka esimerkiksi selvittää tietyn kaupungin väestön tai kaikkien asukkaiden mielipide mistä tahansa asiasta? Kaikkien kysyminen on lähes mahdotonta ja erittäin työlästä. Tällaisissa tapauksissa tarvitsemme näytteen. Juuri tämä käsite perustuu lähes kaikkiin tutkimuksiin ja analyyseihin.

Mitä on näytteenotto

Tiettyä sosiaalista ilmiötä analysoitaessa on välttämätöntä hankkia siitä tietoa. Jos teet tutkimusta, huomaat, että kaikki tutkimuskohteen kokonaisuuden yksiköt eivät ole tutkimuksen ja analyysin kohteena. Vain tietty osa tästä kokonaisuudesta otetaan huomioon. Tämä prosessi on otanta: kun tutkitaan vain tiettyjä yksiköitä sarjasta.

Tietysti paljon riippuu näytteen tyypistä. Mutta on myös perussääntöjä. Tärkeintä on, että väestöstä valinnan on oltava täysin satunnainen. Käytettäviä populaatioyksiköitä ei pitäisi valita minkään kriteerin vuoksi. Karkeasti ottaen, jos on tarpeen rekrytoida väestö tietyn kaupungin väestöstä ja valita vain miehiä, tutkimuksessa on virhe, koska valinta ei tapahtunut sattumalta, vaan se valittiin sukupuolen mukaan. Lähes kaikki näytteenottomenetelmät perustuvat tähän sääntöön.

Näytteenottosäännöt

Jotta valittu populaatio heijastaisi koko ilmiön perusominaisuuksia, se on rakennettava erityisten lakien mukaisesti, ja päähuomiota on kiinnitettävä seuraaviin luokkiin:

  • näyte (otosjoukko);
  • väestö;
  • edustavuus;
  • edustusvirhe;
  • aggregaattiyksikkö;
  • näytteenottomenetelmät.

Näytteenoton ja näytteenoton ominaisuudet ovat seuraavat:

  1. Kaikki saadut tulokset perustuvat matemaattisiin lakeihin ja sääntöihin, eli jos tutkimus suoritetaan oikein ja oikeilla laskelmilla, tulokset eivät vääristy subjektiivisesti.
  2. Sen avulla voit saada tuloksen paljon nopeammin ja vähemmän aikaa ja resursseja tutkimatta kaikkia tapahtumia, vaan vain osaa niistä.
  3. Sitä voidaan käyttää erilaisten kohteiden tutkimiseen: alkaen erityisiä kysymyksiä esimerkiksi meitä kiinnostavan ryhmän ikä, sukupuoli, yleisen mielipiteen tutkiminen tai väestön aineellisen turvallisuuden taso.

Valikoiva havainto

Tämä on valikoivaa tilastollinen havainto, jossa ei tutkittavan tutkimuksen kokonaisuutta ole tutkittu, vaan vain osa siitä, valittu tietyllä tavalla, ja tämän osan tutkimuksen tulokset ulotetaan koko aggregaattiin. Tätä osaa kutsutaan otosjoukkoksi. se ainoa tapa tutkimalla suurta joukkoa tutkimuskohteita.

Mutta valikoivaa havaintoa voidaan käyttää vain tapauksissa, joissa on tarpeen tutkia vain pieni ryhmä yksiköitä. Esimerkiksi tutkittaessa miesten ja naisten suhdetta maailmassa käytetään otantatarkkailua. Ilmeisistä syistä on mahdotonta ottaa huomioon planeettamme jokainen asukas.

Mutta samalla tutkimuksella, mutta eivät kaikki maan asukkaat, mutta tietty 2 "A" -luokka tietyssä koulussa, tietyssä kaupungissa, tietyssä maassa, voivat pärjätä ilman valikoivaa havaintoa. Loppujen lopuksi on täysin mahdollista analysoida tutkimuskohteen koko joukko. Tämän luokan pojat ja tytöt on laskettava - tämä on suhde.

Näyte ja väestö

Itse asiassa kaikki ei ole niin monimutkaista kuin miltä se kuulostaa. Missä tahansa tutkimuskohteessa on kaksi järjestelmää: yleisväestö ja otosjoukko. Mikä se on? Kaikki yksiköt luokitellaan yleisiksi. Ja otokseen - ne väestön yksiköt, jotka otettiin otokseen. Jos kaikki tehdään oikein, valittu osa muodostaa pienennetyn mallin koko (yleisestä) väestöstä.

Jos puhumme koko väestöstä, voimme erottaa vain kaksi sen lajiketta: varma ja määrittelemätön väestö. Riippuu siitä, onko tietyn järjestelmän yksiköiden kokonaismäärä tiedossa vai ei. Jos tämä on tietty populaatio, näytteenotto on helpompaa, koska tiedetään, kuinka monta prosenttia näytteiden kokonaismäärästä otetaan.

Tämä kohta on erittäin tarpeellinen tutkimuksessa. Jos esimerkiksi haluat tutkia huonolaatuisten makeistuotteiden prosenttiosuutta tietyssä tehtaassa. Oletetaan, että väestö on jo määritetty. Tiedetään varmasti, että tämä yritys valmistaa 1000 makeistuotetta vuodessa. Jos teemme näytteen 100 satunnaisesta makeistuotteesta tuhannesta ja lähetämme ne tarkastettavaksi, virhe on minimaalinen. Karkeasti ottaen 10% kaikista tuotteista oli tutkimuksen kohteena, ja tulosten mukaan voimme, kun otetaan huomioon edustavuusvirhe, puhua kaikkien tuotteiden huonosta laadusta.

Ja jos otamme näytteitä 100 makeistuotteesta määrittelemättömältä yleisöltä, jossa todellisuudessa oli esimerkiksi miljoona yksikköä, otoksen tulos ja itse tutkimus ovat kriittisesti epätodennäköisiä ja epätarkkoja. Tunnetko eron? Siksi väestön varmuus on useimmissa tapauksissa erittäin tärkeää ja vaikuttaa suuresti tutkimuksen tulokseen.

Väestön edustavuus

Joten nyt yksi tärkeimmistä kysymyksistä - mikä pitäisi olla näyte? Tämä on eniten Pääasia tutkimus. Tässä vaiheessa on tarpeen laskea näyte ja valita yksiköt kokonaismäärästä siihen. Väestö valittiin oikein, jos tietyt väestön piirteet ja ominaisuudet jäävät otokseen. Tätä kutsutaan edustavuudeksi.

Toisin sanoen, jos osa valinnan jälkeen säilyttää samat taipumukset ja ominaisuudet kuin tutkittavan koko määrä, niin tällaista joukkoa kutsutaan edustavaksi. Kaikkia yksittäisiä otoksia ei kuitenkaan voida valita edustavasta populaatiosta. On myös sellaisia ​​tutkimuskohteita, joiden otos ei yksinkertaisesti voi olla edustava. Tässä syntyy käsite edustavuusvirheestä. Mutta puhutaanpa tästä hieman yksityiskohtaisemmin.

Kuinka tehdä näyte

Edustavuuden maksimoimiseksi on siis olemassa kolme päänäytteenottosääntöä:


Edustavuuden virhe (virhe)

Tärkein ominaisuus valitun otoksen laatu on käsite "edustavuusvirhe". Mikä se on? Nämä ovat tiettyjä eroja valikoivan ja jatkuvan tarkkailun indikaattoreiden välillä. Virheindikaattoreiden osalta edustavuus on jaettu luotettaviin, normaaleihin ja likimääräisiin. Toisin sanoen enintään 3%: n, 3%: n ja 10-20%: n poikkeamat ovat sallittuja. Vaikka tilastoissa on toivottavaa, että virhe ei ylitä 5-6%. Muussa tapauksessa on syytä puhua otoksen riittämättömästä edustavuudesta. Monet tekijät otetaan huomioon laskettaessa edustavuuden harhaa ja sen vaikutusta otokseen tai väestöön:

  1. Todennäköisyys, jolla haluat saada tarkan tuloksen.
  2. Näytteen yksiköiden lukumäärä. Kuten aiemmin mainittiin, mitä vähemmän yksikköä otos tekee, sitä suurempi on edustavuusvirhe ja päinvastoin.
  3. Tutkitun populaation homogeenisuus. Mitä heterogeenisempi väestö on, sitä suurempi on edustusvirhe. Aggregaatin kyky olla edustava riippuu kaikkien sen muodostavien yksiköiden homogeenisuudesta.
  4. Menetelmä yksiköiden valitsemiseksi näytteelle.

Erityistutkimuksissa keskiarvon virheprosenttiosuuden määrittää yleensä tutkija itse havainto -ohjelman ja aiempien tutkimusten perusteella. Yleensä hyväksyttävän marginaalisen otantavirheen (edustavuusvirheen) katsotaan olevan 3–5%.

Isompi ei ole aina parempi

On myös syytä muistaa, että selektiivisen havainnoinnin järjestämisessä tärkeintä on saada sen määrä hyväksyttävään minimiin. Samanaikaisesti ei pidä pyrkiä otantavirheiden rajojen liialliseen pienentämiseen, koska tämä voi johtaa otoksen koon perusteettomaan kasvuun ja siten valikoivan tutkimuksen kustannusten nousuun.

Samaan aikaan on mahdotonta lisätä liikaa edustusvirheen kokoa. Vaikka tässä tapauksessa otosjoukon koko pienenee, tämä johtaa todellakin saatujen tulosten luotettavuuden heikkenemiseen.

Mitä kysymyksiä yleensä kysytään ennen tutkijaa

Kaikki tutkimukset, jos niitä tehdään, on tarkoitettu johonkin tarkoitukseen ja joidenkin tulosten saamiseksi. Otettaessa otantatutkimusta pääsääntöisesti esille ensimmäiset kysymykset:


Menetelmät tutkimusyksiköiden valitsemiseksi otoksesta

Kaikki näytteet eivät ole edustavia. Joskus sama merkki ilmaistaan ​​eri tavalla kokonaisuudessaan ja osittain. Edustavuusvaatimusten saavuttamiseksi on suositeltavaa käyttää erilaisia ​​näytteenottotekniikoita. Lisäksi yhden tai toisen menetelmän käyttö riippuu erityisolosuhteista. Näitä näytteenottotekniikoita ovat:

  • satunnainen valinta;
  • mekaaninen valinta;
  • tyypillinen valinta;
  • sarjavalinta (sisäkkäin).

Satunnaisotanta on mittausjärjestelmä, jonka tarkoituksena on valita väestön yksiköt satunnaisesti, kun todennäköisyys päästä otokseen on sama kaikille väestöyksiköille. On suositeltavaa käyttää tätä tekniikkaa vain homogeenisuuden ja pienen määrän luontaisten ominaisuuksien tapauksessa. Muuten jotkut erityisiä piirteitä riski, että se ei näy otoksessa. Satunnainen näytteenotto on kaikkien muiden näytteenottomenetelmien ydin.

Yksiköiden mekaanisella valinnalla se suoritetaan tietyin aikavälein. Jos on tarpeen muodostaa näyte tietyistä rikoksista, jokainen viides, kymmenes tai viidestoista kortti voidaan poistaa kaikista rekisteröityjen rikosten tilastorekistereistä niiden kokonaismäärän ja käytettävissä olevien otoskokojen mukaan. Tämän menetelmän haittana on, että ennen näytteenottoa on oltava täydellinen tili populaation yksiköistä, sitten on suoritettava ranking, ja vasta sen jälkeen on mahdollista ottaa näyte tietyin aikavälein . Tämä menetelmä on aikaa vievä ja siksi sitä ei käytetä usein.

Tyypillinen (kaavoitettu) valinta on otantatyyppi, jossa väestö on jaettu homogeenisiin ryhmiin tietyn ominaisuuden mukaan. Joskus tutkijat käyttävät muita termejä "ryhmien" sijasta: "alueet" ja "vyöhykkeet". Sitten kustakin ryhmästä valitaan satunnaisesti tietty määrä yksiköitä suhteessa tietty painovoima väestön ryhmät. Tyypillinen valinta suoritetaan usein useissa vaiheissa.

Sarjanäyte on menetelmä, jossa yksiköt valitaan ryhmissä (sarjat) ja kaikki valitun ryhmän (sarjan) yksiköt tutkitaan. Tämän menetelmän etuna on, että joskus on vaikeampaa valita yksittäisiä yksiköitä kuin sarjoja, esimerkiksi tutkittaessa rangaistusta suorittavaa henkilöä. Valituilla alueilla, vyöhykkeillä sovelletaan poikkeuksetta kaikkien yksiköiden tutkimusta, esimerkiksi kaikkien tietyssä laitoksessa rangaistusta suorittavien henkilöiden tutkimista.

näytteenottotyypit:

Oikeastaan ​​satunnaisesti;

Mekaaninen;

Tyypillinen;

Sarja;

Yhdistetty.

Oikein satunnainen näytteenotto koostuu yksiköiden valinnasta yleisestä populaatiosta satunnaisesti tai satunnaisesti ilman järjestelmällisiä elementtejä. Ennen oikean satunnaisvalinnan tekemistä on kuitenkin varmistettava, että kaikilla väestön yksiköillä on poikkeuksetta ehdottomasti samat mahdollisuudet päästä otokseen, luetteloissa tai luettelossa ei ole puutteita yksittäisiä yksiköitä huomiotta jättämättä. jne. Olisi myös vahvistettava selkeät väestörajat, jotta yksittäisten yksiköiden sisällyttäminen tai poissulkeminen olisi selvää. Esimerkiksi opiskelijoita tutkittaessa on ilmoitettava, otetaanko akateemisella lomalla olevat henkilöt, valtiosta riippumattomien yliopistojen opiskelijat, sotilaskoulut jne. on tärkeää, että kauppiaiden kysely selvittää, otetaanko väestö mukaan kaupan paviljongit, kaupalliset teltat ja muut vastaavat kohteet. Itse asiassa satunnainen valinta voi olla toistuva tai toistamaton. Jos haluat tehdä toistuvan valinnan arvontaprosessissa, arpajaisia ​​ei palauteta alkuperäiseen sarjaan eivätkä ne osallistu seuraavaan valintaan. Taulukoita käytettäessä satunnaisia ​​numeroita valinnan toistamatta jättäminen saavutetaan ohittamalla numerot, jos ne toistetaan valitussa sarakkeessa tai sarakkeissa.

Mekaaninen näytteenotto koskee tapauksia, joissa väestö on jollain tavalla järjestetty, ts. yksiköiden järjestelyssä on tietty järjestys (työntekijöiden henkilöstön määrä, äänestäjäluettelot, vastaajien puhelinnumerot, talojen ja asuntojen lukumäärä jne.).

Yleinen populaatio mekaanisen valinnan aikana voidaan järjestää tai järjestää tutkitun arvon mukaan tai korreloida sen kanssa, mikä lisää otoksen edustavuutta. Kuitenkin tässä tapauksessa järjestelmällisen virheen vaara kasvaa, mikä liittyy tutkittavan ominaisuuden arvojen aliarviointiin (jos ensimmäinen arvo tallennetaan kultakin aikaväliltä) tai sen yliarviointiin (jos viimeinen arvo tallennetaan jokaiselta väliltä). Siksi on suositeltavaa aloittaa valinta ensimmäisen välin puolivälistä

Tyypillinen valinta. Tätä valintamenetelmää käytetään tapauksissa, joissa kaikki väestön yksiköt voidaan jakaa useisiin tyypillisiin ryhmiin. Väestöä kartoitettaessa tällaisia ​​ryhmiä voivat olla esimerkiksi piirit, sosiaaliset, ikä- tai koulutusryhmät, kun yrityksiä kartoitetaan - teollisuus tai osa -alue, omistusmuoto jne. Tyypillinen valinta sisältää näytteenoton yksiköistä kustakin tyypillisestä ryhmästä satunnaisella tai mekaanisesti... Koska otosjoukko sisältää jossain suhteessa välttämättä kaikkien ryhmien edustajia, yleisen populaation tyypitys mahdollistaa sen, että ryhmien välisen varianssin vaikutus poissuljettuun keskimääräiseen otantavirheeseen voidaan sulkea pois, mikä tässä tapauksessa määräytyy vain ryhmän sisäisen vaihtelun perusteella.

Yksiköiden valinta tyypillisessä näytteessä voidaan järjestää joko suhteessa tyypillisten ryhmien tilavuuteen tai suhteessa ominaisuuden ryhmän sisäiseen erilaistumiseen.

Sarjan valinta. Tämä valintamenetelmä on kätevä, kun populaatioyksiköt yhdistetään pieniksi ryhmiksi tai sarjoiksi. Paketteja, joissa on tietty määrä, voidaan pitää tällaisina sarjoina. valmistuneet tuotteet, tavaraerät, opiskelijaryhmät, prikaatit ja muut yhdistykset. Sarjanäytteenoton ydin on itse asiassa satunnainen tai mekaaninen sarjojen valinta, jonka aikana suoritetaan jatkuva yksikkötutkimus.

Usein tapahtuu, että on tarpeen analysoida tiettyä sosiaalista ilmiötä ja saada siitä tietoa. Tällaisia ​​tehtäviä esiintyy usein tilastoissa ja tilastollisissa tutkimuksissa. Usein on mahdotonta varmistaa täysin määritelty sosiaalinen ilmiö. Kuinka esimerkiksi selvittää tietyn kaupungin väestön tai kaikkien asukkaiden mielipide mistä tahansa asiasta? Kaikkien kysyminen on lähes mahdotonta ja erittäin työlästä. Tällaisissa tapauksissa tarvitsemme näytteen. Juuri tämä käsite perustuu lähes kaikkiin tutkimuksiin ja analyyseihin.

Mitä on näytteenotto

Tiettyä sosiaalista ilmiötä analysoitaessa on välttämätöntä hankkia siitä tietoa. Jos teet tutkimusta, huomaat, että kaikki tutkimuskohteen kokonaisuuden yksiköt eivät ole tutkimuksen ja analyysin kohteena. Vain tietty osa tästä kokonaisuudesta otetaan huomioon. Tämä prosessi on otanta: kun tutkitaan vain tiettyjä yksiköitä sarjasta.

Tietysti paljon riippuu näytteen tyypistä. Mutta on myös perussääntöjä. Tärkeintä on, että väestöstä valinnan on oltava täysin satunnainen. Käytettäviä populaatioyksiköitä ei pitäisi valita minkään kriteerin vuoksi. Karkeasti ottaen, jos on tarpeen rekrytoida väestö tietyn kaupungin väestöstä ja valita vain miehiä, tutkimuksessa on virhe, koska valinta ei tapahtunut sattumalta, vaan se valittiin sukupuolen mukaan. Lähes kaikki näytteenottomenetelmät perustuvat tähän sääntöön.

Näytteenottosäännöt

Jotta valittu populaatio heijastaisi koko ilmiön perusominaisuuksia, se on rakennettava erityisten lakien mukaisesti, ja päähuomiota on kiinnitettävä seuraaviin luokkiin:

  • näyte (otosjoukko);
  • väestö;
  • edustavuus;
  • edustusvirhe;
  • aggregaattiyksikkö;
  • näytteenottomenetelmät.

Näytteenoton ja näytteenoton ominaisuudet ovat seuraavat:

  1. Kaikki saadut tulokset perustuvat matemaattisiin lakeihin ja sääntöihin, eli jos tutkimus suoritetaan oikein ja oikeilla laskelmilla, tulokset eivät vääristy subjektiivisesti.
  2. Sen avulla voit saada tuloksen paljon nopeammin ja vähemmän aikaa ja resursseja tutkimatta kaikkia tapahtumia, vaan vain osaa niistä.
  3. Sitä voidaan käyttää erilaisten kohteiden tutkimiseen: tietyistä kysymyksistä, esimerkiksi iästä, meitä kiinnostavan ryhmän sukupuolesta, yleisen mielipiteen tai väestön aineellisen turvallisuuden tason tutkimiseen.

Valikoiva havainto

Valikoiva on sellainen tilastollinen havainto, jossa ei tutkittua koko tutkittavaa joukkoa, vaan vain tietty osa siitä, valittu tietyllä tavalla, ja tämän osan tutkimuksen tulokset ulotetaan koko joukkoon. Tätä osaa kutsutaan otosjoukkoksi. Tämä on ainoa tapa tutkia suurta joukkoa tutkimuskohteita.

Mutta valikoivaa havaintoa voidaan käyttää vain tapauksissa, joissa on tarpeen tutkia vain pieni ryhmä yksiköitä. Esimerkiksi tutkittaessa miesten ja naisten suhdetta maailmassa käytetään otantatarkkailua. Ilmeisistä syistä on mahdotonta ottaa huomioon planeettamme jokainen asukas.

Mutta samalla tutkimuksella, mutta eivät kaikki maan asukkaat, mutta tietty 2 "A" -luokka tietyssä koulussa, tietyssä kaupungissa, tietyssä maassa, voivat pärjätä ilman valikoivaa havaintoa. Loppujen lopuksi on täysin mahdollista analysoida tutkimuskohteen koko joukko. Tämän luokan pojat ja tytöt on laskettava - tämä on suhde.


Näyte ja väestö

Itse asiassa kaikki ei ole niin monimutkaista kuin miltä se kuulostaa. Missä tahansa tutkimuskohteessa on kaksi järjestelmää: yleisväestö ja otosjoukko. Mikä se on? Kaikki yksiköt luokitellaan yleisiksi. Ja otokseen - ne väestön yksiköt, jotka otettiin otokseen. Jos kaikki tehdään oikein, valittu osa muodostaa pienennetyn mallin koko (yleisestä) väestöstä.

Jos puhumme koko väestöstä, voimme erottaa vain kaksi sen lajiketta: varma ja määrittelemätön väestö. Riippuu siitä, onko tietyn järjestelmän yksiköiden kokonaismäärä tiedossa vai ei. Jos tämä on tietty populaatio, näytteenotto on helpompaa, koska tiedetään, kuinka monta prosenttia näytteiden kokonaismäärästä otetaan.

Tämä kohta on erittäin tarpeellinen tutkimuksessa. Jos esimerkiksi haluat tutkia huonolaatuisten makeistuotteiden prosenttiosuutta tietyssä tehtaassa. Oletetaan, että väestö on jo määritetty. Tiedetään varmasti, että tämä yritys valmistaa 1000 makeistuotetta vuodessa. Jos teemme näytteen 100 satunnaisesta makeistuotteesta tuhannesta ja lähetämme ne tarkastettavaksi, virhe on minimaalinen. Karkeasti ottaen 10% kaikista tuotteista oli tutkimuksen kohteena, ja tulosten mukaan voimme, kun otetaan huomioon edustavuusvirhe, puhua kaikkien tuotteiden huonosta laadusta.

Ja jos otamme näytteitä 100 makeistuotteesta määrittelemättömältä yleisöltä, jossa todellisuudessa oli esimerkiksi miljoona yksikköä, otoksen tulos ja itse tutkimus ovat kriittisesti epätodennäköisiä ja epätarkkoja. Tunnetko eron? Siksi väestön varmuus on useimmissa tapauksissa erittäin tärkeää ja vaikuttaa suuresti tutkimuksen tulokseen.


Väestön edustavuus

Joten nyt yksi tärkeimmistä kysymyksistä - mikä pitäisi olla näyte? Tämä on tutkimuksen tärkein kohta. Tässä vaiheessa on tarpeen laskea näyte ja valita yksiköt kokonaismäärästä siihen. Väestö valittiin oikein, jos tietyt väestön piirteet ja ominaisuudet jäävät otokseen. Tätä kutsutaan edustavuudeksi.

Toisin sanoen, jos osa valinnan jälkeen säilyttää samat taipumukset ja ominaisuudet kuin tutkittavan koko määrä, niin tällaista joukkoa kutsutaan edustavaksi. Kaikkia yksittäisiä otoksia ei kuitenkaan voida valita edustavasta populaatiosta. On myös sellaisia ​​tutkimuskohteita, joiden otos ei yksinkertaisesti voi olla edustava. Tässä syntyy käsite edustavuusvirheestä. Mutta puhutaanpa tästä hieman yksityiskohtaisemmin.

Kuinka tehdä näyte

Edustavuuden maksimoimiseksi on siis olemassa kolme päänäytteenottosääntöä:

  1. Näytteen koon ainutlaatuisin indikaattori on 20%. Tilastollinen otanta 20% antaa lähes aina tuloksen mahdollisimman lähelle todellisuutta. Samaan aikaan ei ole tarvetta siirtyä kerättyyn suureen osaan väestöstä. 20% otoksesta on luku, joka on kehitetty monissa tutkimuksissa. Annetaan lisää teoriaa. Mitä suurempi otos, sitä pienempi edustusvirhe ja sitä tarkempi tutkimustulos. Mitä lähempänä otos on yksiköiden lukumäärää suhteessa väestöön, sitä tarkemmat ja oikeammat tulokset ovat. Loppujen lopuksi, jos tutkit koko järjestelmää, tulos on 100%. Mutta tässä ei ole enää näytteenottoa. Nämä ovat tutkimuksia, joissa tarkastellaan koko matriisia, kaikkia yksiköitä, joten tämä ei kiinnosta meitä.
  2. Jos 20%: n väestön käsittely on epäkäytännöllistä, väestön yksiköitä saa tutkia vähintään 1001. Tämä on myös yksi tutkimuskohteen ryhmän tutkimuksen indikaattoreista , joka on kehittynyt ajan myötä. Se ei tietenkään anna tarkkoja tuloksia suurille tutkimusmäärille, mutta tuo sen mahdollisimman lähelle mahdollista näytteenottotarkkuutta.
  3. Tilastoissa on monia kaavoja ja yhteenvetotaulukoita. Tutkimuskohteesta ja näytteenottoperusteesta riippuen on suositeltavaa valita yksi tai toinen kaava. Tätä kohtaa käytetään kuitenkin monimutkaisessa ja monivaiheisessa tutkimuksessa.

Edustavuuden virhe (virhe)

Valitun otoksen laadun pääominaisuus on käsite "edustavuusvirhe". Mikä se on? Nämä ovat tiettyjä eroja valikoivan ja jatkuvan tarkkailun indikaattoreiden välillä. Virheindikaattoreiden osalta edustavuus on jaettu luotettaviin, normaaleihin ja likimääräisiin. Toisin sanoen poikkeamat ovat enintään 3%, 3%10%ja 10%20%. Vaikka tilastoissa on toivottavaa, että virhe ei ylitä 5-6%. Muussa tapauksessa on syytä puhua otoksen riittämättömästä edustavuudesta. Monet tekijät otetaan huomioon laskettaessa edustavuuden harhaa ja sen vaikutusta otokseen tai väestöön:

  1. Todennäköisyys, jolla haluat saada tarkan tuloksen.
  2. Näytteen yksiköiden lukumäärä. Kuten aiemmin mainittiin, mitä vähemmän yksikköä otos tekee, sitä suurempi on edustavuusvirhe ja päinvastoin.
  3. Tutkitun populaation homogeenisuus. Mitä heterogeenisempi väestö on, sitä suurempi on edustusvirhe. Aggregaatin kyky olla edustava riippuu kaikkien sen muodostavien yksiköiden homogeenisuudesta.
  4. Menetelmä yksiköiden valitsemiseksi näytteelle.

Erityistutkimuksissa keskiarvon virheprosenttiosuuden määrittää yleensä tutkija itse havainto -ohjelman ja aiempien tutkimusten perusteella. Yleensä hyväksyttävän marginaalisen otantavirheen (edustavuusvirheen) katsotaan olevan 3–5%.


Isompi ei ole aina parempi

On myös syytä muistaa, että selektiivisen havainnoinnin järjestämisessä tärkeintä on saada sen määrä hyväksyttävään minimiin. Samanaikaisesti ei pidä pyrkiä otantavirheiden rajojen liialliseen pienentämiseen, koska tämä voi johtaa otoksen koon perusteettomaan kasvuun ja siten valikoivan tutkimuksen kustannusten nousuun.

Samaan aikaan on mahdotonta lisätä liikaa edustusvirheen kokoa. Vaikka tässä tapauksessa otosjoukon koko pienenee, tämä johtaa todellakin saatujen tulosten luotettavuuden heikkenemiseen.

Mitä kysymyksiä yleensä kysytään ennen tutkijaa

Kaikki tutkimukset, jos niitä tehdään, on tarkoitettu johonkin tarkoitukseen ja joidenkin tulosten saamiseksi. Otettaessa otantatutkimusta pääsääntöisesti esille ensimmäiset kysymykset:

  1. Määritelmä vaadittu määrä näytteenottoyksiköitä eli kuinka monta yksikköä tutkitaan. Lisäksi väestön on edustettava tarkkaa tutkimusta.
  2. Edustavuuden virheen laskeminen tietyllä todennäköisyysasteella. On heti huomattava, että ei ole otantatutkimuksia, joiden todennäköisyys olisi 100%. Jos tietyn segmentin tutkimuksen tehnyt viranomainen väittää, että niiden tulokset ovat 100%: n todennäköisyydellä tarkkoja, tämä on valhetta. Pitkäaikainen käytäntö on jo määrittänyt prosenttiosuuden todennäköisyydestä tehdä oikein otantatutkimus. Tämä luku on 95,4%.

Menetelmät tutkimusyksiköiden valitsemiseksi otoksesta

Kaikki näytteet eivät ole edustavia. Joskus sama merkki ilmaistaan ​​eri tavalla kokonaisuudessaan ja osittain. Edustavuusvaatimusten saavuttamiseksi on suositeltavaa käyttää erilaisia ​​näytteenottotekniikoita. Lisäksi yhden tai toisen menetelmän käyttö riippuu erityisolosuhteista. Näitä näytteenottotekniikoita ovat:

  • satunnainen valinta;
  • mekaaninen valinta;
  • tyypillinen valinta;
  • sarjavalinta (sisäkkäin).

Satunnaisotanta on mittausjärjestelmä, jonka tarkoituksena on valita väestön yksiköt satunnaisesti, kun todennäköisyys päästä otokseen on sama kaikille väestöyksiköille. On suositeltavaa käyttää tätä tekniikkaa vain homogeenisuuden ja pienen määrän luontaisten ominaisuuksien tapauksessa. Muussa tapauksessa jotkin ominaisuudet ovat vaarassa jäädä otokseen. Satunnainen näytteenotto on kaikkien muiden näytteenottomenetelmien ydin.

Yksiköiden mekaanisella valinnalla se suoritetaan tietyin aikavälein. Jos on tarpeen muodostaa näyte tietyistä rikoksista, jokainen viides, kymmenes tai viidestoista kortti voidaan poistaa kaikista rekisteröityjen rikosten tilastorekistereistä niiden kokonaismäärän ja käytettävissä olevien otoskokojen mukaan. Tämän menetelmän haittana on, että ennen näytteenottoa on oltava täydellinen tili populaation yksiköistä, sitten on suoritettava ranking, ja vasta sen jälkeen on mahdollista ottaa näyte tietyin aikavälein . Tämä menetelmä on aikaa vievä ja siksi sitä ei käytetä usein.


Tyypillinen (kaavoitettu) valinta on otantatyyppi, jossa väestö on jaettu homogeenisiin ryhmiin tietyn ominaisuuden mukaan. Joskus tutkijat käyttävät muita termejä "ryhmien" sijaan: "alueet" ja "vyöhykkeet". Sitten tietty määrä yksiköitä valitaan satunnaisesti kustakin ryhmästä suhteessa ryhmän kokonaispainoon. Tyypillinen valinta suoritetaan usein useissa vaiheissa.

Sarjanäyte on menetelmä, jossa yksiköt valitaan ryhmissä (sarjat) ja kaikki valitun ryhmän (sarjan) yksiköt tutkitaan. Tämän menetelmän etuna on, että joskus on vaikeampaa valita yksittäisiä yksiköitä kuin sarjoja, esimerkiksi tutkittaessa rangaistusta suorittavaa henkilöä. Valituilla alueilla, vyöhykkeillä sovelletaan poikkeuksetta kaikkien yksiköiden tutkimusta, esimerkiksi kaikkien tietyssä laitoksessa rangaistusta suorittavien henkilöiden tutkimista.


Suunnitelma

  • Johdanto
  • 1. Näytteenoton rooli
  • Johtopäätös
  • Bibliografia

Johdanto

Tilastotiede on analyyttinen tiede, joka on välttämätön kaikille nykyaikaisille asiantuntijoille. Moderni asiantuntija ei voi olla lukutaitoinen, jos hän ei tunne tilastollisia menetelmiä. Tilastot ovat tärkein väline yrityksen ja yhteiskunnan välisessä viestinnässä. Tilastot ovat yksi tärkeimmistä tieteenaloista kaikkien erikoisalojen opetussuunnitelmassa, koska tilastollinen lukutaito on olennainen osa korkeampi koulutus, ja opetussuunnitelmaan varattujen tuntien osalta se on yksi ensimmäisistä paikoista. Työskennellessään numeroiden kanssa jokaisen asiantuntijan tulisi tietää, miten nämä tai ne tiedot on saatu, mikä on niiden laskentatapa, kuinka täydelliset ja luotettavat ne ovat.

1. Näytteenoton rooli

Joukkoa kaikista väestön yksiköistä, joilla on tietty ominaisuus ja joka on tutkittavaa, kutsutaan tilastossa yleisväestöksi.

Käytännössä ei syystä tai toisesta ole aina mahdollista tai epäkäytännöllistä ottaa huomioon koko väestöä. Sitten he rajoittuvat tutkimaan vain tiettyä osaa siitä, jonka lopullinen tavoite on ulottaa saadut tulokset koko väestöön, ts. soveltaa näytteenottomenetelmää.

Tätä varten jotkut elementit, ns. Näyte, valitaan erityisestä tavasta väestöstä, ja otantatietojen käsittelyn tulokset (esimerkiksi aritmeettiset keskiarvot) yleistetään koko populaatioon.

Näytteenottomenetelmän teoreettinen perusta on laki suuret numerot... Tämän lain nojalla, kun ominaisuus on hajallaan rajoitetusti väestössä ja riittävän suuri otos, jonka todennäköisyys on lähellä täydellistä luotettavuutta, otoksen keskiarvo voi olla mielivaltaisesti lähellä yleistä keskiarvoa. Tämä laki, joka sisältää lauseiden ryhmän, on osoitettu tiukasti matemaattisesti. Näin ollen otokseen laskettua aritmeettista keskiarvoa voidaan kohtuudella pitää koko väestöä kuvaavana indikaattorina.

2. Todennäköisyysperusteisen valinnan menetelmät edustavuuden varmistamiseksi

Jotta otoksesta voitaisiin tehdä johtopäätös väestön ominaisuuksista, otoksen on oltava edustava (edustava), ts. sen on edustettava täysin ja riittävästi väestön ominaisuuksia. Otoksen edustavuus voidaan varmistaa vain, jos tietojen valinta on objektiivista.

Näytejoukko muodostetaan massan todennäköisyysprosessien periaatteen mukaisesti ilman poikkeuksia hyväksytystä valintajärjestelmästä; on varmistettava otosjoukon suhteellinen homogeenisuus tai sen jakautuminen homogeenisiksi yksikköryhmiksi. Näytteenottokehystä muodostettaessa näytteenottoyksikkö on määriteltävä selkeästi. Suunnilleen samankokoiset näytteenottoyksiköt ovat toivottavia, ja mitä pienempi näytteenottoyksikkö, sitä tarkemmat tulokset.

Valintamenetelmiä on kolme: satunnainen valinta, yksiköiden valinta tietyn kaavan mukaan, ensimmäisen ja toisen menetelmän yhdistelmä.

Jos omaksutun järjestelmän mukainen valinta suoritetaan väestöstä, joka on aiemmin jaettu tyyppeihin (kerroksiin tai kerroksiin), tällaista näytettä kutsutaan tyypilliseksi (tai kerrostetuksi, kerrostetuksi tai vyöhykkeiseksi). Toinen näytteen jakautuminen lajeittain määräytyy näytteenottoyksikön mukaan: havaintoyksikkö tai yksikköjen sarja (joskus käytetään termiä "pesä"). Jälkimmäisessä tapauksessa näytettä kutsutaan sarjaksi tai sisäkkäiseksi. Käytännössä käytetään usein tyypillisen näytteenoton ja eränäytteen yhdistelmää. Matemaattisissa tilastoissa, kun keskustellaan tietojen valinnan ongelmasta, otos jaetaan toistuviksi ja toistumattomiksi. Ensimmäinen vastaa palautuvaa pallokaaviota, toinen peruuttamatonta (kun harkitaan datan valintaprosessia pallojen valinnan esimerkin avulla eri väri urnasta). Sosioekonomisissa tilastoissa ei ole järkevää soveltaa toistuvaa otantaa, joten yleensä tarkoitamme toistuvaa otantaa.

Koska sosioekonomisilla kohteilla on monimutkainen rakenne, otoksen järjestäminen voi olla melko vaikeaa. Esimerkiksi kotitalouksien valitseminen väestön kulutusta tutkittaessa iso kaupunki, on helpompi ensin valita alueelliset solut, asuinrakennukset, sitten asunnot tai kotitaloudet ja sitten vastaaja. Tällaista näytettä kutsutaan monivaiheiseksi. Jokainen vaihe käyttää eri yksiköitä valinta: suurempi - alkuvaiheessa, viimeisessä vaiheessa valintayksikkö on sama kuin havaintoyksikkö.

Toinen näytteenottotyyppi on monivaiheinen näytteenotto. Tällainen näyte sisältää tietyn määrän vaiheita, joista jokainen erottuu havainto -ohjelman yksityiskohdista. Esimerkiksi 25% koko väestöstä tutkitaan sen mukaan lyhyt ohjelma, joka neljäs yksikkö tästä otoksesta tutkitaan täydellisemmän ohjelman mukaisesti jne.

Kaikille näytteenottotyypeille yksiköt valitaan kolmella merkityllä tavalla. Harkitse satunnaista valintamenettelyä. Ensinnäkin laaditaan luettelo väestön yksiköistä, jossa jokaiselle yksikölle annetaan digitaalinen koodi (numero tai etiketti). Sitten tehdään arvonta. Pallot vastaavilla numeroilla laitetaan rumpuun, ne sekoitetaan ja pallot valitaan. Piirretyt numerot vastaavat otoksen yksiköitä; huoneiden määrä on sama kuin suunniteltu otoskoko.

Arvon valinta voi olla harhaa teknisten puutteiden (pallojen, rummun laatu) ja muiden syiden vuoksi. Satunnaislukutaulukon mukainen valinta on objektiivisuuden kannalta luotettavampaa. Tällainen taulukko sisältää joukon numeroita, jotka vaihtuvat satunnaisesti ja valitaan elektronisten signaalien avulla. Koska käytämme desimaalilukujärjestelmää 0, 1, 2,., 9, minkä tahansa numeron esiintymisen todennäköisyys on 1/10. Siksi, jos olisi tarpeen luoda satunnaislukutaulukko, joka sisältää 500 merkkiä, niin noin 50 niistä olisi 0, sama määrä olisi 1 jne.

Usein käytetään näytteenottoa jonkin järjestelmän mukaisesti (ns. Suunnattu näytteenotto). Valintajärjestelmä hyväksytään siten, että se heijastaa väestön perusominaisuuksia ja osuuksia. Yksinkertaisin tapa: väestön yksikköluetteloiden mukaan, jotka on koottu siten, että yksiköiden järjestys ei liity tutkittuihin ominaisuuksiin, yksiköiden mekaaninen valinta suoritetaan askeleella, joka on yhtä suuri kuin N: n. Yleensä valinta ei ala ensimmäisen yksikön kanssa, mutta vetäytymällä puoli askelta näytteenottomahdollisuuksien vähentämiseksi ... Tietyillä ominaisuuksilla varustettujen yksiköiden esiintymistiheys, esimerkiksi opiskelijat, joilla on tietty akateeminen suorituskyky, asuvat hostellissa jne. määräytyy väestössä kehittyneen rakenteen mukaan.

Ollakseen varmempia siitä, että otos heijastaa koko väestön rakennetta, jälkimmäinen on jaettu tyyppeihin (kerrostumat tai alueet), ja kustakin tyypistä tehdään satunnainen tai mekaaninen valinta. Valittujen yksiköiden kokonaismäärä eri tyyppejä, pitäisi vastata otoksen kokoa.

Erityisiä vaikeuksia syntyy, kun yksikköluetteloa ei ole, ja valinta on tehtävä joko paikan päällä tai lopullisen tuotteen varaston tuotenäytteistä. Näissä tapauksissa on tärkeää kehittää yksityiskohtaisesti maaston suuntautumissuunnitelma ja valintajärjestelmä ja noudattaa niitä välttäen poikkeamia. Esimerkiksi mittaria kehotetaan siirtymään tietystä bussipysäkistä pohjoiseen kadun parillista puolta pitkin ja laskemalla kaksi taloa ensimmäisestä kulmasta, astu kolmanteen ja suorita tutkimus joka viidennessä asunnossa. Hyväksytyn järjestelmän tiukka noudattaminen varmistaa edustavan otoksen muodostamisen pääedellytyksen - yksiköiden valinnan objektiivisuuden - täyttymisen.

Kiintiönäyte olisi erotettava satunnaisotannasta, kun näyte muodostetaan tiettyjen luokkien (kiintiöt) yksiköistä, jotka on esitettävä määrätyissä suhteissa. Esimerkiksi tavaratalojen ostajia koskevassa kyselyssä voidaan suunnitella 150 vastaajan valitsemista, mukaan lukien 90 naista, joista 25 on tyttöjä, 20 ovat nuoria naisia, joilla on pieniä lapsia, 35 ovat keski-ikäisiä naisia, jotka ovat pukeutuneet työpukuun, 10 on 50 -vuotiaita ja sitä vanhempia naisia; Lisäksi suunniteltiin 70 miehen kysely, joista 25 oli nuoria ja poikia, 20 olivat nuoria miehiä, joilla oli lapsia, 15 pukuihin pukeutuneita miehiä ja 10 urheiluvaatteisiin pukeutuneita miehiä. Tällainen näyte voi olla hyvä kuluttajien suuntausten ja mieltymysten määrittämisessä, mutta jos haluamme käyttää sitä keskimääräisen ostomäärän ja niiden rakenteen määrittämiseen, saamme edustavia tuloksia. Tämä johtuu siitä, että kiintiön otannalla pyritään valitsemaan tietyt luokat.

Näyte ei ehkä ole edustava, vaikka se olisi muodostettu väestön tunnettujen osuuksien mukaisesti, mutta valinta suoritetaan ilman mitään järjestelmää - yksiköitä rekrytoidaan haluamallasi tavalla, jotta varmistetaan niiden luokkien suhde samaan osuudet kuten koko väestössä (esimerkiksi miesten ja naisten suhde, nuoremmat ja vanhemmat kuin työkykyiset ja työkykyiset jne.).

Näiden huomautusten pitäisi varoittaa sinua tällaisista näytteenottomenetelmistä ja korostaa uudelleen objektiivisen näytteenoton tarvetta.

3. Satunnaisen, mekaanisen, tyypillisen ja sarjanäytteenoton organisatoriset ja metodologiset piirteet

Sen mukaan, miten populaation elementit valitaan otokseen, erotetaan useita otantatutkimuksia. Valinta voi olla satunnainen, mekaaninen, tyypillinen ja sarja.

Satunnaisvalinta on sellainen valinta, jossa kaikilla väestönosilla on yhtäläiset mahdollisuudet tulla valituksi. Toisin sanoen jokaiselle väestöryhmälle varmistetaan yhtä suuri todennäköisyys päästä otokseen.

otos tilastollinen todennäköisyysperäinen satunnainen

Satunnaisvalinnan vaatimus saavutetaan käytännössä käyttämällä erää tai satunnaislukutaulukkoa.

Arpaa valittaessa kaikki väestön osat on numeroitu etukäteen ja niiden numerot lisätään kortteihin. Huolellisen sekoittamisen jälkeen tarvittava määrä kortteja valitaan pakkauksesta millään tavalla (peräkkäin tai missä tahansa muussa järjestyksessä), joka vastaa näytteen kokoa. Tässä tapauksessa voit joko laittaa valitut kortit syrjään (jolloin suoritetaan niin sanottu ei-toistuva valinta), tai kun olet vetänyt kortin ulos, kirjoita sen numero ja palauta se pakkaukseen, jolloin saat sen mahdollisuus esiintyä näytteessä uudelleen (toistuva valinta). Kun kortti on valittu uudelleen, pakkaus on sekoitettava huolellisesti aina, kun kortti palautetaan.

Arvonmenetelmää käytetään tapauksissa, joissa koko tutkitun väestön elementtien määrä on pieni. Suurella populaatiolla satunnaisvalinta arpomalla vaikeutuu. Luotettavampi ja vähemmän työläs, jos kyseessä on suuri määrä käsiteltyä dataa, on tapa käyttää satunnaislukutaulukkoa.

Mekaaninen valinta suoritetaan seuraavasti. Jos muodostuu 10% näyte, ts. joka kymmenestä elementistä yksi on valittava, sitten koko sarja jaetaan ehdollisesti 10 elementin yhtä suuriin osiin. Sitten kohde valitaan satunnaisesti kymmenen parhaan joukosta. Arvonta osoitti esimerkiksi yhdeksännen numeron. Näytteen muiden elementtien valinta määräytyy täysin valitun osuuden N perusteella ensimmäisen valitun elementin numeron perusteella. Tässä tapauksessa näyte koostuu elementeistä 9, 19, 29 jne.

Mekaanista valintaa on käytettävä varoen, koska niin sanottujen järjestelmällisten virheiden riski on todellinen. Siksi ennen mekaanisen näytteen ottamista on tarpeen analysoida tutkittu väestö. Jos sen elementit on järjestetty satunnaisesti, mekaanisesti saatu näyte on satunnainen. Usein alkuperäisen sarjan elementit on kuitenkin osittain tai jopa kokonaan järjestetty. On erittäin epätoivottavaa, että mekaaninen näytteenotto järjestää elementit oikealla toistettavuudella, jonka aika voi olla sama kuin mekaanisen näytteenoton aika.

Usein joukon elementit on järjestetty tutkittavan ominaisuuden suuruuden mukaan alenevassa tai kasvavassa järjestyksessä, eikä niillä ole jaksottaisuutta. Mekaaninen valinta tällaisesta populaatiosta saa suunnatun valinnan luonteen, koska yksittäiset populaation osat esitetään otoksessa suhteessa niiden määrään koko populaatiossa, ts. Valinnan tarkoituksena on tehdä otoksesta edustava.

Toinen suunnatun valinnan tyyppi on tyypillinen valinta. Tyypillinen valinta on erotettava tyypillisestä valikoimasta. Tyypillisten kohteiden valintaa käytettiin zemstvo -tilastoissa sekä budjettitutkimuksissa. Samaan aikaan "tyypillisten kylien" tai "tyypillisten tilojen" valinta suoritettiin joidenkin taloudellisten ominaisuuksien mukaan, esimerkiksi pihakohtaisen maanomistuskoon mukaan, asukkaiden ammatin mukaan jne. Tämäntyyppinen valinta ei voi olla perusta otantamenetelmän soveltamiselle, koska tässä tapauksessa sen pääasiallinen vaatimus, valinnan satunnaisuus, ei ole täytetty.

Jos otantamenetelmässä on tyypillinen valinta, populaatio jaetaan laadullisesti homogeenisiin ryhmiin ja sitten tehdään satunnainen valinta kussakin ryhmässä. Tyypillistä valintaa on vaikeampi järjestää kuin itse satunnaista valintaa, koska vaaditaan tiettyä tietoa väestön koostumuksesta ja ominaisuuksista, mutta se antaa tarkempia tuloksia.

Sarjavalinnassa koko väestö on jaettu ryhmiin (sarjoihin). Sitten satunnaisella tai mekaanisella valinnalla tietty osa näistä sarjoista eristetään ja niiden jatkuva käsittely suoritetaan. Itse asiassa sarjavalinta on satunnainen tai mekaaninen valinta, joka suoritetaan alkuperäisen populaation laajennetuille elementeille.

Teoreettisesti sarjanäyte on tarkasteltavista epätäydellisin. Yleensä sitä ei käytetä materiaalin käsittelyyn, mutta se tarjoaa tietyn mukavuuden kyselyn järjestämisessä, erityisesti opiskelussa Maatalous... Esimerkiksi talonpoikaistilojen vuosittaiset otantatutkimukset kollektiivistamista edeltävinä vuosina tehtiin sarjavalintamenetelmällä. Historioitsijan on hyödyllistä olla tietoinen sarjanäytteistä, koska hän voi kohdata tällaisten kyselyiden tulokset.

Edellä kuvattujen klassisten valintamenetelmien lisäksi näytteenottomenetelmän käytännössä käytetään muita menetelmiä. Tarkastellaan kahta niistä.

Tutkittavalla joukolla voi olla monivaiheinen rakenne, se voi koostua ensimmäisen tason yksiköistä, jotka puolestaan ​​koostuvat toisen tason yksiköistä jne. Esimerkiksi provinsseihin kuuluu maakuntia, maakuntia voidaan pitää kokoelmana, volosti koostuu kylistä ja kylät - pihoista.

Monivaiheista valintaa voidaan soveltaa tällaisiin populaatioihin, ts. suorita valinta peräkkäin kussakin vaiheessa. Maakuntien kokonaisuudesta mekaanisella, tyypillisellä tai satunnaisella menetelmällä voit siis valita maakunnat (ensimmäinen vaihe), valita sitten volosit jollakin ilmoitetuista tavoista (toinen vaihe), valita sitten kylät (kolmas vaihe) ja lopuksi , kotitaloudet (neljäs vaihe).

Työntekijöiden talousarvioiden pitkäaikainen valinta on esimerkki kaksivaiheisesta mekaanisesta valinnasta. Ensimmäisessä vaiheessa yritykset valitaan mekaanisesti ja toisessa työntekijät, joiden talousarviota tarkastellaan.

Tutkittavien kohteiden ominaisuuksien vaihtelevuus voi olla erilainen. Esimerkiksi talonpoikaistilojen tarjoaminen omilla työvoima vaihtelee vähemmän kuin esimerkiksi viljelykasvien koko. Tältä osin pienempi otos työvoiman tarjonnan suhteen on yhtä edustava kuin suuri otos tietoja viljelykasvien koosta elementtien määrän suhteen. Tässä tapauksessa näytteestä, jonka perusteella viljelykasvien koko määritetään, on mahdollista tehdä näyte, joka on riittävän edustava määrittämään työvoiman tarjonta ja suorittaa siten kaksivaiheinen valinta. V yleinen tapaus Voit lisätä seuraavat vaiheet, esim. tee toinen alinäyte tuloksena olevasta alinäytteestä ja niin edelleen. Samaa valintamenetelmää käytetään tapauksissa, joissa tutkimuksen tavoitteet edellyttävät eri tarkkuutta eri indikaattoreiden laskemisessa.

Tehtävä 1. Kuvailevat tilastot

Tentissä 20 oppilasta sai seuraavat arvosanat (100 pisteen asteikolla):

1) Muodosta sarja taajuusjakaumia, suhteellisia ja kertyneitä taajuuksia viidelle aikavälille;

2) Rakenna monikulmio, histogrammi ja kumulatiivinen monikulmio;

3) Etsi aritmeettinen keskiarvo, tila, mediaani, ensimmäinen ja kolmas kvartiili, neljännesvuosien välinen alue, keskihajonta ja vaihtelukertoimet. Analysoi tiedot näiden ominaisuuksien avulla ja ilmoita aikaväli, joka sisältää 50% ilmoitettujen määrien keskiarvoista.

1) x (min) = 53, x (maksimi) = 98

R = x (maksimi) - x (min) = 98-53 = 45

h = R / 1 + 3,32 lgn, jossa n on otoksen koko, n = 20

h = 45/1 + 3,32 * lg20 = 9

a (i) - välin alaraja, b (i) - välin yläraja.

a (1) = x (min) - h / 2, b (1) = a (1) + h, niin jos b (i) on i: nnen välin yläraja (lisäksi a (i + 1) = b (i)), sitten b (2) = a (2) + h, b (3) = a (3) + h jne. Välien rakentaminen jatkuu seuraavan osan alkuun välin järjestyksessä, joka on yhtä suuri tai suurempi kuin x (max).

a (1) = 47,5 b (1) = 56,5

a (2) = 56,5 b (2) = 65,5

a (3) = 65,5 b (3) = 74,5

a (4) = 74,5 b (4) = 83,5

a (5) = 83,5 b (5) = 92,5

a (6) = 92,5 b (6) = 101,5

Välit, a (i) - b (i)

Taajuuslaskenta

Taajuus, n (i)

Kertynyt taajuus, n (hi)

2) Kaavioiden rakentamiseksi kirjoitamme muistiin suhteellisten taajuuksien W (i) = n (i) / n jakauman vaihtelusarjat (väli ja diskreetti), kertyneet suhteelliset taajuudet W (hi) ja löydämme suhteen W ( i) / h täyttämällä taulukko.

x (i) = a (i) + b (i) / 2; W (hi) = n (hi) / n

Arvioiden jakauman tilastolliset sarjat:

Välit, a (i) - b (i)

Rakentaaksesi histogrammin suhteellisista taajuuksista abskissaa pitkin, lykkäämme osittaisia ​​aikavälejä, joista jokaiselle rakennamme suorakulmion, jonka pinta-ala on yhtä suuri kuin tämän i: nnen välin suhteellinen taajuus W (i). Tällöin alkeellisen suorakulmion korkeuden tulisi olla yhtä suuri kuin W (i) / h.

Histogrammista saat saman jakauman monikulmion, jos keskipisteet ylemmät pohjat yhdistä suorakulmiot suorilla viivaosuuksilla.

Jos haluat piirtää erillisen sarjan kumulaatioita, piirtämme attribuuttiarvot abskissa -akselia pitkin ja suhteelliset kertyneet taajuudet W (hi) ordinaattiakselia pitkin. Yhdistämme tuloksena olevat pisteet suorilla viivaosuuksilla. Abskissaa pitkin oleville aikavälisarjoille siirretään ryhmittelyn ylärajoja.

3) Löydämme aritmeettisen keskiarvon kaavalla:

Muoti lasketaan kaavalla:

Modaalivälin alaraja; h on ryhmittelyvälin leveys; - modaalivälin taajuus; - modaalia edeltävän aikavälin taajuus; on modaalia seuraavan aikavälin taajuus. = 23,125.

Etsi mediaani:

n = 20: 53.58.59.59.63.67.68.69.71.73.78.79.85.86.87.89.91.91.98,98

Korvaamalla arvot saadaan: Q1 = 65;

Toisen kvartiilin arvo on sama kuin mediaanin arvo, joten Q2 = 75,5; Q3 = 88.

Neljänneksen välinen alue on:

Keskihajonta (keskihajonta) saadaan kaavasta:

Variaatiokerroin:

Näistä laskelmista voidaan nähdä, että 50% ilmoitetuista arvoista sisältää välin 74,5 - 83,5.

Tehtävä 2. Tilastollisten hypoteesien testaus.

Miesten, naisten ja nuorten urheilumieltymykset ovat seuraavat:

Testaa hypoteesi mieltymysten riippumattomuudesta sukupuolesta ja iästä b = 0,05.

1) Hypoteesin testaaminen urheilun mieltymysten riippumattomuudesta.

Pearsen -kerroin:

Chi-neliötestin taulukkoarvo, jonka vapausaste on 4 b = 0,05, on yhtä suuri kuin h 2 tabl = 9,488.

Siitä lähtien hypoteesi hylätään. Erilaiset mieltymykset ovat merkittäviä.

2. Vaatimustenmukaisuushypoteesi.

Lentopallo urheilulajina on lähimpänä koripalloa. Tarkistetaan miesten, naisten ja nuorten mieltymysten vastaavuus.

Ф 2 = 0,1896 + 0,1531 + 0,1624 + 0,1786 + 0,1415 + 0,1533 = 0,979.

Kun merkitsevyystaso on b = 0,05 ja vapausaste k = 2, taulukkoarvo on h 2 tabl = 9,210.

Ф 2> lähtien mieltymysten erot ovat merkittäviä.

Tehtävä 3. Korrelaatio-regressioanalyysi.

Tieliikenneonnettomuuksien analyysi tuotti seuraavat tilastot alle 21 -vuotiaiden kuljettajien prosenttiosuudesta ja vakavien onnettomuuksien määrästä 1000 kuljettajaa kohti:

Suorita graafinen ja korrelaatio-regressioanalyysi tiedoista, ennusta onnettomuuksien määrä, joilla on vakavia seurauksia kaupungille, jossa alle 21-vuotiaiden kuljettajien määrä on 20% kuljettajien kokonaismäärästä.

Saamme näytteen koosta n = 10.

x on alle 21 -vuotiaiden kuljettajien prosenttiosuus,

y on onnettomuuksien määrä 1000 kuljettajaa kohti.

Lineaarinen regressioyhtälö on:

Laskemme peräkkäin:

Samoin löydämme

Näytteen regressiokerroin

Yhteys x: n, y: n välillä on vahva.

Lineaarisen regressioyhtälön muoto on:

Päällä kuva esitetään ala sironta ja ajoittaa lineaarinen regressioita . Suoritamme ennuste varten x n =20 .

Saamme y n =0 .2 9*20-1 .4 6 = 4 .3 4 .

Ennuste merkitys tapahtui lisää kaikista arvot, toimitettu v alkuperäinen pöytä . se seuraus Mennä, mitä korrelaatio riippuvuus suoraan ja kerroin on yhtä suuri kuin 0,29 tarpeeksi iso . Päällä joka yksikkö lisäyksiä Dx hän antaa lisäys Dy =0 .3

Harjoittele 4 . Analyysi väliaikainen rivejä ja ennustaminen .

Ennustaa seuraavan viikon indeksiarvot käyttämällä:

a) liukuvan keskiarvon menetelmä, valitsemalla sen laskemiseen kolmen viikon tiedot;

b) eksponentiaalinen painotettu keskiarvo, valitsemalla b = 0,1.

Satunnaislukutaulukosta löydät numerot 41, 51, 69, 135, 124, 93, 91, 144, 10, 24.

Järjestämme ne nousevassa järjestyksessä: 10, 24, 41, 51, 69, 91, 93, 124, 135, 144.

Suoritamme uuden numeroinnin 1-10. Saamme alkutiedot kymmenen viikon ajalta:

Eksponentiaalinen tasoitus b = 0,1 antaa vain yhden arvon.

Koko ajanjakson keskelle saamme kolme ennustetta: 12.855; 1309; 12,895.

Näiden ennusteiden välillä ollaan samaa mieltä.

Harjoittele 5 . Indeksi analyysi.

Yhtiö harjoittaa tavaroiden kuljetusta. Useiden vuosien ajalta on tietoja neljän tyyppisen rahdin kuljetusmääristä ja rahtiyksikön kuljetuskustannuksista.

Määritä yksinkertaiset hinta-, määrä- ja arvoindeksit kullekin tuotetyypille sekä Laspeyres- ja Pasche -indeksit ja arvoindeksi. Kommentoi saatuja tuloksia mielekkäällä tavalla.

Ratkaisu. Lasketaan yksinkertaiset indeksit:

Laspeyres -indeksi:

Pasche -indeksi:

Kalkkunan hinta:

Yksittäiset indeksit osoittavat, että tavaroiden A, B, C ja D hintojen ja määrien muutoksissa on eroja. Kokonaisindeksit osoittavat yleisiä muutostrendejä. Kuljetettavien tavaroiden kustannukset laskivat yleensä 13%. Syynä on se, että kallein rahti laski määrällisesti 42% ja sen tariffi pysyi lähes ennallaan.

Vuodet 16-20 on numeroitu järjestyksessä 1-5. Lähtötiedot ovat muodossa:

Ensin tutkimme A -rahdin määrän dynamiikkaa.

Indeksi

Ehdoton voitto

Kasvuvauhti, %

Kasvuvauhti,%

Klo Tämä rytmi kasvu keskimäärin päällä kaavoja :

, .

Varten vauhti saada v minkä tahansa tapaus T NS = T. R -1 .

Nyt harkita rahti D .

Indeksi

Ehdoton voitto

Kasvuvauhti, %

Kasvuvauhti,%

Johtopäätös

Keskiarvoilla ja niiden lajikkeilla on tärkeä rooli tilastoissa. Keskimääräisiä indikaattoreita käytetään laajalti analyysissä, koska juuri niissä massan ilmiöiden ja prosessien mallit sekä ajassa että avaruudessa löytävät ilmentymänsä. Joten esimerkiksi työn tuottavuuden kasvun säännöllisyys ilmaistaan ​​tilastollisissa indikaattoreissa keskimääräisen tuotannon kasvusta teollisuudessa työntekijää kohti, väestön hyvinvointitason tasaisen kasvun säännöllisyys ilmenee tilastolliset indikaattorit työntekijöiden ja työntekijöiden keskitulojen kasvusta jne.

Tällaisia ​​muuttuvan ominaisuuden jakautumisen kuvaavia ominaisuuksia, kuten tilaa ja mediaania, käytetään laajalti. Ne ovat erityispiirteitä, ja niiden merkitys on annettu mille tahansa muunnelmasarjan muunnokselle.

Joten ominaisuuden yleisimmän arvon luonnehtimiseen käytetään muotia ja näytetään muuttuvan ominaisuuden arvon määrällinen raja, jonka puolet väestön jäsenistä on saavuttanut, mediaani.

Siten keskiarvot auttavat tutkimaan teollisuuden, tietyn teollisuuden, yhteiskunnan ja koko maan kehitysmalleja.

Bibliografia

1. Tilastoteoria: Oppikirja / R.А. Shmoilova, V.G. Minashkin, N.A. Sadovnikova, E.B. Shuvalov; Toimittaja R.A. Shmoilova. - 4. painos, Rev. ja lisää. - M.: Talous ja tilastot, 2005. - 656p.

2. Gusarov V.M. Tilastot: Opetusohjelma yliopistoille. - M: UNITY-DANA, 2001.

4. Tilastojen teorian ongelmakokoelma: Oppikirja / Toim. Professori V. V. Glinsky ja tohtori D., apulaisprofessori L.K. Serga. Ed. Z-e. - M .: INFRA-M; Novosibirsk: Siperian sopimus, 2002.

5. Tilastot: Oppikirja / Kharchenko L-P., Dolzhenkova V.G., Ionin V.G. ja muut, toim. V.G. Ionina. - 2. painos, Rev. ja lisää. - M .: INFRA-M. 2003.

Samankaltaisia ​​asiakirjoja

    Kuvaavat tilastot ja tilastolliset johtopäätökset. Valintamenetelmät sen varmistamiseksi, että näyte on edustava. Näytetyypin vaikutus virheen suuruuteen. Tehtävät otantamenetelmää sovellettaessa. Havaintotietojen levittäminen väestölle.

    testi, lisätty 27.2.2011

    Valikoiva menetelmä ja sen rooli. Nykyaikaisen valikoivan havainnon teorian kehittäminen. Valintamenetelmien tyypitys. Yksinkertaisen satunnaisotannan käytännön toteutus. Tyypillisen (kerrostetun) näytteen organisointi. Näytteen koko kiintiön valintaa varten.

    raportti lisätty 9.3.2011

    Näytteenoton ja näytteenoton tarkoitus. Organisaation ominaisuudet eri tyyppejä valikoiva havainto. Näytteenottovirheet ja niiden laskentamenetelmät. Näytteenottomenetelmän soveltaminen polttoaine- ja energiakompleksin yritysten analysointiin.

    lukukausi lisätty 10.6.2014

    Selektiivinen havainto menetelmänä tilastollinen tutkimus, sen ominaisuudet. Satunnainen, mekaaninen, tyypillinen ja sarjavalintatyyppi otosjoukkojen muodostamisessa. Näytteenottovirheen käsite ja syyt, menetelmät sen määrittämiseksi.

    tiivistelmä, lisätty 6.4.2010

    Tilastojen käsite ja rooli nykyaikaisen taloudenhallinnan mekanismissa. Jatkuva ja ei-jatkuva tilastollinen havainto, kuvaus otantamenetelmästä. Valintatyypit valikoivaan havaintoon, otantavirheet. Tuotanto- ja taloudelliset indikaattorit.

    lukukausi, lisätty 17.3.2011

    Tutkimus suunnitelman toteuttamisesta. 10% satunnainen ei-toistuva otantatutkimus. Laitoksen tuotantokustannukset. Rajallinen otantavirhe. Keskihintojen ja tuotemyynnin dynamiikka. Muuttuva koostumushintaindeksi.

    testi, lisätty 02/09/2009

    Otoksen ottaminen satunnaismuuttujan n-normaalijakauman koosta. Näytteen numeeristen ominaisuuksien löytäminen. Tietojen ryhmittely- ja muunnossarjat. Taajuushistogrammi. Empiirinen jakelutoiminto. Parametrien tilastollinen arvio.

    laboratoriotyö, lisätty 31.3.2013

    Näytteenoton ja otoksen havaitsemisen käsitteiden ydin, valinnan päätyypit ja luokat. Näytteen koon ja koon määrittäminen. Käytännöllinen käyttö otoksen havainnoinnin tilastollinen analyysi. Näytteenottotaajuuden ja otoksen keskiarvon virheiden laskeminen.

    lukukausi lisätty 17.2.2015

    Valikoivan tarkkailun käsite. Edustavuuden virheet, näytteenottovirheen mittaus. Vaaditun otoskoon määrittäminen. Näytteenottomenetelmän käyttö kiinteän menetelmän sijaan. Hajonta populaatiossa ja indikaattorien vertailu.

    testi, lisätty 23.7.2009

    Valintatyypit ja havaintovirheet. Menetelmät yksiköiden valitsemiseksi näytteestä. Yrityksen kaupallisen toiminnan ominaisuudet. Esimerkkitutkimus tuotteiden kuluttajista. Otosominaisuuksien jakautuminen väestölle.

Suunnitelma:

1. Matemaattisten tilastojen ongelmat.

2. Näytteiden tyypit.

3. Valintamenetelmät.

4. Otoksen tilastollinen jakauma.

5. Empiirinen jakelutoiminto.

6. Monikulmio ja histogrammi.

7. Variaatiosarjan numeeriset ominaisuudet.

8. Tilastolliset arviot jakautumisparametreista.

9. Jakaumaparametrien aikaväli -arviot.

1. Matemaattisten tilastojen ongelmat ja menetelmät

Matematiikan tilastot on matematiikan osa, joka on omistettu menetelmille tilastollisten havaintojen tulosten keräämiseksi, analysoimiseksi ja käsittelemiseksi tieteellisiin ja käytännön tarkoituksiin.

Olkoon tarpeen tutkia joukko homogeenisia esineitä suhteessa johonkin laadullisiin tai määrällisiin ominaisuuksiin, jotka luonnehtivat näitä esineitä. Esimerkiksi, jos osia on erä, osan standardi voi toimia laadullisena indikaattorina ja osan hallittu koko voi toimia kvantitatiivisena indikaattorina.

Joskus tehdään jatkuvaa tutkimusta, ts. tarkista jokaisen objektin haluttu ominaisuus. Käytännössä täydellistä kyselyä käytetään harvoin. Jos esimerkiksi populaatio sisältää erittäin suuren määrän esineitä, täydellisen tutkimuksen suorittaminen on fyysisesti mahdotonta. Jos kohteen kartoitus liittyy sen tuhoamiseen tai vaatii suuria materiaalikustannuksia, täydellisen tutkimuksen suorittaminen ei ole järkevää. Tällaisissa tapauksissa rajoitettu määrä esineitä (otosjoukko) valitaan satunnaisesti koko populaatiosta ja tutkitaan.

Matemaattisten tilastojen päätehtävänä on tutkia koko väestöä käyttäen otostietoja riippuen tavoitteesta, ts. tutkimus populaation todennäköisyysominaisuuksista: jakelulaki, numeeriset ominaisuudet jne. johtopäätösten tekemiseen epävarmassa tilanteessa.

2. Näytetyypit

Yleinen väestö Onko kokoelma esineitä, joista valitaan.

Näytepopulaatio (näyte) Onko kokoelma satunnaisesti valittuja kohteita.

Väestön määrä Onko objektien määrä tässä populaatiossa. Yleisen väestön määrä on ilmoitettu N, valikoiva - n.

Esimerkki:

Jos 1000 osasta 100 osaa valitaan tarkastettavaksi, väestön määrä on N = 1000 ja otoksen koko n = 100.

Valinta voidaan tehdä kahdella tavalla: kun kohde on valittu ja havaittu sen päällä, se voidaan palauttaa tai olla palauttamatta yleisölle. Että. näytteet jaetaan toistuviin ja toistumattomiin näytteisiin.

Toistettukutsutaan näytteenotto, jossa valittu objekti (ennen seuraavan valitsemista) palautetaan yleisölle.

Toistamatonkutsutaan näytteenotto, jossa valittua objektia ei palauteta yleisölle.

Käytännössä käytetään toistuvasti satunnaisnäytteenottoa.

Jotta otantatiedot olisivat riittävän luottavaisia ​​arvioidakseen väestön kiinnostuksen kohteita, on välttämätöntä, että otosobjektit edustavat sitä oikein. Näytteen on edustettava oikein populaation osuuksia. Näytteen pitäisi olla edustaja (edustaja).

Suurten lukujen lain perusteella voidaan väittää, että otos on edustava, jos se otetaan satunnaisesti.

Jos väestön koko on riittävän suuri ja otos on vain merkityksetön osa tätä populaatiota, ero toistettujen ja toistumattomien näytteiden välillä poistetaan; Rajoittavassa tapauksessa, kun otetaan huomioon ääretön yleisjoukko ja otos on rajallinen, tämä ero häviää.

Esimerkki:

Amerikkalaisessa Literary Review -lehdessä tehtiin tilastollisia menetelmiä käyttäen tutkimus Yhdysvaltojen tulevien presidentinvaalien tulosta vuonna 1936 koskevista ennusteista. Tämän tehtävän ehdokkaat olivat F.D. Roosevelt ja AM Landon. Puhelinliittymien viitekirjoja pidettiin lähteenä tutkituille amerikkalaisille. Näistä 4 miljoonaa osoitetta valittiin satunnaisesti, joihin lehden toimitukset lähettivät postikortteja, joissa he pyysivät ilmaisemaan asenteensa presidenttiehdokkaita kohtaan. Kyselyn tulosten käsittelyn jälkeen aikakauslehti julkaisi sosiologisen ennusteen, jonka mukaan Landon voittaa suurella marginaalilla tulevissa vaaleissa. Ja ... olin väärässä: Roosevelt voitti.
Tätä esimerkkiä voidaan pitää esimerkkinä ei-edustavasta otoksesta. Tosiasia on, että Yhdysvalloissa 1900 -luvun ensimmäisellä puoliskolla vain varakkaalla väestönosalla oli puhelimia, jotka tukivat Landonin näkemyksiä.

3. Valintamenetelmät

Käytännössä sovellettu eri tavoin valikoima, joka voidaan jakaa kahteen tyyppiin:

1. Valinta ei edellytä väestön jakamista osiin yksinkertainen satunnainen toistamaton; b) yksinkertainen satunnainen toisto).

2. Valinta, jossa populaatio on jaettu osiin. a) tyypillinen valikoima; b) mekaaninen valinta; v) sarja valinta).

Yksinkertainen rento kutsu tätä valinta, jossa esineitä haetaan yksi kerrallaan koko populaatiosta (satunnaisesti).

Tyypillinenkutsutaan valinta, jossa esineitä ei valita koko väestöstä, vaan jokaisesta sen "tyypillisestä" osasta. Jos esimerkiksi osa valmistetaan useilla koneilla, valinta ei ole tehty kaikkien koneiden valmistamasta osasarjasta, vaan kunkin koneen tuotteista erikseen. Tällaista valintaa käytetään, kun tutkittava kohde vaihtelee huomattavasti "tyypillisissä" väestönosissa.

Mekaaninenkutsutaan valinta, jossa väestö on "mekaanisesti" jaettu niin moniin ryhmiin kuin objektien määrä otokseen on sisällytettävä, ja yksi kohde valitaan kustakin ryhmästä. Jos esimerkiksi sinun on valittava 20% koneen valmistamista osista, jokainen viides osa valitaan; jos sinun on valittava 5% osista, joka 20. jne. Joskus tällainen valinta ei välttämättä takaa näytteen edustavuutta (jos jokainen 20. käännettävä helmi valitaan ja leikkuri vaihdetaan heti valinnan jälkeen, kaikki tylpillä leikkureilla käännetyt helmet valitaan).

Sarjakutsutaan valinta, jossa kohteet valitaan väestöstä ei yksi kerrallaan vaan "sarjoina", joille tehdään jatkuva tutkimus. Jos esimerkiksi tuotteita valmistaa suuri joukko automaattikoneita, vain muutamille koneille tehdään täydellinen tarkastus.

Käytännössä käytetään usein yhdistettyä valintaa, jossa edellä mainitut menetelmät yhdistetään.

4. Näytteen tilastollinen jakauma

Otetaan näyte yleisestä populaatiosta ja arvo x 1- havaitut ajat, x 2 -n 2 kertaa,… x k - n k kertaa. n = n 1 + n 2 + ... + n k on otoksen koko. Havaitut arvotkutsutaan vaihtoehtoja, ja varianttien järjestys, kirjoitettu nousevaan järjestykseen- vaihtosarja... Havaintojen numerotkutsutaan taajuudet (absoluuttiset taajuudet) ja niiden suhde otoksen kokoon- suhteelliset taajuudet tai tilastolliset todennäköisyydet.

Jos varianttien lukumäärä on suuri tai näyte tehdään jatkuvasta yleisjoukosta, vaihtelusarjaa ei koota yksittäisten pistearvojen perusteella, vaan väestön arvoväleillä. Tällaista vaihtelusarjaa kutsutaan väli. Tässä tapauksessa välien pituuksien on oltava yhtä suuret.

Näytteen tilastollinen jakauma kutsutaan vaihtoehtojen luetteloksi ja niitä vastaaviksi tai suhteellisiksi taajuuksiksi.

Tilastollinen jakauma voidaan määrittää myös jaksojen ja vastaavien taajuuksien sekvenssin muodossa (tämän arvovälin sisällä olevien taajuuksien summa)

Taajuuksien pistemuutosalue voidaan esittää taulukossa:

x i
x 1
x 2

x k
n i
n 1
n 2

n k

Samoin voit esittää suhteellisten taajuuksien pistemuutossarjoja.

Lisäksi:

Esimerkki:

Joidenkin tekstien X kirjainten lukumäärä osoitti olevan 1000. Ensimmäinen oli kirjain "I", toinen kirjain "i", kolmas oli "a" ja neljäs "u" ”. Sitten tuli kirjaimet "o", "e", "y", "e", "s".

Kirjoitetaan ne paikat, jotka heillä on aakkosessa, vastaavasti: 33, 10, 1, 32, 16, 6, 21, 31, 29.

Kun olemme tilanneet nämä numerot nousevaan järjestykseen, saamme vaihtelusarjan: 1, 6, 10, 16, 21, 29, 31, 32, 33.

Kirjainten taajuudet tekstissä: "a" - 75, "e" - 87, "i" - 75, "o" - 110, "y" - 25, "s" - 8, "e" - 3, " u ""- 7, "I"- 22.

Laaditaan pistevariaatiosarja:

Esimerkki:

Tilavuuden näytteenottotaajuuksien jakauma on annettu n = 20.

Tee pistevariaatiosarja suhteellisista taajuuksista.

x i

2

6

12

n i

3

10

7

Ratkaisu:

Etsitään suhteelliset taajuudet:


x i

2

6

12

w minä

0,15

0,5

0,35

Välijakaumaa rakennettaessa on sääntöjä välien lukumäärän tai kunkin välin arvon valitsemiseksi. Kriteeri on tässä optimaalinen suhde: intervallien määrän kasvaessa edustavuus paranee, mutta tietojen määrä ja niiden käsittelyaika lisääntyvät. Ero x max - x min suurimman ja pienimmän arvon välillä, varianttia kutsutaan lakaista näytteenotto.

Välien lukumäärän laskeminen k yleensä käytetään empiiristä kaavaa Strojess (olettaen pyöristyksen lähimpään kätevään kokonaislukuun): k = 1 + 3,322 lg n.

Vastaavasti kunkin välin arvo h voidaan laskea kaavalla:

5. Empiirinen jakelutoiminto

Tarkastellaan muutamaa otosta yleisöstä. Olkoon kvantitatiivisen attribuutin X taajuuksien tilastollinen jakauma tiedossa. Otetaan käyttöön merkintä: n x- niiden havaintojen lukumäärä, joissa ominaisuuden havaittu arvo on pienempi kuin x; n - havaintojen kokonaismäärä (otoskoko). Tapahtuman suhteellinen taajuus X<х равна n x / n. Jos x muuttuu, myös suhteellinen taajuus muuttuu, ts. suhteellinen taajuusn x / n- on funktio x. Koska se löytyy empiirisesti, sitten sitä kutsutaan empiiriseksi.

Empiirinen jakelutoiminto (näytteen jakelutoiminto) soita toimintoon, joka määrittää kullekin x: lle tapahtuman X suhteellisen taajuuden<х.


missä vaihtoehtojen määrä on pienempi kuin x,

n on otoksen koko.

Toisin kuin otoksen empiirinen jakautumistoiminto, yleisen väestön jakautumisfunktiota F (x) kutsutaan teoreettinen jakelutoiminto.

Ero empiiristen ja teoreettisten jakautumistoimintojen välillä on se, että teoreettinen funktio F (x) määrittää tapahtuman X todennäköisyyden F * (x) pyrkii todennäköisyydellä tämän tapahtuman todennäköisyyteen F (x). Eli suurille n F * (x) ja F (x) eroavat toisistaan ​​vähän.

Että. on suositeltavaa käyttää otoksen empiiristä jakautumistoimintoa likimääräisen esityksen esittämiseksi teoreettisesta (integraalisesta) jakautumisfunktiosta yleisölle.

F * (x) on kaikki ominaisuudet F (x).

1. Arvot F * (x) kuuluvat intervalliin.

2. F * (x) on ei-vähenevä funktio.

3. Jos on pienin vaihtoehto, niin F * (x) = 0, x: lle < x 1; jos x k on suurin vaihtoehto, niin F * (x) = 1, jos x> x k.

Nuo. F * (x) arvioi F (x).

Jos näyte on muunnossarja, empiirisen funktion muoto on:

Empiiristä funktiokaaviota kutsutaan kumulatiiviseksi.

Esimerkki:

Piirrä empiirinen funktio näytteen annetulle jakaumalle.


Ratkaisu:

Näytteen koko on n = 12 + 18 +30 = 60. Pienin vaihtoehto on 2, ts. kohdassa x < 2. Tapahtuma X<6, (x 1 = 2) наблюдалось 12 раз, т.е. F * (x) = 12/60 = 0,2 klo 2 < x < 6. Tapahtuma X<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < x < 10. Koska x = 10 on sitten suurin vaihtoehto F * (x) = 1 x> 10. Haettu empiirinen funktio on:

Cumulata:


Kumulaation avulla voidaan ymmärtää graafisesti esitetyt tiedot, esimerkiksi vastata kysymyksiin: ”Määritä niiden havaintojen lukumäärä, joille ominaisuuden arvo oli alle 6 tai vähintään 6. F * (6) = 0,2 »Tällöin havaintojen lukumäärä, joissa havaitun ominaisuuden arvo oli alle 6, on 0,2 * n = 0,2 * 60 = 12. Havaintojen lukumäärä, joissa havaitun ominaisuuden arvo oli vähintään 6, on (1-0,2) * n = 0,8 * 60 = 48.

Jos intervallivaihtelusarja on määritetty, empiirisen jakautumistoiminnon muodostamiseksi etsitään aikaväleiden keskipisteet ja niistä saadaan empiirinen jakaumitoiminto, joka on samanlainen kuin pistevariaatiosarja.

6. Monikulmio ja histogrammi

Selvyyden vuoksi tilastollisesta jakaumasta rakennetaan erilaisia ​​kaavioita: polynomi- ja histogrammit

Taajuuden monikulmio tämä on katkoviiva, jonka segmentit yhdistävät pisteet (x 1; n 1), (x 2; n 2),…, (x k; n k), missä vaihtoehdot ovat vastaavia taajuuksia.

Suhteellisten taajuuksien monikulmio tämä on katkoviiva, jonka segmentit yhdistävät pisteet (x 1; w 1), (x 2; w 2),…, (xk; wk), joissa xi on vaihtoehdot ja wi ovat suhteelliset taajuudet, jotka vastaavat niitä.

Esimerkki:

Piirrä suhteellisten taajuuksien polynomi tietylle näytejakaumalle:

Ratkaisu:

Jatkuvan ominaisuuden tapauksessa on suositeltavaa rakentaa histogrammi, jolle aikaväli, johon kaikki piirteen havaitut arvot on liitetty, on jaettu useisiin osaväleihin, joiden pituus on h, ja jokaiselle osavälille ni löytyy - muunnelman taajuuksien summa, joka kuului i: nteen väliin. (Esimerkiksi kun mitataan henkilön pituutta tai painoa, kyseessä on jatkuva merkki).

Taajuushistogrammi se on porrastettu hahmo, joka koostuu suorakulmioista, joiden pohjat ovat osittaisia ​​aikavälejä h ja korkeudet yhtä suuret kuin suhde (taajuustiheys).

Neliö i: nnen osisuorakulmion arvo on yhtä suuri kuin i: nnen aikavälin variantin taajuuksien summa, ts. taajuushistogrammin pinta -ala on yhtä suuri kuin kaikkien taajuuksien summa, ts. otoskoko.

Esimerkki:

Tulokset jännitteen muutoksista (voltteina) sähköverkossa on annettu. Tee vaihtosarja, piirrä taajuuksien monikulmio ja histogrammi, jos jännitearvot ovat seuraavat: 227, 215, 230, 232, 223, 220, 228, 222, 221, 226, 226, 215, 218, 220, 216, 220, 225, 212, 217, 220.

Ratkaisu:

Laitetaan muunnossarja. Meillä on n = 20, x min = 212, x max = 232.

Käytetään Strojess -kaavaa laskemaan säiliöiden lukumäärä.

Taajuuksien vaihtelusarja on seuraava:


Taajuustiheys

212-21 6

0,75

21 6-22 0

0,75

220-224

1,75

224-228

228-232

0,75

Rakennetaan taajuuksien histogrammi:

Rakennetaan taajuuden monikulmio etsimällä ensin välien keskipisteet:


Suhteellisten taajuuksien histogrammi kutsutaan porraskuvaksi, joka koostuu suorakulmioista, joiden pohjat ovat osittaisia ​​välivaihtoehtoja h ja korkeudet ovat yhtä suuret kuin suhde w i/ h (suhteellinen taajuustiheys).

Neliö I: nnen osisuorakulmio on yhtä suuri kuin muunnelman suhteellinen taajuus, joka kuuluu i: nteen väliin. Nuo. suhteellisten taajuuksien histogrammin pinta -ala on yhtä suuri kuin kaikkien suhteellisten taajuuksien summa, ts. yksikkö.

7. Variaatiosarjan numeeriset ominaisuudet

Tarkastellaan yleisten ja otantapopulaatioiden pääpiirteitä.

Yleinen keskikohta kutsutaan väestön ominaisuuden arvojen aritmeettiseksi keskiarvoksi.

Eri arvoille x 1, x 2, x 3,…, x n. tilavuuden N yleisväestöstä:

Jos määritteen arvoilla on vastaavat taajuudet N 1 + N 2 +… + N k = N, niin


Näytteen keskiarvo kutsutaan otosjoukon määritteen arvojen aritmeettiseksi keskiarvoksi.

Jos määritteen arvoilla on vastaavat taajuudet n 1 + n 2 + ... + n k = n, niin


Esimerkki:

Laske näytteen näytteen keskiarvo: x 1 = 51,12; x 2 = 51,07; x 3 = 52,95; x 4 = 52,93; x 5 = 51,1; x 6 = 52,98; x 7 = 52,29; x 8 = 51,23; x 9 = 51,07; x 10 = 51,04.

Ratkaisu:

Yleinen varianssi on väestön määritteen X arvojen poikkeamien neliöiden aritmeettinen keskiarvo yleisestä keskiarvosta.

Eri arvoille x 1, x 2, x 3, ..., x N tilavuuden N yleisjoukon määritteen attribuutista meillä on:

Jos määritteen arvoilla on vastaavat taajuudet N 1 + N 2 +… + N k = N, niin

Yleinen neliöpoikkeama (vakio) kutsutaan yleisen varianssin neliöjuureksi

Valikoiva vaihtelu kutsutaan ominaisuuden havaittujen arvojen poikkeamien keskiarvojen neliöiden aritmeettiseksi keskiarvoksi.

Tilavuuden n otosjoukon määritteen eri arvoille x 1, x 2, x 3, ..., x n meillä on:


Jos määritteen arvoilla on vastaavat taajuudet n 1 + n 2 + ... + n k = n, niin


Valittu keskihajonta (vakio) jota kutsutaan näytteen varianssin neliöjuureksi.


Esimerkki:

Otosjoukko määritetään jakelutaulukossa. Etsi otosvarianssi.


Ratkaisu:

Lause: Varianssi on yhtä suuri kuin ominaisuusarvojen keskimääräisten neliöiden ja kokonaiskeskiarvon neliön välinen ero.

Esimerkki:

Etsi annetun jakauman varianssit.



Ratkaisu:

8. Tilastolliset arviot jakautumisparametreista

Tutkitaan yleistä väestöä tietyn otoksen osalta. Tässä tapauksessa on mahdollista saada vain likimääräinen arvo tuntemattomalle parametrille Q, joka toimii sen estimaattina. On selvää, että arviot voivat muuttua näytteestä toiseen.

Tilastollinen arviointiQ * teoreettisen jakauman tuntematonta parametria kutsutaan funktioksi f, joka riippuu otoksen havaituista arvoista. Tuntemattomien parametrien tilastollisen arvioinnin tehtävä näytteestä on rakentaa sellainen funktio käytettävissä olevista tilastollisista havaintotiedoista, joka antaisi tarkimmat likimääräiset arvot todellisista, tutkijalle tuntemattomista arvoista.

Tilastolliset arviot on jaettu pisteisiin ja aikaväleihin sen mukaan, miten ne esitetään (luku tai väli).

Pistettä kutsutaan tilastolliseksi arvioksi. parametrin Q teoreettisen jakauman parametri Q * = f (x 1, x 2, ..., x n), jossax 1, x 2, ..., x n- tietyn otoksen määrällisen ominaisuuden X empiiristen havaintojen tulokset.

Tällaiset eri näytteistä saadut parametriarviot eroavat useimmiten toisistaan. Absoluuttista eroa / Q * -Q / kutsutaan otanta (arvio) virhe.

Jotta tilastolliset arvioinnit antaisivat luotettavia tuloksia arvioitavista parametreista, niiden on oltava puolueettomia, tehokkaita ja johdonmukaisia.

Pistearvio, jonka matemaattinen odotus on yhtä suuri (ei sama) kuin arvioitu parametri, kutsutaan puolueeton (puolueellinen)... M (Q *) = Q.

Ero M ( Q *) - Q kutsutaan puolueellisuus tai puolueellisuus... Puolueettomien arvioiden osalta harha on 0.

Tehokas arviointi Q *, jolla tietyllä otoskoko n: llä on pienin mahdollinen varianssi: D min (n = const). Tehokkaalla arviolla on pienin vaihtelu verrattuna muihin puolueettomiin ja johdonmukaisiin arvioihin.

Varakaskutsua tätä tilastolliseksi arviointi Q *, joka ntaipumus todennäköisyyteen arvioidun parametrin suhteen Q eli otoskoon kasvaessa n arvio pyrkii todennäköisyydellä parametrin todelliseen arvoon Q.

Johdonmukaisuusvaatimus on yhdenmukainen suurten lukujen lain kanssa: mitä enemmän alkutietoja tutkittavasta kohteesta, sitä tarkempi tulos. Jos otoskoko on pieni, parametrin pistearvio voi johtaa vakaviin virheisiin.

Minkä tahansa näyte (tilavuusn) voidaan ajatella tilattuina setteinäx 1, x 2, ..., x n riippumattomia identtisesti hajautettuja satunnaismuuttujia.

Näytevälineet eri kokoisille näytteille n samasta väestöstä tulee olemaan erilainen. Toisin sanoen otoksen keskiarvoa voidaan pitää satunnaismuuttujana, mikä tarkoittaa, että voimme puhua otoksen keskiarvon jakautumisesta ja sen numeerisista ominaisuuksista.

Otoksen keskiarvo täyttää kaikki tilastollisille arvioille asetetut vaatimukset, ts. antaa puolueettoman, tehokkaan ja johdonmukaisen arvion yleisestä keskiarvosta.

Sen voi todistaa... Näin ollen otosvarianssi on puolueellinen arvio yleisestä varianssista, mikä antaa sille aliarvioidun arvon. Toisin sanoen pienellä otoskokolla se antaa järjestelmällisen virheen. Puolueettoman ja johdonmukaisen arvion saamiseksi riittää ottaa arvo, jota kutsutaan varianssikorjatuksi. Eli.

Käytännössä yleisen varianssin arvioimiseksi käytetään korjattua varianssia n < 30. Muissa tapauksissa ( n> 30) poikkeama tuskin havaittavissa. Siksi suurilla arvoilla n offset -virhe on vähäinen.

Voit myös todistaa, että suhteellinen taajuusn i / n on puolueeton ja johdonmukainen arvio todennäköisyydestä P (X = x i ). Empiirinen jakelutoiminto F * (x ) on puolueeton ja johdonmukainen arvio teoreettisesta jakautumisfunktiosta F (x) = P (X< x ).

Esimerkki:

Etsi puolueettomat arviot keskiarvosta ja varianssista otantataulukosta.

x i
n i

Ratkaisu:

Näytteen koko n = 20.

Puolueeton arvio matemaattisesta odotuksesta on otoksen keskiarvo.


Puolueettoman varianssiarvion laskemiseksi löydämme ensin otosvarianssin:

Etsitään nyt puolueeton arvio:

9. Jakaumaparametrien aikaväli -arviot

Intervalli on tilastollinen arvio, jonka määrittävät kaksi numeerista arvoa, tutkittavan aikavälin päät.

Määrä> 0, jolle | Q - Q * |< , luonnehtii intervalli -arvioinnin tarkkuutta.

Luottamusmiesnimeltään väli , joka tietyllä todennäköisyydelläkattaa parametrin tuntemattoman arvon Q ... Luotettavuusvälin laajentaminen kaikkien mahdollisten parametriarvojen joukkoon Q nimeltään kriittinen alue... Jos kriittinen alue sijaitsee vain luottamusvälin toisella puolella, luottamusväliä kutsutaan yksipuolinen: vasenkätinen jos kriittinen alue on vain vasemmalla, ja oikeakätinen jos vain oikealla. Muussa tapauksessa luottamusväliä kutsutaan kahdenvälinen.

Luotettavuus tai luottamustaso, estimoi Q (käyttäen Q: ta *) on seuraavan epätasa -arvon todennäköisyys: | Q - Q * |< .

Useimmiten luottamustaso asetetaan etukäteen (0,95; 0,99; 0,999) ja sille asetetaan vaatimus olla lähellä yhtä.

Todennäköisyyskutsutaan virheen todennäköisyys tai merkittävyys.

Anna | Q - Q * |< , sitten... Tämä tarkoittaa sitä, että todennäköisyydellävoidaan väittää, että parametrin todellinen arvo Q kuuluu intervalliin... Mitä pienempi poikkeama, sitä tarkempi arvio.

Luottamusvälin rajoja (päitä) kutsutaan luottamusrajat tai kriittiset rajat.

Luottamusvälin rajojen arvot riippuvat parametrin jakelulaista Q *.

Poikkeaman määräjoka on puolet luottamusvälin leveydestä, kutsutaan arvioinnin oikeellisuus.

Menetelmät luottamusvälien muodostamiseksi kehitti ensin yhdysvaltalainen tilastotieteilijä J. Neumann. Arvion tarkkuus, luottamuksen todennäköisyys ja näytteen koko n liittyvät. Siksi, kun tiedät kahden määrän erityisarvot, voit aina laskea kolmannen.

Luottamusvälin löytäminen normaalijakauman matemaattisen odotuksen arvioimiseksi, jos keskihajonta tiedetään.

Otetaan näyte yleisväestöstä normaalin jakautumisen lain mukaisesti. Olkoon yleinen keskihajonta tiedossa, mutta teoreettisen jakauman matemaattisia odotuksia ei tiedetä a ().

Seuraava kaava on pätevä:

Nuo. annetulla poikkeama -arvollavoidaan löytää todennäköisyys, jolla tuntematon yleinen keskiarvo kuuluu aikavälille... Ja päinvastoin. Kaavasta voidaan nähdä, että otoskoon kasvaessa ja luottamustodennäköisyyden kiinteän arvon myötä arvo- vähenee, ts. estimaatin tarkkuus paranee. Kun luotettavuus (luottamustaso) kasvaa, arvo-lisääntyy, ts. estimaatin tarkkuus heikkenee.

Esimerkki:

Testien tuloksena saatiin seuraavat arvot -25, 34, -20, 10, 21. Tiedetään, että ne noudattavat normaalijakauman lakia, jonka keskihajonta on 2. Etsi arvio a * matemaattinen odotus a. Piirrä sille 90%: n luottamusväli.

Ratkaisu:

Etsi puolueeton arvio

Sitten


A: n luottamusväli on: 4 - 1,47< a< 4+ 1,47 или 2,53 < a < 5, 47

Luottamusvälin löytäminen normaalijakauman matemaattisen odotuksen arvioimiseksi, jos keskihajonta on tuntematon.

Olkoon tiedossa, että väestö on normaalijakauman lain alainen, kun a ja... Luottamusvälin tarkkuus luotettavuudellaparametrin a todellinen arvo, tässä tapauksessa lasketaan kaavalla:

, missä n on otoksen koko, , - Opiskelijan kerroin (se on löydettävä annettujen arvojen mukaan n ja taulukosta "Opiskelijan jakautumisen kriittiset kohdat").

Esimerkki:

Testien tuloksena saatiin seuraavat arvot -35, -32, -26, -35, -30, -17. Tiedetään, että he noudattavat normaalijakauman lakia. Etsi väestön matemaattisten odotusten luottamusväli luottamustasolla 0,9.

Ratkaisu:

Etsi puolueeton arvio.

löytö.

Sitten

Luottamusväli muuttuu(-29,2 -5,62; -29,2 + 5,62) tai (-34,82; -23,58).

Luottamusvälin löytäminen normaalijakauman varianssille ja keskihajonnalle

Otetaan satunnaisnäyte volyymista jostakin yleisestä arvosta, joka on jaettu normaalilain mukaisestin < 30, jolle otosvarianssit lasketaan: puolueellinenja korjattu s 2... Etsi sitten aikaväli -arviot tietyllä luotettavuudellayleisen vaihtelun vuoksiDyleinen keskihajontakäytetään seuraavia kaavoja.


tai,

Arvot- löytää käyttämällä kriittisten pisteiden arvotaulukkoaPearsonin jakelu.

Varianssin luottamusväli saadaan näistä eriarvoisuuksista neliöimällä kaikki eriarvoisuuden osat.

Esimerkki:

15 ruuvin laatu tarkistettiin. Olettaen, että niiden valmistusvirheeseen sovelletaan normaalia jakelulakia ja otoksen keskihajontaa5 mm, määritä luotettavastituntemattoman parametrin luottamusväli

Esitämme aikavälin rajat kaksinkertaisena eriarvoisuutena:

Varianssin kaksipuolisen luottamusvälin päät voidaan määrittää suorittamatta aritmeettisia operaatioita tietyllä luottamustasolla ja otoskoko käyttäen asianmukaista taulukkoa (Luottamusvälien rajat varianssille vapaus- ja luotettavuusasteiden määrästä riippuen). Tätä varten taulukosta saadun aikavälin päät kerrotaan korjatulla varianssilla s 2.

Esimerkki:

Ratkaistaan ​​edellinen ongelma eri tavalla.

Ratkaisu:

Etsitään korjattu varianssi:

Käyttämällä taulukkoa "Luottamusvälien rajat varianssille, riippuen vapauden ja luotettavuuden asteista", löydämme varianssin luottamusvälin rajatk= 14 ja: alaraja on 0,513 ja yläraja on 2,354.

Kerro tuloksena olevat rajats 2 ja poimi juuri (koska luottamusväliä ei tarvita varianssille vaan keskihajonnalle).

Kuten esimerkeistä voidaan nähdä, luottamusvälin arvo riippuu sen rakentamismenetelmästä ja antaa samanlaisia, mutta erilaisia ​​tuloksia.

Riittävän suuret näytteet (n> 30) luottamusvälin rajat yleiselle keskihajonnalle voidaan määrittää kaavalla: - jokin numero, joka on esitetty taulukossa ja ilmoitettu vastaavassa viitetaulukossa.

Jos 1- q<1, то формула имеет вид:

Esimerkki:

Ratkaistaan ​​edellinen ongelma kolmannella tavalla.

Ratkaisu:

Aiemmin löydettys= 5,17. q(0,95; 15) = 0,46 - löydämme sen taulukosta.

Sitten: