Hogyan kell helyesen kiszámítani a minta méretét? Szeminárium témája: mintavétel a szociológiai kutatásban Kulcsfogalmak Függő és független minták

Az 1C 8.2-ben és 8.3-ban a mintavétel egy speciális módszer az információsbázis-táblázatok rekordjai között való kereséshez. Nézzük meg közelebbről, mi az a mintavétel, és hogyan kell használni.

Mi a mintavételezés az 1C-ben?

Minta- az 1C-ben szereplő információk rendezési módja, amely abból áll, hogy a kurzort egymás után a következő rekordra helyezzük. Az 1C-ben a lekérdezés eredményéből és az objektumkezelőből, például dokumentumokból vagy könyvtárakból lehet kiválasztani.

Példa objektumkezelő beszerzésére és iterációjára:

Kiválasztás = Könyvtárak. Bankok. Választ() ; Viszlát választás. Következő() Loop EndLoop ;

Példa egy kérésből származó minta lekérésére:

Szerezzen ingyen 267 videóleckét 1C-n:

Request = Új kérés( "Select Link, Code, Name from Directory.Banks") ; Fetch = Lekérdezés. Fuss() . Választ() ; Viszlát választás. Következő() Cikk //végezze el a kívánt műveleteket a "Bankok" könyvtárral EndCycle ;

Mindkét fent felsorolt példa ugyanazokat az adatkészleteket kapja az ismétléshez.

Mintavételi módszerek 1C 8.3

A mintavételezésnek számos módszere van, nézzük meg őket részletesebben:

Választ()- olyan módszer, amellyel a mintát közvetlenül nyerik. A mintából egy másik, alárendelt mintát kaphat, ha a „csoportosítással” bejárás típusa meg van adva.
Tulajdonos()— a metódus inverze a Select()-re. Lehetővé teszi a kérelem „szülő” mintájának beszerzését.
Következő()— egy módszer, amely a kurzort a következő rekordra mozgatja. Ha létezik rekord, True értéket ad vissza, ha nincs rekord, False értéket ad vissza.
Következő keresése()- egy nagyon hasznos módszer, amellyel csak a kötelező mezőket válogathatja kiválasztási érték szerint (kijelölés - mezőstruktúra).
NextByFieldValue()— lehetővé teszi a következő rekord lekérését az aktuális pozíciótól eltérő értékkel. Például meg kell ismételnie az összes rekordot, amelynek egyedi értéke van az „Account” mezőben: Select.NextByFieldValue („Számla”).
Visszaállítás()— lehetővé teszi a kurzor aktuális helyének visszaállítását és eredeti helyzetbe állítását.
Mennyiség()— a kijelölésben lévő rekordok számát adja vissza.
Kap()— ezzel a módszerrel a kurzort a kívánt rekordra állíthatja indexértékkel.
Szint() - szinten az aktuális rekord (szám) hierarchiájában.
RecordType()— megjeleníti a rekord típusát – DetailedRecord, TotalByGrouping, TotalByHierarchy vagy GeneralTotal
Csoport()— az aktuális csoportosítás nevét adja vissza; ha a rekord nem csoportos, akkor üres karakterláncot ad vissza.

Ha elkezdi tanulni az 1C programozást, ajánljuk ingyenes tanfolyamunkat (ne felejtsd el

Tanulási célok

Világosan meg kell különböztetni a népszámlálás (minősítés) és a mintavétel fogalmát.
Ismerje meg a kutatók által végrehajtott hat szakasz lényegét és sorrendjét a mintapopuláció megszerzéséhez.
Határozza meg a „mintavételi keret” fogalmát.
Magyarázza meg a valószínűségi és a determinisztikus mintavétel közötti különbséget!
Különbséget kell tenni a rögzített méretű mintavétel és a többlépcsős (szekvenciális) mintavétel között.
Magyarázza el, mi az a célzott mintavétel, és írja le annak erősségeit és gyengeségeit.
Határozza meg a kvóta-mintavétel fogalmát!
Magyarázza el, mi az a paraméter a mintavételi eljárásban.
Magyarázza el, mi az a származtatott halmaz!
Magyarázza meg, miért van a mintavételi eloszlás fogalma! a legfontosabb fogalom statisztika.

A kutató tehát pontosan meghatározta a problémát, és biztosított a megoldására alkalmas kutatástervet és adatgyűjtési eszközöket. A kutatási folyamat következő szakasza a vizsgálandó elemek kiválasztása. Lehetőség van egy adott sokaság minden elemének felmérésére az adott populáció teljes összeírásával. A teljes lakossági felmérést népszámlálásnak nevezzük. Van egy másik lehetőség is. A sokaság egy bizonyos részét, egy nagy csoport elemeinek mintáját statisztikai felmérésnek vetjük alá, és az ebből a részhalmazból nyert adatok alapján bizonyos következtetéseket vonunk le a teljes csoportra vonatkozóan. A mintaadatokból kapott eredmények nagyobb csoportra való általánosíthatósága a mintagyűjtés módszerétől függ. Ennek a fejezetnek a nagy részét annak szenteljük, hogyan kell kiválasztani a mintát, és miért kell így lennie.

Népszámlálás (minősítés)
Teljes népszámlálás.
Minta
Egy nagyobb objektumcsoport részhalmazának elemeinek gyűjteménye.

A "népesség" vagy "gyűjtemény" fogalma nemcsak az emberekre, hanem a feldolgozóiparban működő cégekre, kis- vagy nagykereskedelmi szervezetekre, vagy akár teljesen élettelen tárgyakra is vonatkozhat, mint például a vállalkozásban előállított alkatrészek; ezt a fogalmat úgy definiáljuk, mint az elemek összességét, amelyek megfelelnek bizonyos meghatározott feltételeknek. Ezek a feltételek egyértelműen meghatározzák mind a célcsoporthoz tartozó elemeket, mind azokat, amelyeket ki kell zárni a mérlegelésből.

A fagyasztott pizzát fogyasztók demográfiai profiljának meghatározására irányuló kutatást annak meghatározásával kell kezdeni, hogy kit kell besorolni, és kit nem. Ebbe a kategóriába tartoznak azok, akik legalább egyszer kipróbálták ezt a pizzát? Magánszemélyek, akik havonta legalább egy pizzát vásárolnak? A héten? Emberek, akik egy hónap alatt egy bizonyos minimális mennyiségű pizzát esznek meg? A kutatónak nagyon pontosan kell meghatároznia a célcsoportot. Gondoskodni kell arról is, hogy a minta a célsokaságból, és ne „valamelyik” sokaságból kerüljön kiválasztásra, ami akkor áll fenn, ha a mintavételi keret nem megfelelő vagy hiányos. Ez utóbbi azon elemek listája, amelyekből a tényleges minta kerül kialakításra.

A kutató több okból is előnyben részesítheti a mintavételi módszert a teljes populációra kiterjedő felméréssel szemben. Először, teljes körű vizsgálat még viszonylag kis méretű aggregálása nagyon nagy anyag- és időköltséget igényel. Gyakran a népszámlálás befejezésekor és az adatok feldolgozásakor az információ már elavult. Bizonyos esetekben a minősítés egyszerűen lehetetlen. Tegyük fel, hogy a kutatók arra vállalkoztak, hogy megvizsgálják, hogy az elektromos izzólámpák tényleges élettartama megfelel-e a számítottnak, amihez a meghibásodásig égve kell tartani. Ha így megvizsgáljuk a teljes lámpakészletet, megbízható adatokat kapunk, de nem marad semmi kereskednivaló.

Végül a kezdők meglepetésére a kutatók előnyben részesíthetik a mintavételt a cenzúrával szemben, hogy biztosítsák az eredmények pontosságát. Az összeírások lefolytatása nagy létszámú személyzet bevonását igényli, ami növeli a szisztematikus (nem mintavételi) hibák valószínűségét. Ez az egyik oka annak, hogy az US Census Bureau mintavételezéssel ellenőrzi a különböző típusú népszámlálások pontosságát. Jól hallotta: mintavételes felmérések végezhetők a minősítési adatok pontosságának ellenőrzésére.

Minta tervezési lépések

ábrán. A 15.1. ábra egy hat lépésből álló sorozatot mutat be, amelyet a mintakutató követhet. Mindenekelőtt meg kell határozni azt a célpopulációt vagy elemkészletet, amelyről a kutató tudni szeretne valamit.

Például a gyerekek preferenciáinak tanulmányozásakor a kutatóknak el kell dönteniük, hogy a vizsgált populáció csak gyerekekből, csak szülőkből vagy mindkettőből áll-e majd.

Összesítés (népesség)
Olyan elemek halmaza, amelyek megfelelnek bizonyos meghatározott feltételeknek.
Mintavételi keret
Azon elemek listája, amelyekből a minta készül; állhat területi egységekből, szervezetekből, egyénekből és egyéb elemekből.

Egy bizonyos cég csak gyerekeken tesztelte elektromos „versenyeit”. Megörvendeztették a gyerekeket. A szülők eltérően reagáltak az új termékre. Az anyukáknak nem tetszett, hogy az attrakción nem tanítják meg a gyerekeket az autók gondozására, az apukáknak pedig, hogy játékszerűen készült a termék.
Az ellenkező helyzet is lehetséges. Egy cég új élelmiszerterméket kezdett gyártani, és országos reklámkampányt indított, amelyben a koraérett gyermeké volt a főszerep, a reklámok hatékonyságát csak az örömtől elragadtatott anyákon tesztelte. A gyerekek undorítónak találták ezt a „gyorsítót”, és vele együtt magát a reklámozott terméket is. A termék elkészült 1.

A kutatónak el kell döntenie, hogy az érintett sokaság kikből vagy miből áll: magánszemélyek, családok, cégek, egyéb szervezetek, hitelkártya-tranzakciók stb. A döntések meghozatalakor meg kell határozni, hogy mely elemeket kell kizárni a sokaságból. Az elemek időbeli és földrajzi hivatkozását is el kell végezni, ami bizonyos esetekben további feltételekhez vagy korlátozásokhoz vezethet. Például, ha egyénekről beszélünk, az érdeklődési körbe csak 18 éven felüliek, vagy csak nők, vagy legalább középfokú végzettséggel rendelkezők tartozhatnak.

A nemzetközi marketingkutatásban a célcsoport földrajzi határainak meghatározása lehet a feladat speciális probléma, mivel ez növeli a vizsgált rendszer heterogenitását. Például a városi és vidéki területek relatív aránya országonként jelentősen eltérhet. A területi szempont komoly hatással van egy ország lakosságának összetételére. Például Chile északi részén a túlnyomórészt indiai lakosság tömören él, míg az ország déli régióiban főleg európaiak leszármazottai élnek.

Lefedettség (előfordulás)
Százalékban kifejezve egy sokaság vagy csoport azon elemeinek aránya, amelyek megfelelnek a mintába kerülés feltételeinek.

Általánosságban elmondható, hogy minél egyszerűbben van meghatározva a célpopuláció, annál nagyobb a lefedettsége (incidenciája), és annál egyszerűbb és olcsóbb a mintavételi eljárás. Lefedettség (előfordulás) egy sokaság vagy csoport elemeinek százalékos arányának felel meg, amelyek megfelelnek a mintába kerülés feltételeinek. A lefedettség közvetlenül befolyásolja az időt és anyagköltségek szükséges a vizsgálathoz. Ha a lefedettség nagy (vagyis a sokaság elemeinek nagy része megfelel egy vagy több egyszerű kritériumnak, amellyel a potenciális válaszadók azonosíthatók), az adatgyűjtés idő- és anyagköltsége minimális. Ezzel szemben, ahogy növekszik azon kritériumok száma, amelyeket a potenciális válaszadóknak teljesíteniük kell, úgy nőnek az anyag- és időköltségek.

ábrán. A 15.2. ábra a felnőtt lakosság egyes sportágakban részt vevő arányát mutatja. Az ábra adatai azt jelzik, hogy a motorozásban részt vevők (a felnőttek mindössze 3,6%-a) vizsgálata sokkal nehezebb és költségesebb, mint a rendszeres szabadidős sétákat (a felnőttek 27,4%-a). A lényeg, hogy a kutató pontosan meghatározza, mely elemek kerüljenek be a vizsgált sokaságba, és mely elemeket zárják ki belőle. A kutatási cél egyértelmű megfogalmazása nagyban megkönnyíti a probléma megoldását. A mintakiválasztási folyamat második lépése a mintakeret meghatározása, amely, mint Ön már tudja, azoknak az elemeknek a listája, amelyekből a minta készül. Legyen egy vizsgálat célpopulációja a Dallas körzetében élő összes család. Első pillantásra jó és könnyen elérhető mintavételi keret lenne a dallasi telefonkönyv. Közelebbről megvizsgálva azonban nyilvánvalóvá válik, hogy a névjegyzékben szereplő családok listája nem teljesen helytálló, mert egyes családok száma kimarad belőle (természetesen a telefonnal nem rendelkező családokat nem tartalmazza), míg néhány családnak több telefonszáma is van . Azok a személyek sem szerepelnek a névjegyzékben, akik a közelmúltban változtatták lakóhelyüket és ennek megfelelően a telefonszámukat.

Tapasztalt kutatók úgy találják, hogy ritkán van pontos egyezés a mintavételi keret és az érdeklődésre számot tartó célpopuláció között. Az egyik legtöbb alkotói szakaszok A mintavétel tervezésének feladata, hogy megfelelő mintavételi keretet határozzon meg, ha a sokaságelemek listázása nehéz. Ez megkövetelheti a mintavételezést a munkablokkokból és az előtagokból, ha például véletlenszerű tárcsázást alkalmaznak a telefonkönyvek hiányosságai miatt. A munkaegységek számának az elmúlt 10 évben tapasztalt jelentős növekedése azonban megnehezítette ezt a feladatot. Hasonló helyzetek adódhatnak a területi zónák vagy szervezetek szelektív megfigyelése során, utólagos részmintavétellel, amikor például egyedek a célpopuláció, de ezekről nincs pontos aktuális lista.

Forrás: SSI-ben szereplő adatok alapján LITE TM: L ow Előfordulás T feltett S ampling" (Fairfield, Conn.: Survey Sampling, Inc., 1994).

A mintavételi eljárás harmadik szakasza szorosan összefügg a mintavételi keret meghatározásával. A mintavételi módszer vagy eljárás megválasztása nagymértékben függ a kutató által alkalmazott mintavételi kerettől. Különböző típusú mintákra van szükség különféle típusok mintavételi keretek. Ez és a következő fejezet áttekintést nyújt a marketingkutatásban használt főbb mintákról. Leírásuk során nyilvánvalóvá kell válnia a kapcsolatnak a mintavételi keret és a kialakításának módja között.

A mintavételi eljárás negyedik lépése a minta méretének meghatározása. Ezt a problémát a fejezet tárgyalja. 17. Az ötödik szakaszban a kutatónak ténylegesen ki kell választania a vizsgálandó elemeket. Az erre a célra használt módszert a kiválasztott mintatípus határozza meg; A mintavételi módszerek tárgyalásakor szó lesz elemeinek kiválasztásáról is. Végül a kutatónak ténylegesen meg kell vizsgálnia a kiválasztott válaszadókat. Ebben a szakaszban nagy a valószínűsége annak, hogy számos hibát követnek el.
Ezeket a problémákat és néhány megoldási módot a fejezet tárgyal. 18.

A mintavételi (mintavételi) tervek típusai

Minden mintavételi ellenőrzési módszer két kategóriába sorolható: valószínűségi minták megfigyelése és determinisztikus minták megfigyelése. A sokaság minden tagja bekerülhet egy valószínűségi mintába, meghatározott, nem nulla valószínűséggel. A sokaság bizonyos tagjainak a mintába való felvételének valószínűsége változhat, de az egyes elemek bekerülésének valószínűsége ismert. Ezt a valószínűséget a mintaelemek kiválasztásához használt konkrét mechanikai eljárás határozza meg.

Determinisztikus minták esetén lehetetlenné válik bármely elem mintába való felvételének valószínűsége. Egy ilyen minta reprezentativitása nem garantálható. Például, Allstate Corporation kifejlesztett egy rendszert a biztosítási káradatok feldolgozására 14 millió háztartás (ügyfele) számára. A vállalat azt tervezi, hogy ezen adatok felhasználásával meghatározza a szolgáltatásai iránti kereslet mintáit – például annak a valószínűségét, hogy egy Mercedes Benz-t birtokló háztartásnak nyaralója is lesz (amelyhez biztosítás szükséges). Bár az adatbázis nagyon nagy, a vállalatnak nincs módja annak felmérésére, hogy egy adott ügyfél mekkora valószínűséggel fog követelni. A vállalat ezért nem lehet biztos abban, hogy az igényt benyújtó ügyfelek adatai a vállalat összes ügyfelét reprezentálják; és még kisebb mértékben - a potenciális ügyfelek vonatkozásában.

Minden determinisztikus minta a kutató egyéni helyzetén, megítélésén vagy preferenciáján alapul, nem pedig a mintaelemek kiválasztásának mechanikus eljárásán. Az ilyen preferenciák néha jó becsléseket adhatnak a populáció jellemzőiről, de nincs mód objektív módon meghatározni, hogy egy minta megfelelő-e az adott feladathoz. A mintavételi eredmények pontosságát csak akkor lehet megítélni, ha ismertek bizonyos elemek kiválasztásának valószínűségét. Emiatt a valószínűségi mintavételt általában kiváló módszernek tekintik a mintavételi hiba nagyságának becslésére. A minták rögzített méretű mintákra és szekvenciális mintákra is feloszthatók. Fix méretű mintákkal végzett munka esetén a minta nagyságának meghatározása a felmérés megkezdése előtt történik, az eredmények elemzését pedig az összes szükséges adat összegyűjtése előzi meg. Elsősorban fix méretű mintákra leszünk kíváncsiak, hiszen ezt a típust szokták alkalmazni a marketingkutatásban.

Valószínűségi mintavétel
Olyan minta, amelyben a sokaság minden eleme valamilyen ismert, nem nulla valószínűséggel szerepelhet.
Determinisztikus mintavétel
Mintavétel bizonyos privát preferenciákon vagy bizonyos elemek kiválasztását meghatározó ítéleteken; ebben az esetben lehetetlenné válik egy tetszőleges sokaságelem mintába való felvételének valószínűsége.

Nem szabad azonban megfeledkezni arról, hogy vannak szekvenciális minták is, amelyek az alábbiakban tárgyalt mindegyik alapvető mintavételi tervhez használhatók.

A szekvenciális mintavételnél a kiválasztott elemek száma előre nem ismert, ezt sorozatos döntések alapján határozzák meg. Ha egy kis mintán végzett felmérés nem vezet megbízható eredményre, a vizsgált elemek köre kibővül. Ha az eredmény továbbra sem meggyőző, a minta méretét ismét megnöveljük. Minden szakaszban döntés születik arról, hogy a kapott eredményt kellően meggyőzőnek ítélik-e, vagy folytatni kell-e az adatgyűjtést. A szekvenciális mintával végzett munka lehetővé teszi az adatok trendjének felmérését az összegyűjtésük során, ami lehetővé teszi a további megfigyelések költségeinek csökkentését azokban az esetekben, amikor ezek megvalósíthatósága semmivé válik.

Mind a valószínűségi, mind a determinisztikus mintavételi terveknek számos típusa van. Például a determinisztikus minták lehetnek nem reprezentatívak (kényelmesek), szándékosak vagy kvótásak; a valószínűségi minták egyszerű véletlenszerű, rétegzett vagy csoportos (klaszter) csoportokra oszlanak, ezek viszont altípusokra oszthatók. ábrán. A 15.3. ábra mutatja azokat a minták típusait, amelyekről ebben és a következő fejezetben lesz szó.

Rögzített térfogatú mintavétel (rögzített mintavétel)
Olyan minta, amelynek mérete előre meghatározott; a szükséges információkat a kiválasztott elemekből határozzuk meg.
Szekvenciális mintavétel
Sorozatos döntések alapján kialakított minta. Ha egy kis minta vizsgálata után az eredmény nem tűnik meggyőzőnek, akkor nagyobb mintát kell figyelembe venni; ha ez a lépés nem vezet eredményre, akkor a minta mérete ismét megnövekszik stb. Így minden szakaszban döntés születik arról, hogy a kapott eredmény kellően meggyőzőnek tekinthető-e.

Nem szabad megfeledkezni arról, hogy a fő mintatípusok kombinálhatók, hogy többet alkossanak összetett terveket szelektív megfigyelés. Ha megérti az alapvető kezdeti típusaikat, könnyebb lesz megérteni a bonyolultabb kombinációkat.

Determinisztikus minták

Amint már említettük, a determinisztikus minta elemeinek kiválasztásánál a privát értékelések vagy döntések döntő szerepet játszanak. Néha ezek a becslések a kutatótól származnak, de más esetekben a populáció elemeinek kiválasztását a terepmunkásokra bízzák. Mivel az elemeket nem mechanikusan választják ki, lehetetlenné válik egy tetszőleges elem mintába kerülésének valószínűsége és ennek megfelelően a mintavételi hiba meghatározása. A választott mintavételi eljárás miatti hiba nem ismerete megakadályozza a kutatókat abban, hogy felmérjék becsléseik pontosságát.

Nem reprezentatív (kényelmi) minták

Nem reprezentatív (kényelmi) minták néha véletlenszerűnek is nevezik, mivel a mintaelemek kiválasztása „véletlenszerű” módon történik - azokat az elemeket választják ki, amelyek a mintavételi időszakban a leginkább elérhetőek vagy látszólag rendelkezésre állnak.

Mindennapi életünk bővelkedik az ilyen válogatások példáiban. Barátokkal beszélgetünk, reakcióik, álláspontjaik alapján következtetéseket vonunk le a társadalomban uralkodó politikai elfogultságokról; egy helyi rádió felhívja az embereket, hogy fejtsék ki véleményüket egy vitatott kérdésben, és az általuk kifejtett nézeteket a rendszer uralkodónak értelmezi; Arra bátorítjuk az önkénteseket, hogy működjenek együtt azokkal, akik önkéntesként segítenek nekünk. A kényelmi mintákkal kapcsolatos probléma nyilvánvaló – nem lehetünk biztosak abban, hogy az ilyen típusú minták valóban a célpopulációt képviselik. Még mindig kételkedhetünk abban, hogy barátaink véleménye pontosan tükrözi a társadalomban uralkodó politikai nézeteket, de sokszor nagyon szeretnénk azt hinni, hogy a nagyobb, ugyanúgy kiválasztott minták reprezentatívak. Mutassuk meg egy példán keresztül egy ilyen feltételezés tévedését.
Néhány évvel ezelőtt a város egyik helyi televíziója, ahol e könyv szerzője él, napi közvélemény-kutatást végzett a helyi közösséget érdeklő témákról. A „Pulse of Madison” közvélemény-kutatást a következőképpen végezték. Az állomás minden este a hat órai híradóban egy-egy vitatott témával kapcsolatos kérdést tett fel a nézőknek, amelyre pozitív vagy negatív választ kellett adni.

Pozitív válasz esetén az egyiket, nemleges válasz esetén másik telefonszámot kellett hívni. A „mellett” és a „nem” szavazatok számát a rendszer automatikusan kiszámolta. A tízórai híradó a telefonos felmérés eredményéről számolt be. Esténként 500-1000 ember hívta a stúdiót, hogy kifejtsék álláspontjukat egy-egy kérdésben; egy televíziós kommentátor a közvélemény főáramának értelmezte a közvélemény-kutatás eredményeit.

Nem reprezentatív (kényelmi) minta
Néha véletlennek is nevezik, mert a mintaelemek kiválasztása „véletlenszerű” módon történik – azokat az elemeket választják ki, amelyek a mintavételi időszak alatt a leginkább elérhetőek, vagy leginkább elérhetőnek tűnnek.

Az egyik hatórás epizódban a következő kérdést tették fel a nézőknek: „Ön szerint 18 évre kellene csökkenteni az alkoholfogyasztás korhatárát Madisonban?” A jelenlegi törvényes korhatár 21 év volt. A közönség rendkívüli aktivitással válaszolt erre a kérdésre – aznap este közel 4000-en hívták a stúdiót, akiknek 78%-a a korhatár leszállítása mellett foglalt állást. Nyilvánvalónak tűnik, hogy egy 4000 fős mintának "reprezentatívnak" kell lennie egy 180 000 fős közösségben. Semmi ilyesmi. Amint azt valószínűleg már sejtette, a lakosság egy bizonyos korosztályát sokkal jobban érdekelte a szavazás ismert végeredménye, mint másokat. Ennek megfelelően nem volt meglepő, hogy a kérdés néhány héttel későbbi megvitatása során kiderült, hogy a hallgatók a felmérésre szánt idő alatt összehangoltan cselekedtek. Felváltva hívták a televíziót, mindegyik többször. Így sem a minta nagyságában, sem a törvény liberalizációját támogatók arányában nem volt semmi meglepő. A minta nem volt reprezentatív.

A minta méretének pusztán növelése nem teszi reprezentatívvá. A minta reprezentativitását nem a méret, hanem az elemek kiválasztásának megfelelő eljárása biztosítja. Ha a felmérésben résztvevőket önkéntesen azonosítják, vagy a mintaelemeket elérhetőségük alapján választják ki, a mintavételi terv nem garantálja a minta reprezentativitását. Az empirikus bizonyítékok arra utalnak, hogy a kényelmi okokból kiválasztott minták ritkán reprezentatívak (a minta méretétől függetlenül). A telefonos közvélemény-kutatások, amelyek 800-900 szavazatot vesznek fel, a nagy, de nem reprezentatív minták leggyakoribb formája.

Céltudatos mintavétel
Determinisztikus (céltudatos) mintavétel, melynek elemei manuálisan kerülnek kiválasztásra; pontosan azokat az elemeket választjuk ki, amelyek a kutató véleménye szerint megfelelnek a felmérés célkitűzéseinek.
Céltudatos mintavétel, attól függően, hogy a kutató képes-e azonosítani a kívánt jellemzőkkel rendelkező válaszadók kezdeti csoportját; ezeket a válaszadókat azután adatközlőként használják fel az egyének további kiválasztásának meghatározásához.

Sajnos sokan bizalommal veszik az ilyen felmérések eredményeit. A nemzetközi marketingkutatásban a nem reprezentatív minták alkalmazásának egyik legjellemzőbb példája az egyes országok felmérése, amely a felmérést kezdeményező ország területén jelenleg élő külföldiekből (például a vidéken élő skandinávokból) álló mintán alapul. az USA). Bár az ilyen minták némi fényt vethetnek a szóban forgó populáció bizonyos aspektusaira, nem szabad elfelejteni, hogy ezek az egyének általában egy „amerikaiasodott” elitet képviselnek, akiknek a saját országukhoz való kötődése meglehetősen feltételes lehet. Nem javasolt nem reprezentatív minták használata leíró vagy ok-okozati felmérések végzésekor. Csak konkrét ötletek vagy koncepciók kidolgozását célzó feltáró vizsgálatokban megengedettek, de még ebben az esetben is célszerű szándékos mintákat használni.

Céltudatos mintavétel

A céltudatos mintavételt néha ún töménytelen; elemeiket, amelyek a kutató véleménye szerint megfelelnek a vizsgálat céljainak, manuálisan választják ki. Procter & Gamble ezt a módszert alkalmazta, amikor a cincinnati központja közelében élő 13-17 éves fiataloknak mutatott be hirdetéseket. A cég étel- és italrészlege felbérelte ezt a tinédzsercsoportot, hogy egyfajta fogyasztói mintaként szolgáljanak. Heti 10 órát dolgozva 1000 dollárért cserébe, és elmentek egy koncertre, televíziós reklámokat néztek, szupermarketeket látogattak a cégvezetőkkel, hogy megnézzék a termékbemutatókat, új termékeket teszteltek, és megvitatták a vásárlási szokásokat. Ha a mintaképviselőket „toborzási” eljárással, nem pedig véletlenszerűen választja ki, a vállalat az általa hasznosnak ítélt tulajdonságokra összpontosíthat, például egy tinédzser azon képességére, hogy egyértelműen kifejezze magát, azzal a kockázattal, hogy nézetei esetleg nem reprezentatívak a korosztályukra nézve.

Ahogy már elhangzott, jellegzetes tulajdonsága A tudatos minta elemeinek irányított kiválasztása. Egyes esetekben a mintaelemeket nem azért választják ki, mert reprezentatívak, hanem azért, mert érdekes információkat szolgáltathatnak a kutatók számára. Amikor a bíróság szakértői vallomásra támaszkodik, bizonyos értelemben szándékos mintavételhez folyamodik. Hasonló álláspont érvényesülhet a kutatási projektek kidolgozásakor is. A kérdés kezdeti vizsgálata során a kutatót elsősorban a vizsgálat kilátásainak meghatározása érdekli, amely meghatározza a mintaelemek kiválasztását.

Hógolyó mintavétel a célzott mintavétel egy olyan típusa, amelyet speciális populációtípusokkal végzett munka során használnak. Ez a minta attól függ, hogy a kutató képes-e azonosítani a kívánt jellemzőkkel rendelkező válaszadók kezdeti csoportját. Ezeket a válaszadókat ezután adatközlőként használják fel az egyének további kiválasztásának meghatározásához.

Képzelje el például, hogy egy vállalat fel akarja mérni egy bizonyos termék szükségességét, amely lehetővé tenné a siket emberek telefonos kommunikációját. A kutatók a siketek közösségének kulcsfiguráinak azonosításával kezdhetik meg ezt a problémát; ez utóbbi megnevezhetné a csoport további tagjait, akik hajlandók részt venni a felmérésben. Ilyen taktikával a minta hógolyóként nő.

Miközben a kutató a kezdeti szakaszaiban A probléma feltárása és a tervezett felmérés kilátásainak és lehetséges korlátainak azonosítása után a célzott mintavétel nagyon hatékony lehet. De semmi esetre sem szabad megfeledkeznünk egy ilyen típusú minta gyengeségeiről, hiszen azt leíró vagy ok-okozati vizsgálatokban is felhasználhatja a kutató, ami azonnal befolyásolja az eredmények minőségét. Az ilyen feledékenység klasszikus példája a fogyasztói árindex („CPI”). Ahogy Südman rámutat ( Sudman): „CPI-t csak 56 városra és nagyvárosi területre határoznak meg, amelyek kiválasztását a politikai tényező is befolyásolja. Valójában ezek a városok csak magukat képviselhetik, miközben az index ún fogyasztási cikkek árindexe az órabéres városlakók számára bérek *, És alkalmazottakés a legtöbb ember számára az Egyesült Államok bármely régiójának árszintjét tükröző indexként jelenik meg. Maga a kiskereskedelmi egységek kiválasztása is nem véletlenszerűen történik, aminek következtében a lehetséges mintavételi hiba becslése lehetetlenné válik"(kiemelés tőlem) 2.

* Vagyis munkások. - Jegyzet. sáv

Kvóta minták

A determinisztikus mintavétel harmadik típusa az kvóta minták; ismert reprezentativitását úgy érik el, hogy bizonyos jellemzőkkel rendelkező elemeket ugyanolyan arányban foglalnak bele, mint a vizsgált sokaságban (lásd „15.1. kutatási ablak”). Példaként fontolóra veheti az egyetemen élő hallgatók reprezentatív mintáját. Ha egy 500 fős mintában egyetlen felső tagozatos sem szerepel, jogunk van kétségbe vonni annak reprezentativitását és az ebből a mintából kapott eredményeknek a vizsgált sokaságra történő alkalmazásának jogosságát. Az arányos mintával végzett munka során a kutató gondoskodhat arról, hogy a felső tagozatos hallgatók aránya a mintában megfeleljen az összes hallgatói létszámon belüli arányuknak.

Tegyük fel, hogy egy kutató mintavizsgálatot végez egyetemi hallgatók körében, és abban érdekelt, hogy a minta ne csak a nemüket, hanem a kurzusok közötti megoszlását is tükrözze. Legyen a hallgatók összlétszáma 10 000: 3200 elsőéves, 2600 másodéves, 2200 harmadéves és 2000 negyedik éves hallgató; ebből 7000 fiú és 3000 lány. 1000 fős mintanagyság esetén az arányos mintavételi terv 320 elsősre, 260 másodévesre, 220 harmadévesre és 200 végzősre, 700 fiúra és 300 lányra van szükség. A kutató úgy valósíthatja meg ezt a tervet, hogy minden kérdezőnek egy meghatározott kvótát rendel, amely meghatározza, hogy mely hallgatókkal kell kapcsolatba lépnie.

Kvóta mintavétel Determinisztikus minta, amelyet úgy választanak ki, hogy a mintában azon elemek aránya, amelyek bizonyos jellemzőkkel rendelkeznek, megközelítőleg megfeleljenek ugyanazon elemek arányának a vizsgált sokaságban; Minden mezei munkás kap egy kvótát, amely meghatározza a lakosság azon jellemzőit, amellyel kapcsolatba kell lépnie.

A 20 interjút lebonyolító kérdező utasítható, hogy kérdezze meg:

hat gólya - öt fiú és egy lány;
hat másodéves – négy fiú és két lány;
négy harmadéves hallgató - három fiú és egy lány;
négy negyedikes diák – két fiú és két lány.

Megjegyzendő, hogy a konkrét mintaelemek kiválasztását nem a kutatási terv, hanem a kérdező választása határozza meg, úgy, hogy csak a kvóta által meghatározott feltételeknek feleljen meg: öt gólyát, egy gólyát stb.

Vegye figyelembe azt is, hogy ez a kvóta pontosan tükrözi a hallgatói populáció nemek szerinti megoszlását, de némileg torzítja a hallgatók kurzusok közötti megoszlását; Az interjúk 70%-a (20-ból 14) fiúk körében történik, de csak 30%-a (20-ból 6) az elsőévesek körében, míg az összes hallgató 32%-át teszik ki. Az egyes kérdezőbiztosok számára kiosztott kvóta nem feltétlenül tükrözi, és általában nem is tükrözi a kontrolljellemzők eloszlását a sokaságban – csak az eredményül kapott mintának kell megfelelő arányossággal rendelkeznie.

Nem szabad elfelejteni, hogy az arányos minták személyes, szubjektív attitűdöktől vagy ítéletektől függenek, nem pedig a mintaelemek kiválasztásának objektív eljárásától. Ráadásul a szándékos mintavételtől eltérően a személyes megítélés itt nem a projektfejlesztőt, hanem a kérdezőt illeti. Felmerül a kérdés, hogy az arányos minták reprezentatívnak tekinthetők-e, még akkor is, ha a sokaság bizonyos kontrolljellemzőkkel rendelkező összetevőinek inherens arányát reprodukálják. Ezzel kapcsolatban három megjegyzést kell tenni.

Először is, a minta néhány más fontos jellemzőben jelentősen eltérhet a sokaságtól, ami komoly hatással lehet az eredményre. Például, ha a tanulmány a diákok körében fennálló faji előítéletek problémájával foglalkozik, akkor fontos körülmény derülhet ki, hogy a válaszadók honnan érkeztek: városból vagy vidékről. Mivel a „városi/vidéki háttérből” jellemző kvótát nem határoztak meg, ennek a jellemzőnek a pontos ábrázolása valószínűtlenné válik. Természetesen van egy alternatíva: határozzon meg kvótákat az összes potenciálisan releváns jellemzőre. A szabályozási jellemzők számának növekedése azonban bonyolultabb specifikációhoz vezet. Ez viszont megnehezíti – sőt néha lehetetlenné is teszi – a mintaelemek kiválasztását, és mindenesetre költségnövekedéshez vezet. Ha például városhoz tartozó ill vidéki lakosságés a társadalmi-gazdasági státusz is releváns lesz a vizsgálat szempontjából, előfordulhat, hogy a kérdezőnek olyan gólyát kell keresnie, aki városi és felső- vagy középosztálybeli. Ön egyetért abban, hogy sokkal könnyebb találni egy férfi gólyát.

Másodszor, nagyon nehéz biztosítani, hogy egy adott minta valóban reprezentatív legyen. Természetesen lehetőség van a minta ellenőrzésére, hogy a kontrollban nem szereplő jellemzők eloszlása megegyezzen a sokaságban való megoszlásukkal. Egy ilyen ellenőrzés azonban csak negatív következtetésekhez vezethet. Az egyetlen dolog, amit azonosítani lehet, az az eloszlások eltérése. Ha a minta és a sokaság eloszlása e jellemzők mindegyikére ismétlődik, akkor fennáll annak a lehetősége, hogy a minta más, nem kifejezetten meghatározott módon tér el a sokaságtól.

És végül, harmadszor. Az interjúztatók, ha magukra hagyják, hajlamosak bizonyos cselekvésekre. Túl gyakran folyamodnak interjúkhoz a barátaikkal. Mivel gyakran magukhoz a kérdezőbiztosokhoz hasonlítanak, fennáll a tévedés veszélye. Angliából származó bizonyítékok arra utalnak, hogy a kvótaminták általában:

a leginkább hozzáférhető elemek szerepének eltúlzása;
a kiscsaládok szerepének lekicsinyítése;
a gyermekes családok szerepének eltúlzása;
az ipari termelésben részt vevő munkavállalók szerepének lekicsinyítése;
a legmagasabb és legalacsonyabb jövedelműek szerepének lekicsinyítése;
a rosszul képzett állampolgárok szerepének lekicsinyítése;
az alacsony társadalmi pozíciót betöltő személyek szerepének lekicsinyítése.

Azok az interjúztatók, akik véletlenszerű járókelők megállításával választanak ki kvótákat, valószínűleg olyan területekre összpontosítják figyelmüket, ahol sok potenciális válaszadó van, mint pl. pláza, vasútállomások és repülőterek, nagy szupermarketek bejáratai és hasonlók. Ez a gyakorlat az ilyen helyekre leggyakrabban látogató embercsoportok felülreprezentáltságához vezet. Ha otthonlátogatásra van szükség, a kérdezőbiztosokat gyakran a kényelem motiválja.
Például előfordulhat, hogy csak napközben végeznek felméréseket, ami a munkavállalók véleményének alulbecsléséhez vezet. Többek között nem lépnek be romos épületekbe, és általában nem másznak fel olyan épületek felső emeletére, ahol nincs lift.

A vizsgált probléma sajátosságaitól függően ezek a tendenciák különféle hibákhoz vezethetnek, de az adatelemzés szakaszában kijavítani őket nagyon-nagyon nehéznek tűnik. Másrészt a mintaelemek objektív kiválasztásával a kutatók rendelkezésére állnak bizonyos eszközök, amelyek lehetővé teszik az adott minta reprezentativitásának értékelési eljárásának egyszerűsítését. Az ilyen minták reprezentativitásának problémájának elemzésekor a kutató nem annyira a minta összetételét, mint inkább elemeinek kiválasztásának eljárását veszi figyelembe.

Kutatási ablak: Zseniális! De ki fogja ezt elolvasni?

A hirdetők minden évben dollármilliókat költenek számtalan kiadványban megjelenő hirdetésekre, az Advertising Age-től a Yankee-ig. A szöveg és a kép bizonyos értékelése elvégezhető a közzététel előtt, mint mondják, otthon, egy reklámügynökségben; valódi ellenőrzése és értékelése csak a hirdetés megjelenése után következik be, körülötte tucatnyi, egyformán gondosan előkészített, az olvasó figyelméért versengő hirdetés.

Vállalat Roper keményítő világszerte fogyasztói, üzleti, kereskedelmi és szakmai magazinokban, újságokban elhelyezett hirdetések olvashatóságának felmérésével foglalkozik. A kutatás eredményeit a hirdetők és ügynökségek tudomására hozzuk – természetesen megfelelő díj ellenében. Mert a hirdetők minden nap mindent megtesznek annak érdekében, hogy hirdetéseiket a fogyasztókhoz, a céghez eljuttassák Keményítőúgy döntött, hogy összeállít egy mintát, amely időszerű és pontos tájékoztatást nyújt az előfizetőknek a reklámozás hatékonyságáról. Minden évben a cég Keményítő több mint 50 000 embert kérdeztek meg, mintegy 20 000 hirdetést megtekintve. Évente mintegy 500 egyéni publikációt tanulmányoztak.

A Starch arányos mintavételt alkalmazott, az egyik nemből 100, a másik nemből 100 olvasóból álló minimális mintaszámmal. Starch arra a következtetésre jutott, hogy ezzel a mintamérettel az olvashatósági szintek jelentős eltérései stabilizálódtak. A 18 éven felüli olvasókat személyesen kérdeztük meg, amelybe minden publikáció kiterjedt, kivéve a lakosság speciális csoportjainak szánt kiadványokat (például a Tizenhét folyóirat publikációinak értékelésére az azonos korú lányokat kérdezték meg).

A felmérések során figyelembe vették az adott kiadvány terjesztési zónáját. Tegyük fel, hogy egy Los Angeles-i magazin tanulmánya Dél-Kaliforniában élő olvasókat vizsgált. Az időt országosan tanulmányozták. A felmérést a magazin egyes számainak szentelték, és egyszerre 20-30 városban végezték el.

Minden kérdezőhöz hozzárendeltek egy kis interjúkvótát, ami a felmérés torzításának minimalizálását szolgálta. A kérdőíveket különböző foglalkozású és életkorú, eltérő jövedelmű emberek között osztották ki. Mindegyik ilyen tanulmány lehetőséget adott arra, hogy álláspontokat elég széles olvasóközönség elé tárjanak. Számos szakmai, üzleti és iparági kiadvány mérlegelésekor figyelembe vették azok előfizetésének és terjesztésének sajátosságait is. A meglehetősen szűk elterjedésű publikációk előfizetési listái lehetővé tették az elfogadható válaszadók kiválasztását.

Minden felmérésben a kérdezőbiztosok arra kérték a válaszadókat, hogy nézzék át a kiadványt, és megkérdezték, hogy észleltek-e hirdetéseket. Ha a válasz igenlő volt, az anyakönyvvezető kérdések egész sorát tette fel, hogy felmérje, milyen mértékben észlelték a hirdetést.

Ez az értékelés háromféle lehet:

Figyelem: azok, akik már figyeltek egy ilyen bejelentés megjelenésének tényére.
Ismerős: azok, akik emlékeztek a hirdetés bármely részére, amely a hirdetettekkel foglalkozott védjegy vagy a hirdetőről.
Olvasás: azok, akik elolvassák a hirdetés legalább felét.

Az összes hirdetés megvizsgálása után a kérdezőbiztosok rögzítették az alapvető besorolási információkat: nem, életkor, foglalkozás, Családi állapot, nemzetiség, jövedelem, családnagyság és összetétel, ami lehetővé tette az olvasói érdeklődés mértékének kereszttáblázatát.

Megfelelő használat esetén a vállalati adatok Keményítő lehetővé teszi a hirdetők és ügynökségek számára, hogy azonosítsák a sikertelen és sikeres hirdetési sémákat, amelyek vonzzák és lekötik az olvasó figyelmét. Az ilyen jellegű információk rendkívül értékesek azoknak a hirdetőknek, akiket elsősorban reklámkampányuk hatékonysága érdekel.

Forrás: Roper Starch Worldwide, Mamaronek, NY 10543.

Valószínűségi minták

A kutató meg tudja határozni egy populáció bármely elemének valószínűségi mintába való bekerülésének valószínűségét, mert elemeinek kiválasztása valamilyen objektív folyamat alapján történik, és nem függ a kutató vagy a terepmunkás szeszélyeitől és preferenciáitól. Mivel az elemek kiválasztásának eljárása objektív, a kutató fel tudja mérni a kapott eredmények megbízhatóságát, ami determinisztikus minták esetében lehetetlen volt, bármennyire is gondos volt az utóbbiak elemeinek kiválasztása.

Nem szabad azt gondolni, hogy a valószínűségi minták mindig reprezentatívabbak, mint a determinisztikusak. Valójában egy determinisztikus minta reprezentatívabb lehet. A valószínűségi minták előnye, hogy lehetővé teszik a lehetséges mintavételi hiba becslését. Ha egy kutató determinisztikus mintával dolgozik, akkor nincs objektív módszere annak értékelésére, hogy az megfelel-e a vizsgálat céljainak.

Egyszerű véletlenszerű mintavétel

A legtöbb ember találkozott ilyen vagy olyan módon egyszerű véletlenszerű mintavétellel, akár a főiskolai statisztikai kurzus részeként, akár az újságokban vagy magazinokban olvasott releváns tanulmányok eredményeiről. Az egyszerű véletlenszerű mintavétel során a mintában szereplő minden elemnek azonos meghatározott valószínűsége van a mintába kerülni, és az eredeti sokaság elemeinek bármely kombinációja potenciálisan mintává válhat. Például, ha egy adott főiskolára beiratkozott hallgatókból egy egyszerű véletlenszerű mintát akarunk húzni, akkor csak listát kell készítenünk az összes hallgatóról, számot kell rendelnünk minden névhez, és számítógép segítségével véletlenszerűen kiválasztanunk egy adott számú tétel.

Népesség

Népesség
Olyan elemek halmaza, amelyek megfelelnek bizonyos meghatározott feltételeknek; tanulmányi (cél)populációnak is nevezik.
Paraméter
Egy általános vagy tanulmányi sokaság sajátos jellemzője vagy mutatója.

Az általános, vagy vizsgált populáció az a sokaság, amelyből a kiválasztás történik. Ez a halmaz (populáció) számos specifikus paraméterrel írható le, amelyek az általános sokaság jellemzői, amelyek mindegyike egy bizonyos mennyiségi mutatót képvisel, amely megkülönbözteti az egyik populációt a másiktól.

Képzelje el, hogy a vizsgált populáció Cincinnati teljes felnőtt lakossága. Számos paraméter használható ennek a populációnak a leírására: átlagéletkor, a népesség aránya felsőoktatás, jövedelmi szint stb. Felhívjuk figyelmét, hogy ezeknek a mutatóknak van egy bizonyos fix értéke. Természetesen ezeket a vizsgált népesség teljes népszámlálásával is kiszámíthatjuk. Általában nem minősítésekre támaszkodunk, hanem a mintára választjuk ki, és a mintamegfigyelés során kapott értékeket használjuk fel a sokaság szükséges paramétereinek meghatározásához.

Szemléltessük az 1. táblázatban elmondottakat. A 15.1 egy 20 főből álló hipotetikus sokaság példája. Az ilyen kis hipotetikus populációval való munka számos előnnyel jár. Először is, a kis mintaméret lehetővé teszi a leírására használható populációs paraméterek egyszerű kiszámítását. Másodszor, ez a hatókör betekintést nyújt abba, hogy mi történhet egy adott mintavételi terv elfogadása esetén. Mindkét funkció megkönnyíti a mintaeredmények összehasonlítását az „igazival”, és ebben az esetben is ismert érték aggregátum, ami nem így van abban a tipikus helyzetben, amikor az aggregátum tényleges értéke ismeretlen. A becslés összehasonlítása a „valós” értékkel különösen ebben az esetben válik egyértelművé.

Tegyük fel, hogy két véletlenszerűen kiválasztott elem alapján meg akarjuk becsülni az egyének átlagos jövedelmét az eredeti sokaságban. Az átlagos jövedelem lesz a paramétere. Ennek az átlagos értéknek a becsléséhez, amelyet μ-ként jelölünk, el kell osztanunk az összes érték összegét a számukkal:

Népességi átlag μ = Népességelemek összege / Elemek száma.

Esetünkben a számítások a következőket adják:

Származtatott készlet

Származtatott készlet minden lehetséges mintából áll, amely adott mintavételi terv (mintavételi terv) szerint az általános sokaságból kiválasztható. Statisztika egy minta jellemzője vagy mutatója. A mintastatisztika értéke egy adott populációs paraméter becslésére szolgál. A különböző minták eltérő statisztikákat vagy becsléseket készítenek ugyanarról a sokaságparaméterről.

Származtatott készlet
A sokaságból egy adott mintavételi terv szerint kiválasztható összes lehetséges megkülönböztethető minta összessége. Statisztika Egy minta jellemzője vagy mutatója.

Tekintsük az összes lehetséges minta származtatott populációját, amelyet a 20 egyedből álló hipotetikus populációnkból kiválaszthatunk egy mintavételi terv szerint, amely feltételezi a minta méretét. n=2 véletlenszerű, nem ismétlődő kiválasztással kaphatjuk meg.

Pillanatnyilag tegyük fel, hogy a népesség egyes egységeire vonatkozó adatokat - esetünkben az egyén nevét és jövedelmét - bögrékre rögzítik, majd egy kancsóba ejtik és összekeverik. A kutató eltávolít egy kört a kancsóból, leírja az információkat és félreteszi. Ugyanezt teszi a kancsóból eltávolított második körrel is. Ezután a kutató mindkét bögrét visszateszi a kancsóba, összekeveri a tartalmát, és megismétli ugyanazt a műveletsort. táblázatban A 15.2. ábra mutatja ennek az eljárásnak a lehetséges kimenetelét. 20 körhöz 190 ilyen páros kombináció lehetséges.

Mindegyik kombinációra kiszámítható az átlagos jövedelem. Mondjuk mintaként AB (k = 1)

k-e minta átlag = Mintaelemek összege / Mintaelemek száma =

ábrán. A 15.4 a teljes sokaságra vonatkozó átlagjövedelem becslését és a hiba nagyságát mutatja az egyes becsléseknél a mintákra k = 25, 62,108,147És 189 .

Mielőtt belekezdenénk a minta átlagjövedelme (statisztika) és a sokaság átlagjövedelme (becslést igénylő paraméter) közötti kapcsolat vizsgálatába, ejtsünk néhány szót a származtatott sokaságról. Először is, a gyakorlatban nem készítünk ilyen aggregátumokat. Ez túl sok időt és erőfeszítést igényelne. A szakember csak egy, a szükséges méretű mintát állíthat össze. A kutató használja koncepció származtatott sokaság és a hozzá tartozó mintavételi eloszlás fogalma a végső következtetések megfogalmazásakor.

Az alábbiakban bemutatjuk, hogyan. Másodszor, nem szabad elfelejteni, hogy a származtatott sokaság az összes lehetséges különböző minta összessége, amely egy adott mintavételi terv szerint kiválasztható a sokaságból. Ha a mintavételi terv bármely része megváltozik, a származtatott sokaság is megváltozik. Így, ha a körök kiválasztásakor a kutató az eltávolított korongok közül az elsőt visszaküldi a kancsóba, mielőtt a másodikat eltávolítaná, a származtatott készlet tartalmazni fogja.

AA, BB stb. minták. Ha a nem ismétlődő minták térfogata 3, és nem 2, akkor ABC típusú minták jelennek meg, és 1140 lesz belőlük, nem pedig 190, ahogy az a előző eset. Amikor az egyszerű véletlenszerű mintavételről a mintaelemek kiválasztásának bármely más módszerére váltunk, a származtatott sokaság is megváltozik.

Emlékeztetni kell arra is, hogy egy adott méretű minta kiválasztása egy általános sokaságból egyenértékű egy elem (190-ből 1) kiválasztásával a származtatott sokaságból. Ez a tény lehetővé teszi számunkra, hogy számos statisztikai következtetést vonjunk le.

A minta átlaga és a populáció átlaga

Van-e jogunk egyenlőségjelet tenni a minta átlagát a valódi sokasági átlaghoz? Mindenesetre feltételezzük, hogy összefüggenek egymással. Ugyanakkor azt is hisszük, hogy hiba fog bekövetkezni. Feltételezhető például, hogy az internetezőktől kapott információk jelentősen eltérnek a „rendes” lakosság körében végzett felmérés eredményeitől. Más esetekben meglehetősen szoros egyezést feltételezhetünk, különben nem tudnánk a mintaértéket felhasználni az általános érték becslésére. De mekkora hibát követhetünk el ebben?

Adjuk össze a táblázatban található összes mintaátlagot. 15.2, és a kapott mennyiséget elosztjuk a minták számával, azaz átlagoljuk az átlagokat.
A következő eredményt kapjuk:

Egybeesik a népesség átlagával. Azt mondják, hogy ebben az esetben van dolgunk elfogulatlan statisztika.

Egy statisztikát torzítatlannak mondunk, ha az összes lehetséges minta átlaga megegyezik a becsült populációs paraméterrel. Kérjük, vegye figyelembe, hogy itt nem valami konkrét jelentésről beszélünk. A részleges becslés meglehetősen távol lehet a valódi értéktől – vegyük például az AB vagy ST mintákat. Egyes esetekben előfordulhat, hogy a valódi sokaságérték nem érhető el bármely lehetséges minta figyelembevételével, még akkor sem, ha a statisztikák elfogulatlanok. A mi esetünkben ez nem így van: a lehetséges minták egész sora - például AT - a valódi sokaságátlaggal megegyező mintaátlagot ad.

Érdemes megvizsgálni e mintabecslések eloszlását, és különösen a becslések e szóródása és a népesség jövedelmi szintjének változása közötti kapcsolatot. A sokaság varianciáját használjuk a variáció mértékeként. A sokaság szórásának meghatározásához ki kell számítanunk az egyes értékek eltérését az átlagtól, össze kell adni az összes eltérés négyzetét, és a kapott összeget el kell osztani a tagok számával. Jelöljük a népesség szórását a^-vel. Akkor:

Populációs variancia σ 2 = Az egyes elemek négyzetes különbségeinek összege
népesség és népesség átlag / Népességelemek száma =

Diszperzió átlagos érték jövedelmi szintje ugyanúgy meghatározható. Vagyis úgy találhatjuk meg, hogy meghatározzuk az egyes átlagok eltéréseit az összátlaguktól, összeadjuk az eltérések négyzetét, és a kapott összeget elosztjuk a tagok számával.

Az átlagos jövedelmi szint szórását más módon is meghatározhatjuk, a lakossági jövedelmi szintek szórásával, hiszen e két érték között közvetlen kapcsolat van. Pontosabban azokban az esetekben, amikor a minta a sokaságnak csak egy kis részét képviseli, a mintaátlag szórása megegyezik a sokaság szórásával osztva a minta méretével:

ahol σ x 2 a jövedelemszint átlagos mintaértékének szóródása, σ 2 a jövedelemszint szórása az általános sokaságban, n- minta nagysága.

Hasonlítsuk össze most az eredmények eloszlását egy mennyiségi jellemző megoszlásával a teljes sokaságban. A 15.5. ábra szemlélteti, hogy az A panelen látható mennyiségi tulajdonság populációs eloszlása többcsúcsos (a 20 érték mindegyike csak egyszer jelenik meg), és szimmetrikus a 9400-as valódi populációs átlaggal.

Mintaelosztás
Egy adott statisztika értékeinek eloszlása az adott mintavételi terv alapján a sokaságból kiválasztható összes lehetséges megkülönböztethető mintára.

A B rovatban látható pontszámok megoszlása az 1. táblázat adatain alapul. 15.3, amelyet viszont a táblázatból való értékek hozzárendelésével állítottak össze. 15.2. méretétől függően egyik vagy másik csoportba, majd megszámlálják a létszámukat a csoportban. A B mező egy hagyományos hisztogram, amelyet a statisztikai kurzus legelején tekintünk, és amely reprezentálja mintavételi eloszlás statisztika. Közben jegyezzük meg a következőket: a mintavételi eloszlás fogalma a statisztika legfontosabb fogalma, a statisztikai következtetések levonásának sarokköve. A vizsgált statisztika ismert mintavételi megoszlása alapján következtetést vonhatunk le a sokaság megfelelő paraméterére. Ha csak azt tudjuk, hogy a mintabecslés mintánként változik, de ennek a változásnak a természete nem ismert, lehetetlenné válik a becsléshez kapcsolódó mintavételi hiba meghatározása. Mivel egy becslés mintavételezési eloszlása leírja annak mintánkénti változását, alapot ad a mintabecslés érvényességének meghatározásához. Ez az oka annak, hogy a valószínűségi mintavétel tervezése olyan fontos a statisztikai következtetésekhez.

A sokaság egyes elemeinek mintájába való bekerülés ismert valószínűségeiből a kérdezőbiztosok megtalálhatják a különböző statisztikák mintavételi eloszlását. A kutatók ezekre az eloszlásokra támaszkodnak – legyen szó a minta átlagáról, a minta arányáról, a minta varianciájáról vagy más statisztikáról –, amikor a minta megfigyelésének eredményét kiterjesztik a sokaságra. Vegye figyelembe azt is, hogy a 2-es méretű minták esetében a mintaátlagok eloszlása egycsúcsos és szimmetrikus a valódi átlagra.

Tehát megmutattuk, hogy:

Az összes lehetséges mintaátlag átlaga megegyezik az általános átlaggal.
A mintaelemek diszperziója bizonyos módon összefügg az általános diszperzióval.
A mintaátlagok eloszlása egycsúcsos, míg egy mennyiségi jellemző értékeinek eloszlása az általános sokaságban többcsúcsos.

Központi határérték tétel

Egy tétel, amely kimondja, hogy egyszerű véletlenszerű térfogatminták esetén n, izolált az általános populációtól általános μ átlaggal és σ 2 szórással, nagy n a mintaátlag x eloszlása megközelíti a normálist μ-vel egyenlő középponttal és σ 2 szórással. Ennek a közelítésnek a pontossága a növekedéssel növekszik n.

Központi határérték tétel. A becslések egycsúcsos eloszlása a központi határeloszlás megnyilvánulásának tekinthető, amely kimondja, hogy egyszerű véletlenszerű térfogatminták esetén n, izolált az általános populációtól valós átlag μ és variancia σ 2, nagy n a mintaátlagok eloszlása megközelíti a normálisat, középpontja megegyezik a valódi átlaggal, és szórása megegyezik a populáció variancia és a mintanagyság arányával, azaz:

Ez a közelítés egyre pontosabbá válik, ahogy növekedünk n. Emlékezz erre. A populáció típusától függetlenül a mintaátlagok eloszlása normális lesz a kellően nagy méretű minták esetében. Mit kell érteni kellően nagy kötet alatt? Ha az általános sokaság valamely mennyiségi jellemzőjének értékeinek eloszlása normális, akkor a minta eloszlása a méretű mintákra vonatkozik. n=1. Ha egy változó (mennyiségi jellemző) eloszlása a sokaságban szimmetrikus, de nem normális, nagyon kis minták a mintaátlagok normális eloszlását eredményezik. Ha az általános sokaság valamely mennyiségi jellemzőjének eloszlásában kifejezett aszimmetria van, akkor nagyobb mintákra van szükség. Márpedig a mintaátlag eloszlása csak akkor fogadható el normálisnak, ha megfelelő méretű mintáról van szó.

A normálgörbe segítségével következtetések levonásához egyáltalán nem szükséges az általános populáció mennyiségi jellemzőinek értékeinek normális eloszlásának feltételéből kiindulni. Inkább a centrális határeloszlás tételére hagyatkozunk, és a sokaságeloszlástól függően meghatározunk egy olyan mintanagyságot, amely lehetővé tenné, hogy normális görbével dolgozzunk. Szerencsére a statisztika normális eloszlását viszonylag kis minták biztosítják - ábra. A 15.6 egyértelműen bizonyítja ezt a körülményt. Konfidencia intervallum becslések. A fentiek segíthetnek abban, hogy bizonyos következtetéseket vonjunk le az általános átlagról? A gyakorlatban ugyanis csak egy, és nem minden lehetséges mintát választunk ki egy adott méretű mintából, és a kapott adatok alapján bizonyos következtetéseket vonunk le a célcsoportra vonatkozóan.

Hogyan történik ez? Mint ismeretes, normál eloszlás esetén az összes megfigyelés bizonyos százalékának van bizonyos szórása; Tegyük fel, hogy a megfigyelések 95%-a az átlag ±1,96 szórása közé esik. Ebben az értelemben nem kivétel a mintaátlagok normál eloszlása, amelyre a centrális határeloszlástétel alkalmazható. Egy ilyen mintaeloszlás átlaga megegyezik a μ általános átlaggal, és szórását az átlag standard hibájának nevezzük:

Kiderült, hogy:

a mintaátlagok 68,26%-a legfeljebb ± σ x-el tér el az általános átlagtól;
A mintaátlagok 95,45%-a legfeljebb ±σ x-el tér el az általános átlagtól;
a mintaátlagok 99,73%-a legfeljebb ± σ x-el tér el az általános átlagtól,

azaz a minta egy bizonyos hányada a kiválasztott értéktől függően azt jelenti zérték által meghatározott intervallumban fog szerepelni z. Ez a kifejezés egyenlőtlenségként átírható:

Általános átlag - z < Среднее по выборке < Генеральное среднее + z(Az átlag négyzetes hibája)

Így a mintaátlag bizonyos valószínűséggel abban az intervallumban van, amelynek határai az eloszlás átlagértékének és bizonyos számú szórásának összege és különbsége. Ez az egyenlőtlenség átalakítható:

Mintaátlag - z(Az átlag négyzetes hibája)< Генеральное среднее < Среднее по выборке + z(Az átlag négyzetes hibája)

Ha például az esetek 95%-ában a 15,1 arányt figyeljük meg ( z= 1,96), akkor az esetek 95%-ában 15,2-es arány figyelhető meg. Azokban az esetekben, amikor a következtetés egyetlen mintaátlagon alapul, a 15.2 kifejezést használjuk.

Fontos megjegyezni, hogy a 15.2 nem jelenti azt, hogy az adott mintának megfelelő intervallumnak feltétlenül tartalmaznia kell az általános átlagot. Az intervallum inkább a kiválasztási eljáráshoz kapcsolódik. Az adott átlag köré szerkesztett intervallum tartalmazhatja vagy nem tartalmazza a valódi populációs átlagot. A levont következtetések helyességébe vetett bizalmunk azon alapul, hogy a választott mintavételi terv szerint megszerkesztett intervallumok 95%-a tartalmazza a valódi átlagot. Úgy gondoljuk, hogy a mintánk ebbe a 95%-ba esik.

Ennek a fontos pontnak a szemléltetésére képzeljük el egy pillanatra, hogy a minta eloszlása a méretű mintákra vonatkozik n= 2 hipotetikus példánkban normális. A 15.4. táblázat egyértelműen szemlélteti az adott terv alapján kiválasztható lehetséges 190 minta közül az első 10 eredményét. Vegye figyelembe, hogy a 10 intervallum közül csak 7 tartalmaz nagy vagy valódi átlagot. A következtetés helyességébe vetett bizalom nem valamilyen konkrét értékelésnek köszönhető, hanem pontosan eljárástértékelések. Ez az eljárás olyan, hogy 100 minta esetében, amelyekre a minta átlagát és a konfidencia intervallumot számítjuk, 95 esetben ez az intervallum tartalmazza a valódi általános értéket. Egy adott minta pontosságát a minta kiválasztásának eljárása határozza meg. A reprezentatív mintavételi terv nem garantálja, hogy minden minta reprezentatív. A statisztikai következtetési eljárások a mintavételi terv reprezentativitásán alapulnak, ezért ez az eljárás olyan kritikus a valószínűségi minták esetében.

A valószínűségi minták lehetővé teszik, hogy az eredmények pontosságát a becslések valódi értékhez való közelségeként értékeljük. Minél nagyobb a statisztika átlagos négyzetes hibája, annál nagyobb a becslések szórása, és annál kisebb az eljárás pontossága.

Egyeseket megzavarhat az a tény, hogy a konfidenciaszint az eljárásra vonatkozik, és nem az adott minta értékére, de nem szabad elfelejteni, hogy az általános érték becsléséhez szükséges konfidenciaszint nagyságát a kutató módosíthatja. Ha nem akar kockáztatni, és attól tart, hogy az öt kiválasztott mintaintervallum egyikével találkozhat, amely nem tartalmazza a sokaság átlagát, választhat egy 99%-os konfidencia intervallumot, amelyben száz mintaintervallumból csak egy nem tartalmazza a népesség átlagát. Továbbá, ha növelheti a minta méretét, növeli az eredmény megbízhatósági szintjét, biztosítva a kívánt pontosságot a sokaság értékének becslésében. Erről részletesebben a fejezetben fogunk beszélni. 17.

Az általunk ismertetett eljárásnak van még egy olyan összetevője, amely némi zavart okozhat. A konfidenciaintervallum becslésénél három mennyiséget használunk: x, zés σx. A minta átlagát x a mintaadatokból számítjuk ki, z a kívánt megbízhatósági szint alapján kerül kiválasztásra. De mi a helyzet az átlagos σ x négyzetes középhibájával? Ez egyenlő:

és ezért ennek meghatározásához meg kell határoznunk az általános sokaság mennyiségi jellemzőjének szórását, azaz 5. Mi a teendő olyan esetekben, amikor a szórás s ismeretlen? Ez a probléma két okból nem merül fel. Először is, általában a legtöbb marketingkutatásban használt kvantitatív attribútum esetében a variáció sokkal lassabban változik, mint a legtöbb, a marketinges számára érdekes változó szintje. Ennek megfelelően a vizsgálat megismétlése esetén az előző, korábban kapott s értékét használhatjuk a számításokban. Másodszor, a minta kiválasztása és az adatok beszerzése után a minta varianciájának meghatározásával megbecsülhetjük a sokaság szórását. Egy torzítatlan minta varianciáját a következőképpen határozzuk meg:

Minta variancia ŝ 2 = A minta átlagától való eltérések négyzetes összege / (Mintaelemek száma -1). A minta szórásának meghatározásához először meg kell találnunk a minta átlagát. Ezután megtaláljuk az egyes mintaértékek és a minta átlaga közötti különbségeket; ezeket a különbségeket négyzetre emeljük, összeadjuk és elosztjuk a minta megfigyelések számával mínusz egy számmal. A minta variancia nem csak az általános variancia becslését adja, hanem az átlag négyzetes hibájának becslésére is használható. Ha ismert a σ 2 általános variancia, akkor a σ x négyzetes közép hiba is ismert, mivel:

Ha az általános variancia ismeretlen, az átlag négyzetes középhibája csak becsülhető. Ez a becslés adott ŝ x, ami egyenlő a minta szórásával osztva a minta méretének négyzetgyökével, azaz. A becslés meghatározása ugyanúgy történik, mint a valódi érték becslése, de az általános szórás helyett a minta szórása kerül be a számítási képletbe. Tehát mondjuk az 5800-as mintaátlagú AB mintához:

Ennek megfelelően ŝ = 283, és

és a 95%-os intervallum most van

ami kisebb az előző értéknél.

táblázatban A 15.5 összefoglalja az ebben a fejezetben tárgyalt különféle átlagok és eltérések számítási képleteit. Egyszerű véletlen minta kialakítása. Példánkban a mintaelemek kiválasztása egy kancsó segítségével történt, amely az eredeti sokaság összes elemét tartalmazta. Ez lehetővé tette számunkra a származtatott sokaság és a mintavételi eloszlás fogalmának megjelenítését. A gyakorlatban nem javasoljuk ilyen módszer alkalmazását, mivel ez növeli a hiba valószínűségét. A bögrék méretükben és szerkezetükben is eltérőek lehetnek, ami bizonyos esetekben az egyik előnyben részesítéséhez vezethet a másikkal szemben. A vietnami kampány résztvevőinek lottósorsolás útján történő kiválasztása példaként szolgálhat az ilyen típusú hibákra.

A szelekciót születési dátummal ellátott korongok kihúzásával végezték egy nagy dobból. A televízió az egész országban sugározta ezt az eljárást. Sajnos a lemezek szisztematikusan kerültek a dobba: a januári dátumok voltak az elsők, a decemberi dátumok az utolsók. Bár a dob intenzív pörgetésnek volt kitéve, a decemberi dátumok sokkal gyakrabban estek, mint a januáriak. Ezt követően ezt az eljárást úgy módosították, hogy az ilyen szisztematikus hibák valószínűsége jelentősen csökkent. Az egyszerű véletlen minta készítésének előnyben részesített módszere a véletlenszámok táblázatának használatán alapul.

Egy ilyen táblázat használata a következő lépésekből áll. Először is, a sokaság elemeihez sorszámokat kell rendelni 1-től N; hipotetikus összességünkben az elem A 1. számú elemet kap B- 2-es szám stb. Másodszor, a véletlenszám-táblázatban lévő számjegyek számának meg kell egyeznie a számmal N. Mert N= 20 kétjegyű szám kerül felhasználásra; Mert N 100 és 999 között háromjegyű számok, stb. Harmadszor, a kiindulási helyzetet véletlenszerűen kell meghatározni. Megnyithatjuk a véletlen számok megfelelő táblázatát, és behunyva a szemünket, ahogy mondani szokás, ujjunkkal mutogathatunk rá. Mivel a véletlenszámtáblázatban a számok véletlenszerű sorrendben vannak, a kiindulási helyzet nem igazán számít.

Végül pedig tetszőleges irányban mozoghatunk - felfelé, lefelé vagy keresztbe, kiválasztva azokat az elemeket, amelyek száma a táblázat véletlen számainak felel meg. Az elmondottak illusztrálására vegyünk egy rövidített véletlenszám-táblázatot (15.6. táblázat). Mert a N= 20, akkor csak kétjegyű számokkal dolgozzunk. Ebben az értelemben táblázat. A 15,6 tökéletesen megfelel nekünk. Döntsük el előre, hogy lejjebb lépünk az oszlopban, de a kiindulási helyzet a tizenegyedik sor és a negyedik oszlop metszéspontjában van, ahol a 77-es szám található.Ez a szám túl nagy, ezért el kell vetni. A következő két szám szintén el lesz vetve, de a negyedik 02 érték kerül felhasználásra, mivel a 2 az elemszámnak felel meg BAN BEN.

A következő öt szám szintén túl nagyként kerül eldobásra, míg a 05 szám jelzi az elemet E. Tehát az elemek BAN BENÉs E lesz a kételemes mintánk, amely alapján ennek a sokaságnak a jövedelmi szintjét fogjuk megítélni. Alternatív stratégia is lehetséges, amelyben véletlen számokat generáló számítógépes program lesz a kiválasztás alapja. Megjelent Utóbbi időben A publikációk azt mutatják, hogy az ilyen programok által generált számok nem teljesen véletlenszerűek, amelyek bizonyos módon megnyilvánulhatnak összetett matematikai modellek felépítésénél, de a legtöbb alkalmazott marketingkutatáshoz felhasználhatók. Jegyezzük meg ismét, hogy egy egyszerű véletlenszerű mintához a sokaság elemeinek sorszámozott listáját kell összeállítani.

Más szóval, az eredeti populáció minden tagját azonosítani kell. Egyes populációk számára ez nem nehéz megtenni, például az 500 legnagyobb amerikai vállalat tanulmányozása során, amelyek listája a Fortune magazinban található. Ezt a listát már összeállították, így ebben az esetben nem lesz nehéz egy egyszerű véletlenszerű mintát képezni. Más kezdeti populációk (például egy bizonyos városban élő családok) számára rendkívül nehéz egy általános lista összeállítása, ami arra kényszeríti a kutatókat, hogy más mintavételi sémákhoz folyamodjanak.

Összegzés

1. tanulási cél
Világosan meg kell különböztetni a népszámlálás (minősítés) és a mintavétel fogalmát

Egy teljes népszámlálást nevezünk képesítés. Minta válogatott elemekből kialakított gyűjtemény.

2. tanulási cél
Ismerje meg a kutatók által végrehajtott hat szakasz lényegét és sorrendjét a mintapopuláció megszerzéséhez

A mintavételi folyamat hat szakaszra oszlik:

népesség-hozzárendelés;
a mintavételi keret meghatározása;
kiválasztási eljárás kiválasztása;
a minta méretének meghatározása;
mintaelemek kiválasztása;
kiválasztott elemek vizsgálata.

3. tanulási cél
Határozza meg a „mintavételi keret” fogalmát

A mintavételi keret azoknak az elemeknek a listája, amelyekből a minta készül.

4. tanulási cél
Magyarázza meg a valószínűségi és a determinisztikus mintavétel közötti különbséget!

Valószínűségi mintában a sokaság minden tagja egy bizonyossal szerepelhet nem nulla adott valószínűség. A sokaság egyes tagjainak a mintába való felvételének valószínűsége eltérhet egymástól, de az egyes elemek bekerülésének valószínűsége ismert. Determinisztikus minták esetén lehetetlenné válik bármely elem mintába való felvételének valószínűsége. Egy ilyen minta reprezentativitása nem garantálható. Minden determinisztikus mintavétel inkább személyes véleményen, ítéleten vagy preferencián alapul. Az ilyen preferenciák néha jó becsléseket adhatnak a populáció jellemzőiről, de nincs mód objektív módon meghatározni, hogy egy minta megfelelő-e az adott feladathoz.

5. tanulási cél
Különbséget kell tenni a rögzített méretű mintavétel és a többlépcsős (szekvenciális) mintavétel között

Fix méretű mintákkal végzett munka esetén a minta nagyságának meghatározása a felmérés megkezdése előtt történik, és az eredmények elemzését az összes szükséges adat összegyűjtése előzi meg. A szekvenciális mintavételnél a kiválasztott elemek száma előre nem ismert, ezt sorozatos döntések alapján határozzák meg.

6. tanulási cél
Magyarázza el, mi az a célzott mintavétel, és írja le annak erősségeit és gyengeségeit

A célzott mintában szereplő elemeket kézzel választják ki, és úgy mutatják be a kutatónak, hogy megfelelnek a felmérés célkitűzéseinek. Feltételezzük, hogy a kiválasztott elemek teljes képet tudnak adni a vizsgált sokaságról. Míg a kutató a probléma feltárásának, valamint a tervezett felmérés kilátásainak és lehetséges korlátainak meghatározásának kezdeti szakaszában van, a célzott mintavétel alkalmazása nagyon hatékony lehet. De semmi esetre sem szabad megfeledkeznünk egy ilyen típusú minta gyengeségeiről, hiszen azt leíró vagy ok-okozati vizsgálatokban is felhasználhatja a kutató, ami azonnal befolyásolja az eredmények minőségét.

7. tanulási cél
Határozza meg a kvóta-mintavétel fogalmát!

Az arányos mintát úgy választják ki, hogy a mintában azon elemek aránya, amelyek bizonyos jellemzőkkel rendelkeznek, megközelítőleg megfeleljenek ugyanazon elemek arányának a vizsgált sokaságban; Ehhez minden számláló kap egy kvótát, amely meghatározza a lakosság jellemzőit, amellyel kapcsolatba kell lépnie.

8. tanulási cél
Magyarázza el, mi az a paraméter a mintavételi eljárásban

Paraméter - az általános vagy vizsgált populáció bizonyos jellemzője vagy mutatója; egy bizonyos mennyiségi mutató, amely megkülönbözteti az egyik populációt a másiktól.

9. tanulási cél
Magyarázza el, mi az a származtatott halmaz!

A származtatott sokaság az összes lehetséges mintából áll, amely adott mintavételi terv szerint kiválasztható a sokaságból.

10. tanulási cél
Magyarázza meg, hogy a mintavételezési eloszlás fogalma miért lényeges fogalom a statisztikában.

A statisztikai következtetések sarokköve a mintavételi eloszlás fogalma. A vizsgált statisztika ismert mintavételi megoszlása alapján következtetést vonhatunk le a sokaság megfelelő paraméterére. Ha csak azt tudjuk, hogy a mintabecslés mintánként változik, de ennek a változásnak a természete nem ismert, lehetetlenné válik a becsléshez kapcsolódó mintavételi hiba meghatározása. Mivel egy becslés mintavételezési eloszlása leírja annak mintánkénti változását, alapot ad a mintabecslés érvényességének meghatározásához.

Minta - esetek halmaza (alanyok, objektumok, események, minták), egy bizonyos eljárást alkalmazva, az általános populációból kiválasztva a vizsgálatban való részvételhez.

Minta nagysága

A mintanagyság a mintapopulációban szereplő esetek száma. Statisztikai okokból legalább 30-35 esetszám javasolt.

Függő és független minták

Két (vagy több) minta összehasonlításakor fontos paraméter a függőségük. Ha lehetséges minden esetben homomorf pár létesítése (vagyis amikor az X mintából egy eset felel meg egy esetnek és csak egy eset az Y mintából és fordítva) minden esetben két mintában (és ez a kapcsolat alapja fontos a a mintákban mért tulajdonság), az ilyen mintákat függőnek nevezzük. Példák függő mintákra:

ikerpárok,
bármely tulajdonság két mérése a kísérleti expozíció előtt és után,
férjek és feleségek
stb.

Ha nincs ilyen kapcsolat a minták között, akkor ezeket a mintákat függetlennek tekintjük, például:

férfi és nő,
pszichológusok és matematikusok.
Ennek megfelelően a függő minták mindig azonos méretűek, míg a független minták mérete eltérő lehet.

A minták összehasonlítása különböző statisztikai kritériumok alapján történik:

Student-féle t-próba
Wilcoxon T-teszt
Mann-Whitney U teszt
Jelzési kritérium
satöbbi.

Reprezentativitás

A minta tekinthető reprezentatívnak vagy nem reprezentatívnak.

Példa egy nem reprezentatív mintára

Az Egyesült Államokban a nem reprezentatív mintavétel egyik leghíresebb történelmi példája az 1936-os elnökválasztás során történt. A több korábbi választás eseményeit is sikeresen megjósoló Literary Digest tévedett jóslataiban, amikor tízmillió próbaszavazatot küldött ki előfizetőinek, országszerte a telefonkönyvekből kiválasztott személyeknek és az autók regisztrációs listáiról. A visszaküldött szavazatok 25%-ában (majdnem 2,5 millió) a szavazatok a következőképpen oszlottak meg:

57% Alf Landon republikánus jelöltet részesítette előnyben

40%-uk az akkori demokrata elnököt, Franklin Rooseveltet választotta

A tényleges választásokon, mint ismeretes, Roosevelt nyert, megszerezve a szavazatok több mint 60%-át. Az Irodalmi Digest hibája a következő volt: a minta reprezentativitását növelni akarták - mivel tudták, hogy előfizetőik többsége republikánusnak tartja magát - telefonkönyvekből és regisztrációs listákból kiválasztott emberekkel bővítették a mintát. Nem vették azonban figyelembe koruk realitását, sőt még több republikánust toboroztak: a nagy gazdasági világválság idején elsősorban a közép- és felső osztály képviselői engedhették meg maguknak, hogy telefont és autót birtokoljanak (vagyis a legtöbb republikánus). , nem demokraták).

A mintákból csoportok felépítésének tervtípusai

A csoportépítési terveknek több fő típusa van:

Különböző körülmények között elhelyezett kísérleti és kontrollcsoportokkal végzett vizsgálat.
Tanulmányozás kísérleti és kontrollcsoportokkal páronkénti szelekciós stratégia alkalmazásával
Egy tanulmány csak egy csoportot - egy kísérleti.
Vegyes (faktoriális) tervezést alkalmazó vizsgálat - minden csoport különböző körülmények közé kerül.

Csoportépítési stratégiák

A pszichológiai kísérletben részt vevő csoportok kiválasztása különböző stratégiák alkalmazásával történik, hogy biztosítsák a belső és külső érvényesség lehető legnagyobb tiszteletben tartását.

Randomizálás (véletlenszerű kiválasztás)
Igazi csoportok vonzása

Randomizálás

Randomizálás, vagy véletlenszerű kiválasztás, egyszerű véletlenszerű minták létrehozására szolgál. Egy ilyen minta használata azon a feltételezésen alapul, hogy a sokaság minden tagja azonos valószínűséggel kerül be a mintába. Például egy 100 hallgatóból álló véletlenszerű minta készítéséhez egy kalapba helyezhet egy papírdarabot az összes egyetemi hallgató nevével, majd kivesz belőle 100 darab papírt - ez véletlenszerű lesz (Goodwin J. , 147. o.).

Páronkénti kiválasztás

Páronkénti kiválasztás- mintavételi csoportok felépítésének stratégiája, amelyben az alanyok csoportjait a kísérlet szempontjából jelentős másodlagos paraméterek tekintetében egyenértékű alanyok alkotják. Ez a stratégia hatékony a kísérleti és kontrollcsoportokkal végzett kísérleteknél a legjobb lehetőség- vonzza

A statisztikákban két fő kutatási módszer létezik - a folyamatos és a szelektív. A mintavételezés során a következő követelmények betartása kötelező: a minta sokaságának reprezentativitása és megfelelő számú megfigyelési egység. A megfigyelési egységek kiválasztásánál lehetőség van Offset hibák, azaz olyan események, amelyek bekövetkezését nem lehet pontosan megjósolni. Ezek a hibák objektívek és természetesek. A mintavételi vizsgálat pontossági fokának meghatározásakor megbecsülik a mintavételi folyamat során előforduló hiba mértékét - Véletlenszerű reprezentativitási hiba (M) — Ez a tényleges különbség a mintavizsgálat során kapott átlagos vagy relatív értékek és az általános populáción végzett vizsgálat során kapott hasonló értékek között.

A kutatási eredmények megbízhatóságának értékelése magában foglalja a következők meghatározását:

1. reprezentativitási hibák

2. a populáció átlagos (vagy relatív) értékeinek megbízhatósági határai

3. az átlagos (vagy relatív) értékek közötti különbség megbízhatósága (t kritérium szerint)

Reprezentativitási hiba számítás(mm) számtani középérték (M):

ahol σ a szórás; n – mintanagyság (>30).

A reprezentativitási hiba (mР) relatív értékének (Р) kiszámítása:

ahol P a megfelelő relatív érték (például %-ban számítva);

Q =100 - Ρ% - P reciproka; n – mintanagyság (n>30)

Klinikai és kísérleti munkában gyakran szükséges használni Kis minta Ha a megfigyelések száma kisebb vagy egyenlő, mint 30. Kis mintával a reprezentativitás hibáinak kiszámításához, mind az átlagos, mind a relatív értékek , A megfigyelések száma eggyel csökken, i.e.

; .

A reprezentativitási hiba nagysága a minta méretétől függ: mint nagyobb szám megfigyelések, témák kevesebb hiba. A mintamutató megbízhatóságának értékeléséhez a következő megközelítést alkalmazzuk: a mutatónak (vagy átlagértéknek) háromszor nagyobbnak kell lennie, mint a hibája, ebben az esetben megbízhatónak tekinthető.

A hiba nagyságának ismerete nem elég ahhoz, hogy biztosak lehessünk a mintavizsgálat eredményeiben, mivel egy mintavizsgálatban előforduló konkrét hiba lényegesen nagyobb (vagy kisebb) lehet, mint az átlagos reprezentativitási hiba. Annak meghatározására, hogy a kutató milyen pontossággal akar eredményt elérni, a statisztika olyan fogalmat használ, mint a hibamentes előrejelzés valószínűsége, amely a szelektív orvosbiológiai statisztikai vizsgálatok eredményeinek megbízhatóságára jellemző. Általában az orvosbiológiai statisztikai vizsgálatok elvégzésekor a hibamentes előrejelzés valószínűsége 95% vagy 99%. A legkritikusabb esetekben, amikor különösen fontos elméleti vagy gyakorlati következtetéseket kell levonni, használja a 99,7%-os hibamentes előrejelzés valószínűségét.

Egy bizonyos érték megfelel a hibamentes előrejelzés bizonyos fokú valószínűségének A véletlenszerű mintavétel határhibája (Δ - delta), amelyet a következő képlet határoz meg:

Δ=t * m, ahol t egy megbízhatósági együttható, amely nagy minta és 95%-os hibamentes előrejelzés esetén 2,6; a hibamentes előrejelzés valószínűsége 99% - 3,0; 99,7% - 3,3 hibamentes előrejelzés valószínűségével, kis mintával pedig egy speciális Student-féle t-értéktáblázat segítségével határozzák meg.

A határmintavételi hiba (Δ) segítségével meghatározható A bizalom határai, amelyben a hibamentes előrejelzés bizonyos valószínűségével a statisztikai mennyiség tényleges értéke szerepel , A teljes populáció jellemzése (átlag vagy relatív).

A megbízhatósági határok meghatározásához a következő képleteket kell használni:

1) átlagos értékekhez:

ahol Mgen a populáció átlagértékének konfidenciahatárai;

Mminta – átlagos érték , Mintapopuláción végzett vizsgálat során szerezték be; t egy konfidencia együttható, amelynek értékét egy hibamentes előrejelzés valószínűségi foka határozza meg, amellyel a kutató az eredményt szeretné elérni; mM az átlagérték reprezentativitásának hibája.

2) relatív értékek esetén:

ahol Pgen a populáció relatív értékének konfidenciahatárai; Az Rsb egy mintapopuláción végzett vizsgálat során kapott relatív érték; t – megbízhatósági együttható; mP a relatív érték reprezentativitásának hibája.

A bizalmi határok azt a határt mutatják meg, amelyen belül a minta mérete véletlenszerű okok függvényében ingadozhat.

Kis számú megfigyeléssel (n<30), для вычисления доверительных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, A rendelkezésre álló szabadsági fokok számának jelzése (n) , Ami egyenlő n-1-gyel.

Statisztikai sokaság- olyan egységek halmaza, amelyek tömeggel, tipikussággal, minőségi homogenitással és változatosság jelenlétével rendelkeznek.

A statisztikai sokaság anyagilag létező objektumokból áll (Alkalmazottak, vállalkozások, országok, régiók), egy objektum.

A népesség egysége— a statisztikai sokaság minden egyes egysége.

Ugyanaz a statisztikai sokaság lehet homogén az egyik jellemzőben és heterogén a másikban.

Minőségi egységesség- a sokaság összes egységének hasonlósága valamilyen alapon és eltérés az összes többi tekintetében.

A statisztikai sokaságban az egyik és a másik populációs egység közötti különbségek gyakran mennyiségi jellegűek. A populáció különböző egységeinek jellemző értékeinek mennyiségi változásait variációnak nevezzük.

Egy tulajdonság variációja- egy jellemző mennyiségi változása (mennyiségi jellemző esetén) a populáció egyik egységéből a másikba való átmenet során.

Jel- ez az egységek, tárgyak és jelenségek megfigyelhető vagy mérhető tulajdonsága, jellemző tulajdonsága vagy egyéb jellemzője. A jeleket mennyiségire és minőségire osztják. Egy jellemző értékének sokféleségét és változékonyságát a sokaság egyes egységeiben ún variáció.

Az attribúciós (minőségi) jellemzők számszerűen nem fejezhetők ki (a népesség nemek szerinti összetétele). A mennyiségi jellemzőknek számszerű kifejezésük van (a népesség életkor szerinti összetétele).

Index- ez az egységek vagy a sokaság egészének bármely tulajdonságának általánosító mennyiségi és minőségi jellemzője meghatározott időben és helyen.

Eredménymutató olyan mutatók összessége, amelyek átfogóan tükrözik a vizsgált jelenséget.

Például a fizetést tanulmányozzák:

Jel - bérek
Statisztikai sokaság – minden alkalmazott
A sokaság egysége minden alkalmazott
Minőségi homogenitás – felhalmozott bérek
Egy jel variációja – egy számsorozat

Populáció és minta belőle

Az alap egy vagy több jellemző mérése eredményeként kapott adathalmaz. Az objektumok valóban megfigyelt halmaza, amelyet statisztikailag egy valószínűségi változó számos megfigyelése reprezentál mintavétel, és a hipotetikusan létező (sejtes) - Általános népesség. A sokaság véges lehet (megfigyelések száma N = állandó) vagy végtelen ( N = ∞), és egy sokaságból vett minta mindig korlátozott számú megfigyelés eredménye. A mintát alkotó megfigyelések számát ún minta nagysága. Ha a minta mérete elég nagy ( n → ∞) figyelembe veszi a mintát nagy, egyébként ezt mintavételnek hívják korlátozott mennyiségben. A mintát figyelembe veszik kicsi, ha egy egydimenziós valószínűségi változó mérésekor a minta mérete nem haladja meg a 30 ( n<= 30 ), és több egyidejű mérésekor ( k) jellemzői a többdimenziós relációs térben n Nak nek k nem haladja meg 10 (n/k< 10) . A mintanyomtatványok variációs sorozat, ha tagjai azok rendes statisztika, azaz a valószínűségi változó mintaértékei x Növekvő sorrendben vannak (rangsorolva), a jellemző értékeit hívják lehetőségek.

Példa. Szinte ugyanaz a véletlenszerűen kiválasztott objektumkészlet - Moszkva egyik közigazgatási körzetének kereskedelmi bankjai - tekinthető mintának az ebben a kerületben található összes kereskedelmi bank általános sokaságából, és mintaként Moszkva összes kereskedelmi bankjának általános populációjából. , valamint minta az ország kereskedelmi bankjaiból stb.

A mintavétel megszervezésének alapvető módszerei

A statisztikai következtetések megbízhatósága és az eredmények értelmes értelmezése attól függ reprezentativitás minták, azaz az általános sokaság tulajdonságainak reprezentációjának teljessége és megfelelősége, amelyhez képest ez a minta reprezentatívnak tekinthető. Egy sokaság statisztikai tulajdonságainak vizsgálata kétféleképpen szervezhető meg: felhasználással folyamatosÉs nem folyamatos. Folyamatos megfigyelés minden vizsgálatáról rendelkezik egységek tanult totalitás, A részleges (szelektív) megfigyelés- csak részei.

Öt fő módja van a minta megfigyelésének megszervezésének:

1. egyszerű véletlenszerű kiválasztás, amelyben az objektumok véletlenszerűen kerülnek kiválasztásra az objektumok sokaságából (például táblázat vagy véletlenszám-generátor segítségével), és minden lehetséges minta azonos valószínűségű. Az ilyen mintákat ún valójában véletlenszerű;

2. egyszerű kiválasztás szokásos eljárással mechanikai komponenssel történik (például dátum, hét napja, lakásszám, ábécé betűi stb.), és az így kapott mintákat ún. mechanikai;

3. rétegelt a kiválasztás abból áll, hogy a kötet általános sokaságát a kötet alpopulációira vagy rétegeire (rétegeire) osztják úgy, hogy . A rétegek a statisztikai jellemzőket tekintve homogén objektumok (például a népesség rétegekre van osztva korcsoportok vagy társadalmi osztályok szerint; a vállalkozások ágazatok szerint). Ebben az esetben a mintákat hívják rétegelt(másképp, rétegzett, tipikus, regionalizált);

4. módszerek sorozatszám kiválasztást használnak a formázáshoz sorozatszám vagy fészek minták. Kényelmesek, ha egy „tömböt” vagy objektumsorozatot kell egyszerre felmérni (például egy árutételt, egy bizonyos sorozat termékét vagy az ország területi-közigazgatási felosztásának lakosságát). A sorozatok kiválasztása történhet tisztán véletlenszerűen vagy mechanikusan. Ebben az esetben egy bizonyos árutétel, vagy egy teljes területi egység (lakóépület vagy tömb) teljes körű ellenőrzését végzik el;

5. kombinált A (lépcsős) szelekció egyszerre több kiválasztási módszert is kombinálhat (például rétegzett és véletlenszerű vagy véletlenszerű és mechanikus); ilyen mintát hívnak kombinált.

A kiválasztás típusai

Által ész egyéni, csoportos és kombinált szelekciót különböztetnek meg. Nál nél egyéni kiválasztás az általános sokaság egyes egységeit kiválasztják a mintapopulációba, azzal csoport kiválasztása- minőségileg homogén egységcsoportok (sorozatok), ill kombinált kiválasztás az első és a második típus kombinációját foglalja magában.

Által módszer szelekciót különböztetik meg ismétlődő és nem ismétlődő minta.

Ismétlés nélküli szelekciónak nevezzük, amelyben a mintában szereplő egység nem tér vissza az eredeti sokasághoz, és nem vesz részt a további szelekcióban; míg az egységek száma a teljes populációban N csökken a kiválasztási folyamat során. Nál nél megismételt kiválasztás elkapták a mintában egy egység a regisztrációt követően visszakerül a teljes sokasághoz, és így más egységekkel együtt egyenlő lehetőséget tart fenn egy további kiválasztási eljárásban való felhasználásra; míg az egységek száma a teljes populációban N változatlan marad (a módszert ritkán alkalmazzák a társadalmi-gazdasági kutatásokban). Azonban nagy N (N → ∞) képletek megismételhető a kiválasztás azokhoz közelít megismételt kiválasztás és az utóbbiak gyakorlatilag gyakrabban használatosak ( N = állandó).

Az általános és minta sokaság paramétereinek alapvető jellemzői

A tanulmány statisztikai következtetései a valószínűségi változó eloszlásán és a megfigyelt értékeken alapulnak (x 1, x 2, ..., x n) a valószínűségi változó realizációinak nevezzük x(n a minta mérete). Egy valószínűségi változó eloszlása az általános sokaságban elméleti, ideális természetű, mintaanalógja pedig empirikus terjesztés. Néhány elméleti eloszlást analitikusan adunk meg, pl. az övék lehetőségek határozza meg az eloszlási függvény értékét a valószínűségi változó lehetséges értékei terének minden pontjában. Egy minta esetében az eloszlásfüggvényt nehéz és néha lehetetlen meghatározni lehetőségek empirikus adatokból becsüljük meg, majd behelyettesítjük az elméleti eloszlást leíró analitikus kifejezésbe. Ebben az esetben a feltételezés (ill hipotézis) az eloszlás típusáról statisztikailag helyes vagy hibás lehet. De mindenesetre a mintából rekonstruált empirikus eloszlás csak nagyjából jellemzi az igazat. A legfontosabb eloszlási paraméterek a várható értékés variancia.

Az eloszlások természetüknél fogva azok folyamatosÉs diszkrét. A legismertebb folyamatos eloszlás az Normál. A paraméterek és hozzá tartozó mintaanalógjai: átlagérték és empirikus variancia. A társadalmi-gazdasági kutatásban a diszkrétek közül a leggyakrabban használt alternatív (dichotóm) terjesztés. Ennek az eloszlásnak a matematikai várakozási paramétere a relatív értéket fejezi ki (ill Ossza meg) a sokaság azon egységei, amelyek rendelkeznek a vizsgált jellemzővel (a betű jelzi); betűvel jelöljük a lakosság azon arányát, amely nem rendelkezik ezzel a tulajdonsággal q (q = 1 - p). Az alternatív eloszlás varianciájának empirikus analógja is van.

Az eloszlás típusától és a populációs egységek kiválasztásának módjától függően az eloszlási paraméterek jellemzőit eltérő módon számítják ki. Az elméleti és empirikus eloszlások főbb jellemzőit a táblázat tartalmazza. 1.

Mintatört k n A minta sokaságban lévő egységek számának és az általános sokaság egységeinek számának arányát:

kn = n/N.

Mintafrakció w a vizsgált jellemzővel rendelkező egységek aránya x a minta méretéhez n:

w = n n/n.

Példa. 1000 db-ot tartalmazó árutételben, 5%-os mintával mintarészesedés k n abszolút értékben 50 egység. (n = N*0,05); ha ebben a mintában 2 hibás terméket találunk, akkor minta hibaarány w 0,04 lesz (w = 2/50 = 0,04 vagy 4%).

Mivel a mintapopuláció eltér az általános sokaságtól, vannak mintavételi hibák.

1. táblázat Az általános és mintapopulációk főbb paraméterei

Mintavételi hibák

Mindenesetre (folyamatos és szelektív) kétféle hiba fordulhat elő: regisztráció és reprezentativitás. Hibák bejegyzés lehet véletlenÉs szisztematikus karakter. Véletlen A hibák sok különböző ellenőrizhetetlen okból állnak, nem szándékosak és általában kiegyenlítik egymást (például a helyiség hőmérséklet-ingadozása miatti változás a készülék teljesítményében).

Szisztematikus a hibák elfogultak, mert sértik a minta objektumok kiválasztására vonatkozó szabályokat (például eltérések a mérésekben a mérőeszköz beállításainak megváltoztatásakor).

Példa. A város lakosságának szociális helyzetének felmérésére a családok 25%-ának felmérését tervezik. Ha minden negyedik lakás kiválasztása a szám alapján történik, akkor fennáll annak a veszélye, hogy csak egy típusú (például egyszobás) lakást választanak ki, ami szisztematikus hibát eredményez és torzítja az eredményeket; A sorsolás útján történő lakásszám kiválasztása előnyösebb, mivel a hiba véletlenszerű lesz.

Reprezentatív hibák csak a mintás megfigyelésben rejlenek, nem kerülhetők el, és abból fakadnak, hogy a mintapopuláció nem reprodukálja teljesen az általános sokaságot. A mintából nyert mutatók értékei eltérnek az általános sokaság azonos értékeinek (vagy folyamatos megfigyeléssel kapott) mutatóitól.

Mintavételi torzítás a sokaság paraméterértéke és a minta értéke közötti különbség. Egy mennyiségi jellemző átlagos értékére egyenlő: , a részesedésre (alternatív jellemző) pedig - .

A mintavételi hibák csak a mintamegfigyelések velejárói. Minél nagyobbak ezek a hibák, annál jobban eltér az empirikus eloszlás az elméletitől. Az empirikus eloszlás paraméterei valószínűségi változók, ezért a mintavételi hibák is valószínűségi változók, különböző mintákhoz eltérő értéket vehetnek fel, ezért szokás számolni átlagos hiba.

Átlagos mintavételi hiba a minta átlagának a matematikai elvárástól való szórását kifejező mennyiség. Ez az érték a véletlenszerű kiválasztás elvének megfelelően elsősorban a minta méretétől és a jellemző variációjának mértékétől függ: minél nagyobb és minél kisebb a jellemző (és így az érték) változása, annál kisebb az átlagos mintavételi hiba. . Az általános és a mintapopuláció varianciái közötti kapcsolatot a következő képlettel fejezzük ki:

azok. ha elég nagy, akkor feltételezhetjük, hogy . Az átlagos mintavételi hiba a mintapopulációs paraméter lehetséges eltéréseit mutatja az általános populációs paramétertől. táblázatban A 2. ábra az átlagos mintavételi hiba kiszámítására szolgáló kifejezéseket mutatja a megfigyelésszervezés különböző módszereihez.

2. táblázat: A mintaátlag átlagos hibája (m) és aránya különböző típusú minták esetén

Hol van a csoporton belüli mintán belüli eltérések átlaga egy folytonos attribútum esetén;

Az arány csoporton belüli eltéréseinek átlaga;

— a kiválasztott sorozatok száma, — a sorozatok teljes száma;

ahol a th sorozat átlaga;

— a teljes mintapopuláció általános átlaga egy folytonos jellemző esetében;

ahol a jellemző részesedése a th sorozatban;

— a jellemző teljes részesedése a teljes mintapopulációban.

Az átlagos hiba nagysága azonban csak bizonyos P valószínűséggel ítélhető meg (P ≤ 1). Ljapunov A.M. bebizonyította, hogy a mintaátlagok eloszlása, és ezáltal az általános átlagtól való eltérése kellően nagy szám esetén megközelítőleg megfelel a normáleloszlási törvénynek, feltéve, hogy az általános sokaság véges átlaggal és korlátozott szórással rendelkezik.

Matematikailag ez az átlagra vonatkozó állítás a következőképpen fejezhető ki:

és a részvény esetében az (1) kifejezés a következő formában jelenik meg:

Ahol - Van marginális mintavételi hiba, ami az átlagos mintavételi hiba többszöröse , a multiplicitási együttható pedig a W.S. által javasolt Student-féle teszt („konfidencia együttható”). Gosset (álnév "diák"); a különböző mintaméretekhez tartozó értékeket egy speciális táblázatban tároljuk.

A Ф(t) függvény értékei t egyes értékeire egyenlők:

Ezért a (3) kifejezés a következőképpen olvasható: valószínűséggel P = 0,683 (68,3%) vitatható, hogy a minta és az általános átlag közötti különbség nem haladja meg az átlagos hiba egy értékét m(t=1), valószínűséggel P = 0,954 (95,4%)- hogy nem haladja meg a két átlagos hiba értékét m (t = 2) , valószínűséggel P = 0,997 (99,7%)- nem haladja meg a három értéket m (t = 3).Így annak a valószínűsége, hogy ez a különbség meghaladja az átlagos hiba háromszorosát, a hibaszintés nem ér többet 0,3% .

táblázatban A 3. ábra a maximális mintavételi hiba kiszámításának képleteit mutatja.

3. táblázat: A minta határhibája (D) az átlaghoz és az arányhoz (p) a különböző típusú mintamegfigyelésekhez

A mintaeredmények általánosítása a sokaságra

A mintamegfigyelés végső célja az általános sokaság jellemzése. Kis mintaméretek esetén a paraméterek ( és ) empirikus becslései jelentősen eltérhetnek valódi értéküktől ( és ). Ezért meg kell határozni azokat a határokat, amelyeken belül a ( és ) paraméterek mintaértékeinek valós értékei ( és ) vannak.

Megbízhatósági intervallum az általános sokaság bármely θ paraméterének e paraméter véletlenszerű értéktartománya, amely 1-hez közeli valószínűséggel ( megbízhatóság) tartalmazza ennek a paraméternek a valódi értékét.

Marginális hiba minták Δ lehetővé teszi a lakosság és azok jellemzőinek határértékeinek meghatározását konfidencia intervallumok, amelyek egyenlőek:

A lényeg megbízhatósági intervallum kivonással kapott maximális hiba a mintaátlagból (részesedés), a felsőt pedig összeadva.

Megbízhatósági intervallum az átlaghoz a maximális mintavételi hibát használja, és egy adott megbízhatósági szinthez a következő képlet határozza meg:

Ez azt jelenti, hogy adott valószínűséggel R, amelyet megbízhatósági szintnek neveznek, és az érték egyedileg határozza meg t, azt lehet állítani, hogy az átlag valódi értéke a tól kezdődő tartományban van , és a részvény valódi értéke a közötti tartományba esik

Három standard konfidenciaszint konfidenciaintervallumának kiszámításakor P = 95%, P = 99% és P = 99,9% az értéket a . Alkalmazások a szabadságfokok számától függően. Ha a minta mérete elég nagy, akkor ezeknek a valószínűségeknek megfelelő értékeket kell megadni t egyenlőek: 1,96, 2,58 És 3,29 . Így a marginális mintavételi hiba lehetővé teszi, hogy meghatározzuk a sokaság jellemzőinek határértékeit és azok konfidencia intervallumait:

A mintamegfigyelés eredményeinek az általános sokaságra való elosztása a társadalmi-gazdasági kutatásokban megvannak a maga sajátosságai, hiszen minden típusának és csoportjának teljes reprezentációját igényli. Az ilyen elosztás lehetőségének alapja a számítás relatív hiba:

Ahol Δ % - relatív maximális mintavételi hiba; , .

Két fő módszer létezik a minta megfigyelésének kiterjesztésére egy populációra: közvetlen újraszámítás és együttható módszer.

Lényeg közvetlen átalakítás abból áll, hogy a mintaátlagot!!\overline(x) megszorozzuk a sokaság méretével.

Példa. Legyen mintavételi módszerrel becsülve a városban élő kisgyermekek átlagos száma egy főre. Ha a városban 1000 fiatal család él, akkor az önkormányzati bölcsődékben szükséges férőhelyek számát úgy kapjuk meg, hogy ezt az átlagot megszorozzuk a teljes népesség számával N = 1000, azaz. 1200 férőhelyes lesz.

Odds módszer Szelektív megfigyelés esetén célszerű használni a folyamatos megfigyelés adatainak tisztázása érdekében.

A következő képletet használják:

ahol minden változó a populáció mérete:

Kötelező mintaméret

4. táblázat: Szükséges mintanagyság (n) különböző típusú mintamegfigyelési szervezetekhez

A megengedett mintavételi hiba előre meghatározott értékével történő mintamegfigyelés tervezésekor szükséges a szükséges mintavételi hiba helyes becslése. minta nagysága. Ez a mennyiség a minta megfigyelése során megengedett hiba alapján határozható meg egy adott valószínűség alapján, amely garantálja a hibaszint megengedett értékét (figyelembe véve a megfigyelés szervezési módját). A szükséges n mintanagyság meghatározására szolgáló képletek könnyen beszerezhetők közvetlenül a maximális mintavételi hiba képleteiből. Tehát a határhiba kifejezéséből:

a minta méretét közvetlenül határozzák meg n:

Ez a képlet azt mutatja, hogy a maximális mintavételi hiba csökkenésével Δ a szükséges mintanagyság jelentősen megnő, ami arányos a variancia és a Student-féle t-próba négyzetével.

Egy adott megfigyelésszervezési módszerhez a szükséges mintanagyságot a táblázatban megadott képletek alapján számítjuk ki. 9.4.

Gyakorlati számítási példák

1. példa: Az átlagérték és a konfidenciaintervallum kiszámítása folytonos mennyiségi jellemzőre.

A hitelezőkkel való elszámolás sebességének felmérésére a banknál 10 fizetési bizonylatból álló véletlenszerű mintát vettek fel. Értékük egyenlőnek bizonyult (napokban): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

Valószínűséggel szükséges P = 0,954 határozza meg a határhibát Δ minta átlaga és az átlagszámítási idő konfidenciahatárai.

Megoldás. Az átlagértéket a táblázat képletével számítjuk ki. 9.1 a minta sokaságára

A variancia kiszámítása a táblázat képletével történik. 9.1.

A nap átlagos négyzethibája.

Az átlagos hiba kiszámítása a következő képlettel történik:

azok. az átlag az x ± m = 12,0 ± 2,3 nap.

Az átlag megbízhatósága az volt

A maximális hibát a táblázat képletével számítjuk ki. 9.3 ismételt mintavételre, mivel a populáció mérete nem ismert, és a P = 0,954 a bizalom szintje.

Így az átlagos érték `x ± D = `x ± 2m = 12,0 ± 4,6, azaz. valódi értéke 7,4 és 16,6 nap közötti tartományban van.

Student-féle t-tábla használata. Az alkalmazás arra enged következtetni, hogy n = 10 - 1 = 9 szabadsági fok esetén a kapott érték 0,001 GBP szignifikanciaszint mellett megbízható, azaz. a kapott átlagérték jelentősen eltér 0-tól.

2. példa Valószínűségbecslés (általános részesedés) p.

1000 család társadalmi helyzetét vizsgáló mechanikus mintavételi módszerrel kiderült, hogy az alacsony jövedelmű családok aránya w = 0,3 (30%)(a minta volt 2% , azaz n/N = 0,02). Megbízhatósági szinttel kötelező p = 0,997 határozza meg a mutatót R alacsony jövedelmű családok az egész régióban.

Megoldás. A bemutatott függvényértékek alapján Ф(t) megtalálni egy adott megbízhatósági szinthez P = 0,997 jelentése t = 3(lásd a 3. képletet). Tört határhibája w táblázat képletével határozzuk meg. 9.3. nem ismétlődő mintavétel (a mechanikus mintavétel mindig nem ismétlődő):

Maximális relatív mintavételi hiba in % lesz:

Az alacsony jövedelmű családok valószínűsége (általános aránya) a régióban lesz р=w±Δw, és a p konfidenciahatárokat a kettős egyenlőtlenség alapján számítjuk ki:

w — Δ w ≤ p ≤ w — Δ w, azaz p valódi értéke a következőkben rejlik:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Így 0,997-es valószínűséggel megállapítható, hogy a régió összes családján belül az alacsony jövedelmű családok aránya 28,6% és 31,4% között mozog.

3. példa Egy intervallumsorozat által meghatározott diszkrét jellemző átlagértékének és konfidenciaintervallumának kiszámítása.

táblázatban 5. Meghatározásra került a megrendelések elkészítésére irányuló kérelmek elosztása a vállalkozás általi végrehajtásuk ütemezése szerint.

5. táblázat A megfigyelések megoszlása a megjelenés időpontja szerint

Megoldás. A rendelések teljesítésének átlagos idejét a következő képlet segítségével számítjuk ki:

Az átlagos időszak a következő lesz:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 hónap.

Ugyanezt a választ kapjuk, ha a táblázat utolsó előtti oszlopának p i-re vonatkozó adatait használjuk. 9.5, a következő képlet segítségével:

Vegye figyelembe, hogy az utolsó fokozat intervallumának közepét úgy találjuk meg, hogy mesterségesen kiegészítjük az előző fokozat intervallumának szélességével, amely 60-36 = 24 hónap.

A variancia kiszámítása a képlet segítségével történik

Ahol x i- az intervallumsorozat közepe.

Ezért!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4), és az átlagos négyzetes hiba: .

Az átlagos hiba kiszámítása a havi képlet segítségével történik, pl. az átlagérték!!\overline(x) ± m = 23,1 ± 13,4.

A maximális hibát a táblázat képletével számítjuk ki. 9,3 ismételt szelekció esetén, mivel a populáció mérete ismeretlen, 0,954-es megbízhatósági szint esetén:

Tehát az átlag:

azok. valódi értéke 0 és 50 hónap közötti tartományban van.

4. példa Az N = 500 nagyvállalat hitelezőivel való elszámolás sebességének meghatározásához egy kereskedelmi bankban egy véletlenszerű, nem ismétlődő kiválasztási módszerrel mintavételezést kell végezni. Határozzuk meg a szükséges n mintanagyságot úgy, hogy P = 0,954 valószínűséggel a mintaátlag hibája ne haladja meg a 3 napot, ha a próbabecslések azt mutatták, hogy az s szórása 10 nap.

Megoldás. A szükséges n vizsgálatok számának meghatározásához a táblázatból a nem ismétlődő kiválasztás képletét használjuk. 9.4:

Ebben a t értéket P = 0,954 konfidenciaszintből határozzuk meg. Ez egyenlő 2-vel. Az átlagos négyzetérték s = 10, a populáció mérete N = 500, és az átlag maximális hibája Δ x = 3. Ezeket az értékeket behelyettesítve a képletbe, a következőt kapjuk:

azok. Elegendő egy 41 vállalkozásból álló mintát összeállítani a szükséges paraméter - a hitelezőkkel való elszámolás sebességének - becsléséhez.