नमूना आकार की सही गणना कैसे करें? संगोष्ठी का विषय: समाजशास्त्रीय अनुसंधान में नमूनाकरण प्रमुख अवधारणाएँ निर्भर और स्वतंत्र नमूने

1C 8.2 और 8.3 में नमूनाकरण सूचना आधार तालिकाओं के अभिलेखों के माध्यम से छाँटने का एक विशेष तरीका है। आइए देखें कि नमूनाकरण क्या है और इसका उपयोग कैसे करें।

1C में नमूना क्या है?

नमूना- 1 सी में सूचना के माध्यम से सॉर्ट करने का एक तरीका, जिसमें क्रमिक रूप से कर्सर को अगले रिकॉर्ड पर रखा जाता है। 1C में चयन क्वेरी परिणाम और ऑब्जेक्ट मैनेजर से प्राप्त किया जा सकता है, उदाहरण के लिए, दस्तावेज़ या निर्देशिका।

ऑब्जेक्ट मैनेजर से प्राप्त करने और पुनरावृति का एक उदाहरण:

चयन = निर्देशिकाएँ। बैंक। चुनना() ; चयन करते समय। नेक्स्ट () साइकिल एंडसाइकल;

क्वेरी से चयन प्राप्त करने का एक उदाहरण:

267 1C वीडियो पाठ निःशुल्क प्राप्त करें:

अनुरोध = नया अनुरोध ( "निर्देशिका से लिंक, कोड, नाम चुनें। बैंक") ; नमूना = अनुरोध। अमल में लाना() । चुनना() ; चयन करते समय। अगला () लूप // "बैंक" निर्देशिका के साथ दिलचस्प क्रियाएं करेंएंडसाइकल;

उपरोक्त दोनों उदाहरणों में पुनरावृति के लिए समान डेटा सेट मिलते हैं।

नमूना लेने के तरीके 1सी 8.3

चयन में बड़ी संख्या में विधियाँ हैं, आइए उन पर अधिक विस्तार से विचार करें:

चुनना()- एक विधि जिसके द्वारा एक नमूना सीधे प्राप्त किया जाता है। चयन से, आप एक और, अधीनस्थ, चयन प्राप्त कर सकते हैं यदि बायपास प्रकार "ग्रुपिंग द्वारा" निर्दिष्ट किया गया हो।
मालिक()चयन () की रिवर्स विधि है। आपको "पैरेंट" क्वेरी चयन प्राप्त करने की अनुमति देता है।
अगला()- एक विधि जो कर्सर को अगले रिकॉर्ड पर ले जाती है। यदि रिकॉर्ड मौजूद है, तो सही है, यदि कोई और रिकॉर्ड नहीं है, तो गलत है।
दूसरा खोजो()- एक बहुत ही उपयोगी विधि जिसके साथ आप चयन के मूल्य (चयन - क्षेत्र संरचना) द्वारा केवल आवश्यक क्षेत्रों पर पुनरावृति कर सकते हैं।
NextByFieldValue()- आपको वर्तमान स्थिति से भिन्न मान के साथ अगला रिकॉर्ड प्राप्त करने की अनुमति देता है। उदाहरण के लिए, "खाता" फ़ील्ड: Selection.NextBy FieldValue ("खाता") के अद्वितीय मान वाले सभी रिकॉर्ड को छाँटना आवश्यक है।
रीसेट()- आपको कर्सर की वर्तमान स्थिति को रीसेट करने और उसे उसकी मूल स्थिति पर सेट करने की अनुमति देता है।
मात्रा()- चयन में रिकॉर्ड की संख्या लौटाता है।
पाना()- विधि का उपयोग करके, आप कर्सर को इंडेक्स वैल्यू द्वारा वांछित रिकॉर्ड पर सेट कर सकते हैं।
स्तर() -वर्तमान प्रविष्टि (संख्या) के पदानुक्रम में स्तर।
रिकॉर्ड का प्रकार()— रिकॉर्ड प्रकार प्रदर्शित करता है — DetailRecord, GroupTotal, HierarchyTotal, या GrandTotal
समूहीकरण ()- वर्तमान ग्रुपिंग का नाम लौटाता है, यदि रिकॉर्ड ग्रुपिंग नहीं है - एक खाली स्ट्रिंग।

यदि आप 1C प्रोग्रामिंग सीखना शुरू कर रहे हैं, तो हम अपने निःशुल्क पाठ्यक्रम की अनुशंसा करते हैं (भूलें नहीं

सिखाने के तरीके

जनगणना (योग्यता) और नमूनाकरण की अवधारणाओं के बीच अंतर करना स्पष्ट है।
एक नमूना आबादी प्राप्त करने के लिए शोधकर्ताओं द्वारा कार्यान्वित छह चरणों का सार और क्रम जानें।
"नमूनाकरण फ्रेम" की अवधारणा को परिभाषित करें।
संभाव्य और नियतात्मक नमूने के बीच अंतर स्पष्ट करें।
निश्चित आकार के नमूने और मल्टीस्टेज (लगातार) नमूने के बीच अंतर।
समझाएं कि जानबूझकर नमूनाकरण क्या है और इसकी ताकत और कमजोरियों दोनों का वर्णन करें।
कोटा नमूनाकरण की अवधारणा को परिभाषित करें।
व्याख्या करें कि चयन प्रक्रिया में पैरामीटर क्या है।
व्याख्या करें कि एक व्युत्पन्न सेट क्या है।
समझाइए कि प्रतिचयन वितरण की अवधारणा क्यों है सबसे महत्वपूर्ण अवधारणाआँकड़े।

इसलिए, शोधकर्ता ने समस्या को सटीक रूप से परिभाषित किया है और इसे हल करने के लिए उपयुक्त शोध डिजाइन और डेटा संग्रह उपकरण प्राप्त किए हैं। अनुसंधान प्रक्रिया का अगला चरण उन तत्वों का चयन होना चाहिए जिनकी जांच की जानी है। इस आबादी की पूरी जनगणना करके किसी आबादी के प्रत्येक तत्व की जांच करना संभव है। जनसंख्या के पूर्ण सर्वेक्षण को जनगणना (योग्यता) कहा जाता है। एक और संभावना है। जनसंख्या का एक निश्चित भाग, एक बड़े समूह के तत्वों का एक नमूना, सांख्यिकीय परीक्षा के अधीन है, और इस उपसमुच्चय पर प्राप्त आंकड़ों के अनुसार, पूरे समूह के संबंध में कुछ निष्कर्ष निकाले जाते हैं। नमूना डेटा से प्राप्त परिणामों को एक बड़े समूह में सामान्यीकृत करने की क्षमता उस विधि पर निर्भर करती है जिसके द्वारा नमूना लिया गया था। इस अध्याय का अधिकांश भाग इस बात पर केंद्रित होगा कि प्रतिदर्श कैसे और क्यों लिया जाना चाहिए।

जनगणना (योग्यता)
जनसंख्या (जनसंख्या) की पूरी जनगणना।
नमूना
वस्तुओं के एक बड़े समूह के सबसेट के तत्वों का संग्रह।

"जनसंख्या" या "संग्रह" की अवधारणा न केवल लोगों को, बल्कि विनिर्माण उद्योग में काम करने वाली फर्मों को, खुदरा विक्रेताओं या थोक विक्रेताओं को, या यहां तक कि पूरी तरह से निर्जीव वस्तुओं को भी संदर्भित कर सकती है, जैसे उद्यम द्वारा उत्पादित भागों; इस अवधारणा को तत्वों के पूरे सेट के रूप में परिभाषित किया गया है जो कुछ शर्तों को पूरा करते हैं। ये शर्तें विशिष्ट रूप से उन तत्वों को परिभाषित करती हैं जो लक्ष्य समूह से संबंधित हैं और वे तत्व जिन्हें विचार से बाहर रखा जाना चाहिए।

एक अध्ययन जिसका उद्देश्य जमे हुए पिज्जा उपभोक्ताओं की जनसांख्यिकीय प्रोफ़ाइल का निर्धारण करना है, को यह पहचान कर शुरू करना चाहिए कि किसे इस तरह वर्गीकृत किया जाना चाहिए और क्या नहीं। क्या ऐसे पिज्जा को कम से कम एक बार चखने वाले लोग इस श्रेणी में आते हैं? वे व्यक्ति जो प्रति माह कम से कम एक पिज्जा खरीदते हैं? हफ्ते में? एक महीने में एक निश्चित न्यूनतम मात्रा से अधिक पिज़्ज़ा खाने वाले व्यक्ति? लक्ष्य समूह निर्धारित करने में शोधकर्ता को बहुत सटीक होना चाहिए। यह सुनिश्चित करने के लिए भी ध्यान रखा जाना चाहिए कि नमूना लक्षित आबादी से लिया गया है न कि "कुछ" आबादी से, जो नमूना फ्रेम अपर्याप्त या अपूर्ण होने पर मामला है। उत्तरार्द्ध उन तत्वों की एक सूची है जिनसे एक वास्तविक नमूना बनेगा।

एक शोधकर्ता कई कारणों से संपूर्ण जनसंख्या के सर्वेक्षण के लिए एक नमूना दृष्टिकोण को प्राथमिकता दे सकता है। पहले तो, पूर्ण परीक्षायहां तक कि एक अपेक्षाकृत छोटे समुच्चय के लिए भी बहुत बड़ी सामग्री और समय की लागत की आवश्यकता होती है। अक्सर, जब तक जनगणना पूरी हो जाती है और डेटा को संसाधित किया जाता है, तब तक सूचना पहले से ही पुरानी हो चुकी होती है। कुछ मामलों में, योग्यता केवल असंभव है। मान लीजिए कि शोधकर्ताओं ने गणना की गई एक के साथ इलेक्ट्रिक गरमागरम लैंप के वास्तविक सेवा जीवन के अनुपालन की जांच करने के लिए निर्धारित किया है, जिसके लिए उन्हें असफल होने तक उन्हें चालू रखने की आवश्यकता है। यदि आप इस तरह से लैंप की पूरी आपूर्ति की जांच करते हैं, तो विश्वसनीय डेटा प्राप्त होगा, लेकिन व्यापार करने के लिए कुछ भी नहीं होगा।

अंत में, शुरुआती लोगों के महान विस्मय के लिए, शोधकर्ता परिणामों की सटीकता के लिए प्रयास करते हुए, जनगणना के लिए नमूना लेना पसंद कर सकते हैं। जनगणना के लिए बड़े कर्मचारियों की आवश्यकता होती है, जिससे पूर्वाग्रह (नॉन-सैंपलिंग) त्रुटियों की संभावना बढ़ जाती है। यह परिस्थिति उन कारणों में से एक है जिसके कारण अमेरिकी जनगणना ब्यूरो विभिन्न प्रकार की जनगणनाओं की सटीकता का परीक्षण करने के लिए नमूना सर्वेक्षणों का उपयोग करता है। आपने सही पढ़ा: योग्यता डेटा की सटीकता का परीक्षण करने के लिए नमूना सर्वेक्षण किया जा सकता है।

नमूना डिजाइन कदम

अंजीर पर। चित्र 15.1 एक छह-चरण अनुक्रम दिखाता है जिसका अनुसरण एक शोधकर्ता नमूना तैयार करते समय कर सकता है। सबसे पहले, लक्ष्य आबादी या तत्वों के समूह को निर्धारित करना आवश्यक है जिसके बारे में शोधकर्ता कुछ जानना चाहता है।

उदाहरण के लिए, बच्चों की प्राथमिकताओं का अध्ययन करते समय, शोधकर्ताओं को यह तय करने की आवश्यकता होती है कि क्या लक्षित आबादी में केवल बच्चे, केवल माता-पिता या दोनों शामिल होंगे।

सकल (जनसंख्या)
तत्वों का एक समूह जो कुछ निश्चित शर्तों को पूरा करता है।
नमूना फ्रेम (आधार)
उन तत्वों की सूची जिनसे चयन किया जाएगा; क्षेत्रीय इकाइयां, संगठन, व्यक्ति और अन्य तत्व शामिल हो सकते हैं।

एक निश्चित कंपनी ने अपनी इलेक्ट्रिक "दौड़" का परीक्षण केवल बच्चों पर किया। बच्चे पूरी तरह से अभिभूत थे। माता-पिता ने नवीनता पर अलग-अलग प्रतिक्रिया व्यक्त की। माताओं को यह तथ्य पसंद नहीं आया कि सवारी ने बच्चों को कार के अनुकूल होना नहीं सिखाया, और डैड्स को यह तथ्य पसंद नहीं आया कि उत्पाद को खिलौने की तरह बनाया गया था।
विपरीत स्थिति भी संभव है। एक फर्म ने एक नया खाद्य उत्पाद लॉन्च किया और एक राष्ट्रव्यापी विज्ञापन अभियान शुरू किया जो अकुशल बच्चे पर केंद्रित था। फर्म ने विज्ञापनों की प्रभावशीलता का परीक्षण केवल उन माताओं पर किया जो रोमांचित थीं। दूसरी ओर, बच्चों को यह "त्वरण" मिला, और इसके साथ विज्ञापित उत्पाद ही घृणित था। उत्पाद समाप्त 1।

शोधकर्ता को यह तय करना होगा कि प्रासंगिक जनसंख्या में कौन या क्या शामिल होगा: व्यक्ति, परिवार, फर्म, अन्य संगठन, क्रेडिट कार्ड लेनदेन, आदि। ऐसे निर्णय लेने में, उन तत्वों को निर्धारित करना आवश्यक है जिन्हें आबादी से बाहर रखा जाना चाहिए। तत्वों का लौकिक और भौगोलिक दोनों संदर्भ होना चाहिए, जो कुछ मामलों में अतिरिक्त शर्तों या प्रतिबंधों के अधीन हो सकते हैं। उदाहरण के लिए, यदि हम व्यक्तियों के बारे में बात कर रहे हैं, तो वांछित जनसंख्या में केवल 18 वर्ष से अधिक आयु के व्यक्ति, या केवल महिलाएं, या केवल कम से कम माध्यमिक शिक्षा वाले व्यक्ति शामिल हो सकते हैं।

अन्तर्राष्ट्रीय विपणन अनुसंधान में लक्षित जनसंख्या के लिए भौगोलिक सीमाओं के निर्धारण का कार्य हो सकता है विशेष समस्या, क्योंकि यह विचाराधीन प्रणाली की विषमता को बढ़ाता है। उदाहरण के लिए, शहरी और ग्रामीण क्षेत्रों का सापेक्ष अनुपात एक देश से दूसरे देश में महत्वपूर्ण रूप से भिन्न हो सकता है। प्रादेशिक पहलू का जनसंख्या की संरचना और उसी देश के भीतर गंभीर प्रभाव पड़ता है। उदाहरण के लिए, चिली के उत्तर में, मुख्य रूप से भारतीय आबादी सघन रूप से रहती है, जबकि देश के दक्षिणी क्षेत्रों में, मुख्य रूप से यूरोपीय लोगों के वंशज रहते हैं।

कवरेज (घटना)
जनसंख्या या समूह के सदस्यों का प्रतिशत जो नमूने में शामिल करने की शर्तों को पूरा करते हैं।

आम तौर पर, लक्षित जनसंख्या को जितना सरल परिभाषित किया जाता है, उसका कवरेज (घटना) उतना ही अधिक होता है और नमूना लेने की प्रक्रिया आसान और सस्ती होती है। कवरेज (घटना)जनसंख्या या समूह के तत्वों के अनुपात से मेल खाती है, प्रतिशत के रूप में व्यक्त किया जाता है, जो नमूने में शामिल करने की शर्तों को पूरा करता है। कवरेज सीधे समय को प्रभावित करता है और माल की लागतसर्वेक्षण के लिए आवश्यक। यदि कवरेज बड़ा है (यानी, जनसंख्या के अधिकांश तत्व संभावित उत्तरदाताओं की पहचान करने के लिए उपयोग किए जाने वाले एक या अधिक सरल मानदंडों को पूरा करते हैं), तो डेटा एकत्र करने के लिए आवश्यक समय और भौतिक लागत कम से कम हो जाती है। इसके विपरीत, संभावित उत्तरदाताओं को मिलने वाले मानदंडों की संख्या में वृद्धि के साथ, सामग्री और समय लागत दोनों में वृद्धि होती है।

अंजीर पर। चित्र 15.2 कुछ खेलों में शामिल वयस्क आबादी के अनुपात को दर्शाता है। आंकड़े में दिए गए डेटा से संकेत मिलता है कि मोटर साइकिल चलाने वाले लोगों (वयस्कों की कुल संख्या का केवल 3.6%) की जांच करना उन लोगों की तुलना में अधिक कठिन और महंगा है जो नियमित रूप से मनोरंजक सैर करते हैं (कुल संख्या का 27.4%) वयस्क)। मुख्य बात यह है कि शोधकर्ता यह निर्धारित करने में सटीक होता है कि अध्ययन आबादी में कौन से तत्वों को शामिल किया जाना चाहिए और किन तत्वों को इससे बाहर रखा जाना चाहिए। अध्ययन के उद्देश्य का एक स्पष्ट विवरण इस समस्या के समाधान की सुविधा प्रदान करता है। नमूना लेने की प्रक्रिया में दूसरा चरण नमूना फ्रेम निर्धारित करना है, जैसा कि आप पहले से ही जानते हैं, उन तत्वों की सूची है जिनसे नमूना तैयार किया जाएगा। बता दें कि एक निश्चित अध्ययन की लक्षित आबादी डलास क्षेत्र में रहने वाले सभी परिवार हैं। पहली नज़र में, डलास टेलीफोन निर्देशिका एक अच्छा और आसानी से सुलभ नमूनाकरण फ्रेम हो सकता है। फिर भी, करीब से जाँच करने पर, यह स्पष्ट हो जाता है कि निर्देशिका में निहित परिवारों की सूची पूरी तरह से सही नहीं है, क्योंकि इसमें कुछ परिवारों की संख्या छोड़ दी गई है (बेशक, इसमें ऐसे परिवार शामिल नहीं हैं जिनके पास टेलीफोन नहीं है), जबकि कुछ परिवारों के पास कई टेलीफोन नंबर हैं। वे व्यक्ति जिन्होंने हाल ही में अपना निवास स्थान बदला है और तदनुसार, उनका टेलीफोन नंबर भी निर्देशिका में मौजूद नहीं है।

अनुभवी शोधकर्ता इस निष्कर्ष पर पहुंचे हैं कि सैंपलिंग फ्रेम और ब्याज की लक्षित आबादी के बीच एक सटीक मेल बहुत दुर्लभ है। सबसे ज्यादा रचनात्मक चरणनमूनाकरण डिजाइन कार्य उन मामलों में उपयुक्त नमूनाकरण फ्रेम का निर्धारण है जहां जनसंख्या सदस्यों को सूचीबद्ध करना मुश्किल है। इसके लिए कार्य ब्लॉकों और उपसर्गों से नमूने लेने की आवश्यकता हो सकती है, उदाहरण के लिए, टेलीफोन निर्देशिकाओं में कमियों के कारण यादृच्छिक डायलिंग का उपयोग किया जाता है। हालांकि, पिछले 10 वर्षों में कार्य इकाइयों में उल्लेखनीय वृद्धि ने इस कार्य को और कठिन बना दिया है। प्रादेशिक क्षेत्रों या संगठनों के चयनात्मक अवलोकन के मामले में भी इसी तरह की स्थिति उत्पन्न हो सकती है, इसके बाद उप-नमूने लेना, जब, कहते हैं, लक्ष्य आबादी व्यक्ति है, लेकिन उनकी कोई सटीक अद्यतन सूची नहीं है।

स्रोत: एसएसआई में निहित डेटा के आधार पर- हल्काटीएम: एलओउ घटना टीलक्षित एसएम्प्लिंग" (फेयरफ़ील्ड, कनेक्टिकट: सर्वे सैम्पलिंग, इंक., 1994)।

नमूना लेने की प्रक्रिया में तीसरा चरण नमूना फ्रेम के निर्धारण से निकटता से संबंधित है। नमूना लेने की विधि या प्रक्रिया का चुनाव काफी हद तक शोधकर्ता द्वारा अपनाए गए नमूने के ढाँचे पर निर्भर करता है। विभिन्न प्रकार के नमूनों की आवश्यकता होती है विभिन्न प्रकार केनमूना चयन ढांचा। यह और अगला अध्याय विपणन अनुसंधान में उपयोग किए जाने वाले मुख्य प्रकार के नमूनों का एक सिंहावलोकन देगा। उनका वर्णन करते समय, नमूना फ्रेम और इसके गठन की विधि के बीच संबंध स्पष्ट होना चाहिए।

नमूनाकरण प्रक्रिया का चौथा चरण नमूना आकार निर्धारित करना है। इस समस्या पर चैप में चर्चा की गई है। 17. पांचवें चरण में, शोधकर्ता को वास्तव में उन तत्वों का चयन करने की आवश्यकता होती है जो सर्वेक्षण के अधीन होंगे। इसके लिए उपयोग की जाने वाली विधि चुने गए नमूना प्रकार द्वारा निर्धारित की जाती है; प्रतिचयन विधियों की चर्चा करते समय, हम इसके तत्वों के चयन के बारे में भी बात करेंगे। और अंत में, शोधकर्ता को वास्तव में पहचाने गए उत्तरदाताओं की जांच करने की आवश्यकता होती है। इस स्तर पर, कई त्रुटियां करने की उच्च संभावना है।
अध्याय में इन समस्याओं और उनके समाधान के कुछ तरीकों पर चर्चा की गई है। 18.

नमूना योजनाओं के प्रकार (नमूनाकरण)

सभी नमूनाकरण विधियों को दो श्रेणियों में विभाजित किया जा सकता है: प्रायिकता नमूनों का अवलोकन और नियतात्मक नमूनों का अवलोकन। एक संभाव्य नमूने में, जनसंख्या के प्रत्येक सदस्य को एक निश्चित निर्दिष्ट गैर-शून्य संभावना के साथ शामिल किया जा सकता है। नमूने में जनसंख्या के कुछ सदस्यों को शामिल करने की संभावना भिन्न हो सकती है, लेकिन इसमें प्रत्येक तत्व को शामिल करने की संभावना ज्ञात है। यह संभावना नमूना सदस्यों का चयन करने के लिए उपयोग की जाने वाली एक विशेष यांत्रिक प्रक्रिया द्वारा निर्धारित की जाती है।

नियतात्मक नमूनों के लिए, नमूने में किसी भी तत्व को शामिल करने की संभावना का अनुमान लगाना असंभव हो जाता है। ऐसे नमूने की प्रतिनिधित्वशीलता की गारंटी नहीं दी जा सकती। उदाहरण के लिए, ऑलस्टेट कॉर्पोरेशन 14 मिलियन परिवारों (इसके ग्राहकों) के दावों के डेटा को संसाधित करने के लिए एक प्रणाली विकसित कर रहा था। कंपनी इस डेटा का उपयोग अपनी सेवाओं की मांग के पैटर्न को निर्धारित करने के लिए करने की योजना बना रही है, जैसे कि संभावना है कि मर्सिडीज बेंज के मालिक के पास एक छुट्टी घर भी होगा (जिसके लिए बीमा की आवश्यकता होगी)। हालाँकि डेटाबेस बहुत बड़ा है, कंपनी के पास इस संभावना का अनुमान लगाने का साधन नहीं है कि कोई विशेष ग्राहक दावा करेगा। इस प्रकार कंपनी यह सुनिश्चित नहीं कर सकती है कि दावा करने वाला ग्राहक डेटा कंपनी के सभी ग्राहकों का प्रतिनिधि है; और कुछ हद तक - संभावित ग्राहकों के संबंध में।

नमूना सदस्यों के लिए एक यांत्रिक चयन प्रक्रिया के बजाय, सभी नियतात्मक नमूने शोधकर्ता की व्यक्तिगत स्थिति, निर्णय या वरीयता पर आधारित होते हैं। ऐसी वरीयताएँ कभी-कभी जनसंख्या की विशेषताओं का अच्छा अनुमान दे सकती हैं, लेकिन कार्य के लिए नमूने की उपयुक्तता को निष्पक्ष रूप से निर्धारित करने का कोई तरीका नहीं है। नमूने के परिणामों की सटीकता का आकलन केवल तभी किया जा सकता है जब कुछ तत्वों के चयन की संभावना ज्ञात हो। इस कारण से, संभाव्यता नमूनाकरण के साथ काम करना आम तौर पर नमूनाकरण त्रुटि की भयावहता का आकलन करने के लिए एक बेहतर तरीका माना जाता है। नमूने को निश्चित आकार के नमूने और अनुक्रमिक नमूने में भी विभाजित किया जा सकता है। निश्चित आकार के नमूनों के साथ काम करते समय, नमूना आकार सर्वेक्षण शुरू होने से पहले निर्धारित किया जाता है, और परिणामों का विश्लेषण सभी आवश्यक डेटा के संग्रह से पहले होता है। हम मुख्य रूप से निश्चित आकार के नमूनों में रुचि लेंगे, क्योंकि इस प्रकार का आमतौर पर विपणन अनुसंधान में उपयोग किया जाता है।

सम्भाव्यता नमूनाचयन
एक नमूना जिसमें जनसंख्या के प्रत्येक तत्व को कुछ ज्ञात गैर-शून्य संभाव्यता के साथ शामिल किया जा सकता है।
नियतात्मक नमूनाकरण
कुछ विशेष प्राथमिकताओं या निर्णयों के आधार पर नमूनाकरण जो कुछ तत्वों के चयन को निर्धारित करता है; उसी समय, नमूने में जनसंख्या के मनमाने तत्व को शामिल करने की संभावना का अनुमान लगाना असंभव हो जाता है।

हालांकि, यह नहीं भूलना चाहिए कि अनुक्रमिक नमूने भी हैं जिनका उपयोग नीचे चर्चा की गई प्रत्येक बुनियादी नमूना डिजाइन के साथ किया जा सकता है।

अनुक्रमिक नमूने में, चयनित तत्वों की संख्या पहले से ज्ञात नहीं है, यह अनुक्रमिक निर्णयों की एक श्रृंखला के आधार पर निर्धारित किया जाता है। यदि एक छोटे से नमूने का सर्वेक्षण विश्वसनीय परिणाम नहीं देता है, तो जांच किए जाने वाले तत्वों की सीमा का विस्तार किया जाता है। यदि उसके बाद परिणाम अनिर्णायक रहता है, तो नमूना आकार फिर से बढ़ा दिया जाता है। प्रत्येक चरण में, यह निर्णय लिया जाता है कि क्या प्राप्त परिणाम को पर्याप्त रूप से ठोस माना जाए या डेटा एकत्र करना जारी रखा जाए या नहीं। अनुक्रमिक नमूनाकरण के साथ काम करने से डेटा की प्रवृत्ति (परिवर्तन की प्रवृत्ति) का आकलन करना संभव हो जाता है, क्योंकि वे एकत्र किए जाते हैं, जो उन मामलों में अतिरिक्त टिप्पणियों से जुड़ी लागतों को कम करता है जहां उनकी उपयोगिता शून्य हो जाती है।

संभाव्य और नियतात्मक दोनों नमूना योजनाएँ कई प्रकारों में आती हैं। उदाहरण के लिए, नियतात्मक नमूने गैर-प्रतिनिधि (सुविधाजनक), जानबूझकर या कोटा हो सकते हैं; संभाव्य नमूने सरल यादृच्छिक, स्तरीकृत या समूह (क्लस्टर) में विभाजित होते हैं, बदले में, उन्हें उपप्रकारों में विभाजित किया जा सकता है। अंजीर पर। चित्र 15.3 इस और अगले अध्याय में चर्चा किए जाने वाले नमूनों के प्रकारों को दर्शाता है।

फिक्स्ड सैंपल (फिक्स्ड सैंपल)
एक नमूना जिसका आकार प्राथमिकता निर्धारित किया जाता है; आवश्यक जानकारी चयनित तत्वों द्वारा निर्धारित की जाती है।
अनुक्रमिक नमूनाकरण
अनुक्रमिक निर्णयों की एक श्रृंखला के आधार पर गठित एक नमूना। यदि, एक छोटे नमूने पर विचार करने के बाद, परिणाम अनिर्णायक होता है, तो एक बड़े नमूने पर विचार किया जाता है; यदि इस कदम से परिणाम नहीं निकलता है, तो नमूना आकार फिर से बढ़ जाता है, आदि। इस प्रकार, प्रत्येक चरण में, यह निर्णय लिया जाता है कि प्राप्त परिणाम को पर्याप्त रूप से ठोस माना जा सकता है या नहीं।

यह याद रखना चाहिए कि मुख्य प्रकार के नमूनों को अधिक बनाने के लिए जोड़ा जा सकता है जटिल योजनाएँचयनात्मक अवलोकन। यदि आप उनके मूल प्रारंभिक प्रकारों को सीखते हैं, तो आपके लिए अधिक जटिल संयोजनों से निपटना आसान हो जाएगा।

नियतात्मक चयन

जैसा कि पहले ही उल्लेख किया गया है, नियतात्मक नमूने के तत्वों का चयन करते समय, निजी अनुमान या निर्णय निर्णायक भूमिका निभाते हैं। कभी-कभी ये आकलन शोधकर्ता से आते हैं, जबकि अन्य मामलों में जनसंख्या तत्वों का चयन फील्ड स्टाफ को दिया जाता है। चूंकि तत्वों को यंत्रवत् रूप से नहीं चुना जाता है, इसलिए नमूने में एक मनमाना तत्व शामिल करने की संभावना निर्धारित करना असंभव हो जाता है और तदनुसार, नमूनाकरण त्रुटि। चयनित नमूनाकरण प्रक्रिया के कारण त्रुटि की अज्ञानता शोधकर्ताओं को उनके अनुमानों की सटीकता का आकलन करने से रोकती है।

गैर-प्रतिनिधि (सुविधा) नमूने

गैर-प्रतिनिधि (सुविधा) नमूनेकभी-कभी यादृच्छिक के रूप में संदर्भित किया जाता है, चूंकि नमूना तत्वों का चयन "यादृच्छिक" तरीके से किया जाता है - उन तत्वों का चयन किया जाता है जो चयन अवधि के दौरान सबसे अधिक सुलभ होते हैं या दिखाई देते हैं।

हमारा दैनिक जीवन ऐसे चयनों के उदाहरणों से भरा पड़ा है। हम दोस्तों के साथ बात करते हैं और उनकी प्रतिक्रियाओं और स्थितियों के आधार पर हम समाज में व्याप्त राजनीतिक पूर्वाग्रहों के बारे में निष्कर्ष निकालते हैं; एक स्थानीय रेडियो स्टेशन लोगों को कुछ विवादास्पद मुद्दे पर अपनी राय व्यक्त करने के लिए प्रोत्साहित करता है, उनकी राय को प्रचलित माना जाता है; हम स्वयंसेवकों के सहयोग का आह्वान करते हैं और उन लोगों के साथ काम करते हैं जो स्वेच्छा से हमारी मदद करते हैं। सुविधा के नमूनों के साथ समस्या स्पष्ट है- हम निश्चित नहीं हो सकते कि इस प्रकार के नमूने वास्तव में लक्षित आबादी का प्रतिनिधित्व करते हैं। हम अभी भी संदेह कर सकते हैं कि हमारे मित्रों की राय समाज में प्रचलित राजनीतिक विचारों को सही ढंग से दर्शाती है, लेकिन हम अक्सर यह मानना चाहते हैं कि इस तरह से चुने गए बड़े नमूने प्रतिनिधि हैं। आइए हम एक उदाहरण के साथ इस तरह की धारणा की गिरावट को दिखाते हैं।
कुछ साल पहले, शहर के स्थानीय टेलीविजन स्टेशनों में से एक, जहां इस पुस्तक के लेखक रहते हैं, ने स्थानीय समुदाय के हित के विषयों पर एक दैनिक जनमत सर्वेक्षण किया। "द मैडिसन पल्स" नामक सर्वेक्षण निम्नानुसार आयोजित किए गए थे। हर शाम छह बजे समाचार के दौरान, स्टेशन ने दर्शकों से एक विशिष्ट विवादास्पद मुद्दे के संबंध में एक प्रश्न पूछा, जिसका सकारात्मक या नकारात्मक उत्तर देना आवश्यक था।

एक सकारात्मक उत्तर के मामले में, एक नकारात्मक उत्तर के मामले में - दूसरे फोन नंबर पर कॉल करना आवश्यक था। "के लिए" और "विरुद्ध" वोटों की संख्या स्वचालित रूप से गिना गया था। दस बजे के समाचार प्रसारण ने टेलीफोन सर्वेक्षण के परिणामों की सूचना दी। हर शाम 500 से 1000 के बीच लोगों ने स्टूडियो को इस या उस मुद्दे पर अपनी स्थिति व्यक्त करने के लिए बुलाया; टेलीविजन टिप्पणीकार ने मतदान के परिणामों की समाज में प्रचलित राय के रूप में व्याख्या की।

गैर-प्रतिनिधि (सुविधा) नमूना
कभी-कभी यादृच्छिक कहा जाता है, क्योंकि नमूना तत्वों का चयन "यादृच्छिक" तरीके से किया जाता है - उन तत्वों का चयन किया जाता है जो चयन अवधि के दौरान सबसे अधिक सुलभ होते हैं या दिखाई देते हैं।

छह घंटे के एक एपिसोड में, दर्शकों से निम्नलिखित प्रश्न पूछा गया: "क्या आपको नहीं लगता कि मैडिसन में शराब पीने की उम्र कम करके 18 कर दी जानी चाहिए?" मौजूदा कानूनी योग्यता 21 साल के अनुरूप है। दर्शकों ने असाधारण गतिविधि के साथ इस प्रश्न पर प्रतिक्रिया व्यक्त की - उस शाम लगभग 4,000 लोगों ने स्टूडियो को फोन किया, जिनमें से 78% आयु सीमा कम करने के पक्ष में थे। यह स्पष्ट प्रतीत होता है कि 4,000 का एक नमूना 180,000 के एक समुदाय का "प्रतिनिधि होना चाहिए"। ऐसा कुछ भी नहीं है। जैसा कि आप अनुमान लगा सकते हैं, कुछ आयु समूह दूसरों की तुलना में ज्ञात परिणामों में अधिक रुचि रखते थे। तदनुसार, यह आश्चर्य की बात नहीं थी कि कुछ सप्ताह बाद इस मुद्दे की चर्चा में, यह पता चला कि सर्वेक्षण के लिए आवंटित समय के दौरान छात्रों ने एक साथ काम किया। उन्होंने टेलीविजन को बारी-बारी से फोन किया, प्रत्येक ने कई बार। इस प्रकार, कानून के उदारीकरण के लिए न तो नमूना आकार और न ही अधिवक्ताओं का प्रतिशत आश्चर्यजनक था। नमूना प्रतिनिधि नहीं था।

केवल नमूना आकार बढ़ाने से यह प्रतिनिधि नहीं बन जाता है। नमूने का प्रतिनिधित्व आकार द्वारा नहीं, बल्कि तत्वों के चयन की उचित प्रक्रिया द्वारा सुनिश्चित किया जाता है। जब सर्वेक्षण प्रतिभागियों को स्वेच्छा से चुना जाता है या नमूना आइटम उनकी उपलब्धता के आधार पर चुने जाते हैं, तो नमूनाकरण योजना नमूने के प्रतिनिधित्व की गारंटी नहीं देती है। अनुभवजन्य साक्ष्य बताते हैं कि सुविधा के लिए चुने गए नमूने शायद ही कभी प्रतिनिधि होते हैं (उनके आकार की परवाह किए बिना)। टेलीफोन पोल, जो 800-900 वोट मानते हैं, बड़े लेकिन अप्रतिनिधि नमूनों का सबसे आम रूप है।

जानबूझकर नमूनाकरण
नियतात्मक (लक्षित) नमूनाकरण, जिसके तत्व मैन्युअल रूप से चुने गए हैं; उन तत्वों का चयन किया जाता है जो शोधकर्ता की राय में सर्वेक्षण के उद्देश्यों को पूरा करते हैं।
वांछित विशेषताओं के साथ उत्तरदाताओं के प्रारंभिक सेट को सेट करने के लिए शोधकर्ता की क्षमता के आधार पर जानबूझकर नमूनाकरण; फिर इन उत्तरदाताओं को सूचनार्थियों के रूप में उपयोग किया जाता है जो व्यक्तियों के आगे चयन का निर्धारण करते हैं।

दुर्भाग्य से, बहुत से लोग ऐसे सर्वेक्षणों के परिणामों को विश्वास के साथ मानते हैं। अंतर्राष्ट्रीय विपणन अनुसंधान में गैर-प्रतिनिधि नमूनों के उपयोग के सबसे विशिष्ट उदाहरणों में से कुछ देशों का सर्वेक्षण है, जो वर्तमान में उस देश के क्षेत्र में रहने वाले विदेशियों के नमूने पर आधारित है, जिसने सर्वेक्षण शुरू किया था (उदाहरण के लिए, स्कैंडिनेवियाई में रहने वाले) संयुक्त राज्य अमेरिका)। हालांकि इस तरह के नमूने विचाराधीन जनसंख्या के कुछ पहलुओं पर कुछ प्रकाश डाल सकते हैं, यह याद रखना चाहिए कि ये व्यक्ति आमतौर पर एक "अमेरिकीकृत" अभिजात वर्ग का प्रतिनिधित्व करते हैं, जिनके अपने देश के साथ संबंध मनमाने ढंग से हो सकते हैं। वर्णनात्मक या कारणात्मक सर्वेक्षणों के लिए गैर-प्रतिनिधि नमूनों के उपयोग की अनुशंसा नहीं की जाती है। वे केवल कुछ विचारों या विचारों के परीक्षण के उद्देश्य से खोजपूर्ण अनुसंधान में अनुमेय हैं, लेकिन इस मामले में भी जानबूझकर नमूनों का उपयोग करना बेहतर है।

जानबूझकर चयन

जानबूझकर नमूने को कभी-कभी कहा जाता है विकेन्द्रित; उनके तत्व, जो शोधकर्ता की राय में, अध्ययन के उद्देश्यों को पूरा करते हैं, मैन्युअल रूप से चुने जाते हैं। प्रोक्टर और जुआअपने सिनसिनाटी मुख्यालय के पास रहने वाले 13 से 17 वर्ष की आयु के लोगों को विज्ञापन दिखाते समय इस विधि का उपयोग किया। कंपनी के खाद्य और पेय विभाग ने किशोरों के इस समूह को एक प्रकार के उपभोक्ता नमूने के रूप में काम पर रखा है। $1,000 के बदले में सप्ताह में 10 घंटे काम करना और एक संगीत कार्यक्रम में जाना, उन्होंने टेलीविजन विज्ञापनों को देखा, उत्पाद प्रदर्शन देखने के लिए कंपनी प्रबंधकों के साथ सुपरमार्केट गए, नए उत्पादों का परीक्षण किया और खरीद व्यवहार पर चर्चा की। यादृच्छिक रूप से "नियुक्ति" की प्रक्रिया के माध्यम से नमूने के लिए प्रतिनिधियों का चयन करके, एक कंपनी उन लक्षणों पर ध्यान केंद्रित कर सकती है जिन्हें उपयोगी माना जाता है, जैसे किशोरों की खुद को स्पष्ट रूप से व्यक्त करने की क्षमता, जोखिम पर कि उनके विचार उनकी उम्र के प्रतिनिधि नहीं हो सकते हैं समूह।

जैसा कि पहले ही उल्लेख किया, बानगीजानबूझकर नमूनाकरण इसके तत्वों का एक दिशात्मक चयन है। कुछ मामलों में, नमूना वस्तुओं का चयन इसलिए नहीं किया जाता है क्योंकि वे प्रतिनिधि हैं, बल्कि इसलिए कि वे शोधकर्ताओं को उनकी रुचि की जानकारी प्रदान कर सकते हैं। जब अदालत किसी विशेषज्ञ की गवाही से निर्देशित होती है, तो यह एक निश्चित अर्थ में जानबूझकर चयन के उपयोग का सहारा लेती है। इसी तरह की स्थिति अनुसंधान परियोजनाओं के विकास में प्रबल हो सकती है। मुद्दे के प्रारंभिक अध्ययन के दौरान, शोधकर्ता मुख्य रूप से अध्ययन की संभावनाओं को निर्धारित करने में रुचि रखता है, जो नमूना तत्वों के चयन को निर्धारित करता है।

व्यापक नमूने लेनाविशिष्ट प्रकार की आबादी के साथ व्यवहार करते समय उपयोग किया जाने वाला एक प्रकार का जानबूझकर नमूनाकरण है। यह नमूना वांछित विशेषताओं के साथ उत्तरदाताओं के प्रारंभिक सेट को निर्दिष्ट करने की शोधकर्ता की क्षमता पर निर्भर करता है। इन उत्तरदाताओं को तब व्यक्तियों के आगे के चयन को निर्धारित करने के लिए सूचनार्थियों के रूप में उपयोग किया जाता है।

उदाहरण के लिए, कल्पना कीजिए कि एक कंपनी एक ऐसे उत्पाद की आवश्यकता का मूल्यांकन करना चाहती है जो बधिर लोगों को फोन पर संवाद करने की अनुमति दे। बधिर समुदाय में प्रमुख व्यक्तियों की पहचान करके शोधकर्ता इस समस्या को विकसित करना शुरू कर सकते हैं; उत्तरार्द्ध समूह के अन्य सदस्यों का नाम दे सकता है जो सर्वेक्षण में भाग लेने के लिए सहमत होंगे। इस रणनीति के साथ, नमूना स्नोबॉल की तरह बढ़ता है।

जबकि अनुसंधानकर्ता है प्रारम्भिक चरणसमस्या समाधान, जब नियोजित सर्वेक्षण की संभावनाओं और संभावित सीमाओं की पहचान की जाती है, तो सुविचारित नमूने का उपयोग बहुत प्रभावी हो सकता है। लेकिन किसी भी मामले में हमें इस प्रकार के नमूने की कमजोरियों के बारे में नहीं भूलना चाहिए, क्योंकि इसका उपयोग शोधकर्ता द्वारा वर्णनात्मक या कारणात्मक अध्ययन में भी किया जा सकता है, जो उनके परिणामों की गुणवत्ता को प्रभावित करने में धीमा नहीं होगा। इस भुलक्कड़पन का एक उत्कृष्ट उदाहरण उपभोक्ता मूल्य सूचकांक ("सीपीआई") है। जैसा कि सूडमैन बताते हैं ( सुदमन): "सीपीआई केवल 56 शहरों और महानगरीय क्षेत्रों के लिए निर्धारित है, जिसका चयन राजनीतिक कारक से भी प्रभावित होता है। वास्तव में, ये शहर केवल अपना प्रतिनिधित्व कर सकते हैं, जबकि सूचकांक कहा जाता है प्रति घंटा प्राप्त करने वाले नागरिकों के लिए उपभोक्ता मूल्य सूचकांक वेतन *, और कर्मचारीऔर संयुक्त राज्य अमेरिका के किसी भी क्षेत्र में मूल्य स्तर को दर्शाते हुए एक सूचकांक के रूप में अधिकांश लोगों को दिखाई देता है। खुदरा दुकानों का चुनाव भी गैर-यादृच्छिक रूप से किया जाता है, जिसके परिणामस्वरूप संभावित नमूनाकरण त्रुटि का आकलन असंभव हो जाता है» (हमारे इटैलिक) 2।

* अर्थात् कर्मयोगी। - टिप्पणी। प्रति।

कोटा के नमूने

नियतात्मक नमूनाकरण का तीसरा प्रकार - कोटा के नमूने; सर्वेक्षण की गई आबादी में कुछ विशेषताओं वाले तत्वों के समान अनुपात को शामिल करके इसकी ज्ञात प्रतिनिधित्व क्षमता प्राप्त की जाती है (देखें "अनुसंधान विंडो 15.1")। उदाहरण के तौर पर, कैंपस में रहने वाले छात्रों का एक प्रतिनिधि नमूना बनाने की कोशिश करने पर विचार करें। यदि 500 व्यक्तियों के एक निश्चित नमूने में एक भी वरिष्ठ छात्र नहीं है, तो हमें अध्ययन के तहत आबादी के लिए इस नमूने पर प्राप्त परिणामों को लागू करने की वैधता और वैधता पर संदेह करने का अधिकार होगा। आनुपातिक नमूने के साथ काम करते समय, शोधकर्ता यह सुनिश्चित कर सकता है कि नमूने में स्नातक छात्रों का अनुपात छात्रों की कुल संख्या में उनके अनुपात के अनुरूप हो।

मान लीजिए कि एक शोधकर्ता विश्वविद्यालय के छात्रों का एक चयनात्मक अध्ययन करता है, जबकि वह इस तथ्य में रुचि रखता है कि नमूना न केवल एक या दूसरे लिंग से संबंधित है, बल्कि पाठ्यक्रमों द्वारा उनका वितरण भी दर्शाता है। बता दें कि छात्रों की कुल संख्या 10,000: 3,200 नए, 2,600 द्वितीय वर्ष, 2,200 तृतीय वर्ष के छात्र और 2,000 चौथे वर्ष के छात्र हैं; जिनमें से 7,000 लड़के और 3,000 लड़कियां हैं। 1,000 लोगों के नमूने के लिए, आनुपातिक नमूना योजना के लिए 320 नए, 260 द्वितीय वर्ष, 220 तृतीय-वर्ष और 200 स्नातक, 700 लड़के और 300 लड़कियों की आवश्यकता होती है। शोधकर्ता प्रत्येक साक्षात्कारकर्ता को एक निश्चित कोटा देकर इस योजना को लागू कर सकता है, जो यह निर्धारित करेगा कि उसे किन छात्रों से संपर्क करना चाहिए।

कोटा नमूनानियतात्मक नमूना इस तरह से चुना जाता है कि कुछ विशेषताओं वाले नमूना तत्वों का अनुपात लगभग अध्ययन के तहत जनसंख्या में समान तत्वों के अनुपात से मेल खाता है; प्रत्येक क्षेत्र कार्यकर्ता को एक कोटा सौंपा गया है जो उस आबादी की विशेषताओं को निर्धारित करता है जिसके साथ उसे संपर्क करना चाहिए।

20 साक्षात्कार आयोजित करने वाले एक साक्षात्कारकर्ता को यह पूछने का निर्देश दिया जा सकता है:

छह प्रथम वर्ष के छात्र - पांच लड़के और एक लड़की;
छह परिष्कार - चार लड़के और दो लड़कियाँ;
तृतीय वर्ष के चार छात्र - तीन लड़के और एक लड़की;
चार चौथे वर्ष के छात्र - दो लड़के और दो लड़कियां।

ध्यान दें कि विशिष्ट नमूना तत्वों का चयन अनुसंधान योजना द्वारा निर्धारित नहीं किया जाता है, बल्कि साक्षात्कारकर्ता की पसंद से होता है, जिसे केवल उन शर्तों का पालन करने के लिए कहा जाता है जो कोटा द्वारा निर्धारित की गई थीं: साक्षात्कार पांच नए, एक नए व्यक्ति, आदि।

यह भी ध्यान दें कि यह कोटा छात्र आबादी के लिंग वितरण को सटीक रूप से दर्शाता है, लेकिन कुछ हद तक पाठ्यक्रमों में छात्रों के वितरण को विकृत करता है; 70% (20 में से 14) साक्षात्कार लड़कों के साथ होते हैं, लेकिन केवल 30% (20 में से 6) प्रथम वर्ष के छात्रों के साथ होते हैं, जबकि वे कुल छात्रों की संख्या का 32% होते हैं। प्रत्येक व्यक्तिगत साक्षात्कारकर्ता को आवंटित कोटा जनसंख्या में नियंत्रण विशेषताओं के वितरण को प्रतिबिंबित नहीं कर सकता है, और आमतौर पर नहीं करता है - केवल अंतिम नमूना आनुपातिक होना चाहिए।

यह याद रखना चाहिए कि आनुपातिक नमूनाकरण वस्तुनिष्ठ नमूनाकरण प्रक्रिया की तुलना में व्यक्तिगत, व्यक्तिपरक दृष्टिकोण या निर्णय पर अधिक निर्भर करता है। इसके अलावा, जानबूझकर नमूनाकरण के विपरीत, यहां व्यक्तिगत निर्णय परियोजना डेवलपर के लिए नहीं बल्कि साक्षात्कारकर्ता के लिए है। सवाल उठता है कि क्या आनुपातिक नमूनों को प्रतिनिधि माना जा सकता है, भले ही वे आबादी में निहित घटकों के अनुपात को पुन: पेश करते हैं जिनकी कुछ नियंत्रण विशेषताएं हैं। इस संबंध में, तीन टिप्पणियां करने की आवश्यकता है।

सबसे पहले, नमूना कुछ अन्य महत्वपूर्ण विशेषताओं में जनसंख्या से बहुत अलग हो सकता है, जो परिणाम पर गंभीर प्रभाव डाल सकता है। उदाहरण के लिए, यदि अध्ययन छात्रों के बीच नस्लीय पूर्वाग्रह की समस्या के लिए समर्पित है, तो यह उदासीन परिस्थिति नहीं हो सकती है कि उत्तरदाता कहाँ से आए हैं: शहर से या ग्रामीण इलाकों से। चूंकि "शहर/ग्रामीण से" विशेषता के लिए कोटा निर्दिष्ट नहीं किया गया है, इसलिए इस विशेषता का सटीक प्रतिनिधित्व असंभव हो जाता है। बेशक, ऐसा एक विकल्प है: सभी संभावित महत्वपूर्ण विशेषताओं के लिए कोटा निर्धारित करना। हालांकि, नियंत्रण विशेषताओं की संख्या में वृद्धि विनिर्देश की जटिलता की ओर ले जाती है। यह, बदले में, जटिल बनाता है - और कभी-कभी इसे असंभव भी बनाता है - नमूना तत्वों का चयन और, किसी भी मामले में, इसकी कीमत में वृद्धि होती है। यदि, उदाहरण के लिए, किसी शहर से संबंधित है या ग्रामीण आबादीऔर सामाजिक आर्थिक स्थिति भी अध्ययन के लिए प्रासंगिक हैं, साक्षात्कारकर्ता को प्रथम वर्ष के छात्र की तलाश करनी पड़ सकती है जो शहरी और उच्च या मध्यम वर्ग का हो। मैं मानता हूं कि सिर्फ एक पुरुष फ्रेशमैन को ढूंढना ज्यादा आसान है।

दूसरे, यह सुनिश्चित करना बहुत कठिन है कि यह नमूना वास्तव में प्रतिनिधि है। बेशक, आप यह देखने के लिए नमूने की जांच कर सकते हैं कि क्या उन विशेषताओं का वितरण जो नियंत्रण में शामिल नहीं हैं, जनसंख्या में उनका वितरण। हालांकि, इस तरह के परीक्षण से केवल नकारात्मक निष्कर्ष निकल सकते हैं। वितरण के केवल विचलन को प्रकट करना संभव है। यदि इन विशेषताओं में से प्रत्येक के लिए नमूने और जनसंख्या के वितरण एक दूसरे को दोहराते हैं, तो एक संभावना है कि नमूना किसी अन्य विशेषता में जनसंख्या से भिन्न हो, जो स्पष्ट रूप से निर्दिष्ट नहीं है।

और अंत में, तीसरा। साक्षात्कारकर्ता, अपने स्वयं के उपकरणों पर छोड़े जाने के कारण, कुछ कार्यों के लिए प्रवृत्त होते हैं। वे भी अक्सर अपने दोस्तों से पूछताछ करने का सहारा लेते हैं। चूंकि वे अक्सर स्वयं साक्षात्कारकर्ताओं की तरह हो जाते हैं, इसलिए त्रुटि का खतरा होता है। इंग्लैंड के साक्ष्य बताते हैं कि कोटा के नमूने निम्न हैं:

सबसे सुलभ तत्वों की भूमिका का अतिशयोक्ति;
छोटे परिवारों की भूमिका को कम करके आंकना;
बच्चों वाले परिवारों की भूमिका का अतिशयोक्ति;
औद्योगिक श्रमिकों की भूमिका को कम करके आंकना;
उच्चतम और निम्नतम आय वाले लोगों की भूमिका को कम करके आंकना;
खराब शिक्षित नागरिकों की भूमिका को कम करके आंकना;
निम्न सामाजिक स्थिति पर कब्जा करने वाले व्यक्तियों की भूमिका को कम करना।

साक्षात्कारकर्ता जो यादृच्छिक राहगीरों को रोककर पूर्व निर्धारित कोटा का चयन करते हैं, संभावित उत्तरदाताओं की बड़ी संख्या वाले क्षेत्रों पर ध्यान केंद्रित करने की संभावना है, जैसे खरीदारी केन्द्र, रेलवे स्टेशन और हवाई अड्डे, बड़े सुपरमार्केट और इसी तरह के प्रवेश द्वार। इस अभ्यास से उन लोगों के समूहों का अधिक प्रतिनिधित्व होता है जो ऐसी जगहों पर अक्सर जाते हैं। जब घर के दौरे की आवश्यकता होती है, तो साक्षात्कारकर्ता अक्सर सुविधा से प्रेरित होते हैं।
उदाहरण के लिए, वे केवल दिन के दौरान सर्वेक्षण कर सकते हैं, जिससे श्रमिकों की राय को कम करके आंका जाता है। अन्य बातों के अलावा, वे जर्जर इमारतों में प्रवेश नहीं करते हैं और, एक नियम के रूप में, उन इमारतों की ऊपरी मंजिलों तक नहीं जाते हैं जिनमें लिफ्ट नहीं है।

अध्ययन के तहत समस्या की बारीकियों के आधार पर, ये प्रवृत्तियाँ विभिन्न प्रकार की त्रुटियों को जन्म दे सकती हैं, लेकिन डेटा विश्लेषण के स्तर पर उन्हें ठीक करना बहुत कठिन लगता है। दूसरी ओर, नमूना तत्वों के एक वस्तुनिष्ठ चयन के साथ, शोधकर्ताओं के पास उनके निपटान में कुछ उपकरण हैं जो किसी दिए गए नमूने की प्रतिनिधित्व क्षमता का आकलन करने की प्रक्रिया को सरल बनाना संभव बनाते हैं। ऐसे नमूनों की प्रतिनिधित्व क्षमता की समस्या का विश्लेषण करते समय, शोधकर्ता नमूने की संरचना को इतना अधिक नहीं मानता जितना कि इसके तत्वों के चयन की प्रक्रिया।

रिसर्च विंडो: शानदार! लेकिन इसे कौन पढ़ेगा?

हर साल, विज्ञापनदाता लाखों डॉलर उन विज्ञापनों पर खर्च करते हैं जो विज्ञापन युग से लेकर यांकी तक अनगिनत प्रकाशनों के पन्नों पर दिखाई देते हैं। पाठ और छवि का एक निश्चित मूल्यांकन इसके प्रकाशन से पहले किया जा सकता है, जैसा कि वे कहते हैं, घर पर, एक विज्ञापन एजेंसी में; विज्ञापन प्रकाशित होने के बाद तक इसका वास्तव में परीक्षण और न्याय नहीं किया जाता है, पाठक के ध्यान के लिए समान रूप से सावधानीपूर्वक तैयार किए गए दर्जनों विज्ञापनों से घिरा हुआ है।

कंपनी दुनिया भर में रोपर स्टार्चउपभोक्ता, व्यापार, व्यापार और पेशेवर पत्रिकाओं और समाचार पत्रों में रखे गए विज्ञापनों की पठनीयता का मूल्यांकन करता है। अनुसंधान के परिणाम विज्ञापनदाताओं और एजेंसियों के ध्यान में लाए जाते हैं - बेशक, एक उचित शुल्क के लिए। क्योंकि विज्ञापनदाता अपने विज्ञापनों को उपभोक्ता, कंपनी तक पहुँचाने के लिए हर दिन बड़ी लंबाई में जाते हैं स्टार्चएक नमूना बनाने का फैसला किया जो ग्राहकों को विज्ञापन की प्रभावशीलता के बारे में समय पर और सटीक जानकारी देगा। हर साल कंपनी स्टार्चलगभग 20,000 विज्ञापनों पर विचार करते हुए, 50,000 से अधिक लोगों का साक्षात्कार लिया। सालाना लगभग 500 व्यक्तिगत प्रकाशनों का अध्ययन किया गया।

स्टार्च ने एक लिंग के न्यूनतम 100 पाठकों और दूसरे लिंग के 100 पाठकों के साथ आनुपातिक नमूनाकरण का उपयोग किया। स्टार्च ने निष्कर्ष निकाला कि इस नमूना आकार के साथ, पठनीयता के स्तर में मुख्य विचलन स्थिर हो गए। 18 वर्ष से अधिक आयु के पाठकों का व्यक्तिगत रूप से साक्षात्कार किया गया था, और सभी प्रकाशनों पर विचार किया गया था, विशेष आबादी के लिए अभिप्रेत लोगों को छोड़कर (जैसे, उपयुक्त आयु की लड़कियों का सत्रह पत्रिका के प्रकाशनों का मूल्यांकन करने के लिए साक्षात्कार किया गया था)।

सर्वेक्षण करते समय, किसी विशेष प्रकाशन के वितरण क्षेत्र को ध्यान में रखा गया। मान लीजिए कि लॉस एंजिल्स पत्रिका के अध्ययन ने दक्षिणी कैलिफोर्निया में रहने वाले पाठकों को देखा। "समय" का राष्ट्रव्यापी अध्ययन किया गया था। सर्वेक्षण पत्रिका के अलग-अलग मुद्दों के लिए समर्पित था और एक ही समय में 20-30 शहरों में आयोजित किया गया था।

प्रत्येक साक्षात्कारकर्ता को साक्षात्कारों का एक छोटा कोटा दिया गया था, जो सर्वेक्षण परिणामों के विचलन को कम करने के उद्देश्य से कार्य करता था। विभिन्न आय वाले विभिन्न व्यवसायों और आयु के लोगों के बीच प्रश्नावली वितरित की गई। इस तरह के प्रत्येक अध्ययन ने काफी व्यापक पाठकों के लिए पदों को प्रस्तुत करना संभव बना दिया। कई पेशेवर, व्यावसायिक और उद्योग प्रकाशनों पर विचार करते समय, उनकी सदस्यता और वितरण की बारीकियों को भी ध्यान में रखा गया। काफी संकीर्ण संचलन वाले प्रकाशनों को समर्पित सदस्यता सूची ने स्वीकार्य उत्तरदाताओं का चयन करना संभव बना दिया।

प्रत्येक सर्वेक्षण में, साक्षात्कारकर्ताओं ने उत्तरदाताओं से प्रकाशन के माध्यम से ब्राउज़ करने के लिए कहा और पूछा कि क्या उन्होंने कोई विज्ञापन देखा है। यदि उत्तर हां था, तो रजिस्ट्रार ने विज्ञापन की स्वीकृति की डिग्री का आकलन करने के लिए कई प्रश्न पूछे।

यह आकलन तीन गुना हो सकता है:

ध्यान दें: जिन्होंने पहले ही इस तरह की घोषणा के प्रकट होने के तथ्य पर ध्यान दिया है।
परिचित: जिन्हें विज्ञापन के किसी भी हिस्से को याद है जिसमें यह विज्ञापित के बारे में था ट्रेडमार्कया विज्ञापनदाता के बारे में।
पढ़ें: विज्ञापन का कम से कम आधा हिस्सा पढ़ने वाले लोग।

सभी विज्ञापनों की जांच के बाद, साक्षात्कारकर्ताओं ने मुख्य वर्गीकरण जानकारी दर्ज की: लिंग, आयु, व्यवसाय, पारिवारिक स्थिति, राष्ट्रीयता, आय, आकार और परिवार की संरचना, जिसने पाठक हित की डिग्री के क्रॉस-सारणी की अनुमति दी।

जब ठीक से उपयोग किया जाता है, तो कंपनी डेटा स्टार्चविज्ञापनदाताओं और एजेंसियों को असफल और सफल दोनों प्रकार की विज्ञापन योजनाओं की पहचान करने की अनुमति दें जो पाठक का ध्यान आकर्षित करती हैं और उनका ध्यान खींचती हैं। इस तरह की जानकारी उन विज्ञापनदाताओं के लिए अत्यंत मूल्यवान है जो मुख्य रूप से अपने विज्ञापन अभियान की प्रभावशीलता में रुचि रखते हैं।

स्रोत: रोपर स्टार्च वर्ल्डवाइड, ममरोनेक, एनवाई 10543।

संभाव्यता के नमूने

शोधकर्ता संभाव्यता नमूने में जनसंख्या के किसी भी तत्व को शामिल करने की संभावना निर्धारित कर सकता है, क्योंकि इसके तत्वों का चयन कुछ वस्तुनिष्ठ प्रक्रिया के आधार पर किया जाता है और यह शोधकर्ता या क्षेत्र कार्यकर्ता की सनक और पूर्वाग्रहों पर निर्भर नहीं करता है। चूंकि तत्व चयन प्रक्रिया वस्तुनिष्ठ है, शोधकर्ता प्राप्त परिणामों की विश्वसनीयता का मूल्यांकन कर सकता है, जो नियतात्मक नमूनों के मामले में असंभव था, चाहे बाद के तत्वों का चयन कितना भी सावधानी से किया गया हो।

यह नहीं सोचा जाना चाहिए कि संभाव्य नमूने हमेशा नियतात्मक लोगों की तुलना में अधिक प्रतिनिधि होते हैं। वास्तव में, नियतात्मक नमूना भी अधिक प्रतिनिधि हो सकता है। संभाव्यता नमूने का लाभ यह है कि वे संभावित नमूनाकरण त्रुटि का अनुमान लगाने की अनुमति देते हैं। यदि शोधकर्ता नियतात्मक नमूने के साथ काम करता है, तो उसके पास अध्ययन के उद्देश्यों के लिए इसकी पर्याप्तता का आकलन करने के लिए एक वस्तुनिष्ठ तरीका नहीं है।

सामान्य उद्देश्यरहित नमूना

अधिकांश लोगों को साधारण यादृच्छिक नमूने किसी न किसी रूप में मिलते हैं, या तो संस्थान में एक सांख्यिकी पाठ्यक्रम के भाग के रूप में, या समाचार पत्रों या पत्रिकाओं में प्रासंगिक अध्ययनों के परिणामों के बारे में पढ़कर। एक साधारण यादृच्छिक नमूने में, नमूने में शामिल प्रत्येक तत्व में अध्ययन के तहत तत्वों के बीच होने की समान संभावना होती है, और मूल जनसंख्या में तत्वों का कोई भी संयोजन संभावित रूप से एक नमूना बन सकता है। उदाहरण के लिए, यदि हम किसी विशेष कॉलेज में नामांकित सभी छात्रों का एक सरल यादृच्छिक नमूना बनाना चाहते हैं, तो हमें बस सभी छात्रों की एक सूची बनाने की आवश्यकता है, इसमें प्रत्येक नाम के लिए एक संख्या निर्दिष्ट करें, और एक कंप्यूटर का उपयोग यादृच्छिक रूप से दिए गए चयन के लिए करें। तत्वों की संख्या।

जनसंख्या

जनसंख्या
कुछ निश्चित शर्तों को पूरा करने वाले तत्वों का एक समूह; इसे अध्ययन (लक्ष्य) जनसंख्या भी कहा जाता है।
पैरामीटर
सामान्य या अध्ययनित जनसंख्या की एक निश्चित विशेषता या संकेतक।

सामान्य, या अध्ययन, सेटवह संग्रह है जिससे चयन किया जाता है। इस जनसंख्या (जनसंख्या) को कई विशिष्ट मापदंडों द्वारा वर्णित किया जा सकता है जो सामान्य जनसंख्या की विशेषताएं हैं, जिनमें से प्रत्येक एक निश्चित मात्रात्मक संकेतक है जो एक जनसंख्या को दूसरे से अलग करता है।

कल्पना कीजिए कि अध्ययन की जा रही जनसंख्या सिनसिनाटी की पूरी वयस्क आबादी है। इस जनसंख्या का वर्णन करने के लिए, कई मापदंडों का उपयोग किया जा सकता है: औसत आयु, जनसंख्या का अनुपात उच्च शिक्षा, आय स्तर, आदि। कृपया ध्यान दें कि इन सभी संकेतकों का एक निश्चित मूल्य है। बेशक, हम अध्ययन के तहत जनसंख्या की पूरी जनगणना करके उनकी गणना कर सकते हैं। आमतौर पर, हालांकि, हम योग्यता पर भरोसा नहीं करते हैं, लेकिन जनसंख्या के आवश्यक मापदंडों को निर्धारित करने के लिए चयनात्मक अवलोकन के दौरान प्राप्त मूल्यों का चयन और उपयोग करते हैं।

हम बताते हैं कि तालिका में क्या कहा गया है। 15.1 20 लोगों की काल्पनिक आबादी का एक उदाहरण। इस तरह की छोटी काल्पनिक आबादी के साथ काम करने के कई फायदे हैं। सबसे पहले, छोटा सा नमूना आकार उन जनसंख्या मापदंडों की गणना करना आसान बनाता है जिनका उपयोग इसका वर्णन करने के लिए किया जा सकता है। दूसरे, यह खंड आपको यह समझने की अनुमति देता है कि जब एक विशेष प्रतिचयन योजना को अपनाया जाता है तो क्या हो सकता है। इन दोनों विशेषताओं से नमूने के परिणामों की "सत्य" और इस मामले में तुलना करना आसान हो जाता है ज्ञात मूल्यएक विशिष्ट स्थिति के बारे में नहीं कहा जा सकता है जिसमें सेट का वास्तविक मूल्य अज्ञात है। इस मामले में "सही" मूल्य के साथ मूल्यांकन की तुलना विशेष स्पष्टता प्राप्त करती है।

मान लीजिए कि हम दो बेतरतीब ढंग से चुनी गई वस्तुओं से, मूल जनसंख्या में व्यक्तियों की औसत आय का अनुमान लगाना चाहते हैं। औसत आय इसका पैरामीटर होगा। इस औसत मूल्य का अनुमान लगाने के लिए, जिसे हम μ के रूप में निरूपित करते हैं, हमें सभी मानों के योग को उनकी संख्या से विभाजित करना चाहिए:

जनसंख्या माध्य μ = जनसंख्या तत्वों का योग / तत्वों की संख्या।

हमारे मामले में, गणना देते हैं:

व्युत्पन्न जनसंख्या

व्युत्पन्न जनसंख्यासभी संभावित नमूने शामिल होते हैं जिन्हें किसी दिए गए नमूनाकरण योजना (नमूना योजना) के अनुसार सामान्य जनसंख्या से चुना जा सकता है। आंकड़ेनमूने की एक विशेषता या संकेतक है। नमूना आँकड़ा मान का उपयोग किसी विशेष जनसंख्या पैरामीटर का अनुमान लगाने के लिए किया जाता है। अलग-अलग नमूने एक ही जनसंख्या पैरामीटर के लिए अलग-अलग आँकड़े या अनुमान प्रदान करते हैं।

व्युत्पन्न जनसंख्या
सभी संभावित अलग-अलग नमूनों का सेट जो किसी दिए गए नमूनाकरण योजना के अनुसार सामान्य आबादी से चुने जा सकते हैं। सांख्यिकी एक नमूने की एक विशेषता या माप।

उन सभी संभावित नमूनों के व्युत्पन्न सेट पर विचार करें जिन्हें 20 व्यक्तियों की हमारी काल्पनिक आबादी से एक नमूना योजना द्वारा चुना जा सकता है जो मानता है कि नमूना आकार है एन = 2यादृच्छिक गैर-दोहराव चयन द्वारा प्राप्त किया जा सकता है।

एक पल के लिए मान लीजिए कि जनसंख्या की प्रत्येक इकाई के लिए डेटा - हमारे मामले में, किसी व्यक्ति का नाम और आय - हलकों पर लिखा जाता है, जिसके बाद उन्हें एक जग में उतारा जाता है और मिलाया जाता है। शोधकर्ता एक सर्कल को जग से निकालता है, उसमें से जानकारी लिखता है और एक तरफ रख देता है। वह जग से लिए गए दूसरे मग के साथ भी ऐसा ही करता है। फिर शोधकर्ता दोनों मगों को जग में लौटाता है, इसकी सामग्री को मिलाता है और क्रियाओं के समान क्रम को दोहराता है। तालिका में। 15.2 नामित प्रक्रिया के संभावित परिणामों को दर्शाता है। 20 हलकों के लिए, 190 ऐसे युग्म संयोजन संभव हैं।

प्रत्येक संयोजन के लिए, आप औसत आय की गणना कर सकते हैं। नमूने के लिए कहते हैं एबी (के = 1)

क-ई नमूना माध्य = नमूनों का योग / नमूनों की संख्या =

अंजीर पर। 15.4 पूरी आबादी के लिए औसत आय का अनुमान और नमूने के लिए प्रत्येक अनुमान के लिए त्रुटि की मात्रा दिखाता है के = 25, 62,108,147और 189 .

नमूना औसत आय (सांख्यिकी) और जनसंख्या माध्य आय (एक पैरामीटर जिसे अनुमानित करने की आवश्यकता है) के बीच संबंध पर विचार करने के लिए आगे बढ़ने से पहले, आइए व्युत्पन्न जनसंख्या के बारे में कुछ शब्द कहें। सबसे पहले, व्यवहार में हम इस तरह के समुच्चय को संकलित नहीं करते हैं। इसमें बहुत अधिक समय और प्रयास की आवश्यकता होगी। व्यवसायी आवश्यक आकार के केवल एक नमूने को संकलित करने तक सीमित है। शोधकर्ता प्रयोग करता है अवधारणाव्युत्पन्न जनसंख्या और अंतिम निष्कर्ष तैयार करते समय नमूनाकरण वितरण की संबंधित अवधारणा।

नीचे कैसे दिखाया जाएगा। दूसरे, यह याद रखना चाहिए कि एक व्युत्पन्न जनसंख्या को सभी संभावित विभिन्न नमूनों की समग्रता के रूप में परिभाषित किया जाता है, जिन्हें किसी दिए गए नमूनाकरण योजना के अनुसार सामान्य जनसंख्या से चुना जा सकता है। जब प्रतिचयन योजना का कोई भाग बदला जाता है, तो व्युत्पन्न जनसंख्या भी बदल जाती है। इसलिए, यदि, हलकों को चुनते समय, शोधकर्ता दूसरे को हटाने से पहले हटाए गए डिस्क में से पहला जग में लौटाता है, तो व्युत्पन्न सेट में शामिल होगा।

नमूने AA, BB, आदि। यदि गैर-दोहराए गए नमूनों की संख्या 2 के बजाय 3 है, तो एबीसी प्रकार के नमूने होंगे, और उनमें से 1140 होंगे, न कि 190, जैसा कि पिछले मामले में था। जब नमूने के तत्वों को निर्धारित करने के लिए सरल यादृच्छिक चयन को किसी अन्य विधि में बदल दिया जाता है, तो व्युत्पन्न जनसंख्या भी बदल जाती है।

यह भी याद रखना चाहिए कि सामान्य आबादी से किसी दिए गए आकार के नमूने का चयन व्युत्पन्न आबादी से एक तत्व (190 में से 1) के चयन के बराबर है। यह तथ्य हमें कई सांख्यिकीय निष्कर्ष निकालने की अनुमति देता है।

नमूना माध्य और सामान्य माध्य

क्या हम वास्तविक जनसंख्या माध्य के साथ नमूना माध्य की बराबरी कर सकते हैं? किसी भी मामले में, हम इस तथ्य से आगे बढ़ते हैं कि वे आपस में जुड़े हुए हैं। हालाँकि, हम यह भी मानते हैं कि कोई त्रुटि होगी। उदाहरण के लिए, यह माना जा सकता है कि इंटरनेट उपयोगकर्ताओं से प्राप्त जानकारी "साधारण" आबादी के सर्वेक्षण के परिणामों से काफी भिन्न होगी। अन्य मामलों में, हम काफी सटीक मिलान मान सकते हैं, अन्यथा हम सामान्य मूल्य का अनुमान लगाने के लिए नमूना मूल्य का उपयोग नहीं कर सकते। लेकिन ऐसा करने में हमसे कितनी बड़ी गलती हो सकती है?

तालिका में निहित सभी नमूना साधनों को जोड़ते हैं। 15.2, और परिणामी योग को नमूनों की संख्या से विभाजित करें, यानी, औसत औसत करें।
हमें निम्नलिखित परिणाम प्राप्त होंगे:

यह सामान्य आबादी के औसत मूल्य के साथ मेल खाता है। उनका कहना है कि इस मामले में हम निपट रहे हैं निष्पक्ष आँकड़ा.

एक आँकड़ा निष्पक्ष कहलाता है यदि सभी संभावित नमूनों में इसका औसत अनुमानित जनसंख्या पैरामीटर के बराबर है। ध्यान दें कि हम यहां किसी विशेष मूल्य के बारे में बात नहीं कर रहे हैं।आंशिक अनुमान वास्तविक मान से बहुत दूर हो सकता है - उदाहरण के लिए, AB या ST नमूने लें। कुछ मामलों में, किसी भी संभावित नमूने पर विचार करते समय जनसंख्या का सही मूल्य प्राप्त नहीं हो सकता है, भले ही आँकड़े निष्पक्ष हों। हमारे मामले में, यह मामला नहीं है: कई संभावित नमूने - उदाहरण के लिए, एटी - वास्तविक जनसंख्या माध्य के बराबर एक नमूना माध्य देता है।

इन नमूना अनुमानों के वितरण और विशेष रूप से अनुमानों के इस फैलाव और जनसंख्या में आय के स्तर में भिन्नता के बीच संबंध पर विचार करना समझ में आता है। सामान्य जनसंख्या के विचरण का उपयोग भिन्नता के माप के रूप में किया जाता है। सामान्य जनसंख्या के विचरण को निर्धारित करने के लिए, हमें माध्य से प्रत्येक मान के विचलन की गणना करनी चाहिए, सभी विचलनों के वर्गों को जोड़ना चाहिए और परिणामी राशि को शब्दों की संख्या से विभाजित करना चाहिए। सामान्य जनसंख्या के प्रसरण को a ^ से निरूपित करें। तब:

जनसंख्या विचरण σ 2 = प्रत्येक तत्व के वर्ग अंतर का योग
जनसंख्या और जनसंख्या औसत / जनसंख्या तत्वों की संख्या =

फैलाव औसत मूल्यआय स्तर को इसी तरह परिभाषित किया जा सकता है। अर्थात्, हम प्रत्येक माध्य के विचलन को उनके कुल माध्य से निर्धारित करके, विचलनों के वर्गों का योग करके, और परिणामी योग को शब्दों की संख्या से विभाजित करके प्राप्त कर सकते हैं।

हम आम जनसंख्या में आय के स्तर के विचरण का उपयोग करके औसत आय स्तर के विचरण को दूसरे तरीके से भी परिभाषित कर सकते हैं, क्योंकि इन दो मात्राओं के बीच सीधा संबंध है। सटीक होने के लिए, ऐसे मामलों में जहां नमूना जनसंख्या के केवल एक छोटे हिस्से का प्रतिनिधित्व करता है, नमूना माध्य का भिन्नता नमूना आकार से विभाजित जनसंख्या के भिन्नता के बराबर है:

जहां σ x 2 आय स्तर के औसत नमूना मूल्य का भिन्नता है, σ 2 सामान्य जनसंख्या में आय स्तर का भिन्नता है, एन- नमूने का आकार।

अब आइए सामान्य आबादी में मात्रात्मक विशेषता के वितरण के साथ परिणामों के वितरण की तुलना करें। चित्र 15.5 से पता चलता है कि बॉक्स ए में दिखाए गए जनसंख्या विशेषता का वितरण बहु-शिखर है (20 मानों में से प्रत्येक केवल एक बार प्रकट होता है) और 9400 के वास्तविक जनसंख्या माध्य के बारे में सममित है।

नमूने का वितरण
किसी दिए गए नमूनाकरण योजना के तहत आबादी से निकाले जा सकने वाले सभी संभावित अलग-अलग नमूने के लिए गणना की गई किसी विशेष आंकड़े के मूल्यों का वितरण।

फ़ील्ड बी में दिखाए गए ग्रेड का वितरण तालिका में डेटा पर आधारित है। 15.3, जो बदले में तालिका से मान निर्दिष्ट करके संकलित किया गया था। समूह में उनकी संख्या की बाद की गणना के साथ, उनके आकार के आधार पर एक या दूसरे समूह को 15.2। फ़ील्ड बी एक पारंपरिक हिस्टोग्राम है, जिसे सांख्यिकी पाठ्यक्रम के अध्ययन की शुरुआत में माना जाता है, जो प्रतिनिधित्व करता है नमूने का वितरणआँकड़े। हम निम्नलिखित पारित करते हुए ध्यान देते हैं: नमूनाकरण वितरण की अवधारणा आंकड़ों की सबसे महत्वपूर्ण अवधारणा है, यह सांख्यिकीय अनुमानों के निर्माण की आधारशिला है। अध्ययन किए गए आँकड़ों के ज्ञात नमूना वितरण के अनुसार, हम सामान्य जनसंख्या के संगत पैरामीटर के बारे में निष्कर्ष निकाल सकते हैं। यदि, दूसरी ओर, यह केवल ज्ञात है कि नमूना अनुमान नमूने से नमूने में बदलता है, लेकिन इस परिवर्तन की प्रकृति अज्ञात है, तो इस अनुमान से जुड़ी नमूना त्रुटि को निर्धारित करना असंभव हो जाता है। चूंकि एक अनुमान का नमूना वितरण वर्णन करता है कि यह नमूने से नमूने में कैसे बदलता है, यह नमूना अनुमान की वैधता निर्धारित करने के लिए एक आधार प्रदान करता है। यह इस कारण से है कि संभाव्यता नमूनाकरण डिजाइन सांख्यिकीय अनुमान के लिए बहुत महत्वपूर्ण है।

नमूने में जनसंख्या के प्रत्येक सदस्य को शामिल करने की ज्ञात संभावनाओं को देखते हुए, साक्षात्कारकर्ता विभिन्न आँकड़ों का नमूना वितरण पा सकते हैं। यह ऐसे वितरण हैं जिन पर शोधकर्ता भरोसा करते हैं - चाहे वह नमूना माध्य हो, नमूना का अनुपात, नमूना भिन्नता, या कुछ अन्य आंकड़े - जब सामान्य आबादी के लिए नमूना अवलोकन के परिणाम का विस्तार किया जाता है। यह भी ध्यान दें कि आकार 2 के नमूने के लिए, नमूना माध्य का वितरण असमान है और वास्तविक माध्य के बारे में सममित है।

तो हमने दिखाया है कि:

सभी संभावित नमूना माध्यों का माध्य सामान्य माध्य के बराबर है।
नमूने के साधनों का विचरण किसी तरह से सामान्य विचरण से संबंधित है।
नमूना साधनों का वितरण असमान है, जबकि सामान्य आबादी में मात्रात्मक विशेषता के मूल्यों का वितरण बहु-मोडल है।

केंद्रीय सीमा प्रमेय

एक प्रमेय कह रहा है कि आकार के साधारण यादृच्छिक नमूने के लिए एन, बड़े पैमाने पर सामान्य औसत μ और विचरण σ 2 के साथ सामान्य आबादी से अलग एननमूना माध्य x का वितरण μ के बराबर केंद्र और एक भिन्नता σ 2 के साथ सामान्य हो जाता है। इस सन्निकटन की सटीकता बढ़ने के साथ बढ़ती है एन.

केंद्रीय सीमा प्रमेय। अनुमानों के असमान वितरण को केंद्रीय सीमा प्रमेय की अभिव्यक्ति के रूप में माना जा सकता है, जिसमें कहा गया है कि मात्रा के सरल यादृच्छिक नमूने के लिए एन, बड़े के लिए सही मतलब μ और विचरण σ 2 के साथ सामान्य आबादी से चुना गया एननमूने का वितरण सही मतलब के बराबर केंद्र के साथ सामान्य दृष्टिकोण और नमूना आकार के जनसंख्या भिन्नता के अनुपात के बराबर एक भिन्नता है, यानी:

यह सन्निकटन अधिक से अधिक सटीक हो जाता है एन. यह याद रखना। जनसंख्या के प्रकार के बावजूद, पर्याप्त बड़े आकार के नमूनों के लिए नमूना साधनों का वितरण सामान्य होगा। पर्याप्त रूप से बड़ी मात्रा का क्या अर्थ है? यदि सामान्य आबादी की मात्रात्मक विशेषता के मूल्यों का वितरण सामान्य है, तो नमूने के वितरण का मतलब नमूने के साथ मात्रा के साथ होता है एन=1। यदि जनसंख्या में एक चर (मात्रात्मक विशेषता) का वितरण सममित है लेकिन सामान्य नहीं है, तो बहुत छोटे आकार के नमूने नमूना साधनों का सामान्य वितरण देंगे। यदि सामान्य जनसंख्या की मात्रात्मक विशेषता के वितरण में स्पष्ट विषमता है, तो बड़े नमूनों की आवश्यकता है। और फिर भी, नमूना माध्य का वितरण केवल तभी सामान्य माना जा सकता है जब हम पर्याप्त आकार के नमूने के साथ काम कर रहे हों।

एक सामान्य वक्र का उपयोग करके निष्कर्ष निकालने के लिए, सामान्य जनसंख्या की मात्रात्मक विशेषता के मूल्यों के वितरण की सामान्यता की स्थिति से आगे बढ़ना आवश्यक नहीं है। बल्कि, हम केंद्रीय सीमा प्रमेय पर भरोसा करते हैं और, जनसंख्या वितरण के आधार पर, ऐसा नमूना आकार निर्धारित करते हैं जो हमें एक सामान्य वक्र के साथ काम करने की अनुमति देगा। सौभाग्य से, आँकड़ों का सामान्य वितरण अपेक्षाकृत छोटे आकार के नमूनों द्वारा प्रदान किया जाता है - अंजीर। 15.6 इस परिस्थिति को स्पष्ट रूप से प्रदर्शित करता है। विश्वास अंतराल अनुमान। क्या उपरोक्त सामान्य औसत के बारे में कुछ निष्कर्ष निकालने में हमारी मदद कर सकता है? दरअसल, व्यवहार में, हम केवल एक का चयन करते हैं, और किसी दिए गए आकार के सभी संभावित नमूने नहीं, और प्राप्त आंकड़ों के आधार पर, हम लक्ष्य समूह के बारे में कुछ निष्कर्ष निकालते हैं।

यह कैसे होता है? जैसा कि आप जानते हैं, एक सामान्य बंटन के साथ, सभी प्रेक्षणों के एक निश्चित प्रतिशत का एक निश्चित मानक विचलन होता है; कहते हैं कि 95% प्रेक्षण माध्य के ±1.96 मानक विचलन के भीतर फिट होते हैं। नमूना साधनों का सामान्य वितरण, जिस पर केंद्रीय सीमा प्रमेय लागू किया जा सकता है, इस अर्थ में कोई अपवाद नहीं है। ऐसे नमूना वितरण का माध्य सामान्य माध्य μ के बराबर होता है, और इसके मानक विचलन को माध्य की मानक त्रुटि कहा जाता है:

यह पता चला है कि:

नमूने के 68.26% का अर्थ है सामान्य माध्य से ± σ x से अधिक नहीं;
नमूने के 95.45% का अर्थ है सामान्य माध्य से ± σ x से अधिक नहीं;
नमूने के 99.73% का अर्थ है सामान्य माध्य से ± σ x से अधिक नहीं,

यानी चुने गए मूल्य के आधार पर नमूने का एक निश्चित अनुपात जेडमूल्य द्वारा निर्धारित अंतराल में संलग्न किया जाएगा जेड. इस अभिव्यक्ति को असमानता के रूप में फिर से लिखा जा सकता है:

सामान्य औसत - जेड < Среднее по выборке < Генеральное среднее + जेड(माध्य की मानक त्रुटि)

इस प्रकार, एक निश्चित संभावना के साथ नमूना मतलब अंतराल में है, जिसकी सीमाएं वितरण के औसत मूल्य का योग और अंतर और मानक विचलन की एक निश्चित संख्या है। इस असमानता को रूप में परिवर्तित किया जा सकता है:

नमूना माध्य - जेड(माध्य की मानक त्रुटि)< Генеральное среднее < Среднее по выборке + जेड(माध्य की मानक त्रुटि)

यदि अनुपात 15.1 देखा जाता है, उदाहरण के लिए, 95% मामलों में ( जेड= 1.96), तो 95% मामलों में अनुपात 15.2 भी देखा जाता है। ऐसे मामलों में जहां निष्कर्ष एकल नमूना माध्य पर आधारित है, हम अभिव्यक्ति 15.2 का उपयोग करते हैं।

उस अभिव्यक्ति 15.2 को याद रखना महत्वपूर्ण है इसका मतलब यह नहीं है कि किसी दिए गए नमूने के अनुरूप अंतराल में आवश्यक रूप से सामान्य माध्य शामिल होना चाहिए। अंतराल का चयन प्रक्रिया से अधिक लेना-देना है।इस माध्य के आसपास बने अंतराल में सही जनसंख्या माध्य शामिल हो भी सकता है और नहीं भी। किए गए निष्कर्षों की शुद्धता में हमारा विश्वास इस तथ्य पर आधारित है कि चयनित नमूनाकरण योजना के अनुसार निर्मित सभी अंतरालों के 95% में सही माध्य होगा। हम मानते हैं कि हमारा नमूना इसी 95% का है।

इस महत्वपूर्ण बिंदु को स्पष्ट करने के लिए, एक पल के लिए कल्पना करें कि आकार के नमूने के लिए नमूने का वितरण मतलब है एन= 2 हमारे काल्पनिक उदाहरण में सामान्य है। तालिका 15.4 दिए गए डिज़ाइन के अनुसार चुने जा सकने वाले संभावित 190 नमूनों में से पहले 10 के परिणामों को ग्राफिक रूप से दर्शाती है। ध्यान दें कि 10 में से केवल 7 अंतरालों में एक सामान्य या सही माध्य शामिल होता है। निष्कर्ष की शुद्धता में विश्वास किसी निजी आकलन के कारण नहीं, बल्कि ठीक-ठीक है प्रक्रियाअनुमान। यह प्रक्रिया ऐसी है कि 100 नमूनों के लिए जिनके लिए नमूना माध्य और विश्वास अंतराल की गणना की जाएगी, 95 मामलों में इस अंतराल में सही सामान्य मान शामिल होगा। इस नमूने की सटीकता उस प्रक्रिया से निर्धारित होती है जिसके द्वारा नमूना बनाया गया था। एक प्रतिनिधि नमूना डिजाइन सभी नमूनों की प्रतिनिधित्व क्षमता की गारंटी नहीं देता है। सांख्यिकीय अनुमान प्रक्रियाएं नमूनाकरण योजना के प्रतिनिधित्व पर आधारित होती हैं, यही वजह है कि यह प्रक्रिया संभाव्यता नमूनों के लिए इतनी महत्वपूर्ण है।

संभाव्य नमूनाकरण हमें परिणामों की सटीकता का मूल्यांकन करने की अनुमति देता है क्योंकि वास्तविक मूल्य के अनुमानों की निकटता होती है। आँकड़ों की मानक त्रुटि जितनी बड़ी होगी, अनुमानों के बिखराव की डिग्री उतनी ही अधिक होगी और प्रक्रिया की सटीकता कम होगी।

कुछ लोग इस तथ्य से भ्रमित हो सकते हैं कि आत्मविश्वास का स्तर प्रक्रिया से संबंधित है, न कि किसी विशेष नमूना मूल्य से, हालांकि, यह याद रखना चाहिए कि सामान्य मूल्य के अनुमान के विश्वास स्तर के मूल्य को इसके द्वारा समायोजित किया जा सकता है शोधकर्ता। यदि आप जोखिम नहीं लेना चाहते हैं और डरते हैं कि आप उन पांच नमूना अंतरालों में से एक में आ सकते हैं जिसमें जनसंख्या माध्य शामिल नहीं है, तो आप 99% विश्वास अंतराल चुन सकते हैं जहां सौ नमूना अंतरालों में से केवल एक में शामिल नहीं है जनसंख्या का मतलब। इसके अलावा, यदि आप नमूना आकार बढ़ा सकते हैं, तो आप जनसंख्या मूल्य के अनुमान की वांछित सटीकता प्रदान करते हुए, परिणाम में विश्वास की डिग्री बढ़ा सकते हैं। हम इस बारे में चैप में अधिक विस्तार से बात करेंगे। 17.

हम जिस प्रक्रिया का वर्णन कर रहे हैं, उसमें एक और घटक है, जो एक निश्चित शर्मिंदगी का कारण बन सकता है। कॉन्फ़िडेंस इंटरवल का आकलन करते समय, तीन मात्राओं का उपयोग किया जाता है: x , जेडऔर σ x। नमूना माध्य x की गणना नमूना डेटा से की जाती है, जेडवांछित आत्मविश्वास स्तर के आधार पर चुना जाता है। लेकिन माध्य σ x की मूल माध्य वर्ग त्रुटि के बारे में क्या? यह इसके बराबर है:

और इसलिए, इसे निर्धारित करने के लिए, हमें सामान्य जनसंख्या की मात्रात्मक विशेषता के मानक विचलन से पूछने की आवश्यकता है, अर्थात 5. मानक विचलन वाले मामलों में क्या करना है एसअज्ञात? यह समस्या दो कारणों से उत्पन्न नहीं होती है। सबसे पहले, आमतौर पर विपणन अनुसंधान में उपयोग की जाने वाली अधिकांश मात्रात्मक विशेषताओं के लिए, विपणक के लिए ब्याज के अधिकांश चर के स्तर की तुलना में भिन्नता बहुत धीरे-धीरे बदलती है। तदनुसार, यदि अध्ययन दोहराया जाता है, तो हम गणना में पिछले, पहले से प्राप्त मूल्य का उपयोग कर सकते हैं। दूसरा, एक बार जब नमूना चुन लिया जाता है और डेटा प्राप्त हो जाता है, तो हम नमूना भिन्नता का निर्धारण करके जनसंख्या भिन्नता का अनुमान लगा सकते हैं। निष्पक्ष नमूना विचरण को इस प्रकार परिभाषित किया गया है:

नमूना विचरण ŝ 2 = नमूना माध्य से चुकता विचलन का योग / (नमूना किए गए आइटमों की संख्या -1)। नमूना विचरण निर्धारित करने के लिए, हमें पहले नमूना माध्य ज्ञात करना होगा। फिर प्रत्येक नमूना मान और नमूना माध्य के बीच अंतर पाया जाता है; इन अंतरों को वर्ग, योग, और एक संख्या से विभाजित किया जाता है जो नमूना टिप्पणियों की संख्या माइनस एक के बराबर होती है। नमूना प्रसरण न केवल कुल प्रसरण का अनुमान प्रदान करता है, बल्कि इसका उपयोग माध्य की मानक त्रुटि का अनुमान लगाने के लिए भी किया जा सकता है। जब सामान्य प्रसरण σ 2 ज्ञात हो, मूल माध्य वर्ग त्रुटि σ x भी ज्ञात हो, क्योंकि:

जब सामान्य प्रसरण अज्ञात होता है, तो माध्य की मानक त्रुटि का केवल अनुमान लगाया जा सकता है। यह अनुमान दिया गया है ŝ x, जो नमूना आकार के वर्गमूल से विभाजित नमूने के मानक विचलन के बराबर है, अर्थात। अनुमान उसी तरह निर्धारित किया जाता है जैसे वास्तविक मूल्य का अनुमान निर्धारित किया गया था, लेकिन सामान्य मानक विचलन के बजाय, नमूने के मानक विचलन को गणना सूत्र में प्रतिस्थापित किया जाता है। तो, आइए नमूना एबी के लिए 5800 के नमूना माध्य के साथ कहें:

तदनुसार, ŝ = 283, और

और 95% रिक्ति अब है

जो पिछले मूल्य से कम है।

तालिका में। 15.5 विभिन्न औसतों और फैलावों के लिए गणना सूत्रों का सार प्रस्तुत करता है, जिन पर इस अध्याय में चर्चा की गई थी। एक साधारण यादृच्छिक नमूने का गठन। हमारे उदाहरण में, नमूना तत्वों का चयन एक जग का उपयोग करके किया गया था, जिसमें मूल जनसंख्या के सभी तत्व शामिल थे। इसने हमें व्युत्पन्न जनसंख्या और नमूनाकरण वितरण की अवधारणाओं की कल्पना करने की अनुमति दी। हम व्यवहार में ऐसी पद्धति का उपयोग करने की अनुशंसा नहीं करते हैं, क्योंकि इससे त्रुटि की संभावना बढ़ जाती है। मग आकार और बनावट दोनों में भिन्न हो सकते हैं, जो कुछ मामलों में एक से दूसरे के लिए वरीयता का कारण बन सकते हैं। लॉटरी के माध्यम से किए गए वियतनामी अभियान में प्रतिभागियों का चयन इस तरह की गलती के उदाहरण के रूप में काम कर सकता है।

बड़े ड्रम से जन्मतिथि वाली डिस्क खींचकर चयन किया गया। टेलीविजन इस प्रक्रिया को पूरे देश में प्रसारित करता है। दुर्भाग्य से, डिस्क को ड्रम में एक व्यवस्थित तरीके से लोड किया गया था, जिसमें जनवरी की तारीखें पहले और दिसंबर की तारीखें आखिरी थीं। हालाँकि ड्रम को तीव्र कताई के अधीन किया गया था, दिसंबर की तारीखें जनवरी की तुलना में बहुत अधिक बार गिरती थीं। इसके बाद, इस प्रक्रिया को इस तरह संशोधित किया गया कि ऐसी व्यवस्थित त्रुटियों की संभावना काफी कम हो गई। एक साधारण यादृच्छिक नमूना उत्पन्न करने की पसंदीदा विधि यादृच्छिक संख्याओं की तालिका के उपयोग पर आधारित है।

ऐसी तालिका का उपयोग करने में निम्नलिखित चरणों का क्रम शामिल है। सबसे पहले, जनसंख्या के तत्वों को 1 से लगातार संख्याओं को निर्दिष्ट किया जाना चाहिए एन; तत्व के लिए हमारी काल्पनिक जनसंख्या में एनंबर 1 तत्व को सौंपा जाएगा बी- संख्या 2, आदि। दूसरे, यादृच्छिक संख्याओं की तालिका में अंकों की संख्या संख्या के समान होनी चाहिए एन. के लिए एन= 20 दो अंकों की संख्या का उपयोग किया जाएगा; के लिए एन 100 और 999 के बीच - तीन अंकों की संख्या, आदि। तीसरा, प्रारंभिक स्थिति को यादृच्छिक रूप से निर्धारित किया जाना चाहिए। हम यादृच्छिक संख्याओं की संगत तालिका खोल सकते हैं और अपनी आँखें बंद कर सकते हैं, जैसा कि वे कहते हैं, उस पर अपनी उंगली से प्रहार करें। क्योंकि यादृच्छिक संख्या तालिका में संख्याएँ यादृच्छिक क्रम में हैं, प्रारंभिक स्थिति वास्तव में मायने नहीं रखती है।

और अंत में, हम किसी भी मनमाने ढंग से चुनी गई दिशा में आगे बढ़ सकते हैं - ऊपर, नीचे या पार, उन तत्वों का चयन करना जिनकी संख्या तालिका से यादृच्छिक संख्याओं के अनुरूप होगी। जो कहा गया है उसे स्पष्ट करने के लिए, यादृच्छिक संख्याओं की संक्षिप्त तालिका (तालिका 15.6) पर विचार करें। क्योंकि एन= 20, हमें केवल दो अंकों की संख्या के साथ कार्य करना चाहिए। इस अर्थ में, टैब। 15.6 हमें पूरी तरह से सूट करता है। मान लीजिए कि हमने पहले से कॉलम को नीचे ले जाने का फैसला किया है, प्रारंभिक स्थिति ग्यारहवीं पंक्ति और चौथे कॉलम के चौराहे पर है, जहां संख्या 77 स्थित है। यह संख्या बहुत बड़ी है, और इसलिए इसे छोड़ दिया जाना चाहिए। अगली दो संख्याओं को भी हटा दिया जाएगा, जबकि चौथे मान 02 का उपयोग किया जाएगा क्योंकि 2 तत्व संख्या है में.

अगले पांच नंबर भी बहुत बड़े होने के कारण खारिज कर दिए जाएंगे, जबकि नंबर 05 तत्व को इंगित करेगा इ. तो तत्व मेंऔर इहमारा दो-तत्व वाला नमूना बन जाएगा, जिसके द्वारा हम इस जनसंख्या की आय के स्तर का न्याय करेंगे। एक वैकल्पिक रणनीति भी संभव है, जिसमें चयन के आधार के रूप में यादृच्छिक संख्या उत्पन्न करने वाले एक कंप्यूटर प्रोग्राम का उपयोग किया जाएगा। इसमें दिखाई दिया हाल तकप्रकाशन इंगित करते हैं कि ऐसे कार्यक्रमों द्वारा उत्पन्न संख्याएं पूरी तरह से यादृच्छिक नहीं होती हैं, जो जटिल गणितीय मॉडल बनाते समय एक निश्चित तरीके से प्रकट हो सकती हैं, लेकिन उनका उपयोग अधिकांश अनुप्रयुक्त विपणन अनुसंधान के लिए किया जा सकता है। फिर से ध्यान दें कि एक साधारण यादृच्छिक नमूने के लिए सामान्य आबादी के तत्वों की अनुक्रमिक क्रमांकित सूची के संकलन की आवश्यकता होती है।

दूसरे शब्दों में, मूल जनसंख्या के प्रत्येक सदस्य की पहचान की जानी चाहिए। कुछ आबादी के लिए, ऐसा करना मुश्किल नहीं है, उदाहरण के लिए, 500 सबसे बड़े अमेरिकी निगमों के एक अध्ययन में, जिसकी एक सूची फॉर्च्यून पत्रिका में दी गई है। यह सूची पहले ही संकलित की जा चुकी है, इसलिए इस मामले में एक साधारण यादृच्छिक नमूना बनाना मुश्किल नहीं होगा। अन्य प्रारंभिक आबादी के लिए (उदाहरण के लिए, किसी विशेष शहर में रहने वाले सभी परिवारों के लिए), एक सामान्य सूची संकलित करना अत्यंत कठिन है, जो शोधकर्ताओं को अन्य नमूना सर्वेक्षण योजनाओं का सहारा लेने के लिए मजबूर करता है।

सारांश

सीखने का उद्देश्य 1
जनगणना (योग्यता) और नमूनाकरण की अवधारणाओं के बीच स्पष्ट रूप से अंतर करें

जनसंख्या (जनसंख्या) की पूर्ण जनगणना कहलाती है योग्य. नमूनासेट, चयनित तत्वों से गठित।

सीखने का उद्देश्य 2
एक नमूना आबादी प्राप्त करने के लिए शोधकर्ताओं द्वारा कार्यान्वित छह चरणों का सार और क्रम जानें

नमूना लेने की प्रक्रिया को छह चरणों में विभाजित किया गया है:

जनसंख्या असाइनमेंट;
नमूनाकरण फ्रेम का निर्धारण;
चयन प्रक्रिया का विकल्प;
नमूना आकार का निर्धारण;
नमूना तत्वों का चयन;
चयनित तत्वों की परीक्षा

सीखने का उद्देश्य 3
"नमूनाकरण फ्रेम" की अवधारणा को परिभाषित करें

नमूनाकरण फ्रेम उन वस्तुओं की सूची है जिनसे नमूना लिया जाएगा।

सीखने का उद्देश्य 4
संभाव्य और नियतात्मक नमूने के बीच अंतर स्पष्ट करें

एक संभाव्य नमूने में, जनसंख्या के प्रत्येक सदस्य को एक निश्चित के साथ शामिल किया जा सकता है गैर शून्य दियासंभावना। नमूने में जनसंख्या के कुछ सदस्यों को शामिल करने की संभावनाएँ एक दूसरे से भिन्न हो सकती हैं, लेकिन इसमें प्रत्येक तत्व को शामिल करने की संभावना ज्ञात है। नियतात्मक नमूनों के लिए, नमूने में किसी भी तत्व को शामिल करने की संभावना का अनुमान लगाना असंभव हो जाता है। ऐसे नमूने की प्रतिनिधित्वशीलता की गारंटी नहीं दी जा सकती। सभी नियतात्मक चयन व्यक्तिगत स्थिति, निर्णय या वरीयता पर आधारित होते हैं। ऐसी वरीयताएँ कभी-कभी जनसंख्या की विशेषताओं का अच्छा अनुमान दे सकती हैं, लेकिन कार्य के लिए नमूने की उपयुक्तता को निष्पक्ष रूप से निर्धारित करने का कोई तरीका नहीं है।

सीखने का उद्देश्य 5
निश्चित आकार के नमूने और बहु-स्तरीय (लगातार) नमूने के बीच अंतर करें

निश्चित आकार के नमूनों के साथ काम करते समय, सर्वेक्षण शुरू होने से पहले नमूना आकार निर्धारित किया जाता है और परिणामों का विश्लेषण सभी आवश्यक डेटा के संग्रह से पहले किया जाता है। अनुक्रमिक नमूने में, चयनित तत्वों की संख्या पहले से ज्ञात नहीं है, यह अनुक्रमिक निर्णयों की एक श्रृंखला के आधार पर निर्धारित किया जाता है।

सीखने का उद्देश्य 6
समझाएं कि जानबूझकर नमूनाकरण क्या है और इसकी ताकत और कमजोरियों दोनों का वर्णन करें

जानबूझकर नमूना लेने वाली वस्तुओं को हाथ से चुना जाता है और सर्वेक्षण के प्रयोजनों के लिए उपयुक्त के रूप में शोधकर्ता को प्रस्तुत किया जाता है। यह माना जाता है कि चयनित तत्व अध्ययन की गई जनसंख्या की पूरी तस्वीर दे सकते हैं। जब तक शोधकर्ता समस्या समाधान के शुरुआती चरणों में है, जब नियोजित सर्वेक्षण की संभावनाएं और संभावित सीमाएं निर्धारित की जा रही हैं, जानबूझकर नमूनाकरण का उपयोग बहुत प्रभावी हो सकता है। लेकिन किसी भी मामले में हमें इस प्रकार के नमूने की कमजोरियों के बारे में नहीं भूलना चाहिए, क्योंकि इसका उपयोग शोधकर्ता द्वारा वर्णनात्मक या कारणात्मक अध्ययन में भी किया जा सकता है, जो उनके परिणामों की गुणवत्ता को प्रभावित करने में धीमा नहीं होगा।

सीखने का उद्देश्य 7
कोटा नमूनाकरण की अवधारणा को परिभाषित करें

आनुपातिक नमूनाकरण इस तरह से चुना जाता है कि कुछ विशेषताओं वाले नमूना तत्वों का अनुपात लगभग अध्ययन के तहत जनसंख्या में समान तत्वों के अनुपात से मेल खाता है; ऐसा करने के लिए, प्रत्येक काउंटर को एक कोटा सौंपा गया है जो जनसंख्या की विशेषताओं को निर्धारित करता है जिसके साथ उसे संपर्क करना चाहिए।

सीखने का उद्देश्य 8
व्याख्या करें कि चयन प्रक्रिया में पैरामीटर क्या है

पैरामीटर - सामान्य या अध्ययनित जनसंख्या की एक निश्चित विशेषता या संकेतक; एक निश्चित मात्रात्मक संकेतक जो एक सेट को दूसरे से अलग करता है।

सीखने का उद्देश्य 9
व्याख्या करें कि एक व्युत्पन्न सेट क्या है

व्युत्पन्न जनसंख्या में सभी संभावित नमूने शामिल होते हैं जिन्हें किसी दिए गए नमूनाकरण योजना के अनुसार सामान्य जनसंख्या से चुना जा सकता है।

सीखने का उद्देश्य 10
समझाइए कि प्रतिचयन वितरण की अवधारणा सांख्यिकी की सबसे महत्वपूर्ण अवधारणा क्यों है।

नमूना वितरण की अवधारणा सांख्यिकीय अनुमान की आधारशिला है। अध्ययन किए गए आँकड़ों के ज्ञात नमूना वितरण के अनुसार, हम सामान्य जनसंख्या के संगत पैरामीटर के बारे में निष्कर्ष निकाल सकते हैं। यदि, दूसरी ओर, यह केवल ज्ञात है कि नमूना अनुमान नमूने से नमूने में बदलता है, लेकिन इस परिवर्तन की प्रकृति अज्ञात है, तो इस अनुमान से जुड़ी नमूना त्रुटि को निर्धारित करना असंभव हो जाता है। चूंकि एक अनुमान का नमूना वितरण वर्णन करता है कि यह नमूने से नमूने में कैसे बदलता है, यह नमूना अनुमान की वैधता निर्धारित करने के लिए एक आधार प्रदान करता है।

नमूना - अध्ययन में भाग लेने के लिए सामान्य आबादी से चुने गए एक निश्चित प्रक्रिया का उपयोग करके मामलों (विषयों, वस्तुओं, घटनाओं, नमूने) का एक सेट।

नमूने का आकार

नमूना आकार - नमूने में शामिल मामलों की संख्या। सांख्यिकीय कारणों से, यह अनुशंसा की जाती है कि मामलों की संख्या कम से कम 30-35 हो।

आश्रित और स्वतंत्र नमूने

दो (या अधिक) नमूनों की तुलना करते समय, उनकी निर्भरता एक महत्वपूर्ण पैरामीटर है। यदि एक होमोमोर्फिक जोड़ी स्थापित करना संभव है (अर्थात, जब नमूना X से एक मामला नमूना Y से एक और केवल एक मामले से मेल खाता है और इसके विपरीत) दो नमूनों में प्रत्येक मामले के लिए (और संबंध का यह आधार सुविधा के लिए महत्वपूर्ण है) नमूने पर मापा जाता है), ऐसे नमूने आश्रित कहलाते हैं। आश्रित चयन के उदाहरण:

जुड़वा बच्चों की जोड़ी
प्रायोगिक प्रदर्शन से पहले और बाद में किसी भी विशेषता के दो माप,
पति और पत्नियाँ
और इसी तरह।

यदि नमूनों के बीच ऐसा कोई संबंध नहीं है, तो इन नमूनों को स्वतंत्र माना जाता है, उदाहरण के लिए:

पुरुषों और महिलाओं,
मनोवैज्ञानिक और गणितज्ञ।
तदनुसार, आश्रित नमूनों का आकार हमेशा समान होता है, जबकि स्वतंत्र नमूनों का आकार भिन्न हो सकता है।

विभिन्न सांख्यिकीय मानदंडों का उपयोग करके नमूनों की तुलना की जाती है:

छात्र का टी-टेस्ट
विलकॉक्सन टी-टेस्ट
मान-व्हिटनी यू परीक्षण
संकेतों का मानदंड
और आदि।

प्रातिनिधिकता

नमूने को प्रतिनिधि या गैर-प्रतिनिधि माना जा सकता है।

एक गैर-प्रतिनिधि नमूने का एक उदाहरण

संयुक्त राज्य अमेरिका में, गैर-प्रतिनिधि नमूने के सबसे प्रसिद्ध ऐतिहासिक उदाहरणों में से एक वह मामला है जो 1936 में राष्ट्रपति चुनाव के दौरान हुआ था। द लिट्रेरी डाइजेस्ट, जिसने पिछले कई चुनावों की घटनाओं की सफलतापूर्वक भविष्यवाणी की थी, ने अपने ग्राहकों, देश भर में फोन बुक से चुने गए लोगों और कार पंजीकरण सूची से लोगों को दस मिलियन परीक्षण मतपत्र भेजकर अपनी भविष्यवाणियों को गलत बताया। लौटाए गए मतपत्रों के 25% (लगभग 2.5 मिलियन) में, मतों का वितरण इस प्रकार किया गया:

57% ने रिपब्लिकन उम्मीदवार अल्फ लैंडन को तरजीह दी

40% ने तत्कालीन-डेमोक्रेटिक राष्ट्रपति फ्रैंकलिन रूजवेल्ट को चुना

जैसा कि सर्वविदित है, रूजवेल्ट ने 60% से अधिक मतों के साथ वास्तविक चुनाव जीते। लिट्रेरी डाइजेस्ट की गलती यह थी: नमूने के प्रतिनिधित्व को बढ़ाना चाहते थे - क्योंकि वे जानते थे कि उनके अधिकांश ग्राहक खुद को रिपब्लिकन मानते हैं - उन्होंने फोन बुक और पंजीकरण सूची से चुने गए लोगों के साथ नमूने का विस्तार किया। हालांकि, उन्होंने अपने समय की वास्तविकताओं को ध्यान में नहीं रखा और वास्तव में और भी अधिक रिपब्लिकन की भर्ती की: ग्रेट डिप्रेशन के दौरान, यह ज्यादातर मध्यम और उच्च वर्ग (यानी अधिकांश रिपब्लिकन, डेमोक्रेट्स नहीं) थे जो खर्च कर सकते थे खुद के फोन और कार।

नमूनों से समूहों के निर्माण की योजना के प्रकार

समूह निर्माण योजना के कई मुख्य प्रकार हैं:

प्रायोगिक और नियंत्रण समूहों के साथ अध्ययन करें, जिन्हें अलग-अलग परिस्थितियों में रखा गया है।
युग्मित चयन रणनीति का उपयोग करके प्रयोगात्मक और नियंत्रण समूहों के साथ अध्ययन करें
केवल एक समूह - प्रायोगिक का उपयोग करके अध्ययन करें।
एक मिश्रित (तथ्यात्मक) योजना का उपयोग करते हुए एक अध्ययन - सभी समूहों को अलग-अलग स्थितियों में रखा गया है।

समूह निर्माण रणनीतियाँ

एक मनोवैज्ञानिक प्रयोग में उनकी भागीदारी के लिए समूहों का चयन विभिन्न रणनीतियों का उपयोग करके किया जाता है जो आंतरिक और बाहरी वैधता के लिए सबसे बड़ा संभव सम्मान सुनिश्चित करने के लिए आवश्यक हैं।

यादृच्छिकरण (यादृच्छिक चयन)
वास्तविक समूहों को शामिल करना

यादृच्छिकीकरण

यादृच्छिकीकरण, या यादृच्छिक चयन, सरल यादृच्छिक नमूने बनाने के लिए प्रयोग किया जाता है। इस तरह के नमूने का उपयोग इस धारणा पर आधारित है कि जनसंख्या के प्रत्येक सदस्य के नमूने में शामिल होने की समान संभावना है। उदाहरण के लिए, 100 छात्रों का एक यादृच्छिक नमूना बनाने के लिए, आप एक टोपी में सभी विश्वविद्यालय के छात्रों के नाम के साथ कागज़ात रख सकते हैं, और फिर उसमें से 100 कागज़ के टुकड़े ले सकते हैं - यह यादृच्छिक चयन होगा (गुडविन जे।, पृष्ठ। 147)।

जोड़ीदार चयन

जोड़ीदार चयन- नमूना समूहों के निर्माण के लिए एक रणनीति, जिसमें विषयों के समूह उन विषयों से बने होते हैं जो प्रयोग के लिए महत्वपूर्ण साइड पैरामीटर के समान हैं। यह रणनीति प्रयोगात्मक और नियंत्रण समूहों का उपयोग करने वाले प्रयोगों के लिए प्रभावी है सबसे बढ़िया विकल्प- आकर्षण

सांख्यिकी में अनुसंधान की दो मुख्य विधियाँ हैं - सतत और चयनात्मक। नमूना अध्ययन करते समय, निम्नलिखित आवश्यकताओं का पालन करना अनिवार्य है: नमूना जनसंख्या का प्रतिनिधित्व और पर्याप्त संख्या में अवलोकन इकाइयाँ। अवलोकन की इकाइयों का चयन करते समय यह संभव है ऑफसेट त्रुटियांअर्थात् ऐसी घटनाएँ, जिनके घटित होने की सटीक भविष्यवाणी नहीं की जा सकती। ये त्रुटियां वस्तुनिष्ठ और स्वाभाविक हैं। नमूनाकरण अध्ययन की सटीकता की डिग्री निर्धारित करने में, नमूनाकरण प्रक्रिया में होने वाली त्रुटि की मात्रा का अनुमान लगाया जाता है - यादृच्छिक प्रतिनिधित्व त्रुटि (एम) — एक नमूना अध्ययन से प्राप्त औसत या सापेक्ष मूल्यों और सामान्य आबादी पर एक अध्ययन से प्राप्त होने वाले समान मूल्यों के बीच वास्तविक अंतर है।

अध्ययन के परिणामों की विश्वसनीयता के आकलन में निम्न का निर्धारण शामिल है:

1. प्रतिनिधित्व की त्रुटियाँ

2. सामान्य जनसंख्या में औसत (या सापेक्ष) मूल्यों की विश्वास सीमा

3. औसत (या सापेक्ष) मूल्यों के अंतर की विश्वसनीयता (मानदंड टी के अनुसार)

प्रतिनिधित्व की त्रुटि की गणना(मिमी) अंकगणितीय माध्य मान (एम):

जहां σ मानक विचलन है; n नमूना आकार (>30) है।

सापेक्ष मान (Р) के प्रतिनिधित्व त्रुटि (mР) की गणना:

जहां पी संबंधित सापेक्ष मान है (गणना की जाती है, उदाहरण के लिए,% में);

क्यू = 100 - पी% पी का व्युत्क्रम है; एन - नमूना आकार (एन> 30)

नैदानिक और प्रायोगिक कार्य में, इसका उपयोग करना अक्सर आवश्यक होता है छोटा सा नमूना,जब प्रेक्षणों की संख्या 30 से कम या उसके बराबर हो। जब नमूना छोटा हो, प्रतिनिधित्व त्रुटियों की गणना करने के लिए, माध्य और सापेक्ष मान दोनों , प्रेक्षणों की संख्या एक से घट जाती है, अर्थात

; .

प्रतिनिधित्व की त्रुटि का परिमाण नमूने के आकार पर निर्भर करता है: अधिक संख्याअवलोकन, विषय कम त्रुटि. एक नमूना संकेतक की विश्वसनीयता का आकलन करने के लिए, निम्नलिखित दृष्टिकोण अपनाया गया था: संकेतक (या औसत मूल्य) इसकी त्रुटि से 3 गुना अधिक होना चाहिए, जिस स्थिति में इसे विश्वसनीय माना जाता है।

नमूना अध्ययन के परिणामों में आश्वस्त होने के लिए त्रुटि की भयावहता को जानना पर्याप्त नहीं है, क्योंकि एक विशेष नमूना त्रुटि औसत प्रतिनिधित्व त्रुटि के मान से काफी अधिक (या कम) हो सकती है। सटीकता का निर्धारण करने के लिए जिसके साथ एक शोधकर्ता एक परिणाम प्राप्त करना चाहता है, सांख्यिकी ऐसी अवधारणा का उपयोग त्रुटि-मुक्त पूर्वानुमान की संभावना के रूप में करती है, जो चयनात्मक बायोमेडिकल सांख्यिकीय अध्ययन के परिणामों की विश्वसनीयता की विशेषता है। आमतौर पर, बायोमेडिकल सांख्यिकीय अध्ययन करते समय, 95% या 99% की त्रुटि-मुक्त भविष्यवाणी की संभावना का उपयोग किया जाता है। सबसे महत्वपूर्ण मामलों में, जब सैद्धांतिक या व्यावहारिक दृष्टि से विशेष रूप से महत्वपूर्ण निष्कर्ष निकालना आवश्यक होता है, तो 99.7% त्रुटि-मुक्त पूर्वानुमान की संभावना का उपयोग किया जाता है।

एक निश्चित मूल्य त्रुटि मुक्त पूर्वानुमान की संभावना की एक निश्चित डिग्री से मेल खाता है एक यादृच्छिक नमूने की सीमांत त्रुटि (Δ - डेल्टा), जो सूत्र द्वारा निर्धारित किया जाता है:

Δ=t * m, जहां t एक विश्वास गुणांक है, जो एक बड़े नमूने और 95% के त्रुटि-मुक्त पूर्वानुमान की संभावना के साथ 2.6 है; 99% - 3.0 के त्रुटि-मुक्त पूर्वानुमान की संभावना के साथ; 99.7% - 3.3 के त्रुटि-मुक्त पूर्वानुमान की संभावना के साथ, और एक छोटे से नमूने के साथ यह छात्र के टी मूल्यों की एक विशेष तालिका द्वारा निर्धारित किया जाता है।

सीमांत नमूनाकरण त्रुटि (Δ) का उपयोग करके, कोई निर्धारित कर सकता है आत्मविश्वास की सीमाएँ, जिसमें, त्रुटि-मुक्त पूर्वानुमान की एक निश्चित संभावना के साथ, सांख्यिकीय मात्रा का वास्तविक मूल्य , संपूर्ण जनसंख्या (औसत या सापेक्ष) की विशेषता।

विश्वास सीमा निर्धारित करने के लिए निम्नलिखित सूत्रों का उपयोग किया जाता है:

1) औसत मूल्यों के लिए:

जहाँ Mgen - सामान्य जनसंख्या में औसत मूल्य की विश्वास सीमा;

Msample - औसत मान , एक नमूना जनसंख्या पर अध्ययन के दौरान प्राप्त; टी एक विश्वास गुणांक है, जिसका मूल्य एक त्रुटि मुक्त पूर्वानुमान की संभावना की डिग्री से निर्धारित होता है जिसके साथ शोधकर्ता परिणाम प्राप्त करना चाहता है; एमएम माध्य की प्रतिनिधित्व त्रुटि है।

2) सापेक्ष मूल्यों के लिए:

जहाँ Rgen - सामान्य जनसंख्या में सापेक्ष मूल्य की विश्वास सीमा; रुपये एक नमूना आबादी पर अध्ययन के दौरान प्राप्त सापेक्ष मूल्य है; टी आत्मविश्वास कारक है; एमपी सापेक्ष मूल्य की प्रतिनिधित्व त्रुटि है।

कॉन्फिडेंस लिमिट्स बताती हैं कि यादृच्छिक प्रकृति के कारणों के आधार पर सैंपल इंडिकेटर के आकार में किस हद तक उतार-चढ़ाव हो सकता है।

टिप्पणियों की एक छोटी संख्या के साथ (एन<30), для вычисления доверительных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, उपलब्ध स्वतंत्रता की डिग्री की संख्या का संकेत (एन) , जो n-1 के बराबर है।

जनसंख्या- इकाइयों का एक समूह जिसमें बड़े पैमाने पर चरित्र, विशिष्टता, गुणात्मक एकरूपता और भिन्नता की उपस्थिति होती है।

सांख्यिकीय आबादी में भौतिक रूप से मौजूदा वस्तुएं (कर्मचारी, उद्यम, देश, क्षेत्र) शामिल हैं, यह एक वस्तु है।

जनसंख्या इकाई- सांख्यिकीय जनसंख्या की प्रत्येक विशिष्ट इकाई।

एक ही सांख्यिकीय जनसंख्या एक विशेषता में सजातीय और दूसरे में विषम हो सकती है।

गुणात्मक एकरूपता- किसी भी विशेषता के लिए जनसंख्या की सभी इकाइयों की समानता और बाकी सभी के लिए असमानता।

एक सांख्यिकीय जनसंख्या में, जनसंख्या की एक इकाई और दूसरी इकाई के बीच का अंतर अक्सर मात्रात्मक प्रकृति का होता है। जनसंख्या की विभिन्न इकाइयों की विशेषता के मूल्यों में मात्रात्मक परिवर्तन को भिन्नता कहा जाता है।

फ़ीचर भिन्नता- जनसंख्या की एक इकाई से दूसरी इकाई में संक्रमण के दौरान एक संकेत का मात्रात्मक परिवर्तन (मात्रात्मक संकेत के लिए)।

संकेत- यह एक संपत्ति, चारित्रिक विशेषता या इकाइयों, वस्तुओं और घटनाओं की अन्य विशेषता है जिसे देखा या मापा जा सकता है। संकेतों को मात्रात्मक और गुणात्मक में विभाजित किया गया है। जनसंख्या की अलग-अलग इकाइयों में किसी विशेषता के मूल्य की विविधता और परिवर्तनशीलता कहलाती है उतार-चढ़ाव.

गुणात्मक (गुणात्मक) विशेषताएं मात्रात्मक नहीं हैं (लिंग द्वारा जनसंख्या की संरचना)। मात्रात्मक विशेषताओं में एक संख्यात्मक अभिव्यक्ति होती है (उम्र के अनुसार जनसंख्या की संरचना)।

अनुक्रमणिका- यह समय और स्थान की विशिष्ट परिस्थितियों में समग्र रूप से इकाइयों या समुच्चय की किसी भी संपत्ति की सामान्य मात्रात्मक गुणात्मक विशेषता है।

उपलब्धिःसंकेतकों का एक सेट है जो अध्ययन के तहत घटना को व्यापक रूप से दर्शाता है।

उदाहरण के लिए, वेतन पर विचार करें:

साइन - मजदूरी
सांख्यिकीय जनसंख्या - सभी कर्मचारी
जनसंख्या की इकाई प्रत्येक श्रमिक है
गुणात्मक एकरूपता - उपार्जित वेतन
फ़ीचर भिन्नता - संख्याओं की एक श्रृंखला

सामान्य जनसंख्या और उससे नमूना

आधार एक या अधिक विशेषताओं को मापने के परिणामस्वरूप प्राप्त डेटा का एक सेट है। वस्तुओं का वास्तव में देखा गया सेट, सांख्यिकीय रूप से एक यादृच्छिक चर के अवलोकनों की एक श्रृंखला द्वारा दर्शाया गया है नमूना, और काल्पनिक रूप से विद्यमान (सोचा हुआ) - सामान्य जनसंख्या. सामान्य जनसंख्या परिमित हो सकती है (टिप्पणियों की संख्या एन = कास्ट) या अनंत ( एन = ∞), और सामान्य आबादी का एक नमूना हमेशा सीमित संख्या में टिप्पणियों का परिणाम होता है। एक नमूना बनाने वाले अवलोकनों की संख्या कहलाती है नमूने का आकार. यदि नमूना आकार काफी बड़ा है एन → ∞) नमूना माना जाता है बड़ाअन्यथा इसे प्रतिदर्श कहते हैं सीमित मात्रा. नमूना माना जाता है छोटा, यदि, एक आयामी यादृच्छिक चर को मापते समय, नमूना आकार 30 से अधिक नहीं है ( एन<= 30 ), और जब एक साथ कई माप ( क) एक बहुआयामी अंतरिक्ष संबंध में सुविधाएँ एनको कबढ़ता नहीं है 10 (एन / के< 10) . नमूना रूपों भिन्नता श्रृंखलाअगर इसके सदस्य हैं आदेश आँकड़े, यानी, यादृच्छिक चर के नमूना मान एक्सआरोही क्रम (रैंकिंग) में क्रमबद्ध होते हैं, विशेषता के मान कहलाते हैं विकल्प.

उदाहरण. वस्तुओं का लगभग एक ही बेतरतीब ढंग से चयनित सेट - मास्को के एक प्रशासनिक जिले के वाणिज्यिक बैंकों को इस जिले के सभी वाणिज्यिक बैंकों की सामान्य आबादी से एक नमूने के रूप में माना जा सकता है, और मास्को में सभी वाणिज्यिक बैंकों की सामान्य आबादी से एक नमूने के रूप में। , साथ ही देश में वाणिज्यिक बैंकों का एक नमूना और आदि।

बुनियादी नमूनाकरण के तरीके

सांख्यिकीय निष्कर्षों की विश्वसनीयता तथा परिणामों की अर्थपूर्ण व्याख्या निर्भर करती है प्रातिनिधिकतानमूने, अर्थात् सामान्य आबादी के गुणों के प्रतिनिधित्व की पूर्णता और पर्याप्तता, जिसके संबंध में इस नमूने को प्रतिनिधि माना जा सकता है। जनसंख्या के सांख्यिकीय गुणों का अध्ययन दो तरीकों से आयोजित किया जा सकता है: का उपयोग करना निरंतरऔर बंद। निरंतर अवलोकनसभी की जांच शामिल है इकाइयांअध्ययन समुच्चय, ए गैर-निरंतर (चयनात्मक) अवलोकन- इसके कुछ हिस्से।

नमूनाकरण को व्यवस्थित करने के पाँच मुख्य तरीके हैं:

1. सरल यादृच्छिक चयन, जिसमें वस्तुओं की सामान्य आबादी से यादृच्छिक रूप से वस्तुओं का चयन किया जाता है (उदाहरण के लिए, तालिका या यादृच्छिक संख्या जनरेटर का उपयोग करके), और प्रत्येक संभावित नमूने की समान संभावना होती है। ऐसे नमूने कहलाते हैं वास्तव में यादृच्छिक;

2. एक नियमित प्रक्रिया के माध्यम से सरल चयनएक यांत्रिक घटक (उदाहरण के लिए, दिनांक, सप्ताह के दिन, अपार्टमेंट नंबर, वर्णमाला के अक्षर, आदि) का उपयोग करके किया जाता है और इस तरह से प्राप्त नमूनों को कहा जाता है यांत्रिक;

3. विभक्त हो गयाचयन में यह तथ्य शामिल है कि आयतन की सामान्य जनसंख्या को आयतन के सबसेट या परतों (स्तरों) में विभाजित किया जाता है ताकि . सांख्यिकीय विशेषताओं के संदर्भ में स्ट्रैट सजातीय वस्तुएं हैं (उदाहरण के लिए, जनसंख्या को आयु समूह या सामाजिक वर्ग द्वारा विभाजित किया जाता है; उद्योग द्वारा उद्यम)। ऐसे में सैंपल मंगाए जाते हैं विभक्त हो गया(अन्यथा, स्तरीकृत, ठेठ, ज़ोन);

4. तरीके धारावाहिकचयन बनाने के लिए उपयोग किया जाता है धारावाहिकया नेस्टेड नमूने. वे सुविधाजनक हैं यदि एक बार में "ब्लॉक" या वस्तुओं की एक श्रृंखला की जांच करना आवश्यक है (उदाहरण के लिए, माल की एक खेप, एक निश्चित श्रृंखला के उत्पाद या देश के क्षेत्रीय-प्रशासनिक विभाजन में जनसंख्या)। श्रृंखला का चयन यादृच्छिक या यांत्रिक तरीके से किया जा सकता है। साथ ही, माल के एक निश्चित बैच, या एक संपूर्ण क्षेत्रीय इकाई (एक आवासीय भवन या एक चौथाई) का निरंतर सर्वेक्षण किया जाता है;

5. संयुक्त(स्टेप्ड) चयन कई चयन विधियों को एक साथ जोड़ सकता है (उदाहरण के लिए, स्तरीकृत और यादृच्छिक या यादृच्छिक और यांत्रिक); ऐसा नमूना कहलाता है संयुक्त.

चयन प्रकार

द्वारा दिमागव्यक्तिगत, समूह और संयुक्त चयन हैं। पर व्यक्तिगत चयननमूना सेट में सामान्य आबादी की अलग-अलग इकाइयों का चयन किया जाता है समूह चयनइकाइयों के गुणात्मक रूप से सजातीय समूह (श्रृंखला) हैं, और संयुक्त चयनपहले और दूसरे प्रकार का संयोजन शामिल है।

द्वारा तरीकाचयन भेद दोहराया और गैर-दोहरावनमूना।

बेजोड़चयन कहा जाता है, जिसमें नमूने में शामिल इकाई मूल आबादी में वापस नहीं आती है और आगे के चयन में भाग नहीं लेती है; जबकि सामान्य जनसंख्या की इकाइयों की संख्या एनचयन प्रक्रिया के दौरान कम पर दोहराया गयाचयन पकड़ानमूने में, पंजीकरण के बाद, इकाई को सामान्य आबादी में वापस कर दिया जाता है और इस प्रकार आगे की चयन प्रक्रिया में उपयोग किए जाने के लिए अन्य इकाइयों के साथ एक समान अवसर बनाए रखा जाता है; जबकि सामान्य जनसंख्या की इकाइयों की संख्या एनअपरिवर्तित रहता है (सामाजिक-आर्थिक अध्ययन में विधि का उपयोग शायद ही कभी किया जाता है)। हालाँकि, एक बड़े के साथ एन (एन → ∞)के लिए सूत्र अदोहरायाचयन उनके करीब हैं दोहराया गयाचयन और बाद वाले का उपयोग लगभग अधिक बार किया जाता है ( एन = कास्ट).

सामान्य और नमूना आबादी के मापदंडों की मुख्य विशेषताएं

अध्ययन के सांख्यिकीय निष्कर्ष का आधार एक यादृच्छिक चर का वितरण है, जबकि प्रेक्षित मान (एक्स 1, एक्स 2, ..., एक्स एन)यादृच्छिक चर की प्राप्ति कहा जाता है एक्स(एन नमूना आकार है)। सामान्य आबादी में एक यादृच्छिक चर का वितरण सैद्धांतिक है, प्रकृति में आदर्श है, और इसका नमूना एनालॉग है प्रयोगसिद्धवितरण। कुछ सैद्धांतिक वितरण विश्लेषणात्मक रूप से दिए गए हैं, अर्थात उनका विकल्पयादृच्छिक चर के संभावित मूल्यों के स्थान में प्रत्येक बिंदु पर वितरण समारोह का मूल्य निर्धारित करें। एक नमूने के लिए, वितरण समारोह निर्धारित करना मुश्किल है, और कभी-कभी असंभव है विकल्पअनुभवजन्य डेटा से अनुमान लगाया जाता है, और फिर उन्हें सैद्धांतिक वितरण का वर्णन करने वाली एक विश्लेषणात्मक अभिव्यक्ति में प्रतिस्थापित किया जाता है। इस मामले में, धारणा (या परिकल्पना) वितरण के प्रकार के बारे में सांख्यिकीय रूप से सही और गलत दोनों हो सकते हैं। लेकिन किसी भी मामले में, नमूने से पुनर्निर्माण किया गया अनुभवजन्य वितरण केवल मोटे तौर पर सही को दर्शाता है। सबसे महत्वपूर्ण वितरण पैरामीटर हैं अपेक्षित मूल्यऔर फैलाव।

उनके स्वभाव से, वितरण हैं निरंतरऔर अलग. सबसे अच्छा ज्ञात निरंतर वितरण है सामान्य. पैरामीटर के चुनिंदा अनुरूप और इसके लिए हैं: औसत मूल्य और अनुभवजन्य भिन्नता। सामाजिक-आर्थिक अध्ययनों में असतत के बीच, सबसे अधिक इस्तेमाल किया जाता है वैकल्पिक (द्विभाजित)वितरण। इस वितरण की अपेक्षा पैरामीटर सापेक्ष मूल्य (या शेयर करना) जनसंख्या की इकाइयाँ जिनका अध्ययन किया जा रहा है (यह अक्षर द्वारा इंगित किया गया है); जनसंख्या का वह अनुपात जिसमें यह विशेषता नहीं है, अक्षर द्वारा निरूपित किया जाता है क्यू (क्यू = 1 - पी). वैकल्पिक वितरण के विचरण का एक अनुभवजन्य अनुरूप भी है।

वितरण के प्रकार और जनसंख्या इकाइयों के चयन की विधि के आधार पर, वितरण मापदंडों की विशेषताओं की अलग-अलग गणना की जाती है। तालिका में सैद्धांतिक और अनुभवजन्य वितरण के लिए मुख्य दिए गए हैं। 1.

सैंपल शेयर के एनसामान्य आबादी की इकाइयों की संख्या के लिए नमूना जनसंख्या की इकाइयों की संख्या का अनुपात है:

के एन = एन / एन.

नमूना शेयर डब्ल्यूउन इकाइयों का अनुपात है जिनमें अध्ययन के तहत विशेषता है एक्सनमूना आकार के लिए एन:

डब्ल्यू = एन एन / एन.

उदाहरण। 5% नमूने के साथ 1000 इकाइयों वाले माल के एक बैच में नमूना अंश के एनपूर्ण मूल्य में 50 इकाइयां हैं। (एन = एन * 0.05); यदि इस नमूने में 2 दोषपूर्ण उत्पाद पाए जाते हैं, तो नमूना अंश डब्ल्यू 0.04 होगा (w = 2/50 = 0.04 या 4%)।

चूंकि प्रतिदर्श जनसंख्या सामान्य जनसंख्या से भिन्न है, इसलिए हैं नमूना त्रुटियां.

तालिका 1. सामान्य और नमूना आबादी के मुख्य पैरामीटर

नमूनाकरण त्रुटियां

किसी भी (ठोस और चयनात्मक) त्रुटियों के साथ दो प्रकार की त्रुटियाँ हो सकती हैं: पंजीकरण और प्रतिनिधित्व। गलतियां पंजीकरणहो सकता है अनियमितऔर व्यवस्थितचरित्र। अनियमितत्रुटियां कई अलग-अलग बेकाबू कारणों से बनी होती हैं, प्रकृति में अनजाने में होती हैं, और आमतौर पर एक दूसरे को एक साथ संतुलित करती हैं (उदाहरण के लिए, कमरे में तापमान में उतार-चढ़ाव के कारण उपकरण रीडिंग में परिवर्तन)।

व्यवस्थितत्रुटियां पक्षपाती हैं, क्योंकि वे नमूने में वस्तुओं के चयन के नियमों का उल्लंघन करते हैं (उदाहरण के लिए, मापने वाले उपकरण की सेटिंग बदलते समय माप में विचलन)।

उदाहरण।शहर में आबादी की सामाजिक स्थिति का आकलन करने के लिए, 25% परिवारों की जांच करने की योजना है। यदि, हालांकि, प्रत्येक चौथे अपार्टमेंट का चयन इसकी संख्या पर आधारित है, तो केवल एक प्रकार के सभी अपार्टमेंट (उदाहरण के लिए, एक कमरे वाले अपार्टमेंट) का चयन करने का खतरा है, जो व्यवस्थित त्रुटि पेश करेगा और परिणामों को विकृत करेगा; बहुत से अपार्टमेंट नंबर का चुनाव अधिक बेहतर है, क्योंकि त्रुटि यादृच्छिक होगी।

प्रतिनिधित्व संबंधी त्रुटियांकेवल चयनात्मक अवलोकन में निहित, उन्हें टाला नहीं जा सकता है और वे इस तथ्य के परिणामस्वरूप उत्पन्न होते हैं कि नमूना पूरी तरह से सामान्य को पुन: पेश नहीं करता है। नमूने से प्राप्त संकेतकों के मूल्य सामान्य जनसंख्या में समान मूल्यों के संकेतकों से भिन्न होते हैं (या निरंतर अवलोकन के दौरान प्राप्त)।

नमूनाकरण त्रुटिसामान्य जनसंख्या में पैरामीटर के मूल्य और उसके नमूना मूल्य के बीच का अंतर है। मात्रात्मक विशेषता के औसत मूल्य के लिए, यह इसके बराबर है: और शेयर (वैकल्पिक विशेषता) के लिए -।

नमूनाकरण त्रुटियां केवल नमूना प्रेक्षणों में अंतर्निहित हैं। ये त्रुटियाँ जितनी बड़ी होती हैं, अनुभवजन्य वितरण सैद्धांतिक से उतना ही भिन्न होता है। अनुभवजन्य वितरण के पैरामीटर और यादृच्छिक चर हैं, इसलिए नमूनाकरण त्रुटियां भी यादृच्छिक चर हैं, वे विभिन्न नमूनों के लिए अलग-अलग मान ले सकते हैं, और इसलिए यह गणना करने के लिए प्रथागत है औसत त्रुटि.

औसत नमूनाकरण त्रुटिगणितीय अपेक्षा से नमूना माध्य के मानक विचलन को व्यक्त करने वाला मान है। यह मूल्य, यादृच्छिक चयन के सिद्धांत के अधीन, मुख्य रूप से नमूना आकार और विशेषता की भिन्नता की डिग्री पर निर्भर करता है: विशेषता की भिन्नता जितनी बड़ी और छोटी होती है (इसलिए, का मान), का मान छोटा होता है औसत नमूना त्रुटि सामान्य और नमूना आबादी के भिन्नताओं के बीच का अनुपात सूत्र द्वारा व्यक्त किया गया है:

वे। पर्याप्त रूप से बड़े के लिए, हम मान सकते हैं कि . औसत नमूनाकरण त्रुटि सामान्य आबादी के पैरामीटर से नमूना आबादी के पैरामीटर के संभावित विचलन को दर्शाती है। तालिका में। 2 अवलोकन के आयोजन के विभिन्न तरीकों के लिए औसत नमूनाकरण त्रुटि की गणना के लिए भाव दिखाता है।

तालिका 2. विभिन्न प्रकार के नमूने के लिए नमूना माध्य और अनुपात की औसत त्रुटि (एम)।

एक सतत विशेषता के लिए इंट्राग्रुप नमूना प्रसरण का औसत कहां है;

शेयर के अंतर-समूह फैलाव का औसत;

- चयनित श्रृंखलाओं की संख्या, - श्रृंखलाओं की कुल संख्या;

जहां वें श्रृंखला का औसत है;

- एक सतत विशेषता के लिए पूरे नमूने का सामान्य औसत;

जहां वें श्रृंखला में विशेषता का अनुपात है;

- पूरे नमूने में विशेषता का कुल हिस्सा।

हालाँकि, औसत त्रुटि के परिमाण को केवल एक निश्चित प्रायिकता Р (Р ≤ 1) के साथ आंका जा सकता है। लायपुनोव ए.एम. साबित किया कि नमूने के वितरण का अर्थ है, और इसलिए सामान्य माध्य से उनका विचलन, पर्याप्त रूप से बड़ी संख्या के साथ, सामान्य वितरण कानून का पालन करता है, बशर्ते कि सामान्य आबादी का एक सीमित औसत और सीमित विचरण हो।

गणितीय रूप से, माध्य के लिए यह कथन इस प्रकार व्यक्त किया जाता है:

और भिन्न के लिए, व्यंजक (1) का रूप होगा:

कहाँ - वहाँ है सीमांत नमूना त्रुटि, जो औसत नमूनाकरण त्रुटि का गुणक है , और बहुलता कारक छात्र की कसौटी ("आत्मविश्वास कारक") है, जिसे डब्ल्यू.एस. गॉसेट (छद्म नाम "छात्र"); विभिन्न नमूना आकारों के मान एक विशेष तालिका में संग्रहीत किए जाते हैं।

t के कुछ मानों के लिए फ़ंक्शन Ф(t) के मान इस प्रकार हैं:

इसलिए, अभिव्यक्ति (3) को निम्नानुसार पढ़ा जा सकता है: संभाव्यता के साथ पी = 0.683 (68.3%)यह तर्क दिया जा सकता है कि नमूने और सामान्य माध्य के बीच का अंतर माध्य त्रुटि के एक मान से अधिक नहीं होगा मी (टी = 1), संभावना के साथ पी = 0.954 (95.4%)- कि यह दो औसत त्रुटियों के मान से अधिक नहीं है मी (टी = 2),संभावना के साथ पी = 0.997 (99.7%)- तीन मानों से अधिक नहीं होगा मी (टी = 3) .इस प्रकार, संभावना है कि यह अंतर औसत त्रुटि के मान के तीन गुना से अधिक हो जाएगा त्रुटि स्तरऔर से अधिक नहीं है 0,3% .

तालिका में। 3 सीमांत नमूनाकरण त्रुटि की गणना के लिए सूत्र दिखाता है।

तालिका 3. विभिन्न प्रकार के नमूना अवलोकन के लिए माध्य और अनुपात (पी) के लिए सीमांत नमूनाकरण त्रुटि (डी)।

जनसंख्या के लिए नमूना परिणाम का विस्तार

नमूना अवलोकन का अंतिम लक्ष्य सामान्य आबादी को चिह्नित करना है। छोटे नमूने के आकार के लिए, मापदंडों के अनुभवजन्य अनुमान ( और ) उनके वास्तविक मूल्यों ( और ) से महत्वपूर्ण रूप से विचलित हो सकते हैं। इसलिए, उन सीमाओं को स्थापित करना आवश्यक हो जाता है जिनके भीतर सही मान (और) पैरामीटर (और) के नमूना मूल्यों के लिए झूठ बोलते हैं।

विश्वास अंतरालसामान्य आबादी के कुछ पैरामीटर θ को इस पैरामीटर के मूल्यों की एक यादृच्छिक श्रेणी कहा जाता है, जिसकी संभावना 1 के करीब है ( विश्वसनीयता) में इस पैरामीटर का सही मान है।

मामूली त्रुटिनमूने Δ आपको सामान्य जनसंख्या और उनकी विशेषताओं के सीमा मूल्यों को निर्धारित करने की अनुमति देता है विश्वास अंतराल, जो बराबर हैं:

जमीनी स्तर विश्वास अंतरालघटाकर प्राप्त किया मामूली त्रुटिनमूना माध्य (साझा) से, और इसे जोड़कर शीर्ष एक।

विश्वास अंतरालमाध्य के लिए, यह सीमांत नमूनाकरण त्रुटि का उपयोग करता है और किसी दिए गए आत्मविश्वास स्तर के लिए सूत्र द्वारा निर्धारित किया जाता है:

इसका मतलब है कि दी गई संभावना के साथ आर, जिसे विश्वास स्तर कहा जाता है और विशिष्ट रूप से मूल्य द्वारा निर्धारित किया जाता है टी, यह तर्क दिया जा सकता है कि माध्य का सही मूल्य सीमा में है , और शेयर का सही मूल्य से सीमा में है

तीन मानक विश्वास स्तरों के लिए विश्वास अंतराल की गणना करते समय पी=95%, पी=99% और पी=99.9%मान द्वारा चुना गया है। स्वतंत्रता की डिग्री की संख्या के आधार पर आवेदन। यदि नमूना आकार काफी बड़ा है, तो इन संभावनाओं के अनुरूप मूल्य टीबराबर हैं: 1,96, 2,58 और 3,29 . इस प्रकार, सीमांत नमूनाकरण त्रुटि हमें सामान्य जनसंख्या की विशेषताओं और उनके विश्वास अंतराल के सीमांत मूल्यों को निर्धारित करने की अनुमति देती है:

सामाजिक-आर्थिक अध्ययनों में सामान्य आबादी के लिए चयनात्मक अवलोकन के परिणामों के वितरण की अपनी विशेषताएं हैं, क्योंकि इसके लिए अपने सभी प्रकारों और समूहों के प्रतिनिधित्व की पूर्णता की आवश्यकता होती है। इस तरह के वितरण की संभावना का आधार गणना है रिश्तेदारों की गलती:

कहाँ Δ % - सापेक्ष सीमांत नमूनाकरण त्रुटि; , .

जनसंख्या के लिए एक नमूना अवलोकन का विस्तार करने के लिए दो मुख्य विधियाँ हैं: प्रत्यक्ष रूपांतरण और गुणांक की विधि.

सार प्रत्यक्ष रूपांतरणनमूना माध्य!!\overline(x) को जनसंख्या के आकार से गुणा करना है।

उदाहरण. बता दें कि शहर में बच्चों की औसत संख्या का अनुमान एक नमूना पद्धति और एक व्यक्ति की राशि से लगाया जाता है। यदि शहर में 1000 युवा परिवार हैं, तो नगरपालिका नर्सरी में आवश्यक स्थानों की संख्या इस औसत को सामान्य जनसंख्या के आकार N = 1000 से गुणा करके प्राप्त की जाती है, अर्थात। 1200 सीटें होंगी।

गुणांक की विधिमामले में उपयोग करने की सलाह दी जाती है जब निरंतर अवलोकन के डेटा को स्पष्ट करने के लिए चयनात्मक अवलोकन किया जाता है।

ऐसा करने में, सूत्र का उपयोग किया जाता है:

जहां सभी चर जनसंख्या का आकार हैं:

आवश्यक नमूना आकार

तालिका 4. विभिन्न प्रकार के नमूनाकरण संगठन के लिए आवश्यक नमूना आकार (एन)।

स्वीकार्य नमूनाकरण त्रुटि के पूर्व निर्धारित मूल्य के साथ एक नमूना सर्वेक्षण की योजना बनाते समय, आवश्यक का सही अनुमान लगाना आवश्यक है नमूने का आकार. इस राशि को चयनात्मक अवलोकन के दौरान स्वीकार्य त्रुटि के आधार पर निर्धारित किया जा सकता है जो एक स्वीकार्य त्रुटि स्तर की गारंटी देता है (अवलोकन के आयोजन के तरीके को ध्यान में रखते हुए)। आवश्यक नमूना आकार n निर्धारित करने के लिए सूत्र आसानी से सीमांत नमूनाकरण त्रुटि के सूत्रों से सीधे प्राप्त किए जा सकते हैं। तो, सीमांत त्रुटि के लिए अभिव्यक्ति से:

नमूना आकार सीधे निर्धारित किया जाता है एन:

यह सूत्र दर्शाता है कि ह्रासमान सीमांत प्रतिचयन त्रुटि के साथ Δ महत्वपूर्ण रूप से आवश्यक नमूना आकार को बढ़ाता है, जो छात्र के टी-टेस्ट के प्रसरण और वर्ग के समानुपाती होता है।

अवलोकन के आयोजन की एक विशिष्ट विधि के लिए, आवश्यक नमूना आकार की गणना तालिका में दिए गए सूत्रों के अनुसार की जाती है। 9.4।

व्यावहारिक गणना उदाहरण

उदाहरण 1. निरंतर मात्रात्मक विशेषता के लिए माध्य मान और विश्वास अंतराल की गणना।

बैंक में लेनदारों के साथ निपटान की गति का आकलन करने के लिए, 10 भुगतान दस्तावेजों का एक यादृच्छिक नमूना लिया गया। उनका मान बराबर निकला (दिनों में): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

संभाव्यता के साथ आवश्यक है पी = 0.954मामूली त्रुटि निर्धारित करें Δ औसत गणना समय का नमूना माध्य और विश्वास सीमा।

समाधान।औसत मान की गणना तालिका के सूत्र द्वारा की जाती है। नमूना जनसंख्या के लिए 9.1

फैलाव की गणना तालिका से सूत्र के अनुसार की जाती है। 9.1।

दिन की औसत वर्ग त्रुटि।

माध्य की त्रुटि की गणना सूत्र द्वारा की जाती है:

वे। माध्य मान है एक्स ± एम = 12.0 ± 2.3 दिन.

माध्य की विश्वसनीयता थी

सीमित त्रुटि की गणना तालिका से सूत्र द्वारा की जाती है। 9.3 पुन: चयन के लिए, चूंकि जनसंख्या का आकार अज्ञात है, और के लिए पी = 0.954आत्मविश्वास स्तर।

इस प्रकार, माध्य मान x ± D = x ± 2m = 12.0 ± 4.6 है, अर्थात इसका वास्तविक मूल्य 7.4 से 16.6 दिनों की सीमा में है।

छात्र तालिका का उपयोग। आवेदन हमें यह निष्कर्ष निकालने की अनुमति देता है कि n = 10 - 1 = 9 डिग्री की स्वतंत्रता के लिए प्राप्त मूल्य एक महत्व स्तर £ 0.001 के साथ विश्वसनीय है, अर्थात। परिणामी माध्य मान 0 से उल्लेखनीय रूप से भिन्न है।

उदाहरण 2. संभाव्यता का अनुमान (सामान्य शेयर) आर।

1000 परिवारों की सामाजिक स्थिति के सर्वेक्षण की एक यांत्रिक नमूना पद्धति के साथ, यह पता चला कि निम्न-आय वाले परिवारों का अनुपात था डब्ल्यू = 0.3 (30%)(नमूना था 2% , अर्थात। एन/एन = 0.02). कॉन्फिडेंस लेवल के साथ चाहिए पी = 0.997एक संकेतक परिभाषित करें आरपूरे क्षेत्र में कम आय वाले परिवार।

समाधान।प्रस्तुत समारोह मूल्यों के अनुसार एफ (टी)दिए गए आत्मविश्वास स्तर के लिए खोजें पी = 0.997अर्थ टी = 3(सूत्र 3 देखें)। सीमांत साझा त्रुटि डब्ल्यूतालिका से सूत्र द्वारा निर्धारित करें। 9.3 नॉन-रिपीटिंग सैंपलिंग के लिए (मैकेनिकल सैंपलिंग हमेशा नॉन-रिपीटिंग होता है):

सापेक्ष नमूनाकरण त्रुटि को सीमित करना % होगा:

क्षेत्र में कम आय वाले परिवारों की संभावना (सामान्य हिस्सेदारी) होगी पी=डब्ल्यू±Δडब्ल्यू, और विश्वास सीमा p की गणना दोहरी असमानता के आधार पर की जाती है:

डब्ल्यू - Δw ≤ पी ≤ डब्ल्यू - Δw, अर्थात। p का सही मान इसके भीतर है:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

इस प्रकार, 0.997 की संभावना के साथ, यह तर्क दिया जा सकता है कि क्षेत्र में सभी परिवारों में निम्न-आय वाले परिवारों का अनुपात 28.6% से 31.4% तक है।

उदाहरण 3अंतराल श्रृंखला द्वारा निर्दिष्ट असतत सुविधा के लिए माध्य मान और विश्वास अंतराल की गणना।

तालिका में। 5. उद्यम द्वारा उनके कार्यान्वयन के समय के अनुसार आदेशों के उत्पादन के लिए आवेदनों का वितरण निर्धारित है।

तालिका 5. घटना के समय तक प्रेक्षणों का वितरण

समाधान। औसत ऑर्डर पूरा होने के समय की गणना सूत्र द्वारा की जाती है:

औसत समय होगा:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 महीने

यदि हम तालिका के अन्तिम स्तंभ से p i पर डेटा का उपयोग करते हैं तो हमें वही उत्तर मिलता है। 9.5 सूत्र का उपयोग करते हुए:

ध्यान दें कि पिछले ग्रेडेशन के अंतराल के मध्य को 60 - 36 = 24 महीने के बराबर पिछले ग्रेडेशन के अंतराल की चौड़ाई के साथ कृत्रिम रूप से पूरक करके पाया जाता है।

फैलाव की गणना सूत्र द्वारा की जाती है

कहाँ एक्स मैं- अंतराल श्रृंखला के मध्य।

इसलिए!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) और मानक त्रुटि है।

माध्य की त्रुटि की गणना महीनों के लिए सूत्र द्वारा की जाती है, अर्थात माध्य है!!\overline(x) ± m = 23.1 ± 13.4।

सीमित त्रुटि की गणना तालिका से सूत्र द्वारा की जाती है। 9.3 पुन: चयन के लिए क्योंकि जनसंख्या का आकार अज्ञात है, 0.954 आत्मविश्वास स्तर के लिए:

तो इसका मतलब है:

वे। इसका वास्तविक मूल्य 0 से 50 महीनों की सीमा में है।

उदाहरण 4एक वाणिज्यिक बैंक में निगम के एन = 500 उद्यमों के लेनदारों के साथ बस्तियों की गति निर्धारित करने के लिए, यादृच्छिक गैर-दोहरावदार चयन की विधि का उपयोग करके एक चयनात्मक अध्ययन करना आवश्यक है। आवश्यक नमूना आकार n निर्धारित करें ताकि प्रायिकता P = 0.954 के साथ नमूना माध्य की त्रुटि 3 दिनों से अधिक न हो, यदि परीक्षण के अनुमानों से पता चलता है कि मानक विचलन 10 दिनों का था।

समाधान. आवश्यक अध्ययनों की संख्या निर्धारित करने के लिए, हम तालिका से गैर-दोहराव वाले चयन के सूत्र का उपयोग करते हैं। 9.4:

इसमें, विश्वास स्तर Р = 0.954 के लिए t का मान निर्धारित किया जाता है। यह 2 के बराबर है। माध्य वर्ग मान s = 10, जनसंख्या आकार N = 500, और माध्य की सीमांत त्रुटि Δ x = 3. इन मानों को सूत्र में प्रतिस्थापित करते हुए, हम प्राप्त करते हैं:

वे। आवश्यक पैरामीटर का अनुमान लगाने के लिए 41 उद्यमों का नमूना बनाना पर्याप्त है - लेनदारों के साथ बस्तियों की गति।