วิธีการคำนวณขนาดตัวอย่างอย่างถูกต้อง? หัวข้อสัมมนา: การสุ่มตัวอย่างในการวิจัยทางสังคมวิทยา แนวคิดหลัก กลุ่มตัวอย่างขึ้นอยู่กับและเป็นอิสระ

การสุ่มตัวอย่างใน 1C 8.2 และ 8.3 เป็นวิธีเฉพาะในการค้นหาผ่านบันทึกของตารางฐานข้อมูล เรามาดูกันดีกว่าว่าการสุ่มตัวอย่างคืออะไรและใช้งานอย่างไร

การสุ่มตัวอย่างใน 1C คืออะไร

ตัวอย่าง- วิธีการเรียงลำดับข้อมูลใน 1C ซึ่งประกอบด้วยการวางเคอร์เซอร์ตามลำดับในบันทึกถัดไป การเลือกใน 1C สามารถรับได้จากผลลัพธ์แบบสอบถามและจากตัวจัดการวัตถุ เช่น เอกสารหรือไดเร็กทอรี

ตัวอย่างการรับและการวนซ้ำจากตัวจัดการอ็อบเจ็กต์:

การเลือก = ไดเรกทอรี ธนาคาร. เลือก() ; ลาก่อนการคัดเลือก ถัดไป() วนรอบ EndLoop ;

ตัวอย่างการรับตัวอย่างจากการร้องขอ:

รับบทเรียนวิดีโอ 267 บทเรียนบน 1C ฟรี:

คำขอ = คำขอใหม่ ( "เลือกลิงค์, รหัส, ชื่อจาก Directory.Banks") ; ดึงข้อมูล = แบบสอบถาม วิ่ง() . เลือก() ; ลาก่อนการคัดเลือก ถัดไป() วนซ้ำ // ดำเนินการตามความสนใจด้วยไดเร็กทอรี "Banks"เอ็นด์ไซเคิล ;

ทั้งสองตัวอย่างที่แสดงไว้ด้านบนได้รับชุดข้อมูลเดียวกันเพื่อทำซ้ำ

วิธีการสุ่มตัวอย่าง 1C 8.3

การสุ่มตัวอย่างมีหลายวิธี ลองพิจารณารายละเอียดเพิ่มเติม:

  • เลือก()- วิธีการรับตัวอย่างโดยตรง จากตัวอย่าง คุณสามารถรับตัวอย่างอื่นซึ่งเป็นรองได้ หากระบุประเภทของการแวะผ่าน "โดยการจัดกลุ่ม"
  • เจ้าของ()— วิธีผกผันกับ Select() ช่วยให้คุณได้รับตัวอย่างคำขอ "หลัก"
  • ต่อไป()— วิธีการเลื่อนเคอร์เซอร์ไปยังบันทึกถัดไป หากมีระเบียนจะส่งกลับ True หากไม่มีระเบียนจะส่งกลับ False
  • ค้นหาถัดไป()- วิธีการที่มีประโยชน์มากซึ่งคุณสามารถจัดเรียงเฉพาะฟิลด์ที่ต้องการตามค่าการเลือก (การเลือก - โครงสร้างฟิลด์)
  • NextByFieldValue()— ช่วยให้คุณได้รับบันทึกถัดไปที่มีค่าแตกต่างจากตำแหน่งปัจจุบัน ตัวอย่างเช่น คุณต้องวนซ้ำระเบียนทั้งหมดที่มีค่าเฉพาะสำหรับฟิลด์ "บัญชี": Select.NextByFieldValue (“บัญชี”)
  • รีเซ็ต()— ให้คุณรีเซ็ตตำแหน่งเคอร์เซอร์ปัจจุบันและตั้งค่าเป็นตำแหน่งเดิม
  • ปริมาณ()— ส่งกลับจำนวนระเบียนในส่วนที่เลือก
  • รับ()— โดยใช้วิธีการนี้คุณสามารถตั้งค่าเคอร์เซอร์บนบันทึกที่ต้องการตามค่าดัชนี
  • ระดับ() -ระดับในลำดับชั้นของบันทึกปัจจุบัน (หมายเลข)
  • ประเภทเรกคอร์ด()— แสดงประเภทของเรกคอร์ด - DetailedRecord, TotalByGrouping, TotalByHierarchy หรือ GeneralTotal
  • กลุ่ม()— ส่งคืนชื่อของการจัดกลุ่มปัจจุบัน หากบันทึกไม่ใช่การจัดกลุ่ม ก็จะส่งคืนสตริงว่าง

หากคุณกำลังเริ่มเรียนรู้การเขียนโปรแกรม 1C เราขอแนะนำหลักสูตรฟรีของเรา (อย่าลืม

เป้าหมายการเรียนรู้

  1. แยกความแตกต่างอย่างชัดเจนระหว่างแนวคิดเรื่องการสำรวจสำมะโนประชากร (คุณสมบัติ) และการสุ่มตัวอย่าง
  2. รู้สาระสำคัญและลำดับของหกขั้นตอนที่นักวิจัยนำไปใช้เพื่อให้ได้ประชากรตัวอย่าง
  3. กำหนดแนวคิดของ "กรอบตัวอย่าง"
  4. อธิบายความแตกต่างระหว่างความน่าจะเป็นและการสุ่มตัวอย่างตามที่กำหนด
  5. แยกแยะระหว่างการสุ่มตัวอย่างที่มีขนาดคงที่และการสุ่มตัวอย่างแบบหลายขั้นตอน (ตามลำดับ)
  6. อธิบายว่าการสุ่มตัวอย่างแบบเจาะจงคืออะไร และอธิบายทั้งจุดแข็งและจุดอ่อน
  7. กำหนดแนวคิดของการสุ่มตัวอย่างโควต้า
  8. อธิบายว่าพารามิเตอร์ในขั้นตอนการสุ่มตัวอย่างคืออะไร
  9. อธิบายว่าชุดที่ได้รับคืออะไร
  10. อธิบายว่าเหตุใดแนวคิดของการกระจายตัวอย่างจึงเป็นเช่นนั้น แนวคิดที่สำคัญที่สุดสถิติ.

ดังนั้นผู้วิจัยจึงกำหนดปัญหาได้อย่างแม่นยำและได้การออกแบบการวิจัยและเครื่องมือรวบรวมข้อมูลที่เหมาะสมสำหรับการแก้ปัญหา ขั้นตอนต่อไปของกระบวนการวิจัยควรเป็นการเลือกองค์ประกอบที่จะตรวจสอบ มีความเป็นไปได้ที่จะสำรวจทุกองค์ประกอบของประชากรที่กำหนดโดยการสำรวจสำมะโนประชากรให้ครบถ้วน การสำรวจประชากรโดยสมบูรณ์เรียกว่าการสำรวจสำมะโนประชากร มีความเป็นไปได้อีกอย่างหนึ่ง ประชากรบางส่วนซึ่งเป็นกลุ่มตัวอย่างของกลุ่มใหญ่อยู่ภายใต้การสำรวจทางสถิติ และจากข้อมูลที่ได้รับจากกลุ่มย่อยนี้ จะมีการสรุปข้อสรุปบางอย่างเกี่ยวกับทั้งกลุ่ม ความสามารถในการสรุปผลลัพธ์ที่ได้รับจากข้อมูลตัวอย่างไปยังกลุ่มที่ใหญ่ขึ้นนั้นขึ้นอยู่กับวิธีการเก็บตัวอย่าง เนื้อหาส่วนใหญ่ในบทนี้จะกล่าวถึงวิธีการเลือกตัวอย่างและเหตุใดจึงควรเลือกตัวอย่าง

การสำรวจสำมะโนประชากร (คุณสมบัติ)
การสำรวจสำมะโนประชากรให้สมบูรณ์
ตัวอย่าง
คอลเลกชันขององค์ประกอบของชุดย่อยของกลุ่มวัตถุที่ใหญ่กว่า

แนวคิดของ "ประชากร" หรือ "การสะสม" ไม่เพียงแต่หมายถึงผู้คนเท่านั้น แต่ยังหมายถึงบริษัทที่ดำเนินงานในอุตสาหกรรมการผลิต องค์กรค้าปลีกหรือค้าส่ง หรือแม้แต่วัตถุที่ไม่มีชีวิตโดยสิ้นเชิง เช่น ชิ้นส่วนที่ผลิตในสถานประกอบการ แนวคิดนี้ถูกกำหนดให้เป็นชุดองค์ประกอบทั้งหมดที่ตรงตามเงื่อนไขที่ระบุบางประการ เงื่อนไขเหล่านี้กำหนดอย่างชัดเจนทั้งองค์ประกอบที่เป็นของกลุ่มเป้าหมายและองค์ประกอบที่ควรแยกออกจากการพิจารณา

การวิจัยเพื่อระบุข้อมูลประชากรของผู้บริโภคพิซซ่าแช่แข็งควรเริ่มต้นด้วยการระบุว่าใครควรและไม่ควรจัดประเภทเช่นนี้ ผู้ที่เคยลองพิซซ่านี้อย่างน้อยหนึ่งครั้งอยู่ในหมวดหมู่นี้หรือไม่? บุคคลที่ซื้อพิซซ่าอย่างน้อยหนึ่งชิ้นต่อเดือน? ในสัปดาห์? คนที่กินพิซซ่ามากกว่าจำนวนขั้นต่ำที่กำหนดในหนึ่งเดือน? ผู้วิจัยต้องมีความแม่นยำในการระบุกลุ่มเป้าหมาย นอกจากนี้ จำเป็นต้องตรวจสอบให้แน่ใจด้วยว่าตัวอย่างนั้นมาจากประชากรเป้าหมาย ไม่ใช่จากประชากร "บางส่วน" ซึ่งเป็นกรณีที่กรอบการสุ่มตัวอย่างไม่เหมาะสมหรือไม่สมบูรณ์ ส่วนหลังคือรายการองค์ประกอบที่จะใช้สร้างตัวอย่างจริง

นักวิจัยอาจชอบวิธีการสุ่มตัวอย่างมากกว่าการสำรวจประชากรทั้งหมดด้วยเหตุผลหลายประการ ประการแรก สอบเต็มการรวมตัวที่มีขนาดค่อนข้างเล็กต้องใช้วัสดุและเวลาจำนวนมาก บ่อยครั้งเมื่อการสำรวจสำมะโนประชากรเสร็จสิ้นและข้อมูลได้รับการประมวลผล ข้อมูลดังกล่าวก็ล้าสมัยไปแล้ว ในบางกรณี คุณสมบัตินั้นเป็นไปไม่ได้เลย สมมติว่านักวิจัยตั้งใจที่จะตรวจสอบว่าอายุการใช้งานจริงของหลอดไส้ไฟฟ้าสอดคล้องกับที่คำนวณไว้หรือไม่ ซึ่งพวกเขาจะต้องเปิดไว้จนกว่าหลอดจะเสีย หากเราตรวจสอบสต็อกหลอดไฟทั้งหมดด้วยวิธีนี้ ก็จะได้ข้อมูลที่เชื่อถือได้ แต่จะไม่มีอะไรเหลือให้ซื้อขาย

สุดท้ายนี้ ทำให้มือใหม่ต้องประหลาดใจที่นักวิจัยอาจชอบการสุ่มตัวอย่างมากกว่าการเซ็นเซอร์ เพื่อรับรองความถูกต้องของผลลัพธ์ การดำเนินการสำรวจสำมะโนต้องอาศัยเจ้าหน้าที่จำนวนมาก ซึ่งจะเพิ่มโอกาสที่จะเกิดข้อผิดพลาดอย่างเป็นระบบ (ไม่มีการสุ่มตัวอย่าง) ข้อเท็จจริงข้อนี้เป็นหนึ่งในสาเหตุที่สำนักงานสำรวจสำมะโนประชากรของสหรัฐอเมริกาใช้ตัวอย่างการสำรวจเพื่อตรวจสอบความถูกต้องของการสำรวจสำมะโนประเภทต่างๆ คุณได้ยินถูกต้อง: อาจมีการดำเนินการสำรวจตัวอย่างเพื่อตรวจสอบความถูกต้องของข้อมูลคุณสมบัติ

ขั้นตอนการออกแบบตัวอย่าง

ในรูป รูปที่ 15.1 แสดงลำดับหกขั้นตอนที่ผู้วิจัยตัวอย่างอาจปฏิบัติตาม ก่อนอื่นจำเป็นต้องกำหนดประชากรเป้าหมายหรือชุดองค์ประกอบที่ผู้วิจัยต้องการทราบบางสิ่ง

ตัวอย่างเช่น เมื่อศึกษาความชอบของเด็ก นักวิจัยจำเป็นต้องตัดสินใจว่าประชากรที่กำลังศึกษาจะประกอบด้วยเด็กเท่านั้น พ่อแม่เท่านั้น หรือทั้งสองอย่าง

รวม (ประชากร)
ชุดองค์ประกอบที่ตรงตามเงื่อนไขที่ระบุบางประการ
กรอบตัวอย่าง
รายชื่อองค์ประกอบที่จะทำตัวอย่าง อาจประกอบด้วยหน่วยอาณาเขต องค์กร บุคคล และองค์ประกอบอื่นๆ

บริษัทแห่งหนึ่งได้ทดสอบ "การแข่งขัน" ทางไฟฟ้ากับเด็กเท่านั้น พวกเขาทำให้เด็ก ๆ พอใจ ผู้ปกครองมีปฏิกิริยาแตกต่างออกไปต่อผลิตภัณฑ์ใหม่ บรรดาคุณแม่ไม่ชอบที่สถานที่ท่องเที่ยวแห่งนี้ไม่ได้สอนให้เด็กๆ ดูแลรถยนต์ และคุณพ่อก็ไม่ชอบที่ผลิตภัณฑ์นี้ถูกสร้างขึ้นมาเหมือนของเล่น
สถานการณ์ตรงกันข้ามก็เป็นไปได้เช่นกัน บริษัท แห่งหนึ่งเริ่มผลิตผลิตภัณฑ์อาหารและเปิดตัวแคมเปญโฆษณาทั่วประเทศโดยมอบหมายบทบาทหลักให้กับเด็กแก่แดด บริษัท ทดสอบประสิทธิภาพของโฆษณาเฉพาะกับคุณแม่ที่ตื่นเต้นและดีใจเท่านั้น เด็กๆ พบ "เครื่องเร่งความเร็ว" นี้และด้วยตัวผลิตภัณฑ์โฆษณานั้นน่าขยะแขยง สินค้าเสร็จแล้วครับ1.

ผู้วิจัยจะต้องตัดสินใจว่าประชากรที่เกี่ยวข้องจะประกอบด้วยใครหรือกลุ่มใด: บุคคล ครอบครัว บริษัท องค์กรอื่น ธุรกรรมบัตรเครดิต ฯลฯ เมื่อทำการตัดสินใจดังกล่าว จำเป็นต้องกำหนดองค์ประกอบที่ควรแยกออกจากประชากร การอ้างอิงองค์ประกอบทั้งชั่วคราวและทางภูมิศาสตร์จะต้องดำเนินการ ซึ่งในบางกรณีอาจอยู่ภายใต้เงื่อนไขหรือข้อจำกัดเพิ่มเติม ตัวอย่างเช่น หากเรากำลังพูดถึงบุคคล ประชากรที่สนใจอาจประกอบด้วยเฉพาะบุคคลที่มีอายุเกิน 18 ปี หรือเฉพาะสตรี หรือเฉพาะบุคคลที่มีการศึกษาระดับมัธยมศึกษาตอนปลายเป็นอย่างน้อยเท่านั้น

งานในการกำหนดขอบเขตทางภูมิศาสตร์สำหรับประชากรเป้าหมายในการวิจัยการตลาดระหว่างประเทศสามารถทำได้ ปัญหาพิเศษเนื่องจากสิ่งนี้จะเพิ่มความหลากหลายของระบบที่กำลังพิจารณา ตัวอย่างเช่น อัตราส่วนสัมพัทธ์ระหว่างพื้นที่เมืองและชนบทอาจแตกต่างกันอย่างมีนัยสำคัญในแต่ละประเทศ ลักษณะอาณาเขตมีผลกระทบร้ายแรงต่อองค์ประกอบของประชากรภายในประเทศหนึ่ง ตัวอย่างเช่น ทางตอนเหนือของชิลี ประชากรอินเดียส่วนใหญ่อาศัยอยู่อย่างหนาแน่น ในขณะที่ในพื้นที่ทางตอนใต้ของประเทศ ประชากรส่วนใหญ่เป็นลูกหลานของชาวยุโรปอาศัยอยู่

ความคุ้มครอง (อุบัติการณ์)
แสดงเป็นเปอร์เซ็นต์ ซึ่งเป็นสัดส่วนขององค์ประกอบของประชากรหรือกลุ่มที่ตรงตามเงื่อนไขในการรวมไว้ในกลุ่มตัวอย่าง

โดยทั่วไป ยิ่งกำหนดประชากรเป้าหมายให้ชัดเจนยิ่งขึ้น ความครอบคลุม (อุบัติการณ์) ก็จะยิ่งสูงขึ้น และขั้นตอนการสุ่มตัวอย่างก็จะง่ายขึ้นและราคาถูกกว่า ความคุ้มครอง (อุบัติการณ์)สอดคล้องกับเปอร์เซ็นต์ขององค์ประกอบของประชากรหรือกลุ่มที่ตรงตามเงื่อนไขในการรวมไว้ในตัวอย่าง ความครอบคลุมส่งผลโดยตรงต่อเวลาและ ต้นทุนวัสดุที่จำเป็นสำหรับการสอบ หากความครอบคลุมมีขนาดใหญ่ (นั่นคือ องค์ประกอบส่วนใหญ่ของประชากรเป็นไปตามเกณฑ์ง่ายๆ อย่างน้อยหนึ่งเกณฑ์ที่ใช้ในการระบุผู้ตอบแบบสอบถามที่มีศักยภาพ) เวลาและต้นทุนวัสดุที่จำเป็นสำหรับการรวบรวมข้อมูลจะลดลง ในทางกลับกัน เมื่อจำนวนเกณฑ์ที่ผู้ตอบแบบสอบถามต้องปฏิบัติตามเพิ่มขึ้น ต้นทุนวัสดุและเวลาก็เพิ่มขึ้น

ในรูป รูปที่ 15.2 แสดงสัดส่วนของประชากรผู้ใหญ่ที่เกี่ยวข้องกับกีฬาบางประเภท ข้อมูลในรูประบุว่าการตรวจสอบผู้ที่เกี่ยวข้องกับการขี่มอเตอร์ไซค์ (เพียง 3.6% ของจำนวนผู้ใหญ่ทั้งหมด) นั้นยากและมีค่าใช้จ่ายสูงกว่าการตรวจสอบผู้ที่เดินเล่นเพื่อสันทนาการเป็นประจำ (27.4% ของจำนวนผู้ใหญ่ทั้งหมด) สิ่งสำคัญคือผู้วิจัยต้องแม่นยำในการพิจารณาว่าควรรวมองค์ประกอบใดไว้ในประชากรที่กำลังศึกษาและควรแยกองค์ประกอบใดออกจากองค์ประกอบนั้น คำแถลงเป้าหมายการวิจัยที่ชัดเจนช่วยอำนวยความสะดวกในการแก้ปัญหานี้อย่างมาก ขั้นตอนที่สองในกระบวนการเลือกตัวอย่างคือการกำหนดเฟรมตัวอย่าง ซึ่งดังที่คุณทราบอยู่แล้วคือรายการองค์ประกอบที่จะดึงตัวอย่าง กำหนดให้ประชากรเป้าหมายของการศึกษาคือทุกครอบครัวที่อาศัยอยู่ในพื้นที่ดัลลัส เมื่อมองแวบแรก กรอบการสุ่มตัวอย่างที่ดีและเข้าถึงได้ง่ายคือสมุดโทรศัพท์ของดัลลัส อย่างไรก็ตาม เมื่อตรวจสอบอย่างใกล้ชิด จะเห็นได้ชัดว่ารายชื่อตระกูลที่มีอยู่ในไดเร็กทอรีนั้นไม่ถูกต้องทั้งหมด เนื่องจากหมายเลขของบางตระกูลถูกละไว้ (แน่นอนว่าไม่รวมถึงครอบครัวที่ไม่มีโทรศัพท์) ในขณะที่บางครอบครัวมีหมายเลขโทรศัพท์หลายหมายเลข บุคคลที่เพิ่งเปลี่ยนสถานที่อยู่อาศัยและหมายเลขโทรศัพท์ของพวกเขาจะไม่รวมอยู่ในไดเร็กทอรีด้วย

นักวิจัยที่มีประสบการณ์พบว่าแทบจะไม่มีการจับคู่ที่ตรงกันทุกประการระหว่างกรอบการสุ่มตัวอย่างกับประชากรเป้าหมายที่สนใจ หนึ่งในที่สุด ขั้นตอนที่สร้างสรรค์งานของการออกแบบการสุ่มตัวอย่างคือการกำหนดกรอบการสุ่มตัวอย่างที่เหมาะสม เมื่อการแสดงรายการองค์ประกอบประชากรเป็นเรื่องยาก ซึ่งอาจต้องมีการสุ่มตัวอย่างจากบล็อคงานและคำนำหน้า ตัวอย่างเช่น การโทรแบบสุ่มถูกใช้เนื่องจากข้อบกพร่องในไดเร็กทอรีโทรศัพท์ อย่างไรก็ตามการเพิ่มขึ้นอย่างมากของหน่วยงานในช่วง 10 ปีที่ผ่านมาทำให้งานนี้ยากขึ้น สถานการณ์ที่คล้ายกันสามารถเกิดขึ้นได้ในระหว่างการสังเกตการณ์แบบเลือกสรรของเขตอาณาเขตหรือองค์กรที่มีการสุ่มตัวอย่างในภายหลัง เมื่อกล่าวได้ว่าประชากรเป้าหมายเป็นรายบุคคล แต่ไม่มีรายการที่แน่นอนในปัจจุบัน

ที่มา: จากข้อมูลที่มีอยู่ใน SSI ไลท์ TM: โอ้อุบัติการณ์ กำหนดเป้าหมาย การขยายขนาด" (Fairfield, Conn.: Survey Sampling, Inc., 1994)

ขั้นตอนที่สามของขั้นตอนการสุ่มตัวอย่างมีความเกี่ยวข้องอย่างใกล้ชิดกับการกำหนดกรอบการสุ่มตัวอย่าง การเลือกวิธีการหรือขั้นตอนการสุ่มตัวอย่างจะขึ้นอยู่กับกรอบการสุ่มตัวอย่างที่ผู้วิจัยนำมาใช้เป็นส่วนใหญ่ ต้องการตัวอย่างประเภทต่างๆ หลากหลายชนิดเฟรมสุ่มตัวอย่าง บทนี้และบทถัดไปจะให้ภาพรวมของตัวอย่างประเภทหลักที่ใช้ในการวิจัยการตลาด เมื่ออธิบายความเชื่อมโยงระหว่างกรอบการสุ่มตัวอย่างและวิธีการสร้างกรอบควรชัดเจน

ขั้นตอนที่สี่ในขั้นตอนการสุ่มตัวอย่างคือการกำหนดขนาดตัวอย่าง ปัญหานี้ถูกกล่าวถึงใน Chap 17. ในขั้นที่ 5 ผู้วิจัยจำเป็นต้องเลือกองค์ประกอบที่จะตรวจสอบจริงๆ วิธีการที่ใช้เพื่อจุดประสงค์นี้ถูกกำหนดโดยประเภทตัวอย่างที่เลือก เมื่อพูดถึงวิธีการสุ่มตัวอย่าง เราจะพูดถึงการเลือกองค์ประกอบต่างๆ ด้วย สุดท้ายนี้ ผู้วิจัยจำเป็นต้องสำรวจผู้ตอบแบบสอบถามที่เลือกจริงๆ ในขั้นตอนนี้มีความเป็นไปได้สูงที่จะทำผิดพลาดหลายครั้ง
ปัญหาเหล่านี้และวิธีการแก้ไขปัญหาเหล่านี้จะกล่าวถึงในบทที่ 18.

ประเภทของแผนการสุ่มตัวอย่าง (sampling)

วิธีการควบคุมการสุ่มตัวอย่างทั้งหมดสามารถแบ่งออกเป็นสองประเภท: การสังเกตตัวอย่างความน่าจะเป็น และการสังเกตตัวอย่างที่กำหนด สมาชิกแต่ละคนของประชากรสามารถรวมไว้ในตัวอย่างความน่าจะเป็นโดยมีความน่าจะเป็นที่ไม่เป็นศูนย์ตามที่ระบุ ความน่าจะเป็นที่จะรวมสมาชิกบางคนในกลุ่มตัวอย่างอาจแตกต่างกันไป แต่เป็นที่ทราบความน่าจะเป็นที่จะรวมแต่ละองค์ประกอบในกลุ่มตัวอย่าง ความน่าจะเป็นนี้กำหนดโดยขั้นตอนทางกลเฉพาะที่ใช้ในการเลือกองค์ประกอบตัวอย่าง

สำหรับตัวอย่างที่กำหนด การประเมินความน่าจะเป็นของการรวมองค์ประกอบใดๆ ไว้ในตัวอย่างจะเป็นไปไม่ได้ ไม่สามารถรับประกันความเป็นตัวแทนของตัวอย่างดังกล่าวได้ ตัวอย่างเช่น, บริษัท ออลสเตท คอร์ปอเรชั่นพัฒนาระบบประมวลผลข้อมูลการเคลมประกัน 14 ล้านครัวเรือน (ลูกค้า) บริษัทวางแผนที่จะใช้ข้อมูลนี้เพื่อกำหนดรูปแบบความต้องการบริการ ตัวอย่างเช่น โอกาสที่ครัวเรือนที่เป็นเจ้าของ Mercedes Benz จะเป็นเจ้าของบ้านพักตากอากาศด้วย (ซึ่งจะต้องมีประกันภัย) แม้ว่าฐานข้อมูลจะมีขนาดใหญ่มาก แต่บริษัทก็ไม่มีทางประเมินความเป็นไปได้ที่ลูกค้ารายใดรายหนึ่งจะทำการเรียกร้อง บริษัทจึงไม่สามารถแน่ใจได้ว่าข้อมูลลูกค้าที่เรียกร้องเป็นตัวแทนของลูกค้าของบริษัททั้งหมด และในขอบเขตที่น้อยกว่านั้น - เกี่ยวข้องกับผู้มีโอกาสเป็นลูกค้า

ตัวอย่างที่กำหนดทั้งหมดจะขึ้นอยู่กับตำแหน่ง การตัดสินใจ หรือความชอบส่วนบุคคลของผู้วิจัย มากกว่าขั้นตอนทางกลในการเลือกองค์ประกอบตัวอย่าง การตั้งค่าดังกล่าวบางครั้งสามารถให้ค่าประมาณที่ดีเกี่ยวกับคุณลักษณะของประชากรได้ แต่ไม่มีวิธีใดที่จะตัดสินได้อย่างเป็นกลางว่ากลุ่มตัวอย่างเหมาะสมกับงานที่ทำอยู่หรือไม่ การประเมินความถูกต้องของผลการสุ่มตัวอย่างสามารถทำได้เฉพาะเมื่อทราบความน่าจะเป็นในการเลือกองค์ประกอบบางอย่างเท่านั้น ด้วยเหตุนี้ โดยทั่วไปการสุ่มตัวอย่างความน่าจะเป็นจึงถือเป็นวิธีการที่ดีกว่าในการประมาณค่าขนาดของข้อผิดพลาดในการสุ่มตัวอย่าง ตัวอย่างยังสามารถแบ่งออกเป็นตัวอย่างที่มีขนาดคงที่และตัวอย่างตามลำดับ เมื่อทำงานกับตัวอย่างที่มีขนาดคงที่ ขนาดตัวอย่างจะถูกกำหนดก่อนที่จะเริ่มการสำรวจ และการวิเคราะห์ผลลัพธ์จะนำหน้าด้วยการรวบรวมข้อมูลที่จำเป็นทั้งหมด เราจะสนใจตัวอย่างที่มีขนาดคงที่เป็นหลัก เนื่องจากเป็นประเภทที่มักใช้ในการวิจัยการตลาด

การสุ่มตัวอย่างความน่าจะเป็น
ตัวอย่างที่สามารถรวมแต่ละองค์ประกอบของประชากรเข้ากับความน่าจะเป็นที่ไม่เป็นศูนย์ที่ทราบแน่ชัด
การสุ่มตัวอย่างแบบกำหนด
การสุ่มตัวอย่างตามความชอบส่วนตัวหรือการตัดสินที่กำหนดการเลือกองค์ประกอบบางอย่าง ในกรณีนี้ การประเมินความน่าจะเป็นที่จะรวมองค์ประกอบประชากรตามอำเภอใจในกลุ่มตัวอย่างกลายเป็นไปไม่ได้

อย่างไรก็ตาม ไม่ควรลืมว่ายังมีตัวอย่างตามลำดับที่สามารถใช้กับการออกแบบการสุ่มตัวอย่างพื้นฐานแต่ละแบบที่กล่าวถึงด้านล่างนี้

ในการสุ่มตัวอย่างตามลำดับ ไม่ทราบจำนวนองค์ประกอบที่เลือกล่วงหน้า โดยพิจารณาจากชุดการตัดสินใจตามลำดับ หากการสำรวจกลุ่มตัวอย่างขนาดเล็กไม่ได้ผลลัพธ์ที่เชื่อถือได้ ช่วงขององค์ประกอบที่สำรวจก็จะถูกขยายออกไป หากผลลัพธ์ยังคงไม่สามารถสรุปได้ ขนาดตัวอย่างจะเพิ่มขึ้นอีกครั้ง ในแต่ละขั้นตอน จะมีการตัดสินใจว่าผลลัพธ์ที่ได้จะถือว่าน่าเชื่อเพียงพอหรือไม่ หรือจะรวบรวมข้อมูลต่อไปหรือไม่ การทำงานกับการสุ่มตัวอย่างตามลำดับทำให้สามารถประเมินแนวโน้มของข้อมูลในขณะที่รวบรวมได้ ซึ่งช่วยให้คุณลดต้นทุนที่เกี่ยวข้องกับการสังเกตเพิ่มเติมในกรณีที่ความเป็นไปได้ไร้ประโยชน์

การออกแบบการสุ่มตัวอย่างทั้งแบบความน่าจะเป็นและแบบกำหนดนั้นมีหลายประเภท ตัวอย่างเช่น ตัวอย่างที่กำหนดขึ้นอาจไม่เป็นตัวแทน (สะดวก) โดยเจตนา หรือโควต้า ตัวอย่างความน่าจะเป็นจะถูกแบ่งออกเป็นแบบสุ่มอย่างง่าย แบ่งชั้น หรือกลุ่ม (คลัสเตอร์) ในทางกลับกัน ก็สามารถแบ่งออกเป็นประเภทย่อยได้ ในรูป รูปที่ 15.3 แสดงประเภทของตัวอย่างที่จะกล่าวถึงในบทนี้และบทถัดไป

การสุ่มตัวอย่างแบบปริมาตรคงที่ (การสุ่มตัวอย่างแบบคงที่)
ตัวอย่างที่มีการกำหนดขนาดนิรนัย; ข้อมูลที่จำเป็นจะถูกกำหนดจากองค์ประกอบที่เลือก
การสุ่มตัวอย่างตามลำดับ
ตัวอย่างที่เกิดขึ้นจากชุดการตัดสินใจตามลำดับ หลังจากพิจารณาตัวอย่างขนาดเล็กแล้ว หากผลลัพธ์ปรากฏว่าไม่สามารถสรุปได้ ให้พิจารณาตัวอย่างที่มีขนาดใหญ่กว่า หากขั้นตอนนี้ไม่นำไปสู่ผลลัพธ์ ขนาดตัวอย่างก็จะเพิ่มขึ้นอีกครั้ง เป็นต้น ดังนั้น ในแต่ละขั้นตอนจึงมีการตัดสินใจว่าผลลัพธ์ที่ได้จะถือว่าน่าเชื่อเพียงพอหรือไม่

ควรจำไว้ว่าตัวอย่างประเภทหลักสามารถนำมารวมกันเพื่อสร้างรูปแบบเพิ่มเติมได้ แผนที่ซับซ้อนการสังเกตแบบเลือกสรร หากคุณเข้าใจประเภทเริ่มต้นพื้นฐาน คุณจะเข้าใจชุดค่าผสมที่ซับซ้อนได้ง่ายขึ้น

ตัวอย่างที่กำหนด

ดังที่ได้กล่าวไปแล้ว เมื่อเลือกองค์ประกอบของกลุ่มตัวอย่างที่กำหนด การประเมินหรือการตัดสินใจส่วนตัวจะมีบทบาทชี้ขาด บางครั้งการประมาณการเหล่านี้มาจากผู้วิจัย แต่ในกรณีอื่นๆ การเลือกองค์ประกอบของประชากรเป็นหน้าที่ของพนักงานภาคสนาม เนื่องจากองค์ประกอบต่างๆ ไม่ได้ถูกเลือกโดยกลไก การพิจารณาความน่าจะเป็นของการรวมองค์ประกอบใดๆ ไว้ในตัวอย่าง และด้วยเหตุนี้ ข้อผิดพลาดในการสุ่มตัวอย่างจึงเป็นไปไม่ได้ การเพิกเฉยต่อข้อผิดพลาดเนื่องจากขั้นตอนการสุ่มตัวอย่างที่เลือกทำให้นักวิจัยไม่สามารถประเมินความแม่นยำของการประมาณการได้

ตัวอย่างที่ไม่ใช่ตัวแทน (สะดวก)

ตัวอย่างที่ไม่ใช่ตัวแทน (สะดวก)บางครั้งเรียกว่าสุ่มเนื่องจากการเลือกองค์ประกอบตัวอย่างจะดำเนินการในลักษณะ "สุ่ม" - องค์ประกอบเหล่านั้นที่มีหรือดูเหมือนว่าจะมีมากที่สุดในช่วงระยะเวลาสุ่มตัวอย่างจะถูกเลือก

ชีวิตประจำวันของเราเต็มไปด้วยตัวอย่างการเลือกสรรดังกล่าว เราพูดคุยกับเพื่อนๆ และจากปฏิกิริยาและจุดยืนของพวกเขา เราได้ข้อสรุปเกี่ยวกับอคติทางการเมืองที่มีอยู่ในสังคม สถานีวิทยุท้องถิ่นเรียกร้องให้ประชาชนแสดงความคิดเห็นในประเด็นที่มีการโต้เถียง และความคิดเห็นที่พวกเขาแสดงออกมาจะถูกตีความว่ามีอยู่ทั่วไป เราสนับสนุนให้อาสาสมัครร่วมมือและทำงานร่วมกับผู้ที่อาสาช่วยเรา ปัญหาเกี่ยวกับตัวอย่างตามความสะดวกนั้นชัดเจน เราไม่สามารถแน่ใจได้ว่าตัวอย่างประเภทนี้เป็นตัวแทนของประชากรเป้าหมายจริงๆ เราอาจยังคงสงสัยว่าความคิดเห็นของเพื่อนสะท้อนความคิดเห็นทางการเมืองที่เกิดขึ้นในสังคมได้อย่างถูกต้อง แต่เรามักอยากจะเชื่อว่ากลุ่มตัวอย่างขนาดใหญ่ที่เลือกในลักษณะเดียวกันนั้นเป็นตัวแทน ให้เราแสดงความเข้าใจผิดของสมมติฐานดังกล่าวพร้อมตัวอย่าง
เมื่อหลายปีก่อน สถานีโทรทัศน์ท้องถิ่นแห่งหนึ่งในเมืองที่ผู้เขียนหนังสือเล่มนี้อาศัยอยู่ ได้ทำการสำรวจความคิดเห็นสาธารณะทุกวันในหัวข้อที่เป็นที่สนใจของชุมชนท้องถิ่น การสำรวจที่เรียกว่า "Pulse of Madison" ได้ดำเนินการดังนี้ ทุกเย็นในช่วงข่าวหกโมงเย็น สถานีจะถามคำถามผู้ชมเกี่ยวกับประเด็นข้อขัดแย้งที่เฉพาะเจาะจง ซึ่งพวกเขาจะต้องให้คำตอบเชิงบวกหรือเชิงลบ

ในกรณีที่ได้รับคำตอบเชิงบวก คุณต้องโทรไปหมายเลขหนึ่ง ในกรณีที่ได้รับคำตอบเชิงลบ คุณต้องโทรไปยังหมายเลขโทรศัพท์อื่น จำนวนคะแนนโหวต "สำหรับ" และ "ต่อต้าน" จะถูกคำนวณโดยอัตโนมัติ ออกอากาศข่าวสิบโมงรายงานผลการสำรวจทางโทรศัพท์ ทุกเย็นมีคนโทรหาสตูดิโอตั้งแต่ 500 ถึง 1,000 คนเพื่อต้องการแสดงจุดยืนของตนในประเด็นใดประเด็นหนึ่ง ผู้บรรยายทางโทรทัศน์ตีความผลการสำรวจว่าเป็นความคิดเห็นของประชาชนกระแสหลัก

ตัวอย่างที่ไม่ใช่ตัวแทน (สะดวก)
บางครั้งเรียกว่าสุ่มเนื่องจากการเลือกองค์ประกอบตัวอย่างจะดำเนินการในลักษณะ "สุ่ม" โดยจะเลือกองค์ประกอบเหล่านั้นที่มีอยู่หรือดูเหมือนว่าจะมีอยู่มากที่สุดในช่วงระยะเวลาสุ่มตัวอย่าง

ในหนึ่งในตอนความยาวหกชั่วโมง ผู้ชมถูกถามคำถามต่อไปนี้: "คุณคิดว่าอายุการดื่มสุราในเมดิสันควรลดลงเหลือ 18 ปีหรือไม่" อายุตามกฎหมายที่มีอยู่คือ 21 ปี ผู้ชมตอบคำถามนี้ด้วยกิจกรรมพิเศษ - ในเย็นวันนั้นมีคนเกือบ 4,000 คนโทรมาที่สตูดิโอ ซึ่ง 78% เห็นชอบให้ลดขีดจำกัดอายุลง ดูเหมือนชัดเจนว่ากลุ่มตัวอย่าง 4,000 คน "ควรเป็นตัวแทน" ของชุมชน 180,000 คน ไม่มีอะไรแบบนั้น ดังที่คุณคงเดาได้แล้วว่า ประชากรกลุ่มหนึ่งสนใจผลการลงคะแนนเสียงที่ทราบมากกว่าคนอื่นๆ มาก ด้วยเหตุนี้ จึงไม่น่าแปลกใจที่เมื่อพูดคุยถึงประเด็นนี้ในอีกไม่กี่สัปดาห์ต่อมา ปรากฏว่านักเรียนแสดงคอนเสิร์ตในช่วงเวลาที่กำหนดสำหรับการสำรวจ พวกเขาเรียกโทรทัศน์ผลัดกัน ครั้งละหลายครั้ง ดังนั้น ทั้งขนาดกลุ่มตัวอย่างและเปอร์เซ็นต์ของผู้สนับสนุนการเปิดเสรีกฎหมายจึงไม่น่าแปลกใจเลย กลุ่มตัวอย่างไม่ได้เป็นตัวแทน

การเพิ่มขนาดตัวอย่างเพียงอย่างเดียวไม่ได้ทำให้เป็นตัวอย่าง ความเป็นตัวแทนของกลุ่มตัวอย่างไม่ได้ขึ้นอยู่กับขนาด แต่โดยขั้นตอนที่เหมาะสมสำหรับการเลือกองค์ประกอบ เมื่อมีการระบุผู้เข้าร่วมการสำรวจโดยสมัครใจหรือเลือกองค์ประกอบตัวอย่างตามความพร้อม แผนการสุ่มตัวอย่างไม่รับประกันความเป็นตัวแทนของตัวอย่าง หลักฐานเชิงประจักษ์แสดงให้เห็นว่าตัวอย่างที่เลือกเพื่อความสะดวกนั้นแทบจะไม่เป็นตัวแทนเลย (ไม่ว่าขนาดตัวอย่างจะเป็นขนาดใดก็ตาม) โพลทางโทรศัพท์ซึ่งสำรวจด้วยคะแนนเสียง 800-900 เสียง เป็นรูปแบบที่พบบ่อยที่สุดของกลุ่มตัวอย่างจำนวนมากแต่ไม่ได้เป็นตัวแทน

การสุ่มตัวอย่างอย่างมีจุดมุ่งหมาย
การสุ่มตัวอย่างแบบกำหนด (โดยเด็ดเดี่ยว) องค์ประกอบที่เลือกด้วยตนเอง มีการเลือกองค์ประกอบเหล่านั้นให้ตรงตามวัตถุประสงค์ของการสำรวจตามความเห็นของผู้วิจัย
การสุ่มตัวอย่างอย่างมีจุดมุ่งหมาย ขึ้นอยู่กับความสามารถของผู้วิจัยในการระบุกลุ่มผู้ตอบแบบสอบถามกลุ่มแรกที่มีลักษณะที่ต้องการ จากนั้นผู้ตอบแบบสอบถามเหล่านี้จะถูกนำมาใช้เป็นผู้ให้ข้อมูลเพื่อพิจารณาการคัดเลือกบุคคลเพิ่มเติม

น่าเสียดายที่หลายคนรับผลการสำรวจดังกล่าวด้วยความมั่นใจ หนึ่งในตัวอย่างทั่วไปที่สุดของการใช้กลุ่มตัวอย่างที่ไม่ใช่ตัวแทนในการวิจัยการตลาดระหว่างประเทศคือการสำรวจของบางประเทศโดยอิงจากกลุ่มตัวอย่างที่ประกอบด้วยชาวต่างชาติที่อาศัยอยู่ในอาณาเขตของประเทศที่ริเริ่มการสำรวจ (เช่น ชาวสแกนดิเนเวียที่อาศัยอยู่ใน ประเทศสหรัฐอเมริกา). แม้ว่าตัวอย่างดังกล่าวอาจให้ความกระจ่างในบางแง่มุมของประชากรที่เป็นปัญหา แต่ต้องจำไว้ว่าบุคคลเหล่านี้มักจะเป็นตัวแทนของชนชั้นสูง "แบบอเมริกัน" ซึ่งความเชื่อมโยงกับประเทศของตนเองอาจมีเงื่อนไขค่อนข้างมาก ไม่แนะนำให้ใช้ตัวอย่างที่ไม่ใช่ตัวแทนเมื่อดำเนินการสำรวจเชิงพรรณนาหรือเชิงสาเหตุ อนุญาตให้ใช้ได้เฉพาะในการศึกษาเชิงสำรวจที่มุ่งพัฒนาแนวคิดหรือแนวคิดเฉพาะเท่านั้น แต่ถึงแม้ในกรณีนี้ ก็ควรใช้ตัวอย่างโดยเจตนามากกว่า

การสุ่มตัวอย่างอย่างมีจุดมุ่งหมาย

บางครั้งเรียกว่าการสุ่มตัวอย่างอย่างมีจุดมุ่งหมาย ไม่เน้น; องค์ประกอบของพวกเขาซึ่งตามความเห็นของผู้วิจัยบรรลุวัตถุประสงค์ของการศึกษาจะถูกเลือกด้วยตนเอง พรอคเตอร์ แอนด์ แกมเบิลใช้วิธีนี้เมื่อแสดงโฆษณาแก่เด็กอายุ 13 ถึง 17 ปีที่อาศัยอยู่ใกล้สำนักงานใหญ่ในซินซินนาติ แผนกอาหารและเครื่องดื่มของบริษัทได้ว่าจ้างวัยรุ่นกลุ่มนี้ให้ทำหน้าที่เป็นตัวอย่างผู้บริโภค พวกเขาทำงาน 10 ชั่วโมงต่อสัปดาห์เพื่อแลกกับเงิน 1,000 ดอลลาร์และไปดูคอนเสิร์ต พวกเขาดูโฆษณาทางโทรทัศน์ เยี่ยมซูเปอร์มาร์เก็ตกับผู้จัดการบริษัทเพื่อดูการจัดแสดงผลิตภัณฑ์ ทดสอบผลิตภัณฑ์ใหม่ และหารือเกี่ยวกับพฤติกรรมการซื้อ ด้วยการเลือกตัวแทนตัวอย่างผ่านกระบวนการ "รับสมัคร" แทนที่จะสุ่ม บริษัทสามารถมุ่งเน้นไปที่คุณลักษณะที่ถือว่ามีประโยชน์ เช่น ความสามารถของวัยรุ่นในการแสดงออกอย่างชัดเจน โดยมีความเสี่ยงที่ความคิดเห็นของพวกเขาอาจไม่เป็นตัวแทนของกลุ่มอายุของพวกเขา

ดังที่ได้กล่าวไปแล้วว่า คุณสมบัติที่โดดเด่นตัวอย่างโดยเจตนาคือการเลือกองค์ประกอบโดยตรง ในบางกรณี องค์ประกอบตัวอย่างจะถูกเลือกไม่ใช่เพราะว่าเป็นตัวแทน แต่เนื่องจากอาจให้ข้อมูลที่เป็นที่สนใจแก่นักวิจัย เมื่อศาลอาศัยคำให้การของผู้เชี่ยวชาญ ในแง่หนึ่งก็คือการใช้การสุ่มตัวอย่างโดยเจตนา ตำแหน่งที่คล้ายกันอาจมีชัยเมื่อพัฒนาโครงการวิจัย ในระหว่างการศึกษาประเด็นเบื้องต้น ผู้วิจัยมีความสนใจในการกำหนดโอกาสในการศึกษาเป็นหลัก ซึ่งจะเป็นการกำหนดการเลือกองค์ประกอบตัวอย่าง

การสุ่มตัวอย่างสโนว์บอลเป็นการสุ่มตัวอย่างแบบเจาะจงประเภทหนึ่งที่ใช้เมื่อทำงานกับประชากรประเภทพิเศษ ตัวอย่างนี้ขึ้นอยู่กับความสามารถของผู้วิจัยในการระบุกลุ่มผู้ตอบแบบสอบถามกลุ่มแรกที่มีลักษณะที่ต้องการ จากนั้นผู้ตอบแบบสอบถามเหล่านี้จะถูกนำมาใช้เป็นผู้ให้ข้อมูลเพื่อพิจารณาการคัดเลือกบุคคลเพิ่มเติม

ลองนึกภาพว่าบริษัทต้องการประเมินความต้องการผลิตภัณฑ์บางอย่างที่ช่วยให้คนหูหนวกสามารถสื่อสารทางโทรศัพท์ได้ นักวิจัยสามารถเริ่มพัฒนาปัญหานี้ได้โดยการระบุบุคคลสำคัญในชุมชนคนหูหนวก ส่วนหลังสามารถระบุชื่อสมาชิกคนอื่นๆ ในกลุ่มนี้ที่จะตกลงเข้าร่วมการสำรวจได้ ด้วยกลยุทธ์ดังกล่าว กลุ่มตัวอย่างจึงเติบโตราวกับก้อนหิมะ

ขณะที่ผู้วิจัยอยู่ที่ ระยะเริ่มแรกเมื่อปัญหาได้รับการสำรวจและระบุแนวโน้มและข้อจำกัดที่เป็นไปได้ของการสำรวจที่วางแผนไว้แล้ว การใช้การสุ่มตัวอย่างแบบเจาะจงอาจมีประสิทธิผลมาก แต่ไม่ว่าในกรณีใดเราไม่ควรลืมจุดอ่อนของกลุ่มตัวอย่างประเภทนี้เนื่องจากผู้วิจัยสามารถใช้ในการศึกษาเชิงพรรณนาหรือเชิงสาเหตุได้ซึ่งจะส่งผลต่อคุณภาพของผลลัพธ์ทันที ตัวอย่างคลาสสิกของการหลงลืมเช่นนี้คือดัชนีราคาผู้บริโภค (“CPI”) ดังที่ Südman ชี้ให้เห็น ( สุดมัน): “CPI กำหนดไว้สำหรับ 56 เมืองและเขตเมืองใหญ่เท่านั้น ซึ่งการคัดเลือกได้รับอิทธิพลจากปัจจัยทางการเมืองด้วย ในความเป็นจริง เมืองเหล่านี้สามารถเป็นตัวแทนของตนเองได้เท่านั้น ในขณะที่มีการเรียกดัชนี ดัชนีราคาสินค้าอุปโภคบริโภคสำหรับชาวเมืองที่ได้รับค่าจ้างรายชั่วโมง ค่าจ้าง *, และ พนักงานและปรากฏต่อคนส่วนใหญ่ในฐานะดัชนีที่สะท้อนระดับราคาในภูมิภาคใดๆ ของสหรัฐอเมริกา การเลือกร้านค้าปลีกเองก็ทำในลักษณะที่ไม่สุ่มด้วยเช่นกัน การประมาณค่าข้อผิดพลาดในการสุ่มตัวอย่างที่เป็นไปได้กลายเป็นไปไม่ได้"(เน้นย้ำ) 2.

* นั่นคือคนงาน - บันทึก. เลน

ตัวอย่างโควต้า

การสุ่มตัวอย่างตามที่กำหนดประเภทที่สามคือ ตัวอย่างโควต้า; ความเป็นตัวแทนที่เป็นที่รู้จักนั้นทำได้โดยการรวมองค์ประกอบที่มีลักษณะบางอย่างในสัดส่วนเดียวกันกับประชากรที่อยู่ระหว่างการศึกษา (ดู “หน้าต่างการวิจัย 15.1”) ตัวอย่างเช่น คุณอาจลองสร้างตัวอย่างที่เป็นตัวแทนของนักเรียนที่อาศัยอยู่ในมหาวิทยาลัย หากในกลุ่มตัวอย่างจำนวน 500 คนไม่มีนักเรียนอาวุโสเพียงคนเดียว เราจะมีสิทธิ์ที่จะสงสัยในความเป็นตัวแทนและความชอบธรรมในการนำผลลัพธ์ที่ได้รับจากตัวอย่างนี้ไปใช้กับประชากรที่กำลังสำรวจ เมื่อทำงานกับกลุ่มตัวอย่างตามสัดส่วน ผู้วิจัยสามารถมั่นใจได้ว่าสัดส่วนของนักเรียนอาวุโสในกลุ่มตัวอย่างสอดคล้องกับสัดส่วนในจำนวนนักเรียนทั้งหมด

สมมติว่านักวิจัยกำลังทำการศึกษาตัวอย่างของนักศึกษามหาวิทยาลัย และเขาสนใจที่จะทำให้แน่ใจว่ากลุ่มตัวอย่างไม่เพียงสะท้อนถึงเพศของพวกเขาเท่านั้น แต่ยังรวมถึงการกระจายตัวของนักศึกษาในหลักสูตรต่างๆ ด้วย ให้จำนวนนักศึกษาทั้งหมดเป็น 10,000: 3,200 คนเป็นนักศึกษาปีแรก 2,600 คนเป็นนักศึกษาปีสอง 2,200 คนเป็นนักศึกษาปีที่สาม 2,000 คนเป็นนักศึกษาปีสี่ ซึ่งเป็นเด็กผู้ชาย 7,000 คน และเด็กผู้หญิง 3,000 คน สำหรับขนาดตัวอย่าง 1,000 คน แผนการสุ่มตัวอย่างตามสัดส่วนต้องใช้นักศึกษาใหม่ 320 คน นักเรียนปีที่สอง 260 คน นักเรียนปีที่สาม 220 คน ผู้สำเร็จการศึกษา 200 คน เด็กผู้ชาย 700 คน และเด็กหญิง 300 คน ผู้วิจัยสามารถใช้แผนนี้ได้โดยการกำหนดโควต้าเฉพาะให้กับผู้สัมภาษณ์แต่ละคนเพื่อกำหนดว่าควรติดต่อนักเรียนคนไหน

การสุ่มตัวอย่างโควต้าตัวอย่างที่กำหนดขึ้นที่เลือกเพื่อให้สัดส่วนขององค์ประกอบในกลุ่มตัวอย่างที่มีลักษณะบางอย่างสอดคล้องกับสัดส่วนขององค์ประกอบเดียวกันในประชากรที่กำลังศึกษาโดยประมาณ พนักงานภาคสนามแต่ละคนจะได้รับโควต้าที่กำหนดลักษณะของประชากรที่เขาต้องติดต่อด้วย

ผู้สัมภาษณ์ที่จะทำการสัมภาษณ์ 20 ครั้งอาจได้รับคำสั่งให้ถาม:

            • น้องใหม่หกคน - เด็กชายห้าคนและเด็กผู้หญิงหนึ่งคน;
            • นักเรียนปีที่สองหกคน - เด็กชายสี่คนและเด็กผู้หญิงสองคน;
            • นักเรียนปีที่สามสี่คน - เด็กชายสามคนและเด็กผู้หญิงหนึ่งคน
            • นักเรียนชั้นปีที่สี่สี่คน - เด็กชายสองคนและเด็กผู้หญิงสองคน

โปรดทราบว่าการเลือกองค์ประกอบตัวอย่างเฉพาะไม่ได้ถูกกำหนดโดยแผนการวิจัย แต่โดยการเลือกของผู้สัมภาษณ์ ซึ่งออกแบบมาเพื่อให้สอดคล้องกับเงื่อนไขที่กำหนดโดยโควต้าเท่านั้น: สัมภาษณ์นักศึกษาใหม่ห้าคน น้องใหม่หนึ่งคน ฯลฯ

โปรดทราบด้วยว่าโควต้านี้สะท้อนถึงการกระจายตัวของประชากรนักศึกษาอย่างแม่นยำ แต่ค่อนข้างบิดเบือนการกระจายตัวของนักศึกษาในหลักสูตรต่างๆ 70% (14 จาก 20) ของการสัมภาษณ์เป็นเด็กผู้ชาย แต่มีเพียง 30% (6 จาก 20) เท่านั้นที่เป็นนักศึกษาใหม่ ในขณะที่คิดเป็น 32% ของจำนวนนักเรียนทั้งหมด โควต้าที่จัดสรรให้กับผู้สัมภาษณ์แต่ละคนอาจไม่ และโดยปกติจะไม่สะท้อนถึงการกระจายของลักษณะการควบคุมในประชากร เฉพาะตัวอย่างผลลัพธ์เท่านั้นที่ควรมีสัดส่วนที่เหมาะสม

ควรจำไว้ว่ากลุ่มตัวอย่างที่ได้สัดส่วนขึ้นอยู่กับทัศนคติส่วนบุคคล ทัศนคติ หรือการตัดสิน มากกว่ากระบวนการที่เป็นกลางในการเลือกองค์ประกอบตัวอย่าง ยิ่งไปกว่านั้น ไม่เหมือนกับการสุ่มตัวอย่างโดยเจตนา การใช้วิจารณญาณส่วนบุคคลในที่นี้ไม่ใช่ของผู้พัฒนาโครงการ แต่ขึ้นอยู่กับผู้สัมภาษณ์ด้วย คำถามเกิดขึ้นว่าตัวอย่างตามสัดส่วนถือได้ว่าเป็นตัวแทนได้หรือไม่ แม้ว่าตัวอย่างเหล่านั้นจะสร้างอัตราส่วนโดยธรรมชาติของส่วนประกอบของประชากรที่มีลักษณะการควบคุมบางอย่างก็ตาม ในเรื่องนี้ต้องมีข้อสังเกต 3 ประการ

ประการแรก กลุ่มตัวอย่างอาจแตกต่างอย่างมีนัยสำคัญจากประชากรในลักษณะที่สำคัญอื่นๆ ซึ่งอาจมีผลกระทบร้ายแรงต่อผลลัพธ์ ตัวอย่างเช่น หากการศึกษาวิจัยนี้มุ่งเน้นไปที่ปัญหาอคติทางเชื้อชาติที่มีอยู่ในหมู่นักเรียน สถานการณ์สำคัญอาจกลายเป็นว่าผู้ตอบแบบสอบถามมาจากไหน: จากเมืองหรือจากชนบท เนื่องจากไม่ได้ระบุโควต้าสำหรับคุณลักษณะ "จากภูมิหลังในเมือง/ชนบท" การนำเสนอคุณลักษณะนี้อย่างถูกต้องจึงไม่น่าจะเป็นไปได้ แน่นอนว่ายังมีอีกทางเลือกหนึ่ง: กำหนดโควต้าสำหรับคุณลักษณะที่อาจเกี่ยวข้องทั้งหมด อย่างไรก็ตาม การเพิ่มจำนวนคุณลักษณะการควบคุมนำไปสู่ข้อกำหนดที่ซับซ้อนมากขึ้น ในทางกลับกัน ทำให้การเลือกองค์ประกอบตัวอย่างเป็นเรื่องยาก—และบางครั้งก็เป็นไปไม่ได้ด้วยซ้ำ และไม่ว่าในกรณีใดก็ตาม จะทำให้ต้นทุนเพิ่มขึ้น เช่นหากอยู่ในเมืองหรือ ประชากรในชนบทและสถานะทางเศรษฐกิจและสังคมก็จะเกี่ยวข้องกับการศึกษาด้วย ผู้สัมภาษณ์อาจต้องมองหาน้องใหม่ที่เป็นชนชั้นสูงหรือชนชั้นกลาง คุณยอมรับว่าการหาน้องใหม่ชายนั้นง่ายกว่ามาก

ประการที่สอง เป็นเรื่องยากมากที่จะให้แน่ใจว่าตัวอย่างที่ให้มานั้นเป็นตัวแทนอย่างแท้จริง แน่นอนว่า คุณสามารถตรวจสอบตัวอย่างเพื่อให้แน่ใจว่าการกระจายตัวของคุณลักษณะที่ไม่รวมอยู่ในการควบคุมตรงกับการกระจายตัวในประชากร อย่างไรก็ตาม การตรวจสอบดังกล่าวสามารถนำไปสู่ข้อสรุปเชิงลบเท่านั้น สิ่งเดียวที่สามารถระบุได้คือความแตกต่างของการแจกแจง หากการแจกแจงของกลุ่มตัวอย่างและประชากรสำหรับแต่ละคุณลักษณะเหล่านี้เกิดขึ้นซ้ำกัน มีความเป็นไปได้ที่กลุ่มตัวอย่างจะแตกต่างจากประชากรในลักษณะอื่นที่ไม่ได้ระบุไว้อย่างชัดเจน

และสุดท้ายประการที่สาม เมื่อปล่อยให้ผู้สัมภาษณ์อยู่กับอุปกรณ์ของตนเอง มักจะดำเนินการบางอย่าง พวกเขาหันไปสัมภาษณ์เพื่อนบ่อยเกินไป เนื่องจากมักจะมีลักษณะคล้ายกับผู้สัมภาษณ์เอง จึงอาจเกิดข้อผิดพลาดได้ หลักฐานจากอังกฤษแสดงให้เห็นว่าตัวอย่างโควต้ามีแนวโน้มที่จะ:

  1. การพูดเกินจริงในบทบาทขององค์ประกอบที่เข้าถึงได้มากที่สุด
  2. มองข้ามบทบาทของครอบครัวเล็กๆ
  3. การพูดเกินจริงในบทบาทของครอบครัวที่มีลูก
  4. ลดบทบาทของคนงานที่เกี่ยวข้องกับการผลิตภาคอุตสาหกรรม
  5. ลดบทบาทของผู้มีรายได้สูงสุดและต่ำสุด
  6. การมองข้ามบทบาทของพลเมืองที่มีการศึกษาต่ำ
  7. มองข้ามบทบาทของผู้ครอบครองตำแหน่งทางสังคมต่ำ
ผู้สัมภาษณ์ที่เลือกโควต้าโดยการหยุดสุ่มผู้สัญจรไปมามีแนวโน้มที่จะมุ่งความสนใจไปที่พื้นที่ที่มีผู้ตอบแบบสอบถามจำนวนมาก เช่น ศูนย์การค้าสถานีรถไฟและสนามบิน ทางเข้าซูเปอร์มาร์เก็ตขนาดใหญ่ และอื่นๆ การปฏิบัตินี้นำไปสู่การนำเสนอกลุ่มคนที่เยี่ยมชมสถานที่ดังกล่าวบ่อยที่สุดมากเกินไป เมื่อจำเป็นต้องไปเยี่ยมบ้าน ผู้สัมภาษณ์มักได้รับแรงจูงใจจากความสะดวกสบาย
ตัวอย่างเช่น พวกเขาอาจทำการสำรวจเฉพาะในระหว่างวันเท่านั้น ซึ่งนำไปสู่การประเมินความคิดเห็นของคนงานต่ำเกินไป เหนือสิ่งอื่นใด พวกเขาไม่เข้าไปในอาคารที่ทรุดโทรมและตามกฎแล้วอย่าปีนขึ้นไปชั้นบนของอาคารที่ไม่มีลิฟต์

แนวโน้มเหล่านี้สามารถนำไปสู่ข้อผิดพลาดประเภทต่าง ๆ ขึ้นอยู่กับลักษณะเฉพาะของปัญหาที่กำลังศึกษา แต่การแก้ไขในขั้นตอนการวิเคราะห์ข้อมูลดูเหมือนจะยากมาก ในทางกลับกัน ด้วยการเลือกองค์ประกอบตัวอย่างตามวัตถุประสงค์ นักวิจัยจึงมีเครื่องมือบางอย่างที่ทำให้ขั้นตอนการประเมินความเป็นตัวแทนของตัวอย่างที่กำหนดง่ายขึ้น เมื่อวิเคราะห์ปัญหาการเป็นตัวแทนของตัวอย่างดังกล่าวผู้วิจัยไม่ได้พิจารณาว่าองค์ประกอบของตัวอย่างเป็นขั้นตอนในการเลือกองค์ประกอบมากนัก

หน้าต่างการวิจัย: ยอดเยี่ยม! แต่ใครจะอ่านเรื่องนี้ล่ะ?

ทุกปี ผู้ลงโฆษณาใช้จ่ายเงินหลายล้านดอลลาร์ไปกับการโฆษณาในสื่อสิ่งพิมพ์จำนวนนับไม่ถ้วน ตั้งแต่ยุคโฆษณาไปจนถึง Yankee การประเมินข้อความและรูปภาพบางอย่างสามารถดำเนินการได้ก่อนที่จะตีพิมพ์ตามที่พวกเขาพูดที่บ้านในเอเจนซี่โฆษณา การตรวจสอบและประเมินผลที่แท้จริงจะเกิดขึ้นหลังจากการตีพิมพ์โฆษณาเท่านั้น โดยมีโฆษณาที่เตรียมไว้อย่างพิถีพิถันหลายสิบรายการล้อมรอบเพื่อแย่งชิงความสนใจของผู้อ่าน

บริษัท Roper Starch ทั่วโลกมีส่วนร่วมในการประเมินความสามารถในการอ่านโฆษณาที่วางอยู่ในนิตยสารและหนังสือพิมพ์สำหรับผู้บริโภค ธุรกิจ การค้าและวิชาชีพ ผลการวิจัยได้รับความสนใจจากผู้ลงโฆษณาและเอเจนซี่ โดยมีค่าธรรมเนียมที่เหมาะสม เนื่องจากผู้โฆษณาพยายามอย่างเต็มที่ทุกวันเพื่อพยายามแสดงโฆษณาของตนต่อผู้บริโภค บริษัท แป้งตัดสินใจรวบรวมตัวอย่างที่จะให้ข้อมูลที่ถูกต้องและทันเวลาแก่สมาชิกเกี่ยวกับประสิทธิภาพของการโฆษณา ทุกปีบริษัท แป้งสำรวจผู้คนกว่า 50,000 คน ดูโฆษณาประมาณ 20,000 รายการ มีการศึกษาสิ่งพิมพ์ประมาณ 500 ฉบับต่อปี

แป้งใช้การสุ่มตัวอย่างตามสัดส่วน โดยมีขนาดตัวอย่างขั้นต่ำ 100 คนสำหรับเพศหนึ่ง และ 100 คนสำหรับเพศอื่น แป้งสรุปว่าด้วยขนาดตัวอย่างนี้ ความแปรผันที่สำคัญของระดับความสามารถในการอ่านค่ามีความเสถียร มีการสำรวจผู้อ่านที่มีอายุมากกว่า 18 ปีด้วยตนเอง และรวมถึงสิ่งพิมพ์ทั้งหมด ยกเว้นที่มีไว้สำหรับกลุ่มประชากรพิเศษ (เช่น มีการสำรวจเด็กผู้หญิงในวัยเดียวกันเพื่อประเมินสิ่งพิมพ์ของนิตยสาร Seventeen)

เมื่อทำการสำรวจจะคำนึงถึงโซนการจำหน่ายของสิ่งพิมพ์เฉพาะด้วย สมมติว่าการศึกษาในนิตยสารลอสแอนเจลิสศึกษาผู้อ่านที่อาศัยอยู่ในแคลิฟอร์เนียตอนใต้ เวลาได้รับการศึกษาในระดับประเทศ การสำรวจนี้จัดทำขึ้นเพื่อนิตยสารแต่ละฉบับโดยเฉพาะ และดำเนินการใน 20-30 เมืองพร้อมกัน

ผู้สัมภาษณ์แต่ละคนได้รับมอบหมายโควต้าการสัมภาษณ์เล็กน้อย ซึ่งมีวัตถุประสงค์เพื่อลดอคติในการสำรวจ แบบสอบถามถูกแจกจ่ายในกลุ่มคนหลากหลายอาชีพและวัยที่มีรายได้ต่างกัน การศึกษาแต่ละครั้งเปิดโอกาสให้นำเสนอจุดยืนแก่ผู้อ่านในวงกว้างพอสมควร เมื่อพิจารณาสิ่งพิมพ์ระดับมืออาชีพ ธุรกิจ และอุตสาหกรรมจำนวนหนึ่ง ยังได้คำนึงถึงข้อมูลเฉพาะของการสมัครสมาชิกและการจัดจำหน่ายด้วย รายการสมัครสมาชิกสำหรับสิ่งพิมพ์ที่มีการกระจายค่อนข้างแคบทำให้สามารถเลือกผู้ตอบแบบสอบถามที่ยอมรับได้

ในการสำรวจแต่ละครั้ง ผู้สัมภาษณ์ขอให้ผู้ตอบอ่านสิ่งพิมพ์และถามว่าพวกเขาสังเกตเห็นโฆษณาใดๆ หรือไม่ หากคำตอบคือการยืนยัน นายทะเบียนจะถามคำถามทั้งชุดเพื่อประเมินระดับการรับรู้โฆษณา

การประเมินนี้อาจมีสามเท่า:

  • ให้ความสนใจ: ผู้ที่ให้ความสนใจกับข้อเท็จจริงของการปรากฏตัวของประกาศดังกล่าวแล้ว
  • ความคุ้นเคย: ผู้ที่จำส่วนใดส่วนหนึ่งของโฆษณาที่เกี่ยวข้องกับโฆษณาได้ เครื่องหมายการค้าหรือเกี่ยวกับผู้ลงโฆษณา
  • อ่าน: ผู้ที่อ่านโฆษณาอย่างน้อยครึ่งหนึ่ง

หลังจากตรวจสอบโฆษณาทั้งหมดแล้ว ผู้สัมภาษณ์ได้บันทึกข้อมูลการจำแนกประเภทพื้นฐาน ได้แก่ เพศ อายุ อาชีพ สถานะครอบครัว, สัญชาติ, รายได้, ขนาดครอบครัว และองค์ประกอบ ซึ่งอนุญาตให้มีตารางไขว้ของระดับความสนใจของผู้อ่าน

เมื่อใช้ข้อมูลของบริษัทอย่างเหมาะสม แป้งช่วยให้ผู้ลงโฆษณาและเอเจนซี่สามารถระบุรูปแบบการโฆษณาทั้งที่ไม่ประสบความสำเร็จและประสบความสำเร็จซึ่งดึงดูดและดึงดูดความสนใจของผู้อ่าน ข้อมูลประเภทนี้มีคุณค่าอย่างยิ่งสำหรับผู้ลงโฆษณาที่สนใจในประสิทธิภาพของแคมเปญโฆษณาเป็นหลัก

ที่มา: Roper Starch Worldwide, Mamaronek, NY 10543

ตัวอย่างความน่าจะเป็น

นักวิจัยสามารถกำหนดความน่าจะเป็นของการรวมองค์ประกอบใด ๆ ของประชากรไว้ในตัวอย่างความน่าจะเป็นได้ เนื่องจากการเลือกองค์ประกอบนั้นดำเนินการบนพื้นฐานของกระบวนการที่เป็นกลางและไม่ขึ้นอยู่กับความตั้งใจและความชอบของนักวิจัยหรือผู้ปฏิบัติงานภาคสนาม เนื่องจากขั้นตอนการเลือกองค์ประกอบมีวัตถุประสงค์ ผู้วิจัยจึงสามารถประเมินความน่าเชื่อถือของผลลัพธ์ที่ได้รับ ซึ่งเป็นไปไม่ได้ในกรณีของตัวอย่างที่กำหนดขึ้น ไม่ว่าการเลือกองค์ประกอบอย่างหลังจะระมัดระวังเพียงใดก็ตาม

เราไม่ควรคิดว่าตัวอย่างความน่าจะเป็นเป็นตัวแทนมากกว่าตัวอย่างที่กำหนดเสมอไป ในความเป็นจริง ตัวอย่างที่กำหนดอาจเป็นตัวแทนได้มากกว่า ข้อดีของตัวอย่างความน่าจะเป็นคือทำให้สามารถประมาณข้อผิดพลาดในการสุ่มตัวอย่างที่อาจเกิดขึ้นได้ หากนักวิจัยทำงานร่วมกับกลุ่มตัวอย่างที่กำหนดขึ้น เขาไม่มีวิธีการที่เป็นกลางในการประเมินความเพียงพอต่อวัตถุประสงค์ของการศึกษา

การสุ่มตัวอย่างอย่างง่าย

คนส่วนใหญ่เคยพบการสุ่มตัวอย่างง่ายๆ ไม่ทางใดก็ทางหนึ่ง ไม่ว่าจะเป็นส่วนหนึ่งของหลักสูตรสถิติที่วิทยาลัยหรือจากการอ่านผลการศึกษาที่เกี่ยวข้องในหนังสือพิมพ์หรือนิตยสาร ในการสุ่มตัวอย่างแบบง่าย แต่ละองค์ประกอบที่รวมอยู่ในตัวอย่างมีความน่าจะเป็นที่ระบุไว้เหมือนกันในการรวมไว้ในตัวอย่าง และการรวมกันขององค์ประกอบใดๆ ในประชากรดั้งเดิมอาจกลายเป็นตัวอย่างได้ ตัวอย่างเช่น หากเราต้องการสุ่มตัวอย่างง่ายๆ ของนักเรียนทุกคนที่ลงทะเบียนเรียนในวิทยาลัยแห่งใดแห่งหนึ่ง เราก็แค่ทำรายชื่อนักเรียนทั้งหมด กำหนดหมายเลขให้กับชื่อแต่ละชื่อ และใช้คอมพิวเตอร์ในการสุ่มเลือก ระบุจำนวนรายการ

ประชากร

ประชากร
ชุดองค์ประกอบที่ตรงตามเงื่อนไขที่กำหนด เรียกอีกอย่างว่าประชากรที่ศึกษา (เป้าหมาย)
พารามิเตอร์
ลักษณะเฉพาะหรือตัวบ่งชี้ของประชากรทั่วไปหรือประชากรที่ทำการศึกษา

ประชากรทั่วไปหรือประชากรที่มีการศึกษาคือประชากรที่ทำการคัดเลือก ชุด (ประชากร) นี้สามารถอธิบายได้ด้วยพารามิเตอร์เฉพาะจำนวนหนึ่ง ซึ่งเป็นคุณลักษณะของประชากรทั่วไป ซึ่งแต่ละตัวแสดงถึงตัวบ่งชี้เชิงปริมาณที่แน่นอนที่แยกแยะประชากรหนึ่งจากอีกประชากรหนึ่ง

ลองนึกภาพว่าประชากรที่ศึกษาคือประชากรผู้ใหญ่ทั้งหมดของซินซินแนติ สามารถใช้พารามิเตอร์จำนวนหนึ่งเพื่ออธิบายประชากรกลุ่มนี้: อายุเฉลี่ย สัดส่วนของประชากรด้วย อุดมศึกษาระดับรายได้ ฯลฯ โปรดทราบว่าตัวชี้วัดทั้งหมดเหล่านี้มีค่าคงที่ที่แน่นอน แน่นอนว่าเราสามารถคำนวณได้โดยการสำรวจสำมะโนประชากรประชากรที่กำลังศึกษาทั้งหมด โดยปกติแล้วเราไม่ได้ขึ้นอยู่กับคุณสมบัติ แต่ขึ้นอยู่กับตัวอย่างที่เราเลือกและใช้ค่าที่ได้รับระหว่างการสังเกตตัวอย่างเพื่อกำหนดพารามิเตอร์ที่ต้องการของประชากร

ให้เราอธิบายสิ่งที่กล่าวไว้ในตารางที่ 1 15.1 เป็นตัวอย่างประชากรสมมุติจำนวน 20 คน การทำงานกับประชากรสมมุติจำนวนไม่มากเช่นนี้มีข้อดีหลายประการ ประการแรก ขนาดตัวอย่างที่เล็กทำให้สามารถคำนวณพารามิเตอร์ประชากรที่สามารถนำมาใช้อธิบายได้อย่างง่ายดาย ประการที่สอง ขอบเขตนี้ให้ข้อมูลเชิงลึกเกี่ยวกับสิ่งที่อาจเกิดขึ้นหากมีการนำแผนการสุ่มตัวอย่างเฉพาะมาใช้ คุณสมบัติทั้งสองนี้ทำให้ง่ายต่อการเปรียบเทียบผลลัพธ์ตัวอย่างกับผลลัพธ์ที่ "จริง" และในกรณีนี้ คุณค่าที่ทราบผลรวม ซึ่งไม่ใช่กรณีในสถานการณ์ทั่วไปที่ไม่ทราบมูลค่าที่แท้จริงของผลรวม การเปรียบเทียบค่าประมาณกับค่า "จริง" จะชัดเจนเป็นพิเศษในกรณีนี้

สมมติว่าเราต้องการประมาณรายได้เฉลี่ยของบุคคลในประชากรดั้งเดิมโดยพิจารณาจากองค์ประกอบสององค์ประกอบที่เลือกแบบสุ่ม รายได้เฉลี่ยจะเป็นพารามิเตอร์ของมัน ในการประมาณค่าเฉลี่ยนี้ซึ่งเราแสดงว่าเป็นμเราต้องหารผลรวมของค่าทั้งหมดด้วยตัวเลข:

ค่าเฉลี่ยประชากร μ = ผลรวมขององค์ประกอบประชากร / จำนวนองค์ประกอบ

ในกรณีของเรา การคำนวณให้:

ชุดที่ได้รับ

ชุดที่ได้รับประกอบด้วยตัวอย่างที่เป็นไปได้ทั้งหมดที่สามารถเลือกได้จากประชากรทั่วไปตามแผนการสุ่มตัวอย่างที่กำหนด (แผนการสุ่มตัวอย่าง) สถิติเป็นคุณลักษณะหรือตัวบ่งชี้ของกลุ่มตัวอย่าง ค่าของสถิติตัวอย่างใช้ในการประมาณค่าพารามิเตอร์ประชากรเฉพาะ ตัวอย่างที่ต่างกันจะสร้างสถิติหรือการประมาณค่าของพารามิเตอร์ประชากรเดียวกันที่แตกต่างกัน

ชุดที่ได้รับ
จำนวนรวมของกลุ่มตัวอย่างที่สามารถแยกแยะได้ทั้งหมดที่เป็นไปได้ ซึ่งสามารถเลือกได้จากประชากรตามแผนการสุ่มตัวอย่างที่กำหนด สถิติ ลักษณะหรือตัวบ่งชี้ของกลุ่มตัวอย่าง

พิจารณาประชากรที่ได้รับของกลุ่มตัวอย่างที่เป็นไปได้ทั้งหมดที่สามารถเลือกได้จากประชากรสมมุติของเราจำนวน 20 คน ภายใต้แผนการสุ่มตัวอย่างที่ถือว่าขนาดตัวอย่างเป็น n=2สามารถรับได้จากการสุ่มเลือกแบบไม่ซ้ำกัน

สมมติว่าในขณะนี้ข้อมูลสำหรับแต่ละหน่วยของประชากร (ในกรณีของเราคือชื่อและรายได้ของแต่ละบุคคล) จะถูกบันทึกไว้บนแก้วน้ำ หลังจากนั้นจึงใส่ลงในเหยือกและผสมกัน ผู้วิจัยนำวงกลมหนึ่งวงออกจากเหยือก เขียนข้อมูลจากนั้นวางไว้ข้างๆ เขาทำเช่นเดียวกันโดยนำวงกลมที่สองออกจากเหยือก จากนั้นผู้วิจัยนำแก้วทั้งสองกลับคืนสู่เหยือก ผสมเนื้อหาและทำซ้ำลำดับการกระทำเดียวกัน ในตาราง รูปที่ 15.2 แสดงผลลัพธ์ที่เป็นไปได้ของขั้นตอนนี้ สำหรับ 20 วงกลม สามารถจับคู่ได้ 190 ชุด

สำหรับแต่ละชุดสามารถคำนวณรายได้เฉลี่ยได้ สมมติว่าเป็นตัวอย่าง เอบี (k= 1)

เค-e ค่าเฉลี่ยตัวอย่าง = ผลรวมขององค์ประกอบตัวอย่าง / จำนวนองค์ประกอบตัวอย่าง =

ในรูป 15.4 แสดงการประมาณการรายได้เฉลี่ยสำหรับประชากรทั้งหมดและขนาดของข้อผิดพลาดสำหรับการประมาณการแต่ละครั้งสำหรับตัวอย่าง เค = 25, 62,108,147และ 189 .

ก่อนที่เราจะเริ่มพิจารณาความสัมพันธ์ระหว่างรายได้เฉลี่ยตัวอย่าง (สถิติ) และรายได้เฉลี่ยของประชากร (พารามิเตอร์ที่ต้องมีการประมาณค่า) สมมติว่ามีคำสองสามคำเกี่ยวกับประชากรที่ได้รับ ประการแรก ในทางปฏิบัติ เราไม่ได้สร้างมวลรวมประเภทนี้ สิ่งนี้จะต้องใช้เวลาและความพยายามมากเกินไป ผู้ประกอบวิชาชีพจำกัดให้รวบรวมตัวอย่างตามขนาดที่ต้องการเพียงตัวอย่างเดียว ผู้วิจัยใช้ แนวคิดประชากรที่ได้รับและแนวคิดที่เกี่ยวข้องของการกระจายตัวอย่างเมื่อกำหนดข้อสรุปขั้นสุดท้าย

จะแสดงด้านล่างอย่างไร ประการที่สอง ควรจำไว้ว่าประชากรที่ได้รับนั้นถูกกำหนดให้เป็นจำนวนรวมของกลุ่มตัวอย่างที่แตกต่างกันที่เป็นไปได้ทั้งหมดที่สามารถเลือกได้จากประชากรตามแผนการสุ่มตัวอย่างที่กำหนด เมื่อส่วนใดส่วนหนึ่งของแผนการสุ่มตัวอย่างเปลี่ยนแปลง ประชากรที่ได้รับก็จะเปลี่ยนแปลงไปด้วย ดังนั้น หากเมื่อเลือกวงกลม ผู้วิจัยคืนดิสก์แผ่นแรกที่ถูกถอดออกไปยังเหยือก ก่อนที่จะลบดิสก์ที่สอง ชุดที่ได้รับจะรวมไว้ด้วย

ตัวอย่าง AA, BB เป็นต้น หากปริมาตรของตัวอย่างที่ไม่ซ้ำกันเท่ากับ 3 และไม่ใช่ 2 ตัวอย่างประเภท ABC จะปรากฏขึ้นและจะมี 1,140 ตัวอย่างและไม่ใช่ 190 เช่นเดียวกับในกรณีก่อนหน้า กรณี. เมื่อเปลี่ยนจากการสุ่มตัวอย่างอย่างง่ายเป็นวิธีอื่นในการเลือกองค์ประกอบตัวอย่าง ประชากรที่ได้รับก็จะเปลี่ยนแปลงไปด้วย

ควรจำไว้ว่าการเลือกตัวอย่างในขนาดที่กำหนดจากประชากรทั่วไปเทียบเท่ากับการเลือกองค์ประกอบหนึ่งรายการ (1 จาก 190) จากประชากรที่ได้รับ ข้อเท็จจริงนี้ช่วยให้เราสามารถสรุปผลทางสถิติได้มากมาย

ค่าเฉลี่ยตัวอย่างและค่าเฉลี่ยประชากร

เรามีสิทธิ์ที่จะเอาค่าเฉลี่ยตัวอย่างกับค่าเฉลี่ยประชากรจริงหรือไม่? ไม่ว่าในกรณีใด เราถือว่าสิ่งเหล่านั้นเชื่อมโยงถึงกัน อย่างไรก็ตาม เรายังเชื่อว่าจะมีข้อผิดพลาดเกิดขึ้นด้วย ตัวอย่างเช่น อาจสันนิษฐานได้ว่าข้อมูลที่ได้รับจากผู้ใช้อินเทอร์เน็ตจะแตกต่างอย่างมากจากผลการสำรวจประชากร "ปกติ" ในกรณีอื่นๆ เราสามารถถือว่าค่าที่ใกล้เคียงกันพอสมควร ไม่เช่นนั้นเราจะไม่สามารถใช้ค่าตัวอย่างเพื่อประมาณค่าทั่วไปได้ แต่เราจะทำผิดพลาดใหญ่หลวงในเรื่องนี้ได้ขนาดไหน?

ลองบวกค่าเฉลี่ยตัวอย่างทั้งหมดที่มีอยู่ในตารางกัน 15.2 และหารจำนวนผลลัพธ์ด้วยจำนวนตัวอย่าง เช่น ลองหาค่าเฉลี่ยกัน
เราจะได้ผลลัพธ์ดังนี้:

มันตรงกับค่าเฉลี่ยประชากร พวกเขาบอกว่าในกรณีนี้เรากำลังเผชิญอยู่ สถิติที่เป็นกลาง.

กล่าวกันว่าสถิติไม่เอนเอียงหากค่าเฉลี่ยของตัวอย่างที่เป็นไปได้ทั้งหมดเท่ากับพารามิเตอร์ประชากรโดยประมาณ โปรดทราบว่าเราไม่ได้พูดถึงความหมายเฉพาะบางอย่างที่นี่การประมาณการบางส่วนอาจอยู่ห่างจากมูลค่าที่แท้จริงค่อนข้างมาก เช่น ตัวอย่าง AB หรือ ST ในบางกรณี มูลค่าประชากรที่แท้จริงอาจไม่สามารถทำได้โดยการพิจารณาตัวอย่างที่เป็นไปได้ แม้ว่าสถิติจะไม่เอนเอียงก็ตาม ในกรณีของเรา กรณีนี้ไม่เป็นเช่นนั้น: กลุ่มตัวอย่างที่เป็นไปได้ทั้งหมด เช่น AT ให้ค่าเฉลี่ยตัวอย่างเท่ากับค่าเฉลี่ยประชากรที่แท้จริง

การพิจารณาการกระจายตัวของการประมาณการตัวอย่างเหล่านี้เป็นเรื่องสมเหตุสมผล และโดยเฉพาะอย่างยิ่งความสัมพันธ์ระหว่างการกระจายของการประมาณการนี้กับความแปรผันของระดับรายได้ในประชากร ความแปรปรวนของประชากรถูกใช้เป็นตัวชี้วัดความแปรปรวน ในการพิจารณาความแปรปรวนของประชากร เราต้องคำนวณค่าเบี่ยงเบนของแต่ละค่าจากค่าเฉลี่ย บวกกำลังสองของการเบี่ยงเบนทั้งหมด และหารผลรวมผลลัพธ์ด้วยจำนวนเทอม ให้เราแสดงการกระจายตัวของประชากรด้วย a^ แล้ว:

ความแปรปรวนของประชากร σ 2 = ผลรวมของผลต่างกำลังสองของแต่ละองค์ประกอบ
ประชากรและค่าเฉลี่ยประชากร / จำนวนองค์ประกอบประชากร =

การกระจายตัว ค่าเฉลี่ยระดับรายได้สามารถกำหนดได้ในลักษณะเดียวกัน นั่นคือ เราสามารถค้นหาได้โดยการหาค่าเบี่ยงเบนของค่าเฉลี่ยแต่ละค่าจากค่าเฉลี่ยโดยรวม รวมค่ากำลังสองของค่าเบี่ยงเบน และหารผลรวมผลลัพธ์ด้วยจำนวนเทอม

เราสามารถกำหนดการกระจายของระดับรายได้เฉลี่ยได้ในอีกทางหนึ่ง โดยใช้การกระจายของระดับรายได้ในประชากร เนื่องจากทั้งสองค่านี้มีความสัมพันธ์โดยตรง พูดให้ถูกก็คือ ในกรณีที่กลุ่มตัวอย่างเป็นตัวแทนเพียงส่วนเล็กๆ ของประชากร ความแปรปรวนของค่าเฉลี่ยกลุ่มตัวอย่างจะเท่ากับความแปรปรวนของประชากรหารด้วยขนาดกลุ่มตัวอย่าง:

โดยที่ σ x 2 คือการกระจายตัวของค่าตัวอย่างเฉลี่ยของระดับรายได้ σ 2 คือการกระจายตัวของระดับรายได้ในประชากรทั่วไป n- ขนาดตัวอย่าง.

ทีนี้ลองเปรียบเทียบการกระจายตัวของผลลัพธ์กับการกระจายตัวของลักษณะเชิงปริมาณในประชากรทั่วไป รูปที่ 15.5 แสดงให้เห็นว่าการกระจายประชากรของลักษณะเชิงปริมาณที่แสดงในแผง A นั้นเป็นแบบหลายจุด (แต่ละค่าจาก 20 ค่าปรากฏเพียงครั้งเดียว) และมีความสมมาตรเกี่ยวกับค่าเฉลี่ยประชากรที่แท้จริงของ 9400

การกระจายตัวอย่าง
การกระจายค่าของสถิติที่ระบุซึ่งคำนวณสำหรับตัวอย่างที่สามารถแยกแยะได้ที่เป็นไปได้ทั้งหมดที่สามารถเลือกได้จากประชากรภายใต้แผนการสุ่มตัวอย่างที่กำหนด

การกระจายคะแนนที่แสดงในกล่อง B ขึ้นอยู่กับข้อมูลในตารางที่ 1 15.3 ซึ่งในทางกลับกันก็ถูกรวบรวมโดยการกำหนดค่าจากตาราง 15.2 ไปกลุ่มใดกลุ่มหนึ่งขึ้นอยู่กับขนาดของพวกเขาตามด้วยการนับจำนวนในกลุ่ม ฟิลด์ B เป็นฮิสโตแกรมแบบดั้งเดิม ซึ่งพิจารณาตั้งแต่ต้นหลักสูตรสถิติซึ่งเป็นตัวแทน การกระจายตัวอย่างสถิติ. ขอให้เราสังเกตสิ่งต่อไปนี้ในการส่งผ่าน: แนวคิดเรื่องการกระจายตัวอย่างเป็นแนวคิดที่สำคัญที่สุดในวิชาสถิติ และเป็นรากฐานสำคัญของการสร้างการอนุมานทางสถิติ จากการกระจายตัวอย่างที่ทราบของสถิติภายใต้การศึกษา เราสามารถสรุปเกี่ยวกับพารามิเตอร์ที่สอดคล้องกันของประชากรได้ หากทราบเพียงว่าค่าประมาณตัวอย่างแตกต่างกันไปในแต่ละตัวอย่าง แต่ไม่ทราบลักษณะของการเปลี่ยนแปลงนี้ จะเป็นไปไม่ได้ที่จะระบุข้อผิดพลาดในการสุ่มตัวอย่างที่เกี่ยวข้องกับค่าประมาณนี้ เนื่องจากการกระจายตัวอย่างของการประมาณค่าจะอธิบายความแปรผันจากตัวอย่างหนึ่งไปอีกตัวอย่างหนึ่ง จึงเป็นพื้นฐานในการพิจารณาความถูกต้องของการประมาณตัวอย่าง ด้วยเหตุนี้การออกแบบการสุ่มตัวอย่างความน่าจะเป็นจึงมีความสำคัญมากสำหรับการอนุมานทางสถิติ

จากความน่าจะเป็นที่ทราบของการรวมไว้ในตัวอย่างของแต่ละองค์ประกอบในประชากร ผู้สัมภาษณ์สามารถค้นหาการกระจายตัวของสถิติต่างๆ ได้ นักวิจัยอาศัยการแจกแจงเหล่านี้ ไม่ว่าจะเป็นค่าเฉลี่ยตัวอย่าง สัดส่วนตัวอย่าง ความแปรปรวนตัวอย่าง หรือสถิติอื่นๆ เมื่อขยายผลลัพธ์ของการสังเกตตัวอย่างไปยังประชากร โปรดทราบว่าสำหรับตัวอย่างขนาด 2 การกระจายตัวของค่าเฉลี่ยตัวอย่างจะเป็นค่ายอดเดียวและสมมาตรกับค่าเฉลี่ยจริง

ดังนั้นเราจึงได้แสดงให้เห็นแล้วว่า:

  1. ค่าเฉลี่ยของค่าเฉลี่ยตัวอย่างที่เป็นไปได้ทั้งหมดเท่ากับค่าเฉลี่ยทั่วไป
  2. การกระจายตัวของค่าเฉลี่ยตัวอย่างมีความสัมพันธ์ในลักษณะใดลักษณะหนึ่งกับการกระจายทั่วไป
  3. การกระจายตัวของค่าเฉลี่ยตัวอย่างเป็นแบบค่ายอดเดียว ในขณะที่การกระจายค่าของลักษณะเชิงปริมาณในประชากรทั่วไปเป็นแบบค่ายอดหลายค่า

ทฤษฎีบทขีดจำกัดกลาง

ทฤษฎีบทที่ระบุว่าสำหรับตัวอย่างปริมาตรแบบสุ่มอย่างง่าย nแยกได้จากประชากรทั่วไปที่มีค่าเฉลี่ยทั่วไป μ และความแปรปรวน σ 2 สำหรับขนาดใหญ่ nการแจกแจงของค่าเฉลี่ยตัวอย่าง x เข้าใกล้ปกติโดยมีศูนย์กลางเท่ากับ μ และความแปรปรวน σ 2 ความแม่นยำของการประมาณนี้จะเพิ่มขึ้นตามการเพิ่มขึ้น n.

ทฤษฎีบทขีดจำกัดกลาง การกระจายตัวของการประมาณค่ายอดจุดเดียวถือได้ว่าเป็นการแสดงทฤษฎีบทขีดจำกัดกลาง ซึ่งระบุว่าสำหรับตัวอย่างปริมาตรแบบสุ่มอย่างง่าย nแยกได้จากประชากรทั่วไปที่มีค่าเฉลี่ยจริง μ และความแปรปรวน σ 2 สำหรับขนาดใหญ่ nการกระจายตัวของค่าเฉลี่ยตัวอย่างเข้าใกล้ปกติโดยมีจุดศูนย์กลางเท่ากับค่าเฉลี่ยจริง และความแปรปรวนเท่ากับอัตราส่วนของความแปรปรวนประชากรต่อขนาดตัวอย่าง กล่าวคือ

การประมาณนี้จะแม่นยำมากขึ้นเรื่อยๆ เมื่อเราเติบโตขึ้น n. จำสิ่งนี้ไว้ ไม่ว่าประชากรประเภทใด การกระจายตัวอย่างจะเป็นเรื่องปกติสำหรับตัวอย่างที่มีขนาดใหญ่เพียงพอ ปริมาณมากเพียงพอควรเข้าใจอะไร? หากการกระจายตัวของค่าลักษณะเชิงปริมาณของประชากรทั่วไปเป็นเรื่องปกติแสดงว่าการกระจายตัวของค่าเฉลี่ยตัวอย่างสำหรับตัวอย่างขนาด n=1. หากการกระจายตัวของตัวแปร (ลักษณะเชิงปริมาณ) ในประชากรมีความสมมาตรแต่ไม่ปกติ ตัวอย่างที่น้อยมากจะทำให้เกิดการกระจายตัวของค่าเฉลี่ยตัวอย่างตามปกติ หากการกระจายตัวของลักษณะเชิงปริมาณของประชากรทั่วไปมีความไม่สมมาตรเด่นชัด ก็จำเป็นต้องมีตัวอย่างที่ใหญ่ขึ้น อย่างไรก็ตาม การกระจายตัวของค่าเฉลี่ยตัวอย่างสามารถยอมรับได้ตามปกติเฉพาะในกรณีที่เรากำลังจัดการกับตัวอย่างที่มีขนาดเพียงพอเท่านั้น

เพื่อที่จะได้ข้อสรุปโดยใช้เส้นโค้งปกตินั้นไม่จำเป็นเลยที่จะต้องดำเนินการจากเงื่อนไขของการแจกแจงปกติของค่าของลักษณะเชิงปริมาณของประชากรทั่วไป แต่เราอาศัยทฤษฎีบทขีดจำกัดศูนย์กลาง และกำหนดขนาดตัวอย่างที่จะช่วยให้เราทำงานกับเส้นโค้งปกติได้ โดยขึ้นอยู่กับการกระจายตัวของประชากร โชคดีที่การกระจายตัวของสถิติตามปกตินั้นรับประกันได้จากตัวอย่างที่มีขนาดค่อนข้างเล็ก - รูปที่. 15.6 แสดงให้เห็นอย่างชัดเจนถึงเหตุการณ์นี้ การประมาณช่วงความเชื่อมั่น ข้อมูลข้างต้นสามารถช่วยเราในการสรุปบางอย่างเกี่ยวกับค่าเฉลี่ยทั่วไปได้หรือไม่? ที่จริงแล้ว ในทางปฏิบัติ เราเลือกเพียงตัวอย่างเดียว และไม่ใช่ตัวอย่างที่เป็นไปได้ทั้งหมดในขนาดที่กำหนด และจากข้อมูลที่ได้รับ เราก็ได้ข้อสรุปบางประการเกี่ยวกับกลุ่มเป้าหมาย

สิ่งนี้เกิดขึ้นได้อย่างไร? ดังที่ทราบกันดีอยู่แล้วว่า จากการแจกแจงแบบปกติ เปอร์เซ็นต์ที่แน่นอนของการสังเกตทั้งหมดมีค่าเบี่ยงเบนมาตรฐานที่แน่นอน สมมติว่า 95% ของการสังเกตมีค่าอยู่ในช่วง ±1.96 ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ย การแจกแจงแบบปกติของค่าเฉลี่ยตัวอย่าง ซึ่งสามารถใช้ทฤษฎีบทขีดจำกัดจุดศูนย์กลางได้ ก็ไม่มีข้อยกเว้นในแง่นี้ ค่าเฉลี่ยของการแจกแจงตัวอย่างเท่ากับค่าเฉลี่ยทั่วไป μ และค่าเบี่ยงเบนมาตรฐานเรียกว่าค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย:

ปรากฎว่า:

  • ค่าเฉลี่ยตัวอย่าง 68.26% เบี่ยงเบนไปจากค่าเฉลี่ยทั่วไปไม่เกิน ± σ x
  • ค่าเฉลี่ยตัวอย่างร้อยละ 95.45 เบี่ยงเบนไปจากค่าเฉลี่ยทั่วไปไม่เกิน ±σ x
  • ค่าเฉลี่ยตัวอย่างร้อยละ 99.73 เบี่ยงเบนไปจากค่าเฉลี่ยทั่วไปไม่เกิน ± σ x

เช่น สัดส่วนที่แน่นอนของค่าเฉลี่ยตัวอย่างขึ้นอยู่กับค่าที่เลือก zจะอยู่ในช่วงที่กำหนดโดยค่า z. นิพจน์นี้สามารถเขียนใหม่เป็นอสมการได้:

ค่าเฉลี่ยทั่วไป - z < Среднее по выборке < Генеральное среднее + z(ข้อผิดพลาด Root Mean Square ของค่าเฉลี่ย)

ดังนั้น ค่าเฉลี่ยตัวอย่างที่มีความน่าจะเป็นที่แน่นอนจะอยู่ในช่วง โดยมีขอบเขตคือผลรวมและผลต่างของค่าเฉลี่ยของการแจกแจงและค่าเบี่ยงเบนมาตรฐานจำนวนหนึ่ง ความไม่เท่าเทียมกันนี้สามารถแปลงเป็น:

ตัวอย่างค่าเฉลี่ย - z(ข้อผิดพลาด Root Mean Square ของค่าเฉลี่ย)< Генеральное среднее < Среднее по выборке + z(ข้อผิดพลาด Root Mean Square ของค่าเฉลี่ย)

หากสังเกตอัตราส่วน 15.1 เช่น ใน 95% ของกรณี ( z= 1.96) จากนั้นใน 95% ของกรณีจะสังเกตอัตราส่วน 15.2 ในกรณีที่ข้อสรุปขึ้นอยู่กับค่าเฉลี่ยตัวอย่างเดียว เราใช้นิพจน์ 15.2

สิ่งสำคัญคือต้องจำนิพจน์ 15.2 นั้น ไม่ได้หมายความว่าช่วงที่สอดคล้องกับตัวอย่างที่กำหนดจะต้องรวมค่าเฉลี่ยทั่วไปด้วย ช่วงเวลานั้นเกี่ยวข้องกับขั้นตอนการคัดเลือกมากกว่าช่วงที่สร้างขึ้นรอบๆ ค่าเฉลี่ยที่กำหนดอาจรวมหรือไม่รวมค่าเฉลี่ยประชากรที่แท้จริงก็ได้ ความมั่นใจของเราในความถูกต้องของข้อสรุปนั้นขึ้นอยู่กับข้อเท็จจริงที่ว่า 95% ของช่วงทั้งหมดที่สร้างขึ้นตามแผนการสุ่มตัวอย่างที่เลือกจะมีค่าเฉลี่ยที่แท้จริง เราเชื่อว่าตัวอย่างของเราอยู่ภายใน 95% นี้

เพื่ออธิบายประเด็นสำคัญนี้ ขอให้เราจินตนาการสักครู่ว่าการกระจายตัวอย่างหมายถึงตัวอย่างที่มีขนาด n= 2 ในตัวอย่างสมมุติของเราถือเป็นเรื่องปกติ ตารางที่ 15.4 แสดงให้เห็นอย่างชัดเจนถึงผลลัพธ์สำหรับ 10 ตัวอย่างแรกจากตัวอย่างที่เป็นไปได้ 190 ตัวอย่างที่สามารถเลือกได้ภายใต้การออกแบบที่กำหนด โปรดทราบว่ามีเพียง 7 ช่วงจาก 10 ช่วงเท่านั้นที่มีค่าเฉลี่ยมากหรือจริง ความมั่นใจในความถูกต้องของข้อสรุปไม่ได้เกิดจากการประเมินเฉพาะบางอย่าง แต่เกิดจากความแม่นยำ ขั้นตอนการประเมิน ขั้นตอนนี้ทำให้สำหรับตัวอย่าง 100 ตัวอย่างที่จะคำนวณค่าเฉลี่ยตัวอย่างและช่วงความเชื่อมั่น ใน 95 กรณี ช่วงนี้จะรวมค่าทั่วไปที่แท้จริงด้วย ความแม่นยำของตัวอย่างที่กำหนดจะพิจารณาจากขั้นตอนการเลือกตัวอย่าง การออกแบบการเก็บตัวอย่างที่เป็นตัวแทนไม่ได้รับประกันว่าตัวอย่างทั้งหมดจะเป็นตัวแทน ขั้นตอนการอนุมานทางสถิติขึ้นอยู่กับความเป็นตัวแทนของแผนการสุ่มตัวอย่าง ซึ่งเป็นเหตุผลว่าทำไมขั้นตอนนี้จึงมีความสำคัญอย่างยิ่งต่อตัวอย่างความน่าจะเป็น

ตัวอย่างความน่าจะเป็นทำให้คุณสามารถประเมินความถูกต้องของผลลัพธ์ได้ โดยใกล้เคียงกับค่าประมาณที่กระทำกับค่าจริง ยิ่งค่าคลาดเคลื่อนกำลังสองเฉลี่ยของสถิติมาก ระดับการกระจายของการประมาณการก็จะยิ่งสูงขึ้น และความแม่นยำของกระบวนการก็จะยิ่งต่ำลง

บางคนอาจสับสนกับข้อเท็จจริงที่ว่าระดับความเชื่อมั่นเกี่ยวข้องกับขั้นตอนและไม่ใช่ค่าตัวอย่างเฉพาะ แต่ควรจำไว้ว่าผู้วิจัยสามารถปรับขนาดของระดับความเชื่อมั่นในการประมาณค่าทั่วไปได้ หากคุณไม่ต้องการเสี่ยงใดๆ และกังวลว่าคุณอาจพบกับช่วงตัวอย่างหนึ่งในห้าช่วงที่เลือกซึ่งไม่รวมค่าเฉลี่ยประชากร คุณสามารถเลือกช่วงความเชื่อมั่น 99% ซึ่งมีเพียงหนึ่งในร้อยตัวอย่างเท่านั้น ช่วงเวลาไม่รวมค่าเฉลี่ยประชากร นอกจากนี้ หากคุณสามารถเพิ่มขนาดตัวอย่างได้ คุณจะเพิ่มระดับความเชื่อมั่นของผลลัพธ์ โดยให้ความแม่นยำที่ต้องการในการประมาณค่าประชากร เราจะพูดถึงเรื่องนี้โดยละเอียดใน Chap 17.

ขั้นตอนที่เรากำลังอธิบายมีองค์ประกอบอีกหนึ่งอย่างที่อาจทำให้เกิดความสับสนได้ เมื่อประมาณค่าช่วงความเชื่อมั่น จะใช้ปริมาณสามปริมาณ: x, zและ σx ค่าเฉลี่ยตัวอย่าง x คำนวณจากข้อมูลตัวอย่าง zถูกเลือกตามระดับความมั่นใจที่ต้องการ แต่ค่าคลาดเคลื่อนกำลังสองเฉลี่ยรากของค่าเฉลี่ย σ x ล่ะ? มันเท่ากับ:

ดังนั้นในการที่จะกำหนดได้นั้น เราจึงต้องกำหนดค่าเบี่ยงเบนมาตรฐานของลักษณะเชิงปริมาณของประชากรทั่วไป คือ 5. จะทำอย่างไรในกรณีที่ค่าเบี่ยงเบนมาตรฐาน ไม่รู้จัก? ปัญหานี้ไม่ได้เกิดขึ้นด้วยเหตุผลสองประการ ประการแรก โดยทั่วไปสำหรับคุณลักษณะเชิงปริมาณส่วนใหญ่ที่ใช้ในการวิจัยการตลาด รูปแบบจะเปลี่ยนแปลงช้ากว่าระดับของตัวแปรส่วนใหญ่ที่นักการตลาดสนใจ ดังนั้น หากทำการศึกษาซ้ำ เราสามารถใช้ค่า s ที่ได้รับก่อนหน้านี้มาในการคำนวณได้ ประการที่สอง เมื่อเลือกตัวอย่างและข้อมูลที่ได้รับแล้ว เราสามารถประมาณค่าความแปรปรวนของประชากรได้โดยการพิจารณาความแปรปรวนของตัวอย่าง ความแปรปรวนของกลุ่มตัวอย่างที่ไม่เอนเอียงถูกกำหนดเป็น:

ความแปรปรวนตัวอย่าง ŝ 2 = ผลรวมของการเบี่ยงเบนกำลังสองจากค่าเฉลี่ยตัวอย่าง / (จำนวนองค์ประกอบตัวอย่าง -1) ในการหาความแปรปรวนตัวอย่าง เราต้องหาค่าเฉลี่ยตัวอย่างก่อน จากนั้นจะพบความแตกต่างระหว่างค่าตัวอย่างแต่ละค่ากับค่าเฉลี่ยตัวอย่าง ความแตกต่างเหล่านี้จะถูกยกกำลังสอง สรุป และหารด้วยตัวเลขเท่ากับจำนวนการสังเกตตัวอย่างลบด้วยหนึ่ง ความแปรปรวนตัวอย่างไม่เพียงแต่ให้ค่าประมาณของความแปรปรวนทั่วไปเท่านั้น แต่ยังสามารถใช้เพื่อประมาณค่าความคลาดเคลื่อนกำลังสองเฉลี่ยรากของค่าเฉลี่ยได้อีกด้วย เมื่อทราบความแปรปรวนทั่วไป σ 2 ค่าคลาดเคลื่อนกำลังสองเฉลี่ยราก σ x ก็ทราบเช่นกัน เนื่องจาก:

เมื่อไม่ทราบความแปรปรวนทั่วไป สามารถประมาณค่าความคลาดเคลื่อนกำลังสองเฉลี่ยรากของค่าเฉลี่ยได้เท่านั้น ประมาณนี้ให้มา ŝ x ซึ่งเท่ากับค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างหารด้วยรากที่สองของขนาดตัวอย่าง กล่าวคือ การประมาณจะถูกกำหนดในลักษณะเดียวกับการประมาณมูลค่าที่แท้จริง แต่แทนที่จะมีค่าเบี่ยงเบนมาตรฐานทั่วไป ค่าเบี่ยงเบนมาตรฐานตัวอย่างจะถูกแทนที่ด้วยสูตรการคำนวณ สมมติว่าสำหรับตัวอย่าง AB ที่มีค่าเฉลี่ยตัวอย่างเท่ากับ 5800:

ดังนั้น ŝ = 283 และ

และช่วง 95% อยู่ในขณะนี้

ซึ่งน้อยกว่าค่าเดิม

ในตาราง 15.5 สรุปสูตรการคำนวณสำหรับค่าเฉลี่ยและความแปรปรวนต่างๆ ที่กล่าวถึงในบทนี้ การก่อตัวของตัวอย่างสุ่มอย่างง่าย ในตัวอย่างของเรา การเลือกองค์ประกอบตัวอย่างดำเนินการโดยใช้เหยือกซึ่งมีองค์ประกอบทั้งหมดของประชากรดั้งเดิม สิ่งนี้ทำให้เราเห็นภาพแนวคิดเกี่ยวกับประชากรที่ได้รับและการกระจายตัวอย่าง เราไม่แนะนำให้ใช้วิธีการดังกล่าวในทางปฏิบัติ เนื่องจากจะเพิ่มโอกาสที่จะเกิดข้อผิดพลาด แก้วอาจแตกต่างกันทั้งขนาดและเนื้อสัมผัส ซึ่งในบางกรณีอาจทำให้คุณชอบแก้วชนิดใดสีหนึ่งมากกว่าแก้วชนิดอื่น การคัดเลือกผู้เข้าร่วมแคมเปญเวียดนามซึ่งดำเนินการโดยใช้ลอตเตอรีสามารถใช้เป็นตัวอย่างของข้อผิดพลาดประเภทนี้ได้

การเลือกทำได้โดยการดึงดิสก์ที่มีวันเดือนปีเกิดจากถังขนาดใหญ่ โทรทัศน์ถ่ายทอดขั้นตอนนี้ไปทั่วประเทศ น่าเสียดายที่ดิสก์ถูกโหลดลงในดรัมอย่างเป็นระบบ: วันที่ของเดือนมกราคมมาก่อน วันที่ของเดือนธันวาคมสุดท้าย แม้ว่ากลองจะถูกปั่นอย่างเข้มข้น แต่วันที่ในเดือนธันวาคมกลับบ่อยกว่าเดือนมกราคมมาก ต่อจากนั้น ขั้นตอนนี้ได้รับการแก้ไขในลักษณะที่จะลดโอกาสที่จะเกิดข้อผิดพลาดอย่างเป็นระบบลงอย่างมาก วิธีที่นิยมใช้ในการสุ่มตัวอย่างอย่างง่ายนั้นขึ้นอยู่กับการใช้ตารางตัวเลขสุ่ม

การใช้ตารางดังกล่าวเกี่ยวข้องกับลำดับขั้นตอนต่อไปนี้ ขั้นแรก องค์ประกอบของประชากรจะต้องได้รับการกำหนดหมายเลขตามลำดับตั้งแต่ 1 ถึง เอ็น; ในจำนวนทั้งสิ้นสมมุติของเราคือองค์ประกอบ จะได้รับมอบหมายหมายเลข 1 องค์ประกอบ บี- หมายเลข 2 เป็นต้น ประการที่สอง จำนวนหลักในตารางเลขสุ่มจะต้องตรงกับตัวเลข เอ็น. สำหรับ เอ็น= จะใช้ตัวเลขสองหลัก 20 ตัว สำหรับ เอ็นระหว่าง 100 ถึง 999 เป็นตัวเลขสามหลัก เป็นต้น ประการที่สาม จะต้องกำหนดตำแหน่งเริ่มต้นโดยการสุ่ม เราสามารถเปิดตารางตัวเลขสุ่มที่เกี่ยวข้องและหลับตาตามที่พวกเขาพูดให้ชี้นิ้วไปที่มัน เนื่องจากตัวเลขในตารางตัวเลขสุ่มเรียงลำดับแบบสุ่ม ตำแหน่งเริ่มต้นจึงไม่สำคัญ

และสุดท้าย เราสามารถเคลื่อนที่ไปในทิศทางที่เลือกโดยพลการ - ขึ้น, ลงหรือข้าม โดยเลือกองค์ประกอบที่ตัวเลขจะตรงกับตัวเลขสุ่มจากตาราง เพื่ออธิบายสิ่งที่กล่าวไว้ ให้พิจารณาตารางย่อของตัวเลขสุ่ม (ตารางที่ 15.6) เพราะว่า เอ็น= 20 เราควรทำงานกับตัวเลขสองหลักเท่านั้น ในความหมายนี้ตาราง 15.6 เหมาะกับเราสุดๆ ให้เราตัดสินใจล่วงหน้าว่าจะเลื่อนลงมาตามคอลัมน์แต่ตำแหน่งเริ่มต้นอยู่ที่จุดตัดของแถวที่สิบเอ็ดกับคอลัมน์ที่สี่ซึ่งมีหมายเลข 77 อยู่ จำนวนนี้มากเกินไปจึงต้องทิ้งไป ตัวเลขสองตัวถัดไปจะถูกละทิ้งไป แต่ค่าที่สี่ 02 จะถูกนำมาใช้เนื่องจาก 2 สอดคล้องกับหมายเลของค์ประกอบ ใน.

ตัวเลขห้าตัวถัดไปจะถูกละทิ้งเนื่องจากใหญ่เกินไป ในขณะที่หมายเลข 05 จะบ่งบอกถึงองค์ประกอบ อี. ดังนั้นองค์ประกอบต่างๆ ในและ อีจะกลายเป็นตัวอย่างสององค์ประกอบของเรา โดยที่เราจะตัดสินระดับรายได้ของประชากรกลุ่มนี้ กลยุทธ์ทางเลือกก็เป็นไปได้เช่นกัน โดยจะใช้โปรแกรมคอมพิวเตอร์ที่สร้างตัวเลขสุ่มเป็นพื้นฐานในการเลือก ปรากฏตัวใน เมื่อเร็วๆ นี้สิ่งตีพิมพ์ระบุว่าตัวเลขที่สร้างโดยโปรแกรมดังกล่าวไม่ใช่การสุ่มโดยสมบูรณ์ ซึ่งสามารถแสดงออกมาได้ในลักษณะใดลักษณะหนึ่งเมื่อสร้างแบบจำลองทางคณิตศาสตร์ที่ซับซ้อน แต่สามารถใช้เพื่อการวิจัยการตลาดประยุกต์ส่วนใหญ่ได้ โปรดทราบอีกครั้งว่าการสุ่มตัวอย่างอย่างง่ายจำเป็นต้องมีการรวบรวมรายการองค์ประกอบของประชากรที่มีหมายเลขตามลำดับ

กล่าวอีกนัยหนึ่ง จะต้องระบุสมาชิกแต่ละคนของประชากรดั้งเดิม สำหรับประชากรบางกลุ่ม การทำสิ่งนี้ไม่ใช่เรื่องยาก เช่น เมื่อศึกษาบริษัทอเมริกันที่ใหญ่ที่สุด 500 แห่ง ซึ่งมีรายชื่ออยู่ในนิตยสาร Fortune รายการนี้ได้รับการรวบรวมแล้ว ดังนั้นการสุ่มตัวอย่างง่ายๆ ในกรณีนี้จึงไม่ใช่เรื่องยาก สำหรับประชากรเริ่มแรกอื่นๆ (เช่น สำหรับทุกครอบครัวที่อาศัยอยู่ในเมืองหนึ่ง) การรวบรวมรายชื่อทั่วไปเป็นเรื่องยากมาก ซึ่งบังคับให้นักวิจัยหันไปใช้แผนการสุ่มตัวอย่างอื่น

สรุป

วัตถุประสงค์การเรียนรู้ 1
แยกความแตกต่างอย่างชัดเจนระหว่างแนวคิดเรื่องการสำรวจสำมะโนประชากร (คุณสมบัติ) และการสุ่มตัวอย่าง

เรียกว่าการสำรวจสำมะโนประชากรโดยสมบูรณ์ คุณสมบัติ. ตัวอย่างคอลเลกชันที่เกิดจากองค์ประกอบที่เลือก

วัตถุประสงค์การเรียนรู้ 2
รู้สาระสำคัญและลำดับของหกขั้นตอนที่นักวิจัยนำไปใช้เพื่อให้ได้ประชากรตัวอย่าง

กระบวนการสุ่มตัวอย่างแบ่งออกเป็นหกขั้นตอน:

  1. การกำหนดประชากร
  2. การกำหนดกรอบการสุ่มตัวอย่าง
  3. การเลือกขั้นตอนการคัดเลือก
  4. การกำหนดขนาดตัวอย่าง
  5. การเลือกองค์ประกอบตัวอย่าง
  6. การตรวจสอบองค์ประกอบที่เลือก

วัตถุประสงค์การเรียนรู้ 3
กำหนดแนวคิดของ "กรอบตัวอย่าง"

กรอบการสุ่มตัวอย่างคือรายการองค์ประกอบที่จะใช้สุ่มตัวอย่าง

วัตถุประสงค์การเรียนรู้ 4
อธิบายความแตกต่างระหว่างความน่าจะเป็นและการสุ่มตัวอย่างตามที่กำหนด

ในกลุ่มตัวอย่างความน่าจะเป็น สมาชิกแต่ละคนของประชากรสามารถรวมเข้ากับค่าจำนวนหนึ่งได้ ให้ไม่เป็นศูนย์ความน่าจะเป็น ความน่าจะเป็นที่จะรวมสมาชิกบางคนในกลุ่มตัวอย่างอาจแตกต่างกัน แต่เป็นที่ทราบกันดีถึงความน่าจะเป็นที่จะรวมแต่ละองค์ประกอบในกลุ่มตัวอย่าง สำหรับตัวอย่างที่กำหนด การประเมินความน่าจะเป็นของการรวมองค์ประกอบใดๆ ไว้ในตัวอย่างจะเป็นไปไม่ได้ ไม่สามารถรับประกันความเป็นตัวแทนของตัวอย่างดังกล่าวได้ การสุ่มตัวอย่างตามที่กำหนดทั้งหมดจะขึ้นอยู่กับความเห็นส่วนตัว การตัดสิน หรือความชอบ การตั้งค่าดังกล่าวบางครั้งสามารถให้ค่าประมาณที่ดีเกี่ยวกับคุณลักษณะของประชากรได้ แต่ไม่มีวิธีใดที่จะตัดสินได้อย่างเป็นกลางว่ากลุ่มตัวอย่างเหมาะสมกับงานที่ทำอยู่หรือไม่

วัตถุประสงค์การเรียนรู้ 5
แยกแยะระหว่างการสุ่มตัวอย่างที่มีขนาดคงที่และการสุ่มตัวอย่างแบบหลายขั้นตอน (ตามลำดับ)

เมื่อทำงานกับตัวอย่างที่มีขนาดคงที่ ขนาดตัวอย่างจะถูกกำหนดก่อนที่การสำรวจจะเริ่มต้น และการวิเคราะห์ผลลัพธ์จะนำหน้าด้วยการรวบรวมข้อมูลที่จำเป็นทั้งหมด ในการสุ่มตัวอย่างตามลำดับ ไม่ทราบจำนวนองค์ประกอบที่เลือกล่วงหน้า โดยพิจารณาจากชุดการตัดสินใจตามลำดับ

วัตถุประสงค์การเรียนรู้ 6
อธิบายว่าการสุ่มตัวอย่างแบบเจาะจงคืออะไร และอธิบายทั้งจุดแข็งและจุดอ่อน

รายการในกลุ่มตัวอย่างแบบเจาะจงจะถูกเลือกด้วยมือและนำเสนอต่อผู้วิจัยเมื่อบรรลุวัตถุประสงค์ของการสำรวจ สันนิษฐานว่าองค์ประกอบที่เลือกสามารถให้ภาพที่สมบูรณ์ของประชากรที่กำลังศึกษาได้ ในขณะที่ผู้วิจัยยังอยู่ในขั้นเริ่มต้นของการสำรวจปัญหาและกำหนดโอกาสและข้อจำกัดที่เป็นไปได้ของการสำรวจที่วางแผนไว้ การใช้การสุ่มตัวอย่างแบบเจาะจงอาจมีประสิทธิผลมาก แต่ไม่ว่าในกรณีใดเราไม่ควรลืมจุดอ่อนของกลุ่มตัวอย่างประเภทนี้เนื่องจากผู้วิจัยสามารถใช้ในการศึกษาเชิงพรรณนาหรือเชิงสาเหตุได้ซึ่งจะส่งผลต่อคุณภาพของผลลัพธ์ทันที

วัตถุประสงค์การเรียนรู้ 7
กำหนดแนวคิดของการสุ่มตัวอย่างโควต้า

เลือกตัวอย่างตามสัดส่วนเพื่อให้สัดส่วนขององค์ประกอบในตัวอย่างที่มีลักษณะบางอย่างสอดคล้องกับสัดส่วนขององค์ประกอบเดียวกันในประชากรที่กำลังศึกษาโดยประมาณ ในการทำเช่นนี้ ผู้แจกแจงแต่ละคนจะได้รับโควต้าที่กำหนดลักษณะของประชากรที่เขาต้องติดต่อด้วย

วัตถุประสงค์การเรียนรู้ 8
อธิบายว่าพารามิเตอร์ในขั้นตอนการสุ่มตัวอย่างคืออะไร

พารามิเตอร์ - ลักษณะเฉพาะหรือตัวบ่งชี้ของประชากรทั่วไปหรือประชากรที่ศึกษา ตัวบ่งชี้เชิงปริมาณบางอย่างที่แยกแยะประชากรหนึ่งจากอีกประชากรหนึ่ง

วัตถุประสงค์การเรียนรู้ 9
อธิบายว่าชุดที่ได้รับคืออะไร

ประชากรที่ได้รับประกอบด้วยตัวอย่างที่เป็นไปได้ทั้งหมดที่สามารถเลือกได้จากประชากรตามแผนการสุ่มตัวอย่างที่กำหนด

วัตถุประสงค์การเรียนรู้ 10
อธิบายว่าเหตุใดแนวคิดเรื่องการกระจายตัวอย่างจึงเป็นแนวคิดที่สำคัญในสถิติ

แนวคิดเรื่องการกระจายตัวอย่างถือเป็นรากฐานสำคัญของการอนุมานทางสถิติ จากการกระจายตัวอย่างที่ทราบของสถิติภายใต้การศึกษา เราสามารถสรุปเกี่ยวกับพารามิเตอร์ที่สอดคล้องกันของประชากรได้ หากทราบเพียงว่าค่าประมาณตัวอย่างแตกต่างกันไปในแต่ละตัวอย่าง แต่ไม่ทราบลักษณะของการเปลี่ยนแปลงนี้ จะเป็นไปไม่ได้ที่จะระบุข้อผิดพลาดในการสุ่มตัวอย่างที่เกี่ยวข้องกับค่าประมาณนี้ เนื่องจากการกระจายตัวอย่างของการประมาณค่าจะอธิบายความแปรผันจากตัวอย่างหนึ่งไปอีกตัวอย่างหนึ่ง จึงเป็นพื้นฐานในการพิจารณาความถูกต้องของการประมาณตัวอย่าง

ตัวอย่าง - ชุดของกรณี (วิชา วัตถุ เหตุการณ์ ตัวอย่าง) โดยใช้ขั้นตอนบางอย่าง คัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา

ขนาดตัวอย่าง

ขนาดตัวอย่างคือจำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำให้จำนวนเคสมีอย่างน้อย 30-35

ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ

เมื่อเปรียบเทียบสองตัวอย่าง (หรือมากกว่า) พารามิเตอร์ที่สำคัญคือการพึ่งพาอาศัยกัน หากเป็นไปได้ที่จะสร้างคู่โฮโมมอร์ฟิก (นั่นคือ เมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับกรณีเดียวจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และพื้นฐานสำหรับความสัมพันธ์นี้มีความสำคัญสำหรับ ลักษณะที่วัดได้ในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่าขึ้นอยู่กับ ตัวอย่างของกลุ่มตัวอย่างที่ต้องพึ่งพา:

  1. คู่แฝด
  2. การวัดลักษณะใดๆ สองครั้งก่อนและหลังการสัมผัสการทดลอง
  3. สามีและภรรยา
  4. และอื่น ๆ

หากไม่มีความสัมพันธ์ดังกล่าวระหว่างกลุ่มตัวอย่าง ตัวอย่างเหล่านี้จะถือว่าเป็นอิสระ ตัวอย่างเช่น:

  1. ผู้ชายและผู้หญิง,
  2. นักจิตวิทยาและนักคณิตศาสตร์
  3. ดังนั้น ตัวอย่างที่ต้องพึ่งพาจะมีขนาดเท่ากันเสมอ ในขณะที่ขนาดของตัวอย่างอิสระอาจแตกต่างกัน

การเปรียบเทียบตัวอย่างทำได้โดยใช้เกณฑ์ทางสถิติต่างๆ:

  • แบบทดสอบของนักเรียน
  • วิลคอกสันที-ทดสอบ
  • การทดสอบแมนน์-วิทนีย์ยู
  • เกณฑ์การลงนาม
  • และอื่น ๆ.

ความเป็นตัวแทน

ตัวอย่างอาจถือได้ว่าเป็นตัวแทนหรือไม่เป็นตัวแทน

ตัวอย่างของกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน

ในสหรัฐอเมริกา ตัวอย่างทางประวัติศาสตร์ที่มีชื่อเสียงที่สุดอย่างหนึ่งของการสุ่มตัวอย่างโดยไม่เป็นตัวแทนเกิดขึ้นระหว่างการเลือกตั้งประธานาธิบดีในปี 1936 Literary Digest ซึ่งคาดการณ์เหตุการณ์การเลือกตั้งครั้งก่อนได้สำเร็จ คาดการณ์ผิดเมื่อได้ส่งบัตรลงคะแนนทดสอบจำนวน 10 ล้านใบให้กับสมาชิก ผู้ที่ได้รับเลือกจากสมุดโทรศัพท์ทั่วประเทศ และผู้ที่มาจากรายชื่อทะเบียนรถยนต์ ใน 25% ของบัตรลงคะแนนที่ได้รับคืน (เกือบ 2.5 ล้านใบ) แบ่งคะแนนเสียงดังนี้

57% ต้องการผู้สมัครจากพรรครีพับลิกัน Alf Landon

40% เลือกประธานาธิบดีแฟรงคลิน รูสเวลต์ ซึ่งเป็นพรรคเดโมแครตในขณะนั้น

ในการเลือกตั้งจริง ดังที่ทราบกันดีว่ารูสเวลต์ชนะ โดยได้รับคะแนนเสียงมากกว่า 60% ข้อผิดพลาดของ Literary Digest คือ: ต้องการเพิ่มความเป็นตัวแทนของกลุ่มตัวอย่าง - เนื่องจากพวกเขารู้ว่าสมาชิกส่วนใหญ่คิดว่าตัวเองเป็นพรรครีพับลิกัน - พวกเขาจึงขยายกลุ่มตัวอย่างให้รวมผู้ที่ได้รับเลือกจากสมุดโทรศัพท์และรายชื่อการลงทะเบียน อย่างไรก็ตาม พวกเขาไม่ได้คำนึงถึงความเป็นจริงของเวลาของพวกเขาและในความเป็นจริงได้คัดเลือกพรรครีพับลิกันมากขึ้น: ในช่วงภาวะเศรษฐกิจตกต่ำครั้งใหญ่ส่วนใหญ่เป็นตัวแทนของชนชั้นกลางและชนชั้นสูงที่สามารถเป็นเจ้าของโทรศัพท์และรถยนต์ได้ (นั่นคือพรรครีพับลิกันส่วนใหญ่ ไม่ใช่พรรคเดโมแครต)

ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง

แผนการสร้างกลุ่มมีหลายประเภทหลัก:

  • เป็นการศึกษากับกลุ่มทดลองและกลุ่มควบคุมซึ่งจัดอยู่ในสภาวะต่างๆ
  • ศึกษากับกลุ่มทดลองและกลุ่มควบคุมโดยใช้กลยุทธ์การเลือกแบบคู่
  • การศึกษาโดยใช้เพียงกลุ่มเดียว - กลุ่มทดลอง
  • การศึกษาโดยใช้การออกแบบแบบผสม (แฟคทอเรียล) ทุกกลุ่มจะถูกจัดให้อยู่ในสภาวะที่แตกต่างกัน

กลยุทธ์การสร้างกลุ่ม

การคัดเลือกกลุ่มเพื่อเข้าร่วมในการทดลองทางจิตวิทยาดำเนินการโดยใช้กลยุทธ์ต่างๆ เพื่อให้แน่ใจว่ามีการเคารพความถูกต้องทั้งภายในและภายนอกมากที่สุด

  • การสุ่ม (การเลือกแบบสุ่ม)
  • ดึงดูดกลุ่มจริง

การสุ่ม

การสุ่ม, หรือ การเลือกแบบสุ่ม, ใช้เพื่อสร้างตัวอย่างสุ่มอย่างง่าย การใช้ตัวอย่างดังกล่าวตั้งอยู่บนสมมติฐานที่ว่าสมาชิกแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในกลุ่มตัวอย่างเท่าๆ กัน ตัวอย่างเช่น หากต้องการสุ่มตัวอย่างนักเรียน 100 คน คุณสามารถใส่กระดาษที่มีชื่อของนักศึกษามหาวิทยาลัยทุกคนใส่หมวก แล้วหยิบกระดาษออกมา 100 แผ่น - นี่จะเป็นการเลือกแบบสุ่ม (Goodwin J. , น. 147)

การเลือกคู่

การเลือกคู่- กลยุทธ์ในการสร้างกลุ่มตัวอย่าง โดยกลุ่มวิชาประกอบด้วยวิชาที่เทียบเท่ากันในแง่ของพารามิเตอร์รองที่มีนัยสำคัญต่อการทดลอง กลยุทธ์นี้มีประสิทธิภาพสำหรับการทดลองโดยใช้กลุ่มทดลองและกลุ่มควบคุมด้วย ตัวเลือกที่ดีที่สุด- ดึงดูด

ในทางสถิติมีวิธีการวิจัยหลักสองวิธีคือแบบต่อเนื่องและแบบเลือกสรร เมื่อดำเนินการศึกษาตัวอย่าง จำเป็นต้องปฏิบัติตามข้อกำหนดต่อไปนี้: ความเป็นตัวแทนของประชากรตัวอย่างและหน่วยสังเกตการณ์ในจำนวนที่เพียงพอ เมื่อเลือกหน่วยสังเกตการณ์ก็สามารถทำได้ ข้อผิดพลาดออฟเซ็ตเช่น เหตุการณ์ดังกล่าวที่ไม่สามารถคาดเดาเหตุการณ์ได้อย่างแม่นยำ ข้อผิดพลาดเหล่านี้เป็นไปตามวัตถุประสงค์และเป็นธรรมชาติ เมื่อพิจารณาระดับความแม่นยำของการศึกษาการสุ่มตัวอย่าง ปริมาณของข้อผิดพลาดที่อาจเกิดขึ้นในระหว่างกระบวนการสุ่มตัวอย่างจะถูกประมาณ - ข้อผิดพลาดในการเป็นตัวแทนแบบสุ่ม () — คือความแตกต่างที่แท้จริงระหว่างค่าเฉลี่ยหรือค่าสัมพัทธ์ที่ได้รับระหว่างการศึกษาตัวอย่างกับค่าใกล้เคียงกันที่จะได้รับระหว่างการศึกษาประชากรทั่วไป

การประเมินความน่าเชื่อถือของผลการวิจัยเกี่ยวข้องกับการกำหนด:

1. ข้อผิดพลาดในการเป็นตัวแทน

2. ขีดจำกัดความเชื่อมั่นของค่าเฉลี่ย (หรือสัมพัทธ์) ในประชากร

3. ความน่าเชื่อถือของความแตกต่างระหว่างค่าเฉลี่ย (หรือสัมพัทธ์) (ตามเกณฑ์ t)

การคำนวณข้อผิดพลาดในการเป็นตัวแทน(มม.) ค่าเฉลี่ยเลขคณิต (M):

โดยที่ σ คือค่าเบี่ยงเบนมาตรฐาน n—ขนาดตัวอย่าง (>30)

การคำนวณข้อผิดพลาดในการเป็นตัวแทน (mР) ค่าสัมพัทธ์ (Р):

โดยที่ P คือค่าสัมพัทธ์ที่สอดคล้องกัน (คำนวณ เช่น เป็น%)

Q =100 - Ρ% - ส่วนกลับของ P; n—ขนาดตัวอย่าง (n>30)

ในงานทางคลินิกและการทดลองมักจำเป็นต้องใช้ ตัวอย่างเล็กๆ น้อยๆเมื่อจำนวนการสังเกตน้อยกว่าหรือเท่ากับ 30 โดยมีตัวอย่างเล็กๆ เพื่อคำนวณข้อผิดพลาดของการเป็นตัวแทนทั้งค่าเฉลี่ยและค่าสัมพัทธ์ , จำนวนการสังเกตลดลงหนึ่งรายการนั่นคือ

; .

ขนาดของข้อผิดพลาดในการเป็นตัวแทนขึ้นอยู่กับขนาดตัวอย่าง: มากกว่า จำนวนที่มากขึ้นการสังเกตหัวข้อ ข้อผิดพลาดน้อยลง. ในการประเมินความน่าเชื่อถือของตัวบ่งชี้ตัวอย่าง ให้ใช้แนวทางต่อไปนี้: ตัวบ่งชี้ (หรือค่าเฉลี่ย) จะต้องมากกว่าข้อผิดพลาด 3 เท่า ซึ่งในกรณีนี้จะถือว่าเชื่อถือได้

การทราบขนาดของข้อผิดพลาดนั้นไม่เพียงพอที่จะมั่นใจในผลลัพธ์ของการศึกษาตัวอย่าง เนื่องจากข้อผิดพลาดเฉพาะในการศึกษาตัวอย่างอาจมีมากกว่า (หรือน้อยกว่า) กว่าข้อผิดพลาดในการเป็นตัวแทนโดยเฉลี่ยอย่างมีนัยสำคัญ เพื่อกำหนดความแม่นยำที่นักวิจัยต้องการได้รับผลลัพธ์ สถิติใช้แนวคิดเช่นความน่าจะเป็นของการพยากรณ์ที่ปราศจากข้อผิดพลาด ซึ่งเป็นลักษณะของความน่าเชื่อถือของผลลัพธ์ของตัวอย่างการศึกษาทางสถิติทางชีวการแพทย์ โดยทั่วไป เมื่อทำการศึกษาทางสถิติทางชีวการแพทย์ ความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาดคือ 95% หรือ 99% ในกรณีที่สำคัญที่สุด เมื่อจำเป็นต้องหาข้อสรุปที่สำคัญเป็นพิเศษในแง่ทฤษฎีหรือปฏิบัติ ให้ใช้ความน่าจะเป็นของการพยากรณ์ที่ปราศจากข้อผิดพลาดที่ 99.7%

ค่าบางอย่างสอดคล้องกับระดับความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาด ข้อผิดพลาดเล็กน้อยของการสุ่มตัวอย่าง (Δ - เดลต้า)ซึ่งถูกกำหนดโดยสูตร:

Δ=t * m โดยที่ t คือสัมประสิทธิ์ความเชื่อมั่น ซึ่งมีตัวอย่างจำนวนมากและความน่าจะเป็น 95% ที่จะพยากรณ์โดยปราศจากข้อผิดพลาด จะเท่ากับ 2.6 ด้วยความน่าจะเป็นของการคาดการณ์ที่ปราศจากข้อผิดพลาด 99% - 3.0; โดยมีความน่าจะเป็นที่การพยากรณ์โดยปราศจากข้อผิดพลาดคือ 99.7% - 3.3 และด้วยตัวอย่างขนาดเล็ก จะถูกกำหนดโดยใช้ตารางพิเศษของค่า t ของนักเรียน

การใช้ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม (Δ) เราสามารถระบุได้ ขอบเขตความน่าเชื่อถือซึ่งด้วยความน่าจะเป็นที่แน่นอนของการพยากรณ์ที่ปราศจากข้อผิดพลาด จะมีค่าที่แท้จริงของปริมาณทางสถิติอยู่ , การแสดงลักษณะของประชากรทั้งหมด (โดยเฉลี่ยหรือสัมพันธ์กัน)

เพื่อกำหนดขีดจำกัดความเชื่อมั่น จะใช้สูตรต่อไปนี้:

1) สำหรับค่าเฉลี่ย:

โดยที่ Mgen คือขีดจำกัดความเชื่อมั่นของค่าเฉลี่ยในประชากร

ตัวอย่าง - ค่าเฉลี่ย , ได้รับระหว่างการศึกษาประชากรตัวอย่าง t คือสัมประสิทธิ์ความเชื่อมั่นซึ่งค่าจะถูกกำหนดโดยระดับความน่าจะเป็นของการพยากรณ์ที่ปราศจากข้อผิดพลาดซึ่งผู้วิจัยต้องการได้รับผลลัพธ์ mM คือข้อผิดพลาดของการเป็นตัวแทนของค่าเฉลี่ย

2) สำหรับค่าสัมพัทธ์:

โดยที่ Pgen คือขีดจำกัดความเชื่อมั่นของค่าสัมพัทธ์ในประชากร Rsb คือค่าสัมพัทธ์ที่ได้รับเมื่อทำการศึกษาประชากรตัวอย่าง t—สัมประสิทธิ์ความเชื่อมั่น; mP คือข้อผิดพลาดของการเป็นตัวแทนของค่าสัมพัทธ์

ขีดจำกัดความเชื่อมั่นแสดงขีดจำกัดที่ขนาดตัวอย่างสามารถผันผวนได้ ขึ้นอยู่กับเหตุผลที่สุ่ม

ด้วยข้อสังเกตอันน้อยนิด (น<30), для вычисления довери­тельных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, ระบุจำนวนองศาอิสระที่มีอยู่ (n) , ซึ่งเท่ากับ n-1

ประชากรทางสถิติ- ชุดของหน่วยที่มีมวล ลักษณะทั่วไป ความสม่ำเสมอในเชิงคุณภาพ และการมีอยู่ของการเปลี่ยนแปลง

ประชากรทางสถิติประกอบด้วยวัตถุที่มีอยู่อย่างเป็นรูปธรรม (พนักงาน วิสาหกิจ ประเทศ ภูมิภาค) เป็นวัตถุ

หน่วยของประชากร— แต่ละหน่วยเฉพาะของประชากรทางสถิติ

ประชากรทางสถิติเดียวกันสามารถมีลักษณะเป็นเนื้อเดียวกันได้ในลักษณะหนึ่งและต่างกันในลักษณะอื่นได้

ความสม่ำเสมอเชิงคุณภาพ- ความคล้ายคลึงกันของทุกหน่วยของประชากรในบางพื้นฐานและความแตกต่างจากหน่วยอื่น ๆ ทั้งหมด

ในประชากรทางสถิติ ความแตกต่างระหว่างหน่วยประชากรหนึ่งกับอีกหน่วยหนึ่งมักมีลักษณะเป็นเชิงปริมาณ การเปลี่ยนแปลงเชิงปริมาณในค่าของคุณลักษณะของหน่วยต่าง ๆ ของประชากรเรียกว่าการแปรผัน

การเปลี่ยนแปลงของลักษณะ- การเปลี่ยนแปลงเชิงปริมาณในลักษณะ (สำหรับลักษณะเชิงปริมาณ) ในระหว่างการเปลี่ยนจากหน่วยประชากรหนึ่งไปยังอีกหน่วยหนึ่ง

เข้าสู่ระบบ- เป็นคุณสมบัติ ลักษณะเฉพาะ หรือลักษณะอื่นของหน่วย วัตถุ และปรากฏการณ์ที่สามารถสังเกตหรือวัดได้ สัญญาณแบ่งออกเป็นเชิงปริมาณและเชิงคุณภาพ ความหลากหลายและความแปรปรวนของมูลค่าของลักษณะเฉพาะในแต่ละหน่วยของประชากรเรียกว่า การเปลี่ยนแปลง.

ลักษณะเฉพาะ (เชิงคุณภาพ) ไม่สามารถแสดงเป็นตัวเลขได้ (องค์ประกอบของประชากรตามเพศ) ลักษณะเชิงปริมาณมีการแสดงออกเป็นตัวเลข (องค์ประกอบของประชากรตามอายุ)

ดัชนี- นี่เป็นลักษณะทั่วไปเชิงปริมาณและคุณภาพของทรัพย์สินใดๆ ของหน่วยหรือประชากรโดยรวมภายใต้เงื่อนไขเฉพาะของเวลาและสถานที่

ดัชนีชี้วัดคือชุดตัวชี้วัดที่สะท้อนปรากฏการณ์ที่กำลังศึกษาอย่างครอบคลุม

ตัวอย่างเช่น มีการศึกษาเงินเดือน:
  • เข้าสู่ระบบ - ค่าจ้าง
  • ประชากรทางสถิติ-พนักงานทุกคน
  • หน่วยประชากรคือพนักงานแต่ละคน
  • ความสม่ำเสมอเชิงคุณภาพ - ค่าจ้างสะสม
  • การเปลี่ยนแปลงของเครื่องหมาย - ชุดตัวเลข

ประชากรและกลุ่มตัวอย่างจากนั้น

พื้นฐานคือชุดของข้อมูลที่ได้รับจากการวัดคุณลักษณะตั้งแต่หนึ่งรายการขึ้นไป ชุดของวัตถุที่สังเกตได้อย่างแท้จริง ซึ่งแสดงทางสถิติด้วยการสังเกตตัวแปรสุ่มจำนวนหนึ่งคือ การสุ่มตัวอย่างและที่มีอยู่ตามสมมุติฐาน (การคาดเดา) - ประชากรทั่วไป. ประชากรอาจมีจำกัด (จำนวนการสังเกต N = ค่าคงที่) หรืออนันต์ ( ยังไม่มีข้อความ = ∞) และตัวอย่างจากประชากรจะเป็นผลมาจากการสังเกตในจำนวนที่จำกัดเสมอ เรียกว่าจำนวนการสังเกตที่ก่อตัวเป็นตัวอย่าง ขนาดตัวอย่าง. หากขนาดตัวอย่างมีขนาดใหญ่พอ ( n → ∞) พิจารณาตัวอย่างแล้ว ใหญ่มิฉะนั้นจะเรียกว่าการสุ่มตัวอย่าง ปริมาณจำกัด. โดยจะพิจารณาตัวอย่าง เล็กหากเมื่อทำการวัดตัวแปรสุ่มหนึ่งมิติขนาดตัวอย่างจะต้องไม่เกิน 30 ( n<= 30 ) และเมื่อทำการวัดหลายรายการพร้อมกัน ( เค) คุณลักษณะในปริภูมิความสัมพันธ์หลายมิติ nถึง เคไม่เกิน 10 (ไม่ระบุ< 10) . แบบฟอร์มตัวอย่าง ซีรีย์การเปลี่ยนแปลงถ้ามีสมาชิกอยู่ สถิติลำดับคือค่าตัวอย่างของตัวแปรสุ่ม เอ็กซ์ถูกเรียงลำดับจากน้อยไปมาก (จัดอันดับ) ค่าของคุณลักษณะจะถูกเรียกว่า ตัวเลือก.

ตัวอย่าง. ชุดวัตถุที่สุ่มเลือกมาเกือบจะเหมือนกัน - ธนาคารพาณิชย์ของเขตบริหารหนึ่งของมอสโก ถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทั้งหมดในเขตนี้ และเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทุกแห่งในมอสโก ตลอดจนตัวอย่างจากธนาคารพาณิชย์ของประเทศ เป็นต้น

วิธีการพื้นฐานในการจัดการเก็บตัวอย่าง

ความน่าเชื่อถือของข้อสรุปทางสถิติและการตีความผลลัพธ์ที่มีความหมายขึ้นอยู่กับ ความเป็นตัวแทนตัวอย่างเช่น ความสมบูรณ์และเพียงพอของการเป็นตัวแทนของคุณสมบัติของประชากรทั่วไปซึ่งสัมพันธ์กับตัวอย่างนี้สามารถถือว่าเป็นตัวแทนได้ การศึกษาคุณสมบัติทางสถิติของประชากรสามารถจัดได้สองวิธี: การใช้ อย่างต่อเนื่องและ ไม่ต่อเนื่อง การสังเกตอย่างต่อเนื่องจัดให้มีการตรวจสอบทั้งหมด หน่วยศึกษา จำนวนทั้งสิ้น, ก การสังเกตบางส่วน (เลือก)- เพียงบางส่วนเท่านั้น

มีห้าวิธีหลักในการจัดการการสังเกตตัวอย่าง:

1. การเลือกแบบสุ่มอย่างง่ายซึ่งวัตถุจะถูกสุ่มเลือกจากประชากรของวัตถุ (เช่น การใช้ตารางหรือตัวสร้างตัวเลขสุ่ม) โดยแต่ละตัวอย่างที่เป็นไปได้มีความน่าจะเป็นเท่ากัน ตัวอย่างดังกล่าวเรียกว่า สุ่มจริงๆ;

2. การเลือกอย่างง่ายโดยใช้ขั้นตอนปกติดำเนินการโดยใช้ส่วนประกอบทางกล (เช่น วันที่ วันในสัปดาห์ หมายเลขอพาร์ตเมนต์ ตัวอักษร ฯลฯ) และตัวอย่างที่ได้รับในลักษณะนี้เรียกว่า เครื่องกล;

3. แบ่งชั้นการคัดเลือกประกอบด้วยข้อเท็จจริงที่ว่าประชากรทั่วไปของปริมาตรถูกแบ่งออกเป็นประชากรย่อยหรือชั้น (ชั้น) ของปริมาตร ดังนั้น Strata เป็นวัตถุที่เป็นเนื้อเดียวกันในแง่ของลักษณะทางสถิติ (ตัวอย่างเช่น ประชากรแบ่งออกเป็นชั้นตามกลุ่มอายุหรือชนชั้นทางสังคม วิสาหกิจ - ตามอุตสาหกรรม) ในกรณีนี้จะมีการเรียกตัวอย่าง แบ่งชั้น(มิฉะนั้น, แบ่งชั้น, โดยทั่วไป, แบ่งเขต);

4.วิธีการ อนุกรมการคัดเลือกถูกนำมาใช้เพื่อสร้าง อนุกรมหรือ ตัวอย่างรัง. สะดวกหากจำเป็นต้องสำรวจ "บล็อก" หรือชุดของวัตถุในคราวเดียว (เช่น ชุดสินค้า ผลิตภัณฑ์ของชุดใดชุดหนึ่ง หรือประชากรในอาณาเขตและฝ่ายบริหารของประเทศ) การเลือกซีรี่ส์สามารถทำได้แบบสุ่มหรือโดยกลไก ในกรณีนี้จะมีการตรวจสอบสินค้าบางชุดหรือหน่วยอาณาเขตทั้งหมด (อาคารที่อยู่อาศัยหรือบล็อก) โดยสมบูรณ์

5. รวมกันการเลือก (แบบขั้นบันได) สามารถรวมวิธีการเลือกได้หลายวิธีพร้อมกัน (เช่น แบบแบ่งชั้นและสุ่ม หรือสุ่มและเชิงกล) ตัวอย่างดังกล่าวเรียกว่า รวมกัน.

ประเภทของการเลือก

โดย จิตใจการคัดเลือกรายบุคคล กลุ่ม และแบบรวมมีความโดดเด่น ที่ การเลือกรายบุคคลแต่ละหน่วยของประชากรทั่วไปจะถูกเลือกให้เป็นประชากรตัวอย่างด้วย การเลือกกลุ่ม- กลุ่มหน่วยที่เป็นเนื้อเดียวกัน (อนุกรม) ในเชิงคุณภาพ และ การเลือกแบบรวมเกี่ยวข้องกับการผสมระหว่างประเภทที่หนึ่งและสอง

โดย วิธีการคัดเลือกมีความโดดเด่น ซ้ำและไม่ซ้ำซ้อนตัวอย่าง.

ทำซ้ำๆเรียกว่าการคัดเลือกโดยหน่วยที่รวมอยู่ในกลุ่มตัวอย่างจะไม่กลับคืนสู่ประชากรเดิมและไม่มีส่วนร่วมในการคัดเลือกต่อไป ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นจะลดลงในระหว่างกระบวนการคัดเลือก ที่ ซ้ำแล้วซ้ำเล่าการเลือก จับได้ในกลุ่มตัวอย่าง หน่วยหนึ่งหลังจากการลงทะเบียนจะถูกส่งกลับไปยังประชากรทั่วไป และด้วยเหตุนี้จึงยังคงมีโอกาสที่เท่าเทียมกันพร้อมกับหน่วยอื่น ๆ ที่จะใช้ในขั้นตอนการคัดเลือกเพิ่มเติม ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นยังคงไม่เปลี่ยนแปลง (วิธีนี้ไม่ค่อยมีการใช้ในการวิจัยทางเศรษฐกิจและสังคม) อย่างไรก็ตามด้วยความใหญ่โต ยังไม่มีข้อความ (N → ∞)สูตรสำหรับ ทำซ้ำได้การคัดเลือกเข้าใกล้ผู้ที่ ซ้ำแล้วซ้ำเล่าการเลือกและอันหลังนั้นมักใช้บ่อยกว่า ( N = ค่าคงที่).

ลักษณะพื้นฐานของพารามิเตอร์ของประชากรทั่วไปและประชากรตัวอย่าง

ข้อสรุปทางสถิติของการศึกษานี้ขึ้นอยู่กับการแจกแจงของตัวแปรสุ่มและค่าที่สังเกตได้ (x 1, x 2, ..., xn)เรียกว่าการรับรู้ตัวแปรสุ่ม เอ็กซ์(n คือขนาดตัวอย่าง) การแจกแจงของตัวแปรสุ่มในประชากรทั่วไปมีลักษณะทางทฤษฎีและเป็นอุดมคติ และมีลักษณะคล้ายคลึงกับตัวอย่าง เชิงประจักษ์การกระจาย. การแจกแจงทางทฤษฎีบางอย่างมีการระบุไว้ในเชิงวิเคราะห์ เช่น ของพวกเขา ตัวเลือกกำหนดค่าของฟังก์ชันการแจกแจงในแต่ละจุดในปริภูมิของค่าที่เป็นไปได้ของตัวแปรสุ่ม สำหรับตัวอย่าง ฟังก์ชันการกระจายจึงเป็นเรื่องยากและบางครั้งก็ไม่สามารถระบุได้ ตัวเลือกถูกประมาณจากข้อมูลเชิงประจักษ์ จากนั้นจึงแทนที่เป็นนิพจน์เชิงวิเคราะห์ที่อธิบายการกระจายตัวทางทฤษฎี ในกรณีนี้ สมมติฐาน (หรือ สมมติฐาน) เกี่ยวกับประเภทของการแจกแจงอาจมีความถูกต้องทางสถิติหรือผิดพลาดก็ได้ แต่ไม่ว่าในกรณีใด การกระจายตัวเชิงประจักษ์ที่สร้างขึ้นใหม่จากตัวอย่างจะแสดงลักษณะเฉพาะของจริงโดยคร่าวๆ เท่านั้น พารามิเตอร์การกระจายที่สำคัญที่สุดคือ มูลค่าที่คาดหวังและความแปรปรวน

โดยธรรมชาติแล้วจะมีการแจกแจง อย่างต่อเนื่องและ ไม่ต่อเนื่อง. การกระจายตัวต่อเนื่องที่รู้จักกันดีที่สุดคือ ปกติ. ตัวอย่างของพารามิเตอร์ที่คล้ายคลึงกันได้แก่: ค่าเฉลี่ยและความแปรปรวนเชิงประจักษ์ ในบรรดางานวิจัยที่ไม่ต่อเนื่องในการวิจัยทางเศรษฐกิจและสังคม มีการใช้บ่อยที่สุด ทางเลือก (ขั้ว)การกระจาย. พารามิเตอร์ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้จะแสดงค่าสัมพัทธ์ (หรือ แบ่งปัน) หน่วยของประชากรที่มีลักษณะเฉพาะที่กำลังศึกษา (ระบุด้วยตัวอักษร) สัดส่วนของประชากรที่ไม่มีลักษณะนี้จะแสดงด้วยตัวอักษร คิว (คิว = 1 - พี). ความแปรปรวนของการแจกแจงแบบทางเลือกยังมีการเปรียบเทียบเชิงประจักษ์ด้วย

ขึ้นอยู่กับประเภทของการแจกแจงและวิธีการเลือกหน่วยประชากร ลักษณะของพารามิเตอร์การแจกแจงจะถูกคำนวณแตกต่างกัน หลักสำหรับการแจกแจงทางทฤษฎีและเชิงประจักษ์แสดงไว้ในตาราง 1.

ตัวอย่างเศษส่วน k nอัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไปเรียกว่า:

kn = ไม่มี/ไม่มี.

ตัวอย่างเศษส่วน wคืออัตราส่วนของหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา xถึงขนาดตัวอย่าง n:

w = n n / n.

ตัวอย่าง.ในชุดสินค้าที่มีจำนวน 1,000 หน่วย โดยมีตัวอย่าง 5% แบ่งปันตัวอย่าง k nมูลค่าสัมบูรณ์คือ 50 หน่วย (n = น*0.05); หากพบสินค้าชำรุด 2 ชิ้นในตัวอย่างนี้แสดงว่า อัตราข้อบกพร่องตัวอย่าง wจะเป็น 0.04 (w = 2/50 = 0.04 หรือ 4%)

เนื่องจากประชากรกลุ่มตัวอย่างแตกต่างจากประชากรทั่วไปจึงมี ข้อผิดพลาดในการสุ่มตัวอย่าง.

ตารางที่ 1. พารามิเตอร์หลักของประชากรทั่วไปและประชากรตัวอย่าง

ข้อผิดพลาดในการสุ่มตัวอย่าง

ไม่ว่าในกรณีใด (ต่อเนื่องและเลือก) อาจเกิดข้อผิดพลาดสองประเภท: การลงทะเบียนและการเป็นตัวแทน ข้อผิดพลาด การลงทะเบียนสามารถมี สุ่มและ อย่างเป็นระบบอักขระ. สุ่มข้อผิดพลาดประกอบด้วยสาเหตุที่ควบคุมไม่ได้หลายประการ โดยไม่ได้ตั้งใจและมักจะเกิดความสมดุลระหว่างกัน (เช่น การเปลี่ยนแปลงประสิทธิภาพของอุปกรณ์เนื่องจากความผันผวนของอุณหภูมิในห้อง)

อย่างเป็นระบบข้อผิดพลาดมีอคติเนื่องจากละเมิดกฎในการเลือกวัตถุสำหรับตัวอย่าง (เช่น ความเบี่ยงเบนในการวัดเมื่อเปลี่ยนการตั้งค่าของอุปกรณ์วัด)

ตัวอย่าง.เพื่อประเมินสถานการณ์ทางสังคมของประชากรในเมือง มีการวางแผนที่จะสำรวจ 25% ของครอบครัว หากการเลือกอพาร์ทเมนต์ที่สี่ทุกแห่งขึ้นอยู่กับจำนวนก็อาจมีความเสี่ยงในการเลือกอพาร์ทเมนท์ทั้งหมดที่มีประเภทเดียวเท่านั้น (เช่นอพาร์ทเมนต์แบบหนึ่งห้อง) ซึ่งจะทำให้เกิดข้อผิดพลาดอย่างเป็นระบบและบิดเบือนผลลัพธ์ การเลือกหมายเลขอพาร์ทเมนต์ตามล็อตจะดีกว่าเนื่องจากข้อผิดพลาดจะเป็นแบบสุ่ม

ข้อผิดพลาดในการเป็นตัวแทนมีอยู่ในการสังเกตตัวอย่างเท่านั้น ไม่สามารถหลีกเลี่ยงได้ และเกิดขึ้นเนื่องจากการที่ประชากรตัวอย่างไม่ได้แพร่พันธุ์ประชากรทั่วไปได้อย่างสมบูรณ์ ค่าของตัวบ่งชี้ที่ได้จากตัวอย่างแตกต่างจากตัวบ่งชี้ของค่าเดียวกันในประชากรทั่วไป (หรือได้จากการสังเกตอย่างต่อเนื่อง)

อคติในการสุ่มตัวอย่างคือความแตกต่างระหว่างค่าพารามิเตอร์ในประชากรและค่าตัวอย่าง สำหรับค่าเฉลี่ยของคุณลักษณะเชิงปริมาณจะเท่ากับ: และสำหรับส่วนแบ่ง (คุณลักษณะทางเลือก) -

ข้อผิดพลาดในการสุ่มตัวอย่างมีอยู่ในการสังเกตตัวอย่างเท่านั้น ยิ่งข้อผิดพลาดเหล่านี้มากเท่าใด การกระจายเชิงประจักษ์ก็จะยิ่งแตกต่างจากการกระจายทางทฤษฎีมากขึ้นเท่านั้น พารามิเตอร์ของการแจกแจงเชิงประจักษ์เป็นตัวแปรสุ่ม ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างก็เป็นตัวแปรสุ่มเช่นกัน โดยสามารถรับค่าที่แตกต่างกันสำหรับตัวอย่างที่แตกต่างกันได้ ดังนั้นจึงเป็นเรื่องปกติที่จะคำนวณ ข้อผิดพลาดโดยเฉลี่ย.

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยคือปริมาณที่แสดงค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่างจากค่าคาดหวังทางคณิตศาสตร์ ค่านี้ขึ้นอยู่กับหลักการของการเลือกแบบสุ่ม ขึ้นอยู่กับขนาดตัวอย่างและระดับความแปรผันของคุณลักษณะเป็นหลัก: ยิ่งความแปรผันของคุณลักษณะมากหรือน้อย (และด้วยเหตุนี้ค่า) ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลง . ความสัมพันธ์ระหว่างความแปรปรวนของประชากรทั่วไปและประชากรตัวอย่างแสดงโดยสูตร:

เหล่านั้น. เมื่อใหญ่พอเราก็สรุปได้ว่า ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยแสดงให้เห็นความเบี่ยงเบนที่เป็นไปได้ของพารามิเตอร์ประชากรตัวอย่างจากพารามิเตอร์ประชากรทั่วไป ในตาราง 2 แสดงนิพจน์สำหรับการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับวิธีการต่างๆ ในการจัดการสังเกตการณ์

ตารางที่ 2 ความคลาดเคลื่อนเฉลี่ย (m) ของค่าเฉลี่ยตัวอย่างและสัดส่วนสำหรับตัวอย่างประเภทต่างๆ

โดยที่ค่าเฉลี่ยของความแปรปรวนตัวอย่างภายในกลุ่มสำหรับแอตทริบิวต์ต่อเนื่อง

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มของสัดส่วน

— จำนวนซีรีส์ที่เลือก — จำนวนซีรีส์ทั้งหมด

,

ค่าเฉลี่ยของซีรีย์นั้นอยู่ที่ไหน

- ค่าเฉลี่ยโดยรวมของประชากรตัวอย่างทั้งหมดสำหรับลักษณะเฉพาะต่อเนื่อง

,

ส่วนแบ่งของคุณลักษณะในซีรีส์ th อยู่ที่ไหน

— ส่วนแบ่งรวมของลักษณะเฉพาะในประชากรตัวอย่างทั้งหมด

อย่างไรก็ตาม ขนาดของข้อผิดพลาดโดยเฉลี่ยสามารถตัดสินได้ด้วยความน่าจะเป็น P (P ≤ 1) เท่านั้น Lyapunov A.M. พิสูจน์ว่าการกระจายตัวของค่าเฉลี่ยตัวอย่าง และการเบี่ยงเบนไปจากค่าเฉลี่ยทั่วไปในจำนวนที่มากพอสมควร เป็นไปตามกฎการกระจายแบบปกติ โดยมีเงื่อนไขว่าประชากรทั่วไปมีค่าเฉลี่ยจำกัดและมีความแปรปรวนจำกัด

ในทางคณิตศาสตร์ ข้อความสำหรับค่าเฉลี่ยนี้แสดงเป็น:

และสำหรับการแบ่งใช้ นิพจน์ (1) จะอยู่ในรูปแบบ:

ที่ไหน - มี ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อยซึ่งเป็นผลคูณของข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย , และค่าสัมประสิทธิ์หลายหลากคือแบบทดสอบของนักเรียน ("ค่าสัมประสิทธิ์ความมั่นใจ") ที่เสนอโดย W.S. Gosset (นามแฝง "นักเรียน"); ค่าสำหรับขนาดตัวอย่างที่แตกต่างกันจะถูกเก็บไว้ในตารางพิเศษ

ค่าของฟังก์ชัน Ф(t) สำหรับค่าบางค่าของ t เท่ากับ:

ดังนั้นนิพจน์ (3) จึงสามารถอ่านได้ดังนี้: ด้วยความน่าจะเป็น พี = 0.683 (68.3%)อาจเป็นที่ถกเถียงกันอยู่ว่าความแตกต่างระหว่างตัวอย่างและค่าเฉลี่ยทั่วไปจะไม่เกินหนึ่งค่าของข้อผิดพลาดโดยเฉลี่ย ม.(t=1)ด้วยความน่าจะเป็น พี = 0.954 (95.4%)- ว่าจะไม่เกินค่าของข้อผิดพลาดเฉลี่ยสองครั้ง ม. (เสื้อ = 2) ,ด้วยความน่าจะเป็น พี = 0.997 (99.7%)- จะไม่เกินสามค่า ม. (เสื้อ = 3) .ดังนั้นความน่าจะเป็นที่ความแตกต่างนี้จะเกินสามเท่าของข้อผิดพลาดโดยเฉลี่ยจึงถูกกำหนดโดย ระดับข้อผิดพลาดและไม่มีจำนวนอีกต่อไป 0,3% .

ในตาราง 3 แสดงสูตรสำหรับคำนวณข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด

ตารางที่ 3 ความคลาดเคลื่อนส่วนเพิ่ม (D) ของตัวอย่างสำหรับค่าเฉลี่ยและสัดส่วน (p) สำหรับการสังเกตตัวอย่างประเภทต่างๆ

ลักษณะทั่วไปของผลลัพธ์ตัวอย่างต่อประชากร

เป้าหมายสูงสุดของการสังเกตตัวอย่างคือการจำแนกลักษณะของประชากรทั่วไป ด้วยขนาดตัวอย่างที่น้อย การประมาณค่าเชิงประจักษ์ของพารามิเตอร์ ( และ ) อาจเบี่ยงเบนไปจากค่าที่แท้จริง ( และ ) อย่างมีนัยสำคัญ ดังนั้นจึงจำเป็นต้องสร้างขอบเขตที่ค่าจริง ( และ ) อยู่สำหรับค่าตัวอย่างของพารามิเตอร์ ( และ )

ช่วงความเชื่อมั่นของพารามิเตอร์ใด ๆ θ ของประชากรทั่วไปคือช่วงสุ่มของค่าของพารามิเตอร์นี้ซึ่งมีความน่าจะเป็นใกล้กับ 1 ( ความน่าเชื่อถือ) มีค่าจริงของพารามิเตอร์นี้

ข้อผิดพลาดเล็กน้อยตัวอย่าง Δ ช่วยให้คุณกำหนดค่าที่ จำกัด ของลักษณะของประชากรทั่วไปและค่าของพวกเขา ช่วงความมั่นใจซึ่งเท่ากัน:

บรรทัดล่าง ช่วงความมั่นใจได้จากการลบ ข้อผิดพลาดสูงสุดจากค่าเฉลี่ยตัวอย่าง (ส่วนแบ่ง) และค่าบนโดยบวกเข้าไป

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยจะใช้ค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุด และสำหรับระดับความเชื่อมั่นที่กำหนดจะถูกกำหนดโดยสูตร:

ซึ่งหมายความว่าด้วยความน่าจะเป็นที่กำหนด ซึ่งเรียกว่าระดับความเชื่อมั่นและถูกกำหนดโดยค่าโดยไม่ซ้ำกัน ทีอาจเป็นที่ถกเถียงกันอยู่ว่ามูลค่าที่แท้จริงของค่าเฉลี่ยอยู่ในช่วงตั้งแต่ และมูลค่าที่แท้จริงของหุ้นอยู่ในช่วงตั้งแต่

เมื่อคำนวณช่วงความเชื่อมั่นสำหรับระดับความเชื่อมั่นมาตรฐานสามระดับ P = 95%, P = 99% และ P = 99.9%ค่าจะถูกเลือกโดย การสมัครขึ้นอยู่กับจำนวนองศาอิสระ หากขนาดตัวอย่างใหญ่เพียงพอ ค่าที่สอดคล้องกับความน่าจะเป็นเหล่านี้ ทีเท่าเทียมกัน: 1,96, 2,58 และ 3,29 . ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มทำให้เราสามารถกำหนดค่าที่ จำกัด ของลักษณะของประชากรและช่วงความเชื่อมั่น:

การกระจายผลลัพธ์ของการสังเกตตัวอย่างไปยังประชากรทั่วไปในการวิจัยทางเศรษฐกิจและสังคมมีลักษณะเฉพาะของตัวเอง เนื่องจากต้องมีการนำเสนอทุกประเภทและกลุ่มทั้งหมดอย่างสมบูรณ์ พื้นฐานสำหรับความเป็นไปได้ของการกระจายดังกล่าวคือการคำนวณ ข้อผิดพลาดที่เกี่ยวข้อง:

ที่ไหน Δ % - ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดสัมพัทธ์ , .

มีสองวิธีหลักในการขยายการสังเกตตัวอย่างไปยังประชากร: วิธีการคำนวณใหม่และค่าสัมประสิทธิ์โดยตรง.

แก่นแท้ การแปลงโดยตรงประกอบด้วยการคูณค่าเฉลี่ยตัวอย่าง!!\overline(x) ด้วยขนาดของประชากร

ตัวอย่าง. ให้ประมาณจำนวนเด็กวัยหัดเดินโดยเฉลี่ยในเมืองด้วยวิธีสุ่มตัวอย่างและจำนวนเป็นหนึ่งคน หากมีครอบครัวเล็ก 1,000 ครอบครัวในเมือง จำนวนสถานที่ที่ต้องการในสถานรับเลี้ยงเด็กเทศบาลจะได้มาโดยการคูณค่าเฉลี่ยนี้ด้วยขนาดของประชากรทั่วไป N = 1,000 เช่น จะมีที่นั่ง 1,200 ที่นั่ง

วิธีการต่อรองขอแนะนำให้ใช้ในกรณีที่ดำเนินการสังเกตแบบเลือกเพื่อชี้แจงข้อมูลของการสังเกตอย่างต่อเนื่อง

ใช้สูตรต่อไปนี้:

โดยที่ตัวแปรทั้งหมดคือขนาดประชากร:

ขนาดตัวอย่างที่ต้องการ

ตารางที่ 4 ขนาดตัวอย่างที่ต้องการ (n) สำหรับองค์กรสังเกตการณ์ตัวอย่างประเภทต่างๆ

เมื่อวางแผนการสังเกตตัวอย่างด้วยค่าที่กำหนดไว้ล่วงหน้าของข้อผิดพลาดในการสุ่มตัวอย่างที่อนุญาต จำเป็นต้องประมาณค่าที่จำเป็นอย่างถูกต้อง ขนาดตัวอย่าง. ปริมาตรนี้สามารถกำหนดได้บนพื้นฐานของข้อผิดพลาดที่อนุญาตในระหว่างการสังเกตตัวอย่าง โดยขึ้นอยู่กับความน่าจะเป็นที่กำหนดซึ่งรับประกันค่าที่อนุญาตของระดับข้อผิดพลาด (โดยคำนึงถึงวิธีการจัดระเบียบการสังเกต) สูตรสำหรับกำหนดขนาดตัวอย่างที่ต้องการ n สามารถรับได้โดยตรงจากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ดังนั้นจากการแสดงออกของข้อผิดพลาดเล็กน้อย:

ขนาดตัวอย่างจะถูกกำหนดโดยตรง n:

สูตรนี้แสดงว่าเมื่อข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดลดลง Δ ขนาดตัวอย่างที่ต้องการจะเพิ่มขึ้นอย่างมาก ซึ่งเป็นสัดส่วนกับความแปรปรวนและกำลังสองของการทดสอบของนักเรียน

สำหรับวิธีการเฉพาะในการจัดการสังเกตการณ์ ขนาดตัวอย่างที่ต้องการจะคำนวณตามสูตรที่ให้ไว้ในตาราง 9.4.

ตัวอย่างการคำนวณเชิงปฏิบัติ

ตัวอย่างที่ 1 การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะเชิงปริมาณต่อเนื่อง

เพื่อประเมินความรวดเร็วในการชำระหนี้กับเจ้าหนี้ ธนาคารจึงสุ่มตัวอย่างเอกสารการชำระเงิน 10 ฉบับ ค่าของพวกเขากลายเป็นเท่ากัน (เป็นวัน): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

จำเป็นด้วยความน่าจะเป็น พ = 0.954กำหนดข้อผิดพลาดเล็กน้อย Δ ค่าเฉลี่ยตัวอย่างและขีดจำกัดความเชื่อมั่นของเวลาในการคำนวณเฉลี่ย

สารละลาย.ค่าเฉลี่ยคำนวณโดยใช้สูตรจากตาราง 9.1 สำหรับประชากรตัวอย่าง

ความแปรปรวนคำนวณโดยใช้สูตรจากตาราง 9.1.

ค่าคลาดเคลื่อนกำลังสองเฉลี่ยของวัน

ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตร:

เหล่านั้น. ค่าเฉลี่ยคือ x ± m = 12.0 ± 2.3 วัน.

ความน่าเชื่อถือของค่าเฉลี่ยก็คือ

เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างซ้ำ เนื่องจากไม่ทราบขนาดประชากร และสำหรับ พ = 0.954ระดับความมั่นใจ

ดังนั้นค่าเฉลี่ยคือ `x ± D = `x ± 2m = 12.0 ± 4.6 กล่าวคือ มูลค่าที่แท้จริงอยู่ในช่วง 7.4 ถึง 16.6 วัน

การใช้โต๊ะนักเรียน แอปพลิเคชันช่วยให้เราสรุปได้ว่าสำหรับ n = 10 - 1 = 9 องศาอิสระ ค่าที่ได้รับมีความน่าเชื่อถือโดยมีระดับนัยสำคัญเท่ากับ 0.001 ปอนด์ เช่น ค่าเฉลี่ยผลลัพธ์จะแตกต่างอย่างมากจาก 0

ตัวอย่างที่ 2 การประมาณความน่าจะเป็น (ส่วนแบ่งทั่วไป) น.

วิธีการสุ่มตัวอย่างเชิงกลเพื่อสำรวจสถานภาพทางสังคมของ 1,000 ครอบครัว พบว่าสัดส่วนของครอบครัวที่มีรายได้น้อยคือ ก = 0.3 (30%)(ตัวอย่างคือ 2% , เช่น. ไม่มี/ไม่มี = 0.02). จำเป็นด้วยระดับความมั่นใจ พี = 0.997กำหนดตัวบ่งชี้ ครอบครัวผู้มีรายได้น้อยทั่วทั้งภูมิภาค

สารละลาย.ขึ้นอยู่กับค่าฟังก์ชันที่นำเสนอ เอฟ(ที)ค้นหาระดับความมั่นใจที่กำหนด พ = 0.997ความหมาย เสื้อ = 3(ดูสูตร 3) ความคลาดเคลื่อนเล็กน้อยของเศษส่วน กำหนดโดยสูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างแบบไม่ทำซ้ำ (การสุ่มตัวอย่างเชิงกลจะไม่ทำซ้ำเสมอ):

ข้อผิดพลาดในการสุ่มตัวอย่างสัมพัทธ์สูงสุดใน % จะ:

ความน่าจะเป็น (ส่วนแบ่งทั่วไป) ของครอบครัวที่มีรายได้น้อยในภูมิภาคจะเป็น р=w±Δwและขีดจำกัดความเชื่อมั่น p คำนวณจากอสมการสองเท่า:

w — Δ w ≤ p ≤ w — Δ w, เช่น. มูลค่าที่แท้จริงของ p อยู่ภายใน:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

ดังนั้นด้วยความน่าจะเป็นที่ 0.997 จึงระบุได้ว่าส่วนแบ่งของครอบครัวที่มีรายได้น้อยในทุกครอบครัวในภูมิภาคมีตั้งแต่ 28.6% ถึง 31.4%

ตัวอย่างที่ 3การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะที่ไม่ต่อเนื่องที่ระบุโดยชุดช่วง

ในตาราง 5. มีการระบุการกระจายแอปพลิเคชันสำหรับการผลิตคำสั่งซื้อตามเวลาที่องค์กรดำเนินการ

ตารางที่ 5. การกระจายของการสังเกตตามเวลาที่ปรากฏ

สารละลาย. เวลาเฉลี่ยในการดำเนินการตามคำสั่งซื้อให้เสร็จสมบูรณ์คำนวณโดยใช้สูตร:

ระยะเวลาเฉลี่ยจะเป็น:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 เดือน

เราจะได้คำตอบเดียวกันหากเราใช้ข้อมูลบน p i จากคอลัมน์สุดท้ายของตาราง 9.5 โดยใช้สูตร:

โปรดทราบว่าจุดกึ่งกลางของช่วงเวลาสำหรับการไล่สีครั้งสุดท้ายนั้นพบได้โดยการเสริมด้วยความกว้างของช่วงเวลาของการไล่ระดับก่อนหน้าอย่างเทียมเท่ากับ 60 - 36 = 24 เดือน

ความแปรปรวนคำนวณโดยใช้สูตร

ที่ไหน x ฉัน- ช่วงกลางของอนุกรมช่วงเวลา

ดังนั้น!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) และค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ

ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตรรายเดือนเช่น ค่าเฉลี่ยคือ!!\overline(x) ± m = 23.1 ± 13.4

เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการคัดเลือกซ้ำ เนื่องจากไม่ทราบขนาดประชากร สำหรับระดับความเชื่อมั่น 0.954:

ดังนั้นค่าเฉลี่ยคือ:

เหล่านั้น. มูลค่าที่แท้จริงของมันอยู่ในช่วงตั้งแต่ 0 ถึง 50 เดือน

ตัวอย่างที่ 4เพื่อกำหนดความเร็วของการชำระหนี้กับเจ้าหนี้ของบริษัท N = 500 บริษัท ในธนาคารพาณิชย์ จำเป็นต้องทำการศึกษาตัวอย่างโดยใช้วิธีการสุ่มแบบไม่ซ้ำกัน จงหาขนาดตัวอย่างที่ต้องการ n โดยความน่าจะเป็น P = 0.954 ค่าคลาดเคลื่อนของค่าเฉลี่ยตัวอย่างจะไม่เกิน 3 วัน หากค่าประมาณการทดลองพบว่าค่าเบี่ยงเบนมาตรฐาน s คือ 10 วัน

สารละลาย. เพื่อกำหนดจำนวนการศึกษาที่ต้องการ n เราจะใช้สูตรสำหรับการเลือกแบบไม่ซ้ำกันจากตาราง 9.4:

ในนั้นค่า t ถูกกำหนดจากระดับความเชื่อมั่นที่ P = 0.954 มีค่าเท่ากับ 2 ค่ากำลังสองเฉลี่ยคือ s = 10 ขนาดประชากรคือ N = 500 และค่าคลาดเคลื่อนสูงสุดของค่าเฉลี่ยคือ Δ x = 3 เมื่อแทนค่าเหล่านี้ลงในสูตรเราจะได้:

เหล่านั้น. ก็เพียงพอที่จะรวบรวมตัวอย่าง 41 องค์กรเพื่อประเมินพารามิเตอร์ที่ต้องการ - ความเร็วของการชำระหนี้กับเจ้าหนี้