ݺߣ

ݺߣShare a Scribd company logo
1
บทที่ 1
บทนำ
1.1 ควำมหมำยของสถิติ
สถิติ แปลมาจากภาษาอังกฤษคือ Statistics ซึ่งมาจากภาษาลาติน Status หรือ States ซึ่งแต่
เดิมเป็นค่าที่ใช้ทางด้านการปกครองบ้านเมือง(หรือ State) เกี่ยวกับการเก็บบันทึกเรื่องราว และข้อมูล
ต่างๆ ของรัฐ เช่น ประชากร การภาษีอากร เป็นต้น ต่อมาในปี ค.ศ. 1719-1772 Gottfried Achenwall
ใช้คา “Statistik” ซึ่งมาจากภาษาอิตาลี Statista หมายถึง Statesman และในปี ค.ศ. 1787
Dr. E.A.W.Zimmerman ใช้คาว่า Statistics และในปี ค.ศ. 1791-1799 John Sinclair เป็นผู้นาเอาคา
Statistics ไปใช้อย่างแพร่หลายใน Statistical Account of Scotland
สถิติ (Statistics) หมายถึง ตัวเลขต่างๆ หรือข้อเท็จจริงที่ได้จากการเก็บรวบรวมข้อมูล ซึ่งมี
เนื้อหาครอบคลุมไปในแทบทุกแขนงวิชา เพื่อช่วยในการตัดสินใจหรือพยากรณ์เรื่องที่สนใจให้ถูกต้องและ
มีประสิทธิภาพมากขึ้น เช่น สถิติการเกิดหรือการตายของประชากรในประเทศไทย จานวนอุบัติเหตุที่
เกิดขึ้นในช่วงเทศกาลปีใหม่ ปริมาณน้าฝน ผลผลิตทางการเกษตร สถิติเกี่ยวกับจานวนนักศึกษาที่สอบตก
วิชาสถิติ เป็นต้น
1.2 ควำมหมำยของคำบำงคำในวิชำสถิติ
ประชำกร (Population) หมายถึง เซตของหน่วยทุกหน่วยที่เราสนใจจะทาการศึกษา ซึ่งอาจ
เป็นคน สัตว์ สิ่งของ ต้นไม้ ฯลฯ เช่น ถ้าเราสนใจรายได้เฉลี่ยต่อครัวเรือนของคนในอาเภอหัวหิน ดังนั้น
ประชากรในที่นี้คือ ครัวเรือนของคนในอาเภอหัวหินทั้งหมด หรือ ถ้าเราสนใจอายุการใช้งานของสินค้าที่
ผลิตได้จากโรงงานแห่งหนึ่งในประเทศไทย ประชากรในที่นี้คือสินค้าทุกชิ้นที่ผลิตจากโรงงานแห่งนั้น
นั่นเอง
และขนาดของประชากรแทนด้วยสัญลักษณ์ “N”
ตัวอย่ำง (Sample) หมายถึง บางส่วนของประชากรที่ถูกสุ่มมาเป็นตัวแทนที่ดีของประชากร
หรือ เซตย่อย(Subset)ของประชากร เช่น สุ่มพนักงานมา 50 คน จากพนักงานทั้งหมด 5,000 คน ดังนั้น
N=5,000(แทนขนาดของประชากร) และ n=50 (แทนขนาดของตัวอย่าง)
2
พำรำมิเตอร์ (Parameter) หมายถึง ค่าที่คานวณได้จากประชากร เช่น ค่าเฉลี่ยของประชากร
, ค่าพาย π เป็นต้น
โดยที่ (อ่านว่า มิว) หมายถึง ค่าเฉลี่ยของประชากร
(อ่านว่า ซิกม่า) หมายถึง ส่วนเบี่ยงเบนมาตรฐานของประชากร
(อ่านว่า ซิกม่ากาลังสอง) หมายถึง ความแปรปรวนของประชากร
(อ่านว่า พี) หมายถึง สัดส่วนของประชากร
ρ (อ่านว่า โร) หมายถึง สัมประสิทธิ์สหสัมพันธ์ของประชากร
ค่ำสถิติ (Statistic) หมายถึง ค่าที่คานวณได้จากตัวอย่าง เช่น ค่าเฉลี่ยของตัวอย่าง ̅ , ค่า
ความแปรปรวน เป็นต้น
โดยที่ ̅ (อ่านว่า เอ็กบาร์) หมายถึง ค่าเฉลี่ยของตัวอย่าง
(อ่านว่า เอสเล็ก) หมายถึง ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง
(อ่านว่า เอสเล็กกาลังสอง) หมายถึง ความแปรปรวนของตัวอย่าง
̂ (อ่านว่า พีแฮท) หมายถึง สัดส่วนของตัวอย่าง
γ (อ่านว่า แกมม่า) หมายถึง สัมประสิทธิ์สหสัมพันธ์ของตัวอย่าง
ข้อมูล (Data) หมายถึง กลุ่มของตัวเลขที่เป็นตัวแทนในเรื่องหรือสิ่งที่เราสนใจ ซึ่งในบางครั้ง
ข้อมูลอาจไม่เป็นตัวเลขก็ได้ กรณีข้อมูลเป็นตัวเลข ได้แก่ ส่วนสูง น้าหนัก รายได้ เป็นต้น และในกรณี
ข้อมูลไม่ใช่ตัวเลข ได้แก่ ข้อมูลเกี่ยวกับสัญชาติ ข้อมูลเกี่ยวกับกรุ๊ปเลือด ข้อมูลเกี่ยวกับศาสนา หรือ
ข้อมูลแสดงความคิดเห็น เป็นต้น
ตัวแปร (Variable) หมายถึง ลักษณะของหน่วยในประชากรที่เราสนใจจะทาการศึกษาแล้ววัด
ค่าออกมาได้ ซึ่งอาจเป็นตัวเลขหรือตัวหนังสือก็ได้ เช่น บริษัทแห่งหนึ่งต้องการทราบว่าปัจจัยใดที่ทาให้
ลูกค้าเลือกซื้อสินค้าของบริษัท ในที่นี้ประชากรคือ ลูกค้าทุกคนที่ซื้อสินค้าของบริษัท และตัวแปรในที่นี้
คือ ปัจจัยที่ทาให้ลูกค้าเลือกซื้อสินค้าของบริษัท เป็นต้น
3
1.3 ประเภทของสถิติ
สามารถแบ่งวิชาสถิติออกเป็น 2 ประเภท คือ สถิติเชิงพรรณนา และสถิติเชิงอนุมาน ดังนี้
1.3.1 สถิติเชิงพรรณนำ หรือสถิติเชิงบรรยำย (Descriptive Statistics) หมายถึง สถิติที่มุ่ง
อธิบายถึงกระบวนการต่างๆ ที่ใช้ในการเก็บรวบรวมข้อมูล การนาเสนอข้อมูล ระเบียบวิธีที่ใช้ และคิด
คานวณค่าต่างๆเหล่านั้น เพื่อที่จะสรุปและตีความให้ถูกต้องตามความเป็นจริง และนาความรู้เหล่านั้นมา
ช่วยในการตัดสินใจ หรือในการดาเนินการต่างๆ ยกตัวอย่าง เช่น เมื่อเราเก็บข้อมูลโดยการสุ่มตัวอย่าง
สินค้าเพื่อชั่งน้าหนักจานวน 50 ชิ้น จากนั้นนาข้อมูลน้าหนักของสินค้าทั้ง 50 ชิ้นมาแจกแจงความถี่ หรือ
นาข้อมูลชุดนั้นมาหาค่าน้าหนักเฉลี่ย ซึ่งการแจกแจงความถี่หรือการหาค่าน้าหนักเฉลี่ยล้วนจัดเป็นสถิติ
เชิงพรรณนาทั้งสิ้น
1.3.2 สถิติเชิงอนุมำน (Inference Statistics) หมายถึง สถิติที่มุ่งอธิบายลักษณะโดยรวมของ
ประชากรโดยอาศัยข้อมูลที่ได้จากตัวอย่าง และต้องนาทฤษฎีความน่าจะเป็น (Probability theory) มา
ช่วยในการตัดสินใจเพื่อให้ได้ผลสรุปที่ดีขึ้น ได้แก่ การประมาณค่า และการทดสอบสมมติฐาน เป็นต้น
1.4 ประเภทของข้อมูล
1.4.1 แบ่งตำมลักษณะของข้อมูล
แบ่งออกเป็น 2 ประเภท คือ ข้อมูลเชิงคุณภาพ และข้อมูลเชิงปริมาณ
1. ข้อมูลเชิงคุณภำพ (Qualitative Data) คือ ข้อมูลที่ไม่สามารถระบุค่าได้ว่ามากหรือน้อย
มักเป็นข้อความหรือตัวหนังสือ เช่น เพศของนักศึกษา (ชาย/หญิง), ศาสนา (พุทธ/คริสต์/อิสลาม เป็น
ต้น), อาชีพ (ข้าราชการ/พ่อค้าแม่ค้า/รับจ้าง เป็นต้น), สีของรถยนต์ เป็นต้น
2. ข้อมูลเชิงปริมำณ (Quantitative Data) คือ ข้อมูลที่วัดค่าออกมาได้ว่ามากหรือน้อย ซึ่ง
สามารถแสดงเป็นตัวเลขได้ เช่น รายได้ อายุ ส่วนสูง น้าหนัก ยอดขายของสินค้า จานวนผู้ประสบภัย
จานวนผู้ร้องเรียน เป็นต้น
1.4.2 แบ่งตำมแหล่งที่มำของข้อมูล
แบ่งออกเป็น 2 ประเภท คือ ข้อมูลปฐมภูมิ และข้อมูลทุติยภูมิ
4
1. ข้อมูลปฐมภูมิ (Primary Data) คือ ข้อมูลที่เก็บรวบรวมจากแหล่งกาเนิดหรือผู้ใช้เก็บรวม
รวมเอง ซึ่งอาจได้โดยการสัมภาษณ์ทางโทรศัพท์ การให้สัมภาษณ์ การทดลอง การตอบแบบสอบถาม
การสารวจทางไปรษณีย์ หรือการสังเกต ข้อดีของข้อมูลปฐมภูมิคือข้อมูลมีรายละเอียดตรงตามความ
ต้องการของผู้ใช้ และสามารถทราบคุณภาพของข้อมูลได้ดีกว่า แต่ข้อเสียคือเสียเวลา และมีค่าใช้จ่ายสูง
ในการเก็บรวบรวมข้อมูล
2. ข้อมูลทุติยภูมิ (Secondary Data) คือ ข้อมูลที่มีการเก็บรวบรวมจากแหล่งกาเนิดไว้แล้ว
หรือผู้ใช้ข้อมูลไม่ได้เก็บรวบรวมข้อมูลเองโดยตรง แต่มีผู้อื่นหรือหน่วยงานอื่นทาการเก็บรวบรวมข้อมูลไว้
แล้ว เป็นข้อมูลที่ได้มีการวิเคราะห์เบื้องต้นมาแล้ว เช่น แหล่งข้อมูลจากหนังสือ วารสาร เอกสารสิ่งพิมพ์
อินเตอร์เน็ต ข้อมูลการเกิดการตายที่ได้จากสานักงานสถิติแห่งชาติ จานวนผู้ประสบอุบัติเหตุ จานวน
ผู้ป่วยตามโรงพยาบาล เป็นต้น ข้อดีของข้อมูลทุติยภูมิคือประหยัดเวลาและค่าใช้จ่ายในการเก็บรวบรวม
ข้อมูล เสียเสียคือการนาข้อมูลทุติยภูมิมาใช้บางครั้งอาจไม่ตรงกับความต้องการหรือวัตถุประสงค์ของผู้ใช้
หรืออาจไม่มีรายละเอียดเพียงพอ นอกจากนี้ผู้ใช้มักไม่ทราบถึงข้อบกพร่องของข้อมูล ซึ่งอาจส่งผลให้การ
สรุปผลอาจผิดพลาดได้
1.4.3 แบ่งตำมระดับกำรวัด
ข้อมูลแบ่งตามระดับการวัด (Level of Measurement) หรือ แบ่งตามมาตราวัด
(Measurement scales) แบ่งได้เป็น 4 ระดับ(มาตรา) เรียงจากต่าไปสูง ดังนี้ 1) มาตรานามบัญญัติ
2) มาตราอันดับ 3) มาตราอันตรภาคหรือช่วง 4) มาตราอัตราส่วน
1. มำตรำนำมบัญญัติ (Nominal scale) เป็นมาตราวัดของตัวแปรเชิงคุณภาพที่เป็นเพียงการ
แบ่งกลุ่มของตัวแปร เพื่อให้เห็นความแตกต่างกัน แต่ไม่สามารถบอกปริมาณว่ามากหรือน้อยเพียงใด เช่น
เพศ(1. ชาย, 2. หญิง), ศาสนา(1 พุทธ, 2. คริสต์, 3. อิสลาม), อาชีพ, สี เป็นต้น
2. มำตรำอันดับ (Ordinal scale) เป็นมาตราวัดที่สูงกว่ามาตรานามบัญญัติที่มีการกาหนดค่า
ของข้อมูลในลักษณะการเรียงลาดับ หรือจัดลาดับความสาคัญของข้อมูลได้ เช่น ตาแหน่งงาน, ระดับ
การศึกษา, ยศของทหารหรือตารวจ เป็นต้น
3. มำตรำอันตรภำคหรือช่วง (Interval scale) เป็นมาตราวัดที่มีการกาหนดค่าของข้อมูลเป็น
ตัวเลขมักอยู่ในรูปของสเกล โดยแต่ละช่วงจะมีค่าเท่าๆกัน แต่ในมาตรานี้จะมีไม่มีศูนย์แท้ เช่น
5
4. มำตรำอัตรำส่วน (Ratio scale) เป็นมาตราวัดของตัวแปรเชิงปริมาณที่มีการกาหนดค่า
ข้อมูลเป็นตัวเลข โดยตัวเลขแต่ละค่าแสดงให้ทราบถึงความแตกต่างกัน และบอกได้ว่ามีปริมาณมากหรือ
น้อยเป็นกี่เท่าของอีกค่าหนึ่ง เช่น รายได้ น้าหนัก ส่วนสูง ระยะทาง เวลา เป็นต้น
1.5 กำรเก็บรวบรวมข้อมูล
การเก็บรวบรวมข้อมูลแบ่งออกเป็น 4 แบบ คือ
1. กำรเก็บรวบรวมข้อมูลจำกกำรสำรวจ เป็นวิธีการเก็บรวบรวมข้อมูลจากผู้ให้ข้อมูลโดยตรง
ซึ่งอาจทาได้โดยการสัมภาษณ์ การตอบแบบสอบถาม การสังเกต ข้อมูลที่เก็บรวบรวมได้โดยวิธีนี้ เรียกว่า
ข้อมูลปฐมภูมิ (Primary data) การเก็บรวบรวมข้อมูลด้วยวิธีนี้ อาจทาได้ 2 ลักษณะ คือ
1.1 กำรสำมะโน (Census) หมายถึง การเก็บรวบรวมข้อมูลจากทุกหน่วยของ
ประชากรที่เราสนใจ เช่น การทาสามะโนประชากรประเทศไทยโดยสานักงานสถิติแห่งชาติ สามะโนทาง
การเกษตร เป็นต้น และข้อเสียของการทาสามะโนคือ ใช้กาลังคนมาก เสียเวลา และค่าใช้จ่ายสูงมาก ทา
ให้ข้อมูลที่ได้ขาดความน่าเชื่อถือหรือไม่ทันปัจจุบัน ส่วนข้อดีของการทาสามะโนคือ ข้อมูลที่เก็บรวบรวม
ได้ครอบคลุมทุกเรื่องที่เราสนใจ หรือเป็นข้อมูลหลักซึ่งจะนาไปใช้ในการวางแผนเก็บข้อมูลอื่นๆ ได้อีก
1.2 กำรสำรวจด้วยตัวอย่ำง (Sample survey) หมายถึง การเก็บรวบรวมข้อมูลจาก
หน่วยตัวอย่างที่เลือกมาเป็นตัวแทนของประชากรที่เราสนใจ เป็นวิธีที่นิยมใช้กันมากที่สุดในปัจจุบัน ไม่ว่า
จะเป็นงานวิจัยทางด้านธุรกิจ ทางการศึกษา ทางการแพทย์ เป็นต้น เหตุผลที่เราต้องสารวจด้วยตัวอย่าง
คือ ประหยัดเวลาและค่าใช้จ่ายในการเก็บรวบรวมข้อมูล ประมวลผลข้อมูล วิเคราะห์ข้อมูล ความถูกต้อง
ของข้อมูลมีสูงมาก ซึ่งเราอาจจะมีการสร้างกรอบตัวอย่างในกรณีที่สามารถสร้างกรอบตัวอย่างได้ โดยที่
กาหนดรายละเอียดต่างๆของสมาชิกในกลุ่ม เช่น ชื่อ ที่อยู่ เบอร์โทรศัพท์ อีเมลล์ เป็นต้น มีการกาหนด
แผนการสุ่มตัวอย่าง และขนาดของตัวอย่างที่เหมาะสม เพื่อให้ได้ค่าที่คานวณจากตัวอย่าง(สถิติ) เป็นค่าที่
เหมาะสมในการสรุปลักษณะของประชากร
2. กำรเก็บรวบรวมข้อมูลจำกข้อมูลทุติยภูมิ เมื่อข้อมูลที่สนใจศึกษาได้ถูกเก็บรวบรวมไว้แล้ว
หรือปรากฏอยู่แล้วในสื่อที่ตีพิมพ์เผยแพร่ เช่น ปรากฏอยู่ในหนังสือ งานวิจัย วารสาร หนังสือพิมพ์
อินเตอร์เน็ต เป็นต้น นักวิจัยสามารถนาข้อมูลเหล่านั้นมาใช้ได้เลย เช่น ข้อมูลอัตราการว่างงาน อัตราการ
เกิด อัตราเงินเฟ้อในประเทศ ดัชนีราคาหุ้นในตลาดหลักทรัพย์ เป็นต้น
6
3. กำรเก็บรวบรวมข้อมูลจำกกำรทดลอง เป็นการเก็บรวบรวมข้อมูลที่ได้จากการทดลองหรือ
ห้องปฏิบัติการ เพื่อให้ได้ข้อมูลที่ต้องการ เช่น การเก็บรวบรวมข้อมูลทางด้านการแพทย์ การศึกษา ทาง
การตลาด การเกษตร เช่น การทดลองการใช้เครื่องสาอางหรือครีมบารุงผิวกับผู้บริโภค การทดลองการ
เพาะเนื้อเยื่อของสัตว์ การทดลองปลูกพืชในโรงเพาะชา เป็นต้น ทั้งนี้ข้อมูลที่ได้จากการทดลองจะมีขนาด
ตัวอย่างที่เหมาะสม แบบแผนการทดลองที่เหมาะสมและควบคุมได้ เช่น การทดลองปลูกพืชชนิดเดียวกัน
ในโรงเพาะชา เราสามารถควบคุมอุณหภูมิให้เหมาะสมกับพืชชนิดนั้นๆได้
4. กำรเก็บรวบรวมข้อมูลจำกกำรสังเกต เป็นการเก็บรวบรวมข้อมูลโดยใช้การสังเกตของผู้วิจัย
เองหรือจัดส่งเจ้าหน้าที่ไปทาการสังเกต หรือเฝ้าดูพฤติกรรมของหน่วยตัวอย่าง และจดบันทึกข้อมูลที่ได้
จากการสังเกตเหล่านั้น เช่น สังเกตพฤติกรรมการเรียนของนักศึกษา การสังเกตพฤติกรรมการบริโภค
อาหารของนักเรียน หรือการติดตั้งโทรทัศน์วงจรปิดไว้ดูพฤติกรรมการเลือกซื้อสินค้าของลูกค้า เป็นต้น
การเก็บรวบรวมข้อมูลจากการสังเกต เพื่อให้ข้อมูลเป็นที่น่าเชื่อถือเราต้องกาหนดวัตถุประสงค์ให้แน่นอน
ก่อนว่า จะเก็บข้อมูลอะไร มีการอบรมผู้สังเกตการณ์ให้มีความชานาญในเรื่องที่สังเกต เพื่อไม่ให้เกิดความ
เอนเอียงของผู้สังเกตการณ์ นอกจากนี้ ผู้ที่ได้รับมอบหมายให้เป็นผู้สังเกตการณ์จะต้องเป็นผู้มีไหวพริบ
ช่างสังเกต และมีความละเอียดรอบคอบในการสรุปผลการสังเกตด้วย
1.6 กำรสุ่มตัวอย่ำงและเทคนิคกำรสุ่มตัวอย่ำง
กำรสุ่มตัวอย่ำง (Sampling) หมายถึง การสุ่มเพียงบางส่วนของประชากรมาเป็นตัวอย่าง
เทคนิคกำรสุ่มตัวอย่ำง (Sampling Technique)
ในการสุ่มตัวอย่างมีเทคนิค 2 ประการ คือ
1. กำรสุ่มตัวอย่ำงแบบทรำบควำมน่ำจะเป็น (Probability Sampling) หมายถึง การสุ่ม
ตัวอย่างจากประชากรโดยอาศัยทฤษฎีความน่าจะเป็น โดยทราบความน่าจะเป็นที่แต่ละหน่วยของ
ประชากรจะถูกสุ่มมาเป็นตัวอย่าง
2. กำรสุ่มตัวอย่ำงแบบไม่ทรำบควำมน่ำจะเป็น (Non-probability Sampling) หมายถึง
การสุ่มตัวอย่างจากประชากร โดยไม่ทราบความน่าจะเป็นที่แต่ละหน่วยของประชากรจะถูกสุ่มมาเป็น
ตัวอย่าง
7
1.6.1 กำรสุ่มตัวอย่ำงแบบทรำบควำมน่ำจะเป็น เป็นการสุ่มตัวอย่างจากประชากรที่มีจากัด
และมีกรอบการสุ่มตัวอย่าง (Sampling frame) โดยในที่นี้จะศึกษาวิธีการสุ่มตัวอย่างแบบทราบความ
น่าจะเป็น จานวน 4 วิธี คือ
1. การสุ่มตัวอย่างแบบง่าย (Simple Random Sampling)
2. การสุ่มตัวอย่างแบบมีระบบ (Systematic Random Sampling)
3. การสุ่มตัวอย่างแบบแบ่งชั้นภูมิ (Stratified Random Sampling)
4. การสุ่มตัวอย่างแบบกลุ่ม (Cluster Sampling)
1.6.1.1 กำรสุ่มตัวอย่ำงแบบง่ำย (Simple Random Sampling หรือ SRS) เป็นการสุ่ม
ตัวอย่างที่ทุกๆหน่วยในประชากรมีโอกาสที่จะถูกเลือกเป็นตัวอย่างเท่าๆกัน ซึ่งวิธีการเลือกตัวอย่างแบบ
ง่ายนี้ ทาได้ 2 วิธี คือ
ก. ใช้วิธีกำรจัดฉลำก มักจะใช้กรณีที่ประชากรมีไม่มาก การจับฉลากทาได้ 2 วิธี คือ เลือก
โดยไม่มีการแทนที่ (Sampling without replacement) และเลือกโดยมีการแทนที่ (Sampling with
replacement) ซึ่งในทางปฏิบัตินิยมใช้แบบแทนที่มากกว่า
ข. ใช้ตำรำงเลขสุ่ม (Random number tables) ซึ่งเป็นที่นิยมกันอย่างแพร่หลายในทาง
ปฏิบัติ เพราะใช้ง่ายและสะดวกรวดเร็ว
วิธีกำรใช้ตำรำงเลขสุ่ม
การใช้ตารางเลขสุ่ม ขั้นแรกต้องใส่หมายเลขกากับให้กับหน่วยประชากรทั้งหมด ขั้นต่อมา
จึงใช้ตารางเลขสุ่มช่วยในการเลือกหน่วยตัวอย่าง โดยการเปิดตารางเลขสุ่มหน้าใดก็ได้แบบสุ่ม แล้วนา
วัตถุปลายแหลม เช่น ปากกา หรือดินสอ จิ้มลงบนตารางเลขสุ่มที่เป็นตัวเลขแบบสุ่มๆ(โดยไม่มองว่าจะได้
แถวไหน) หลังจากจิ้มแล้วให้ดูว่าได้แถวไหนหรือคอลัมน์ไหนเป็นตัวเริ่มต้น แล้วเริ่มอ่านตัวเลขนั้นจากซ้าย
ไปขวา หรือจากบนลงล่างก็ได้ จนจบแถวนั้นๆ แล้วให้เริ่มอ่านแถวต่อไปจนครบจานวนตัวอย่างที่ต้องการ
ส่วนมากแล้วจะอ่านจากซ้ายไปขวา ตัวอย่างตารางเลขสุ่มบางส่วนเป็นดังนี้
8
Column
Line 1 2 3 4 5 6 7 8 9 10
1 41101 17336 48951 53674 17880 45260 8575 49321 36191 17095
2 32123 91576 84221 78902 82010 30847 62329 63898 23268 74283
3 26091 68409 69704 82267 14751 13151 93115 01437 56945 89661
4 67680 79790 48462 59278 44185 29616 76531 19589 83139 28454
5 15184 19260 17073 17026 25264 08388 27182 22557 61501 67481
6 58010 45039 57181 10238 36874 28546 37444 80824 63981 39942
7 56425 53996 86245 32623 78858 08143 60377 42925 42815 11159
ตัวอย่างเช่น ถ้าต้องการสุ่มพนักงานจานวน 30 คน จากพนักงานทั้งหมด 400 คน เพื่อศึกษาความคิดเห็น
ต่อการเข้ารับบริการประกันสังคมของบริษัทแห่งหนึ่งในประเทศไทย โดยใช้วิธีการสุ่มอย่างง่ายจากตาราง
เลขสุ่ม มีวิธีดังนี้คือ กาหนดหมายเลข 001-400 ให้กับพนักงานแต่ละคน แล้วสุ่มตัวเลขจากตารางเลขสุ่ม
สมมติว่า สุ่มได้ตัวเลข 32123 91576 84221 เป็นตัวเริ่มต้น ดังนั้น ให้ใช้เลขไม่เกิน 3 หลัก และมีค่าไม่
เกิน 400 มาเป็นตัวอย่าง เช่น 321, 239, 157, 684(เกิน 400 ไม่ใช้), 221 ทาต่อไปเรื่อยๆ จนครบ 30
หน่วยตามที่เราต้องการ ดังนั้น เราจะได้พนักงานหมายเลข 321, 239, 157, 221 เป็นต้น
วิธีการสุ่มแบบอย่างง่ายมีข้อดี คือ เป็นวิธีการที่ง่ายไม่ซับซ้อนและเข้าใจง่ายกว่าวิธีอื่นๆ
และควรใช้กับประชากรที่มีลักษณะคล้ายคลึงกันมากที่สุด ข้อเสีย คือ หน่วยตัวอย่างที่สุ่มได้กระจัด
กระจายกันมาก ทาให้ยากต่อการเก็บรวบรวมข้อมูล และเสียค่าใช้จ่ายมากในการเก็บรวบรวมข้อมูล
1.6.1.2 กำรสุ่มตัวอย่ำงแบบมีระบบ (Systematic Random Sampling) หมายถึง การ
สุ่มตัวอย่างจากประชากรที่มีการกาหนดหมายเลขลงบนสมาชิกทุกหน่วยในประชากรอย่างสุ่ม และหน่วย
ตัวอย่างที่สุ่มได้เป็นตัวอย่างสุ่มที่มีระยะห่างเท่ากัน ( ) เมื่อ N เป็นจานวนประชากร และ n
เป็นจานวนตัวอย่าง
ตัวอย่างเช่น ต้องการสารวจรายได้ต่อครัวเรือนในชุมชนแห่งหนึ่งในประเทศไทย ที่มีทั้งหมด
60 ครัวเรือน โดยมีแผนที่ของครัวเรือนดังกล่าว และต้องการเลือกตัวอย่างมา 10 ครัวเรือน
( ) วิธีการเลือกตัวอย่างโดยการสุ่มแบบมีระบบนี้ เขียนเลขกากับให้แต่ละครัวเรือนทั้ง
60 ครัวเรือน ซึ่งจะได้ครัวเรือนที่ 1, 2, 3, … , 60 ดังนั้นก็เลือกจุดเริ่มต้นแบบสุ่มๆ สมมติได้เลข 5
หมายความว่า ครัวเรือนแรกที่ถูกเลือกมาเป็นตัวอย่างคือ ครัวเรือนที่ 5 ต่อไปก็คือครัวเรือนที่ (5+6) =
11 และครัวเรือนต่อไปคือครัวเรือนที่ (11+6) = 17, 23, 29, 35, 41, 47, 53, 59 ครบ 10 ครัวเรือนที่
ต้องการเป็นตัวอย่างแล้วก็หยุดทา
9
1.6.1.3 กำรสุ่มตัวอย่ำงแบบแบ่งชั้นภูมิ (Stratified Random Sampling) หมายถึง การ
สุ่มตัวอย่างจากประชากรที่มีความแตกต่างกันในลักษณะที่ต้องการศึกษา ดังนั้นเราต้องจาแนกประชากร
ออกเป็นกลุ่มย่อยโดยให้หน่วยต่างๆ ที่เหมือนกันอยู่ในกลุ่มเดียวกัน ซึ่งเราเรียกว่า “ชั้นภูมิ” จากนั้นจึงทา
การสุ่มตัวอย่างมาจากแต่ละชั้นภูมิ โดยอาศัยวิธีการสุ่มแบบอย่างง่าย เช่น การสารวจค่าใช้จ่ายของ
นักศึกษามหาวิทยาลัยแห่งหนึ่ง เราจาแนกนักศึกษาออกเป็นกลุ่มต่างๆ แยกตามคณะ หลังจากนั้นจึงทา
การสุ่มตัวอย่างนักศึกษามาจากแต่ละคณะ โดยวิธี SRS
ภาพแสดงการสุ่มแบบแบ่งชั้นภูมิ
ข้อดีของการสุ่มแบบแบ่งชั้นภูมิ คือ มีประสิทธิภาพสูงกว่าวิธีสุ่มแบบ SRS และได้
รายละเอียดแยกออกเป็นรายชั้นภูมิ ทาให้สามารถที่จะศึกษาเปรียบเทียบระหว่างกลุ่มได้ และประหยัด
ค่าใช้จ่าย สาหรับข้อเสีย คือ ต้องจัดเตรียมรายละเอียดของงานไว้ล่วงหน้าเพื่อจัดแบ่งเป็นชั้นภูมิ
1.6.1.4 กำรสุ่มตัวอย่ำงแบบกลุ่ม (Cluster Sampling) หมายถึง การสุ่มตัวอย่างโดยแบ่ง
ประชากรออกเป็นกลุ่มย่อยๆ เรียกว่า cluster ก่อน แล้วจึงทาการสุ่มกลุ่มของหน่วยตัวอย่าง (Cluster)
โดยใช้วิธีการสุ่มแบบอย่างง่าย หรือแบบมีระบบ จากนั้นจึงรวบรวมข้อมูลมาจากหน่วยย่อยทุกหน่วยของ
กลุ่มที่สุ่มได้ โดยให้หน่วยประชากรในกลุ่มเดียวกันมีลักษณะแตกต่างกัน ส่วนหน่วยประชากรต่างกลุ่มกัน
ให้มีลักษณะคล้ายคลึงกัน เช่น ต้องการสารวจค่าใช้จ่ายในแต่ละวันของพนักงาน 20 คน จากแผนกต่างๆ
ทั้ง 5 แผนก แต่ละแผนกมีพนักงาน 10 คน วิธีการก็คือต้องเตรียมรายชื่อแผนกต่างๆ ทั้ง 5 แผนกก่อน
แล้วสุ่มมาเพียง 2 แผนก จาก 5 แผนก แล้วเก็บข้อมูลจากพนักงาน 2 แผนกที่สุ่มได้เท่านั้น ก็จะได้ข้อมูล
จากพนักงาน 20 คน ตามที่ต้องการ ดังภาพ
10
ภาพแสดงการสุ่มแบบกลุ่ม
ข้อดีของการสุ่มตัวอย่างแบบกลุ่ม คือ เนื่องจากกรอบตัวอย่างที่สร้างขึ้นไม่กระจัดกระจาย
กันมากนัก จึงมีค่าใช้จ่ายในการเก็บรวบรวมข้อมูลน้อย และประหยัดเวลาในการเก็บรวบรวมข้อมูล
1.6.2 กำรสุ่มตัวอย่ำงแบบไม่ทรำบควำมน่ำจะเป็น เป็นการสุ่มตัวอย่างจากประชากรที่มี
จานวนไม่จากัด หรือไม่มีกรอบการสุ่มตัวอย่าง เหมาะสาหรับงานวิจัยที่มีวัตถุประสงค์ในการศึกษาและ
อธิบายเฉพาะกลุ่มตัวอย่างเท่านั้น โดยไม่ต้องการสรุปอ้างอิงไปยังประชากร แบ่งออกเป็น 3 วิธี คือ
1. การสุ่มตัวอย่างตามความสะดวก (Convenience Sampling)
2. การสุ่มตัวอย่างตามความประสงค์ (Judgement Sampling)
3. การสุ่มตัวอย่างแบบโควต้า (Quota Sampling)
1.6.2.1 กำรสุ่มตัวอย่ำงตำมควำมสะดวก หมายถึง การสุ่มตัวอย่างโดยอาศัยความสะดวก
ของผู้สุ่มเอง หรือการสุ่มตัวอย่างที่หน่วยตัวอย่างถูกสุ่มโดยบังเอิญ และไม่ทราบโอกาสที่หน่วยตัวอย่างแต่
ละหน่วยจะถูกสุ่ม
1.6.2.2 กำรสุ่มตัวอย่ำงตำมควำมประสงค์ หมายถึง การสุ่มตัวอย่างโดยที่หน่วยตัวอย่างที่
ผู้สุ่มได้เลือกขึ้นมาเป็นตัวอย่าง อาจมาจากเหตุผลส่วนตัว หรืออาศัยประสบการณ์ของผู้สุ่มเป็นหลักใน
การตัดสินใจ ในการสุ่มตัวอย่างด้วยวิธีนี้ผู้วิจัยควรจะกาหนดวัตถุประสงค์ให้ชัดเจน เช่น ผู้จัดการฝ่าย
การตลาดได้ตัดสินใจเลือกร้านค้าในเขตสีลม 5 ร้าน เพื่อวางขายสินค้าใหม่ โดยผู้จัดการฝ่ายการตลาด
อาจใช้ประสบการณ์ หรือความชานาญในการตัดสินใจเลือกร้านค้าทั้ง 5 ร้าน
11
1.6.2.3 กำรสุ่มตัวอย่ำงแบบโควต้ำ หมายถึง การสุ่มตัวอย่างโดยไม่สนใจว่าตัวอย่างที่
เลือกมานั้นจะเลือกมาด้วยวิธีใด เพียงแต่ให้มีจานวนหน่วยครบตามที่กาหนดไว้ในแต่ละโควต้าเท่านั้น มัก
นามาใช้กับการสารวจทัศนคติความคิดเห็นในเรื่องต่างๆ ที่เราสนใจ

More Related Content

บทที่ 1

  • 1. 1 บทที่ 1 บทนำ 1.1 ควำมหมำยของสถิติ สถิติ แปลมาจากภาษาอังกฤษคือ Statistics ซึ่งมาจากภาษาลาติน Status หรือ States ซึ่งแต่ เดิมเป็นค่าที่ใช้ทางด้านการปกครองบ้านเมือง(หรือ State) เกี่ยวกับการเก็บบันทึกเรื่องราว และข้อมูล ต่างๆ ของรัฐ เช่น ประชากร การภาษีอากร เป็นต้น ต่อมาในปี ค.ศ. 1719-1772 Gottfried Achenwall ใช้คา “Statistik” ซึ่งมาจากภาษาอิตาลี Statista หมายถึง Statesman และในปี ค.ศ. 1787 Dr. E.A.W.Zimmerman ใช้คาว่า Statistics และในปี ค.ศ. 1791-1799 John Sinclair เป็นผู้นาเอาคา Statistics ไปใช้อย่างแพร่หลายใน Statistical Account of Scotland สถิติ (Statistics) หมายถึง ตัวเลขต่างๆ หรือข้อเท็จจริงที่ได้จากการเก็บรวบรวมข้อมูล ซึ่งมี เนื้อหาครอบคลุมไปในแทบทุกแขนงวิชา เพื่อช่วยในการตัดสินใจหรือพยากรณ์เรื่องที่สนใจให้ถูกต้องและ มีประสิทธิภาพมากขึ้น เช่น สถิติการเกิดหรือการตายของประชากรในประเทศไทย จานวนอุบัติเหตุที่ เกิดขึ้นในช่วงเทศกาลปีใหม่ ปริมาณน้าฝน ผลผลิตทางการเกษตร สถิติเกี่ยวกับจานวนนักศึกษาที่สอบตก วิชาสถิติ เป็นต้น 1.2 ควำมหมำยของคำบำงคำในวิชำสถิติ ประชำกร (Population) หมายถึง เซตของหน่วยทุกหน่วยที่เราสนใจจะทาการศึกษา ซึ่งอาจ เป็นคน สัตว์ สิ่งของ ต้นไม้ ฯลฯ เช่น ถ้าเราสนใจรายได้เฉลี่ยต่อครัวเรือนของคนในอาเภอหัวหิน ดังนั้น ประชากรในที่นี้คือ ครัวเรือนของคนในอาเภอหัวหินทั้งหมด หรือ ถ้าเราสนใจอายุการใช้งานของสินค้าที่ ผลิตได้จากโรงงานแห่งหนึ่งในประเทศไทย ประชากรในที่นี้คือสินค้าทุกชิ้นที่ผลิตจากโรงงานแห่งนั้น นั่นเอง และขนาดของประชากรแทนด้วยสัญลักษณ์ “N” ตัวอย่ำง (Sample) หมายถึง บางส่วนของประชากรที่ถูกสุ่มมาเป็นตัวแทนที่ดีของประชากร หรือ เซตย่อย(Subset)ของประชากร เช่น สุ่มพนักงานมา 50 คน จากพนักงานทั้งหมด 5,000 คน ดังนั้น N=5,000(แทนขนาดของประชากร) และ n=50 (แทนขนาดของตัวอย่าง)
  • 2. 2 พำรำมิเตอร์ (Parameter) หมายถึง ค่าที่คานวณได้จากประชากร เช่น ค่าเฉลี่ยของประชากร , ค่าพาย π เป็นต้น โดยที่ (อ่านว่า มิว) หมายถึง ค่าเฉลี่ยของประชากร (อ่านว่า ซิกม่า) หมายถึง ส่วนเบี่ยงเบนมาตรฐานของประชากร (อ่านว่า ซิกม่ากาลังสอง) หมายถึง ความแปรปรวนของประชากร (อ่านว่า พี) หมายถึง สัดส่วนของประชากร ρ (อ่านว่า โร) หมายถึง สัมประสิทธิ์สหสัมพันธ์ของประชากร ค่ำสถิติ (Statistic) หมายถึง ค่าที่คานวณได้จากตัวอย่าง เช่น ค่าเฉลี่ยของตัวอย่าง ̅ , ค่า ความแปรปรวน เป็นต้น โดยที่ ̅ (อ่านว่า เอ็กบาร์) หมายถึง ค่าเฉลี่ยของตัวอย่าง (อ่านว่า เอสเล็ก) หมายถึง ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง (อ่านว่า เอสเล็กกาลังสอง) หมายถึง ความแปรปรวนของตัวอย่าง ̂ (อ่านว่า พีแฮท) หมายถึง สัดส่วนของตัวอย่าง γ (อ่านว่า แกมม่า) หมายถึง สัมประสิทธิ์สหสัมพันธ์ของตัวอย่าง ข้อมูล (Data) หมายถึง กลุ่มของตัวเลขที่เป็นตัวแทนในเรื่องหรือสิ่งที่เราสนใจ ซึ่งในบางครั้ง ข้อมูลอาจไม่เป็นตัวเลขก็ได้ กรณีข้อมูลเป็นตัวเลข ได้แก่ ส่วนสูง น้าหนัก รายได้ เป็นต้น และในกรณี ข้อมูลไม่ใช่ตัวเลข ได้แก่ ข้อมูลเกี่ยวกับสัญชาติ ข้อมูลเกี่ยวกับกรุ๊ปเลือด ข้อมูลเกี่ยวกับศาสนา หรือ ข้อมูลแสดงความคิดเห็น เป็นต้น ตัวแปร (Variable) หมายถึง ลักษณะของหน่วยในประชากรที่เราสนใจจะทาการศึกษาแล้ววัด ค่าออกมาได้ ซึ่งอาจเป็นตัวเลขหรือตัวหนังสือก็ได้ เช่น บริษัทแห่งหนึ่งต้องการทราบว่าปัจจัยใดที่ทาให้ ลูกค้าเลือกซื้อสินค้าของบริษัท ในที่นี้ประชากรคือ ลูกค้าทุกคนที่ซื้อสินค้าของบริษัท และตัวแปรในที่นี้ คือ ปัจจัยที่ทาให้ลูกค้าเลือกซื้อสินค้าของบริษัท เป็นต้น
  • 3. 3 1.3 ประเภทของสถิติ สามารถแบ่งวิชาสถิติออกเป็น 2 ประเภท คือ สถิติเชิงพรรณนา และสถิติเชิงอนุมาน ดังนี้ 1.3.1 สถิติเชิงพรรณนำ หรือสถิติเชิงบรรยำย (Descriptive Statistics) หมายถึง สถิติที่มุ่ง อธิบายถึงกระบวนการต่างๆ ที่ใช้ในการเก็บรวบรวมข้อมูล การนาเสนอข้อมูล ระเบียบวิธีที่ใช้ และคิด คานวณค่าต่างๆเหล่านั้น เพื่อที่จะสรุปและตีความให้ถูกต้องตามความเป็นจริง และนาความรู้เหล่านั้นมา ช่วยในการตัดสินใจ หรือในการดาเนินการต่างๆ ยกตัวอย่าง เช่น เมื่อเราเก็บข้อมูลโดยการสุ่มตัวอย่าง สินค้าเพื่อชั่งน้าหนักจานวน 50 ชิ้น จากนั้นนาข้อมูลน้าหนักของสินค้าทั้ง 50 ชิ้นมาแจกแจงความถี่ หรือ นาข้อมูลชุดนั้นมาหาค่าน้าหนักเฉลี่ย ซึ่งการแจกแจงความถี่หรือการหาค่าน้าหนักเฉลี่ยล้วนจัดเป็นสถิติ เชิงพรรณนาทั้งสิ้น 1.3.2 สถิติเชิงอนุมำน (Inference Statistics) หมายถึง สถิติที่มุ่งอธิบายลักษณะโดยรวมของ ประชากรโดยอาศัยข้อมูลที่ได้จากตัวอย่าง และต้องนาทฤษฎีความน่าจะเป็น (Probability theory) มา ช่วยในการตัดสินใจเพื่อให้ได้ผลสรุปที่ดีขึ้น ได้แก่ การประมาณค่า และการทดสอบสมมติฐาน เป็นต้น 1.4 ประเภทของข้อมูล 1.4.1 แบ่งตำมลักษณะของข้อมูล แบ่งออกเป็น 2 ประเภท คือ ข้อมูลเชิงคุณภาพ และข้อมูลเชิงปริมาณ 1. ข้อมูลเชิงคุณภำพ (Qualitative Data) คือ ข้อมูลที่ไม่สามารถระบุค่าได้ว่ามากหรือน้อย มักเป็นข้อความหรือตัวหนังสือ เช่น เพศของนักศึกษา (ชาย/หญิง), ศาสนา (พุทธ/คริสต์/อิสลาม เป็น ต้น), อาชีพ (ข้าราชการ/พ่อค้าแม่ค้า/รับจ้าง เป็นต้น), สีของรถยนต์ เป็นต้น 2. ข้อมูลเชิงปริมำณ (Quantitative Data) คือ ข้อมูลที่วัดค่าออกมาได้ว่ามากหรือน้อย ซึ่ง สามารถแสดงเป็นตัวเลขได้ เช่น รายได้ อายุ ส่วนสูง น้าหนัก ยอดขายของสินค้า จานวนผู้ประสบภัย จานวนผู้ร้องเรียน เป็นต้น 1.4.2 แบ่งตำมแหล่งที่มำของข้อมูล แบ่งออกเป็น 2 ประเภท คือ ข้อมูลปฐมภูมิ และข้อมูลทุติยภูมิ
  • 4. 4 1. ข้อมูลปฐมภูมิ (Primary Data) คือ ข้อมูลที่เก็บรวบรวมจากแหล่งกาเนิดหรือผู้ใช้เก็บรวม รวมเอง ซึ่งอาจได้โดยการสัมภาษณ์ทางโทรศัพท์ การให้สัมภาษณ์ การทดลอง การตอบแบบสอบถาม การสารวจทางไปรษณีย์ หรือการสังเกต ข้อดีของข้อมูลปฐมภูมิคือข้อมูลมีรายละเอียดตรงตามความ ต้องการของผู้ใช้ และสามารถทราบคุณภาพของข้อมูลได้ดีกว่า แต่ข้อเสียคือเสียเวลา และมีค่าใช้จ่ายสูง ในการเก็บรวบรวมข้อมูล 2. ข้อมูลทุติยภูมิ (Secondary Data) คือ ข้อมูลที่มีการเก็บรวบรวมจากแหล่งกาเนิดไว้แล้ว หรือผู้ใช้ข้อมูลไม่ได้เก็บรวบรวมข้อมูลเองโดยตรง แต่มีผู้อื่นหรือหน่วยงานอื่นทาการเก็บรวบรวมข้อมูลไว้ แล้ว เป็นข้อมูลที่ได้มีการวิเคราะห์เบื้องต้นมาแล้ว เช่น แหล่งข้อมูลจากหนังสือ วารสาร เอกสารสิ่งพิมพ์ อินเตอร์เน็ต ข้อมูลการเกิดการตายที่ได้จากสานักงานสถิติแห่งชาติ จานวนผู้ประสบอุบัติเหตุ จานวน ผู้ป่วยตามโรงพยาบาล เป็นต้น ข้อดีของข้อมูลทุติยภูมิคือประหยัดเวลาและค่าใช้จ่ายในการเก็บรวบรวม ข้อมูล เสียเสียคือการนาข้อมูลทุติยภูมิมาใช้บางครั้งอาจไม่ตรงกับความต้องการหรือวัตถุประสงค์ของผู้ใช้ หรืออาจไม่มีรายละเอียดเพียงพอ นอกจากนี้ผู้ใช้มักไม่ทราบถึงข้อบกพร่องของข้อมูล ซึ่งอาจส่งผลให้การ สรุปผลอาจผิดพลาดได้ 1.4.3 แบ่งตำมระดับกำรวัด ข้อมูลแบ่งตามระดับการวัด (Level of Measurement) หรือ แบ่งตามมาตราวัด (Measurement scales) แบ่งได้เป็น 4 ระดับ(มาตรา) เรียงจากต่าไปสูง ดังนี้ 1) มาตรานามบัญญัติ 2) มาตราอันดับ 3) มาตราอันตรภาคหรือช่วง 4) มาตราอัตราส่วน 1. มำตรำนำมบัญญัติ (Nominal scale) เป็นมาตราวัดของตัวแปรเชิงคุณภาพที่เป็นเพียงการ แบ่งกลุ่มของตัวแปร เพื่อให้เห็นความแตกต่างกัน แต่ไม่สามารถบอกปริมาณว่ามากหรือน้อยเพียงใด เช่น เพศ(1. ชาย, 2. หญิง), ศาสนา(1 พุทธ, 2. คริสต์, 3. อิสลาม), อาชีพ, สี เป็นต้น 2. มำตรำอันดับ (Ordinal scale) เป็นมาตราวัดที่สูงกว่ามาตรานามบัญญัติที่มีการกาหนดค่า ของข้อมูลในลักษณะการเรียงลาดับ หรือจัดลาดับความสาคัญของข้อมูลได้ เช่น ตาแหน่งงาน, ระดับ การศึกษา, ยศของทหารหรือตารวจ เป็นต้น 3. มำตรำอันตรภำคหรือช่วง (Interval scale) เป็นมาตราวัดที่มีการกาหนดค่าของข้อมูลเป็น ตัวเลขมักอยู่ในรูปของสเกล โดยแต่ละช่วงจะมีค่าเท่าๆกัน แต่ในมาตรานี้จะมีไม่มีศูนย์แท้ เช่น
  • 5. 5 4. มำตรำอัตรำส่วน (Ratio scale) เป็นมาตราวัดของตัวแปรเชิงปริมาณที่มีการกาหนดค่า ข้อมูลเป็นตัวเลข โดยตัวเลขแต่ละค่าแสดงให้ทราบถึงความแตกต่างกัน และบอกได้ว่ามีปริมาณมากหรือ น้อยเป็นกี่เท่าของอีกค่าหนึ่ง เช่น รายได้ น้าหนัก ส่วนสูง ระยะทาง เวลา เป็นต้น 1.5 กำรเก็บรวบรวมข้อมูล การเก็บรวบรวมข้อมูลแบ่งออกเป็น 4 แบบ คือ 1. กำรเก็บรวบรวมข้อมูลจำกกำรสำรวจ เป็นวิธีการเก็บรวบรวมข้อมูลจากผู้ให้ข้อมูลโดยตรง ซึ่งอาจทาได้โดยการสัมภาษณ์ การตอบแบบสอบถาม การสังเกต ข้อมูลที่เก็บรวบรวมได้โดยวิธีนี้ เรียกว่า ข้อมูลปฐมภูมิ (Primary data) การเก็บรวบรวมข้อมูลด้วยวิธีนี้ อาจทาได้ 2 ลักษณะ คือ 1.1 กำรสำมะโน (Census) หมายถึง การเก็บรวบรวมข้อมูลจากทุกหน่วยของ ประชากรที่เราสนใจ เช่น การทาสามะโนประชากรประเทศไทยโดยสานักงานสถิติแห่งชาติ สามะโนทาง การเกษตร เป็นต้น และข้อเสียของการทาสามะโนคือ ใช้กาลังคนมาก เสียเวลา และค่าใช้จ่ายสูงมาก ทา ให้ข้อมูลที่ได้ขาดความน่าเชื่อถือหรือไม่ทันปัจจุบัน ส่วนข้อดีของการทาสามะโนคือ ข้อมูลที่เก็บรวบรวม ได้ครอบคลุมทุกเรื่องที่เราสนใจ หรือเป็นข้อมูลหลักซึ่งจะนาไปใช้ในการวางแผนเก็บข้อมูลอื่นๆ ได้อีก 1.2 กำรสำรวจด้วยตัวอย่ำง (Sample survey) หมายถึง การเก็บรวบรวมข้อมูลจาก หน่วยตัวอย่างที่เลือกมาเป็นตัวแทนของประชากรที่เราสนใจ เป็นวิธีที่นิยมใช้กันมากที่สุดในปัจจุบัน ไม่ว่า จะเป็นงานวิจัยทางด้านธุรกิจ ทางการศึกษา ทางการแพทย์ เป็นต้น เหตุผลที่เราต้องสารวจด้วยตัวอย่าง คือ ประหยัดเวลาและค่าใช้จ่ายในการเก็บรวบรวมข้อมูล ประมวลผลข้อมูล วิเคราะห์ข้อมูล ความถูกต้อง ของข้อมูลมีสูงมาก ซึ่งเราอาจจะมีการสร้างกรอบตัวอย่างในกรณีที่สามารถสร้างกรอบตัวอย่างได้ โดยที่ กาหนดรายละเอียดต่างๆของสมาชิกในกลุ่ม เช่น ชื่อ ที่อยู่ เบอร์โทรศัพท์ อีเมลล์ เป็นต้น มีการกาหนด แผนการสุ่มตัวอย่าง และขนาดของตัวอย่างที่เหมาะสม เพื่อให้ได้ค่าที่คานวณจากตัวอย่าง(สถิติ) เป็นค่าที่ เหมาะสมในการสรุปลักษณะของประชากร 2. กำรเก็บรวบรวมข้อมูลจำกข้อมูลทุติยภูมิ เมื่อข้อมูลที่สนใจศึกษาได้ถูกเก็บรวบรวมไว้แล้ว หรือปรากฏอยู่แล้วในสื่อที่ตีพิมพ์เผยแพร่ เช่น ปรากฏอยู่ในหนังสือ งานวิจัย วารสาร หนังสือพิมพ์ อินเตอร์เน็ต เป็นต้น นักวิจัยสามารถนาข้อมูลเหล่านั้นมาใช้ได้เลย เช่น ข้อมูลอัตราการว่างงาน อัตราการ เกิด อัตราเงินเฟ้อในประเทศ ดัชนีราคาหุ้นในตลาดหลักทรัพย์ เป็นต้น
  • 6. 6 3. กำรเก็บรวบรวมข้อมูลจำกกำรทดลอง เป็นการเก็บรวบรวมข้อมูลที่ได้จากการทดลองหรือ ห้องปฏิบัติการ เพื่อให้ได้ข้อมูลที่ต้องการ เช่น การเก็บรวบรวมข้อมูลทางด้านการแพทย์ การศึกษา ทาง การตลาด การเกษตร เช่น การทดลองการใช้เครื่องสาอางหรือครีมบารุงผิวกับผู้บริโภค การทดลองการ เพาะเนื้อเยื่อของสัตว์ การทดลองปลูกพืชในโรงเพาะชา เป็นต้น ทั้งนี้ข้อมูลที่ได้จากการทดลองจะมีขนาด ตัวอย่างที่เหมาะสม แบบแผนการทดลองที่เหมาะสมและควบคุมได้ เช่น การทดลองปลูกพืชชนิดเดียวกัน ในโรงเพาะชา เราสามารถควบคุมอุณหภูมิให้เหมาะสมกับพืชชนิดนั้นๆได้ 4. กำรเก็บรวบรวมข้อมูลจำกกำรสังเกต เป็นการเก็บรวบรวมข้อมูลโดยใช้การสังเกตของผู้วิจัย เองหรือจัดส่งเจ้าหน้าที่ไปทาการสังเกต หรือเฝ้าดูพฤติกรรมของหน่วยตัวอย่าง และจดบันทึกข้อมูลที่ได้ จากการสังเกตเหล่านั้น เช่น สังเกตพฤติกรรมการเรียนของนักศึกษา การสังเกตพฤติกรรมการบริโภค อาหารของนักเรียน หรือการติดตั้งโทรทัศน์วงจรปิดไว้ดูพฤติกรรมการเลือกซื้อสินค้าของลูกค้า เป็นต้น การเก็บรวบรวมข้อมูลจากการสังเกต เพื่อให้ข้อมูลเป็นที่น่าเชื่อถือเราต้องกาหนดวัตถุประสงค์ให้แน่นอน ก่อนว่า จะเก็บข้อมูลอะไร มีการอบรมผู้สังเกตการณ์ให้มีความชานาญในเรื่องที่สังเกต เพื่อไม่ให้เกิดความ เอนเอียงของผู้สังเกตการณ์ นอกจากนี้ ผู้ที่ได้รับมอบหมายให้เป็นผู้สังเกตการณ์จะต้องเป็นผู้มีไหวพริบ ช่างสังเกต และมีความละเอียดรอบคอบในการสรุปผลการสังเกตด้วย 1.6 กำรสุ่มตัวอย่ำงและเทคนิคกำรสุ่มตัวอย่ำง กำรสุ่มตัวอย่ำง (Sampling) หมายถึง การสุ่มเพียงบางส่วนของประชากรมาเป็นตัวอย่าง เทคนิคกำรสุ่มตัวอย่ำง (Sampling Technique) ในการสุ่มตัวอย่างมีเทคนิค 2 ประการ คือ 1. กำรสุ่มตัวอย่ำงแบบทรำบควำมน่ำจะเป็น (Probability Sampling) หมายถึง การสุ่ม ตัวอย่างจากประชากรโดยอาศัยทฤษฎีความน่าจะเป็น โดยทราบความน่าจะเป็นที่แต่ละหน่วยของ ประชากรจะถูกสุ่มมาเป็นตัวอย่าง 2. กำรสุ่มตัวอย่ำงแบบไม่ทรำบควำมน่ำจะเป็น (Non-probability Sampling) หมายถึง การสุ่มตัวอย่างจากประชากร โดยไม่ทราบความน่าจะเป็นที่แต่ละหน่วยของประชากรจะถูกสุ่มมาเป็น ตัวอย่าง
  • 7. 7 1.6.1 กำรสุ่มตัวอย่ำงแบบทรำบควำมน่ำจะเป็น เป็นการสุ่มตัวอย่างจากประชากรที่มีจากัด และมีกรอบการสุ่มตัวอย่าง (Sampling frame) โดยในที่นี้จะศึกษาวิธีการสุ่มตัวอย่างแบบทราบความ น่าจะเป็น จานวน 4 วิธี คือ 1. การสุ่มตัวอย่างแบบง่าย (Simple Random Sampling) 2. การสุ่มตัวอย่างแบบมีระบบ (Systematic Random Sampling) 3. การสุ่มตัวอย่างแบบแบ่งชั้นภูมิ (Stratified Random Sampling) 4. การสุ่มตัวอย่างแบบกลุ่ม (Cluster Sampling) 1.6.1.1 กำรสุ่มตัวอย่ำงแบบง่ำย (Simple Random Sampling หรือ SRS) เป็นการสุ่ม ตัวอย่างที่ทุกๆหน่วยในประชากรมีโอกาสที่จะถูกเลือกเป็นตัวอย่างเท่าๆกัน ซึ่งวิธีการเลือกตัวอย่างแบบ ง่ายนี้ ทาได้ 2 วิธี คือ ก. ใช้วิธีกำรจัดฉลำก มักจะใช้กรณีที่ประชากรมีไม่มาก การจับฉลากทาได้ 2 วิธี คือ เลือก โดยไม่มีการแทนที่ (Sampling without replacement) และเลือกโดยมีการแทนที่ (Sampling with replacement) ซึ่งในทางปฏิบัตินิยมใช้แบบแทนที่มากกว่า ข. ใช้ตำรำงเลขสุ่ม (Random number tables) ซึ่งเป็นที่นิยมกันอย่างแพร่หลายในทาง ปฏิบัติ เพราะใช้ง่ายและสะดวกรวดเร็ว วิธีกำรใช้ตำรำงเลขสุ่ม การใช้ตารางเลขสุ่ม ขั้นแรกต้องใส่หมายเลขกากับให้กับหน่วยประชากรทั้งหมด ขั้นต่อมา จึงใช้ตารางเลขสุ่มช่วยในการเลือกหน่วยตัวอย่าง โดยการเปิดตารางเลขสุ่มหน้าใดก็ได้แบบสุ่ม แล้วนา วัตถุปลายแหลม เช่น ปากกา หรือดินสอ จิ้มลงบนตารางเลขสุ่มที่เป็นตัวเลขแบบสุ่มๆ(โดยไม่มองว่าจะได้ แถวไหน) หลังจากจิ้มแล้วให้ดูว่าได้แถวไหนหรือคอลัมน์ไหนเป็นตัวเริ่มต้น แล้วเริ่มอ่านตัวเลขนั้นจากซ้าย ไปขวา หรือจากบนลงล่างก็ได้ จนจบแถวนั้นๆ แล้วให้เริ่มอ่านแถวต่อไปจนครบจานวนตัวอย่างที่ต้องการ ส่วนมากแล้วจะอ่านจากซ้ายไปขวา ตัวอย่างตารางเลขสุ่มบางส่วนเป็นดังนี้
  • 8. 8 Column Line 1 2 3 4 5 6 7 8 9 10 1 41101 17336 48951 53674 17880 45260 8575 49321 36191 17095 2 32123 91576 84221 78902 82010 30847 62329 63898 23268 74283 3 26091 68409 69704 82267 14751 13151 93115 01437 56945 89661 4 67680 79790 48462 59278 44185 29616 76531 19589 83139 28454 5 15184 19260 17073 17026 25264 08388 27182 22557 61501 67481 6 58010 45039 57181 10238 36874 28546 37444 80824 63981 39942 7 56425 53996 86245 32623 78858 08143 60377 42925 42815 11159 ตัวอย่างเช่น ถ้าต้องการสุ่มพนักงานจานวน 30 คน จากพนักงานทั้งหมด 400 คน เพื่อศึกษาความคิดเห็น ต่อการเข้ารับบริการประกันสังคมของบริษัทแห่งหนึ่งในประเทศไทย โดยใช้วิธีการสุ่มอย่างง่ายจากตาราง เลขสุ่ม มีวิธีดังนี้คือ กาหนดหมายเลข 001-400 ให้กับพนักงานแต่ละคน แล้วสุ่มตัวเลขจากตารางเลขสุ่ม สมมติว่า สุ่มได้ตัวเลข 32123 91576 84221 เป็นตัวเริ่มต้น ดังนั้น ให้ใช้เลขไม่เกิน 3 หลัก และมีค่าไม่ เกิน 400 มาเป็นตัวอย่าง เช่น 321, 239, 157, 684(เกิน 400 ไม่ใช้), 221 ทาต่อไปเรื่อยๆ จนครบ 30 หน่วยตามที่เราต้องการ ดังนั้น เราจะได้พนักงานหมายเลข 321, 239, 157, 221 เป็นต้น วิธีการสุ่มแบบอย่างง่ายมีข้อดี คือ เป็นวิธีการที่ง่ายไม่ซับซ้อนและเข้าใจง่ายกว่าวิธีอื่นๆ และควรใช้กับประชากรที่มีลักษณะคล้ายคลึงกันมากที่สุด ข้อเสีย คือ หน่วยตัวอย่างที่สุ่มได้กระจัด กระจายกันมาก ทาให้ยากต่อการเก็บรวบรวมข้อมูล และเสียค่าใช้จ่ายมากในการเก็บรวบรวมข้อมูล 1.6.1.2 กำรสุ่มตัวอย่ำงแบบมีระบบ (Systematic Random Sampling) หมายถึง การ สุ่มตัวอย่างจากประชากรที่มีการกาหนดหมายเลขลงบนสมาชิกทุกหน่วยในประชากรอย่างสุ่ม และหน่วย ตัวอย่างที่สุ่มได้เป็นตัวอย่างสุ่มที่มีระยะห่างเท่ากัน ( ) เมื่อ N เป็นจานวนประชากร และ n เป็นจานวนตัวอย่าง ตัวอย่างเช่น ต้องการสารวจรายได้ต่อครัวเรือนในชุมชนแห่งหนึ่งในประเทศไทย ที่มีทั้งหมด 60 ครัวเรือน โดยมีแผนที่ของครัวเรือนดังกล่าว และต้องการเลือกตัวอย่างมา 10 ครัวเรือน ( ) วิธีการเลือกตัวอย่างโดยการสุ่มแบบมีระบบนี้ เขียนเลขกากับให้แต่ละครัวเรือนทั้ง 60 ครัวเรือน ซึ่งจะได้ครัวเรือนที่ 1, 2, 3, … , 60 ดังนั้นก็เลือกจุดเริ่มต้นแบบสุ่มๆ สมมติได้เลข 5 หมายความว่า ครัวเรือนแรกที่ถูกเลือกมาเป็นตัวอย่างคือ ครัวเรือนที่ 5 ต่อไปก็คือครัวเรือนที่ (5+6) = 11 และครัวเรือนต่อไปคือครัวเรือนที่ (11+6) = 17, 23, 29, 35, 41, 47, 53, 59 ครบ 10 ครัวเรือนที่ ต้องการเป็นตัวอย่างแล้วก็หยุดทา
  • 9. 9 1.6.1.3 กำรสุ่มตัวอย่ำงแบบแบ่งชั้นภูมิ (Stratified Random Sampling) หมายถึง การ สุ่มตัวอย่างจากประชากรที่มีความแตกต่างกันในลักษณะที่ต้องการศึกษา ดังนั้นเราต้องจาแนกประชากร ออกเป็นกลุ่มย่อยโดยให้หน่วยต่างๆ ที่เหมือนกันอยู่ในกลุ่มเดียวกัน ซึ่งเราเรียกว่า “ชั้นภูมิ” จากนั้นจึงทา การสุ่มตัวอย่างมาจากแต่ละชั้นภูมิ โดยอาศัยวิธีการสุ่มแบบอย่างง่าย เช่น การสารวจค่าใช้จ่ายของ นักศึกษามหาวิทยาลัยแห่งหนึ่ง เราจาแนกนักศึกษาออกเป็นกลุ่มต่างๆ แยกตามคณะ หลังจากนั้นจึงทา การสุ่มตัวอย่างนักศึกษามาจากแต่ละคณะ โดยวิธี SRS ภาพแสดงการสุ่มแบบแบ่งชั้นภูมิ ข้อดีของการสุ่มแบบแบ่งชั้นภูมิ คือ มีประสิทธิภาพสูงกว่าวิธีสุ่มแบบ SRS และได้ รายละเอียดแยกออกเป็นรายชั้นภูมิ ทาให้สามารถที่จะศึกษาเปรียบเทียบระหว่างกลุ่มได้ และประหยัด ค่าใช้จ่าย สาหรับข้อเสีย คือ ต้องจัดเตรียมรายละเอียดของงานไว้ล่วงหน้าเพื่อจัดแบ่งเป็นชั้นภูมิ 1.6.1.4 กำรสุ่มตัวอย่ำงแบบกลุ่ม (Cluster Sampling) หมายถึง การสุ่มตัวอย่างโดยแบ่ง ประชากรออกเป็นกลุ่มย่อยๆ เรียกว่า cluster ก่อน แล้วจึงทาการสุ่มกลุ่มของหน่วยตัวอย่าง (Cluster) โดยใช้วิธีการสุ่มแบบอย่างง่าย หรือแบบมีระบบ จากนั้นจึงรวบรวมข้อมูลมาจากหน่วยย่อยทุกหน่วยของ กลุ่มที่สุ่มได้ โดยให้หน่วยประชากรในกลุ่มเดียวกันมีลักษณะแตกต่างกัน ส่วนหน่วยประชากรต่างกลุ่มกัน ให้มีลักษณะคล้ายคลึงกัน เช่น ต้องการสารวจค่าใช้จ่ายในแต่ละวันของพนักงาน 20 คน จากแผนกต่างๆ ทั้ง 5 แผนก แต่ละแผนกมีพนักงาน 10 คน วิธีการก็คือต้องเตรียมรายชื่อแผนกต่างๆ ทั้ง 5 แผนกก่อน แล้วสุ่มมาเพียง 2 แผนก จาก 5 แผนก แล้วเก็บข้อมูลจากพนักงาน 2 แผนกที่สุ่มได้เท่านั้น ก็จะได้ข้อมูล จากพนักงาน 20 คน ตามที่ต้องการ ดังภาพ
  • 10. 10 ภาพแสดงการสุ่มแบบกลุ่ม ข้อดีของการสุ่มตัวอย่างแบบกลุ่ม คือ เนื่องจากกรอบตัวอย่างที่สร้างขึ้นไม่กระจัดกระจาย กันมากนัก จึงมีค่าใช้จ่ายในการเก็บรวบรวมข้อมูลน้อย และประหยัดเวลาในการเก็บรวบรวมข้อมูล 1.6.2 กำรสุ่มตัวอย่ำงแบบไม่ทรำบควำมน่ำจะเป็น เป็นการสุ่มตัวอย่างจากประชากรที่มี จานวนไม่จากัด หรือไม่มีกรอบการสุ่มตัวอย่าง เหมาะสาหรับงานวิจัยที่มีวัตถุประสงค์ในการศึกษาและ อธิบายเฉพาะกลุ่มตัวอย่างเท่านั้น โดยไม่ต้องการสรุปอ้างอิงไปยังประชากร แบ่งออกเป็น 3 วิธี คือ 1. การสุ่มตัวอย่างตามความสะดวก (Convenience Sampling) 2. การสุ่มตัวอย่างตามความประสงค์ (Judgement Sampling) 3. การสุ่มตัวอย่างแบบโควต้า (Quota Sampling) 1.6.2.1 กำรสุ่มตัวอย่ำงตำมควำมสะดวก หมายถึง การสุ่มตัวอย่างโดยอาศัยความสะดวก ของผู้สุ่มเอง หรือการสุ่มตัวอย่างที่หน่วยตัวอย่างถูกสุ่มโดยบังเอิญ และไม่ทราบโอกาสที่หน่วยตัวอย่างแต่ ละหน่วยจะถูกสุ่ม 1.6.2.2 กำรสุ่มตัวอย่ำงตำมควำมประสงค์ หมายถึง การสุ่มตัวอย่างโดยที่หน่วยตัวอย่างที่ ผู้สุ่มได้เลือกขึ้นมาเป็นตัวอย่าง อาจมาจากเหตุผลส่วนตัว หรืออาศัยประสบการณ์ของผู้สุ่มเป็นหลักใน การตัดสินใจ ในการสุ่มตัวอย่างด้วยวิธีนี้ผู้วิจัยควรจะกาหนดวัตถุประสงค์ให้ชัดเจน เช่น ผู้จัดการฝ่าย การตลาดได้ตัดสินใจเลือกร้านค้าในเขตสีลม 5 ร้าน เพื่อวางขายสินค้าใหม่ โดยผู้จัดการฝ่ายการตลาด อาจใช้ประสบการณ์ หรือความชานาญในการตัดสินใจเลือกร้านค้าทั้ง 5 ร้าน
  • 11. 11 1.6.2.3 กำรสุ่มตัวอย่ำงแบบโควต้ำ หมายถึง การสุ่มตัวอย่างโดยไม่สนใจว่าตัวอย่างที่ เลือกมานั้นจะเลือกมาด้วยวิธีใด เพียงแต่ให้มีจานวนหน่วยครบตามที่กาหนดไว้ในแต่ละโควต้าเท่านั้น มัก นามาใช้กับการสารวจทัศนคติความคิดเห็นในเรื่องต่างๆ ที่เราสนใจ