แนวคิดพื้นฐานทางสถิติ

Get Started. It's Free
or sign up with your email address
แนวคิดพื้นฐานทางสถิติ by Mind Map: แนวคิดพื้นฐานทางสถิติ

1. สถิติเป็นตัวเลขที่แสดงข้อเท็จจริงในเรื่องต่างๆซึ่งอาจหมายถึงศาสตร์แขนงหนึ่งที่เรียกว่าสถิติศาสตร์แบ่งได้เป็นสถิติเชิงพรรณนาและสถิตเชิงอนุมานซึ่งต้องมีการเก็บรวบรวมข้อมูลเพื่อนำไปประมวลผลเป็นข่าวสารที่ต้องการการแบ่งประเภทข้อมูลอาจแบ่งตามาตราการวัดลักษณะของข้อมูล แหล่งของข้อมูล ประเภทของข้อมูล เป็นต้น สถิติศาสตร์มีขั้นตอนในการศึกษาที่เรียกว่าระเบียบวิธีทางสถิติ 4 ขั้นตอน คือการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูลและการแปลความหมายของข้อมูล

2. ความหมายของสถิติ สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistic มีรากศัพท์มาจาก Stat หมายถึง ข้อมูลหรือสารสนเทศ ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่างๆ เช่น การทำสำมะโนครัวเพื่อทราบพลเมืองในประเทศทั้งหมด สถิติ หมายถึง ตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน อัตราการเกิดของเด็กทารก ปริมาณหน้าฝนในแต่ละปี สถิติในความหมายนี้ เรียกว่าข้อมูลทางสถิติ (Statistical data) อีกความหมายหนึ่งสถิติหมายถึงวิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูลการนำเสนอข้อมูลการวิเคราะห์ ข้อมูลและการตีความหมายข้อมูล

3. ประเภทของสถิติ

3.1. 1.สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่ม หนึ่ง ไม่สามารถอ้างอิงไปยังกลุ่มอื่น ๆได้ สถิติที่อยู่ในประเภทนี้ เช่น ค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม ส่วนเบี่ยงเบนมาตรฐาน พิสัย ฯลฯ

3.2. 2. สถิติอ้างอิง (Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่ม หนึ่งหรือหลายกลุ่มแล้วสามารถอ้างอิงไปยังกลุ่มประชากรได้ โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของ ประชากร ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง และตัวแทนที่ดีของประชากรเรียกว่ากลุ่มตัวอย่าง สถิติอ้างอิงสามารถแบ่งออกเป็น 2 ประเภทคือ 2.1 สถิติมีพารามิเตอร์ (Parametric Statistics) เป็นวิธีการทางสถิติที่จะต้องเป็นไป ตามข้อตกลงเบื้องต้นดังนี้ 1. ข้อมูลต้องอยู่ในระดับช่วงขึ้นไป 2. ข้อมูลที่ได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ 3. กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาต้องมีความแปรปรวนเท่ากัน สถิติประเภทนี้ เช่น t-test, Z-test, ANOVA, Regression ฯลฯ 2.2 สถิติไร้พารามิเตอร์ (Nonparametric Statistics) เป็นวิธีการทางสถิติที่ สามารถนำมาใช้ได้โดยปราศจากข้อตกลงเบื้องต้นสถิติที่อยู่ในประเภทนี้ เช่น ไคสแควร์, Median test, Sign test ฯลฯโดยปกติแล้วนักวิจัยนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติพารามิเตอร์มีอำนาจ การทดสอบ (Power of Test) สูงกว่าการใช้สถิติไร้พารามิเตอร์ สถิติมีพารามิเตอร์เป็นการทดสอบที่ได้มาตรฐาน มีขั้นตอนต่าง ๆ ที่สมบูรณ์ ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นในการใช้สถิติมีพารามิเตอร์จึง ไม่มีผู้ใดคิดที่จะหันกลับไปใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน

4. ข้อมูลละระดับการวัดข้อมูล

4.1. 1. มาตรนามบัญญัติ (nominal scale)เป็นการวัดระดับต่ำสุด โดยจะเป็นเพียงการจำแนกประเภทของคุณลักษณะหรือสิ่งของต่างๆ ตัวอย่างเช่น จำแนกผลลัพธ์จากการโยนเหรียญเป็นหัว หรือก้อย จำแนกหมู่โลหิต A,B,O หรือAB จำแนกบุคคลตามอาชีพเป็นข้าราชการค้าขาย หรือเกษตรกร หรือจำแนกสีของรุ้งออกเป็นสีต่างๆ การวัดในระดับนี้ อาจเป็นการกำหนดสัญลักษณ์ เพื่อจำแนกสิ่งต่างๆ เช่น กำหนดแทนเพศชาย แทนเพศหญิง นอกจากนั้น อาจมีการกำหนดตัวเลขเพื่อจำแนกสิ่งต่างๆ โดยที่ ตัวเลขดังกล่าวไม่มีความหมายในเชิงปริมาณ เช่นเลขที่บ้าน ดังนั้นจึงนำเลขต่างๆ มาบวก ลบ คูณ หรือหารกันไม่ได้กระทำได้เพียงการนับเพื่อดูความถี่หรือการเกิดซ้ำๆ กัน ตัวอย่างข้อมูลอื่นๆ ที่ได้จากการวัดประเภทนี้เช่น หมายเลขนักฟุตบอล หมายเลขโทรศัพท์ หมายเลขประจำตัวผู้เสียภาษี รหัสไปรษณีย์ เลขหมู่หนังสือในห้องสมุด และหมายเลขเที่ยวบิน เป็นต้น

4.2. 2. มาตรเรียงอันดับ (ordinal or ranking scale) การวัดในระดับนี้เป็นการเรียงอันดับสิ่งต่างๆ ตามลักษณะหนึ่งๆ ซึ่งมีความสัมพันธ์กันในลักษณะดีกว่า ยากกว่าหรือนิยามมากกว่าตัวอย่างเช่น แม่บ้านคนหนึ่งมีความนิยมผงซักฟอก 3 ตราเป็น ดีที่สุด ดีมาก และดี ซึ่งจะเป็นว่าการวัดในระดับนั้น ในการวัดระดับนี้เพื่อความสะดวกอาจมีการกำหนดอันดับเป็นตัวเลขให้แก่สิ่งต่างๆ โดยที่ตัวเลขดังกล่าวไม่มีความหมายในเชิงปริมาณตัวอย่างเช่นกล้วยไม้ที่ชนะการประกวดเป็นอันดับที่ 1 อันดับที่ 2 และอันดับที่ 3 มิได้หมายความว่า กล้วยไม้ที่ชนะการประกวดเป็นอันดับที่ 1 มีความงามเป็น 2 เท่าของกล้วยไม้ที่ได้อันดับที่ 2 และระบุไม่ได้ว่ากล้วยไม้ที่ได้อันดับที่ 1 งามกว่ากล้วยไม้ที่ได้อันดับที่ 2 มากน้อยเพียงใดนอกจากนั้น ความแตกต่างของความงามระหว่างกล้วยไม้ที่ได้อันดับที่ 1 กับ 2 และระหว่างกล้วยไม้ที่ได้อันดับที่ 2 กับ 3 ไม่จำเป็นต้องเท่ากัน ดังนั้นข้อมูลที่ได้จากการวัดในระดับนี้จึงนำมาบวก ลบ คูณ หาร กันไม่ได้

4.3. 3. มาตรอันตรภาค (interval scale)การวัดในระดับนี้ นอกจากจะมีคุณสมบัติการจำแนกและการเรียงอันดับสิ่งต่างๆ แล้ว แต่ละหน่วยของการวัดยังมีค่าคงที่อีกด้วยซึ่งทำให้สามารถระบุความแตกต่างระหว่างสิ่งต่างๆ ว่ามีมากน้อยเพียงใด นั่นคือ ข้อมูลซึ่งเป็นตัวเลขที่ได้จากการวัดในระดับนี้ จะมีความหมายในเชิงปริมาณอย่างแท้จริง

4.4. 4. มาตราอัตราส่วน (ratio scale) เป็นการวัดระดับสูงสุด ซึ่งนอกจากจะมีคุณสมบัติต่างๆ เหมือนมาตรอันตรภาคแล้ว ยังมีศูนย์แท้เป็นจุดเริ่มต้น นั่นคือ 0 หมายความว่าไม่มีอะไรเลยเช่น วัดน้ำหนักในหน่วยระบบเมตริกได้ 0 กิโลกรัมแสดงว่าไม่มีน้ำหนักเลย และเมื่อแปลงเป็นหน่วยระบบอังกฤษก็จะหนัก 0 ปอนด์ ซึ่งแสดงว่าไม่มีน้ำหนักเลยเช่นกัน ดังนั้น ข้อมูลที่ได้จากการวัดในระดับนี้จึงนำมาบวก ลบ คูณ หาร

5. การประมวลผล เป็นการนำข้อมูลที่เปลี่ยนสภาพแล้วมาวิเคราะห์ด้วยโปรแกรมสำเร็จรูปทางสถิติ ประกอบด้วย - การนิยามหรือการดึงข้อมูล - การแปลงค่าของข้อมูล - การรวมแฟ้มข้อมูล - การคำนวณและเปรียบเทียบ - การวิเคราะห์ข้อมูลทางสถิติ

6. การแสดงผลลัพธ์ โดยอาจเป็นรายงานที่อยู่ในรูปข้อความ ตาราง หรือกราฟ แล้วแต่ความเหมาะสม และความสวยงาม การกำหนดตัวแปรและรหัสของตัวแปร ดังได้กล่าวมาแล้วว่าการกำหนดรหัสมักจะใช้สำหรับข้อมูลเชิงคุณภาพ ในทางปฏิบัติแล้วและสร้างหรือกำหนดรหัสจะทำควบคู่กับการสร้างแบบสอบถาม เนื่องจากแบบสอบถามประกอบด้วยคำถามหรือกำหนดรหัสจะทำควบคู่กับการสร้างแบบสอบถามเนื่องจากแบบสอบถามประกอบด้วยคำถามหรือรายการข้อมูลต่างๆ โดยแต่ละรายการข้อมูลต้องมีการกำหนดตัวแปร 1 ตัว และค่าของตัวแปรก็คือข้อมูลโดยถ้าเป็นข้อมูลเชิงปริมาณ ค่าของตัวแปรก็คือค่ารหัสที่นักวิจัยเป็นผู้กำหนดนั่นเอง โดยทั่วไปจะเว้นเนื้อที่ด้านขวามือของแบบสอบถามไว้สำหรับลงรหัส ซึ่งจะทำเป็นช่องสี่เหลี่ยม ไว้ตรงกับคำถามนั้นๆ โดยมีจำนวนช่องสี่เหลี่ยมเพียงพอกับการบันทึกรหัสหรือค่าที่เป็นไปได้ของคำถามนั้นๆพร้อมกำหนดชี่อตัวแปรแทนคำถาม เพื่อนำไปใช้อ้างอิงในภายหลัง โดยชื่อตัวแปรนี้อาจกำหนดให้สอดคล้องกับรายการข้อมูลเพื่อให้สื่อความยาวไม่เกิน 8 ตัวอักษร เช่น คำถามอายุ กำหนดชื่อตัวแปรเป็น age โดยกำหนดสอบถามจากข้าราชการซึ่งตามระเบียบต้องมีอายุไม่เกิน 60 ปี ดังนั้นรหัสหรือค่าสุงสุดประกอบด้วยตัวเลข 2 หลัก และกำหนดช่องสี่เหลี่ยมในลักษณะ เพี่อให้เพียงพอกับการบันท฿กอายุที่เป็นไปได้ของข้าราชการแต่ละคนและกล่าวว่าค่าหรือรหัสของตัวแปร age มีความกว้างเป็น 2 อนึ่ง คำถามในแบบสอบถาม 1 ข้อ อาจจะกำหนดตัวแปรได้มากกว่า 1ตัว ก็ได้ทั้งนี้เนื่องจากว่าคำถาม 1 ข้ออาจประกอบด้วยหลายรายการข้อมูลนั่นเอง