Data Loading...

หนังสือเรียนวิชาคณิตศาสตร์ บทที่ 7 Flipbook PDF

หนังสือเรียนวิชาคณิตศาสตร์ บทที่ 7


122 Views
203 Downloads
FLIP PDF 304.16KB

DOWNLOAD FLIP

REPORT DMCA

114

บทที่ 7 สถิติเบื้องตน สาระสําคัญ 1. ขอมูลสถิติ หมายถึง ตัวเลขหรือขอความที่แทนขอเท็จจริงของลักษณะที่เราสนใจ 2. ระเบียบวิธีการทางสถิติ จะประกอบไปดวย การเก็บรวบรวมขอมูล การนําเสนอขอมูล การ วิเคราะหและการตีความของขอมูล 3. การเก็บรวบรวมขอมูล หมายถึง กระบวนการกระทําเพื่อจะใหไดขอมูลที่ตองการศึกษาภายใต ขอบเขตที่กําหนด 4. การนําเสนอขอมูลที่เก็บรวบรวมมา จะมี 2 แบบ คือ การนําเสนออยางเปนแบบแผนและการ นําเสนออยางไมเปนแบบแผน 5. การวัดแนวโนมเขาสูสวนกลาง เปนการหาคากลางดวยวิธีตาง ๆ กัน เพื่อใชเปนตัวแทนของ ขอมูลทั้งชุด คากลางที่นิยมใชมี 3 วิธี คาเฉลี่ยเลขคณิต คามัธยฐานและคาฐานนิยม ผลการเรียนรูที่คาดหวัง 1. อธิบายขั้นตอนการวิเคราะหขอมูลเบื้องตน และสามารถนําผลการวิเคราะหขอมูลเบื้องตนไปใช ในการตัดสินใจได 2. เลือกใชคากลางที่เหมาะสมกับขอมูลที่กําหนดและวัตถุประสงคที่ตองการได 3. นําเสนอขอมูลในรูปแบบตางๆรวมทั้งการอานและตีความหมายจากการนําเสนอขอมูลได ขอบขายเนื้อหา เรื่องที่ 1 การวิเคราะหขอมูลเบื้องตน เรื่องที่ 2 การหาคากลางของขอมูลโดยใชคาเฉลี่ยเลขคณิต มัธยฐานและฐานนิยม เรื่องที่ 3 การนําเสนอขอมูล

115

เรื่องที่ 1 การวิเคราะหขอ มูลเบื้องตน ความหมาย คําวา “สถิต”ิ เปนเรื่องที่มีความสําคัญและจําเปนอยางยิ่งตอการตัดสินใจหรือวางแผน ซึ่งแตเดิม เขาใจวา สถิติ หมายถึง ขอมูลหรือขาวสารที่เปนประโยชนตอการบริหารงานของภาครัฐ เชน การ จัดเก็บภาษี การสํารวจผลผลิต ขอมูลที่เกี่ย วของกับประชากร จึงมีรากศัพทมาจากคําวา “State” แต ปจจุบันสถิติ มีความหมายอยู 2 ประการ คือ 1. ตัวเลขที่แทนขอเท็จจริงที่มีการแปรเปลี่ยนไปตามปริมาณสิ่งของที่วัดเปนคาออกมา เชน สถิติเกี่ยวกับจํานวนนักเรียนในโรงเรียน จํานวนนักเรียนที่มาและขาดการเรียนในรอบเดือน ปริมาณ น้ําฝนในรอบป จํานวนอุบัติเหตุการเดินทางในชวงปใหมและสงกรานต เปนตน 2. สถิติใ นความหมายของวิชาหรือ ศาสตรที่ต รงกับ ภาษาอังกฤษวา “Statistics” หมายถึ ง กระบวนการจัดกระทําของขอมูลตั้งแตการเก็บรวบรวมขอมูล การวิเคราะหขอมูล การนําเสนอขอมูล และการตีความหรือแปลความหมายขอมูล เปนตน การศึกษาวิชาสถิติจะชวยใหผูเรียนมีความรูความเขาใจในระเบียบวิธีสถิติที่เปนประโยชนใ น ชีวิต ประจําวัน ตั้งแตก ารวางแผน การเลือกใช และการปฏิบัติใ นการดําเนินงานตาง ๆ รวมทั้งการ แกปญหาในเรื่องตาง ๆ ทั้งในวงการศึกษาวิทยาศาสตร การเกษตร การแพทย การทหาร ธุรกิจตาง ๆ เปนตน กิจการตาง ๆ ตองอาศัยขอมูลสถิติและระเบียบสถิติตาง ๆ มาชวยจัดการ ทั้งนี้เนื่องจากการ ตัดสินใจหรือการวางแผน และการแกปญหาอยางมีหลักเกณฑจะทําใหโอกาสที่จะตัดสินใจเกิดความ ผิดพลาดนอยที่สุดได นอกจากนี้หลักวิชาทางสถิติยังสามารถนําไปประยุกตใชกับการจัดเก็บรวบรวมขอมูล เพื่อความ จําเปน ที่ตองนําไปใชงานในดานตางๆ โดยเฉพาะอยางยิ่งทําใหทราบขอมูล และทําความเขาใจกับ ขาวสารและรายงานขอมูลทางวิชาการตาง ๆ ที่นําเสนอในรูปแบบของตาราง แผนภูมิ แผนภาพ กราฟ ซึ่งผูอานหากมีความรูความเขาใจในเรื่องของสถิติเบื้องตนแลว จะทําใหผูอานสามารถรูและเขาใจใน ขอมูลและขาวสารไดเปนอยางดี 1.1 ชนิดของขอมูล อาจแบงไดเปนดังนี้ 1. ขอมูลเชิงคุณภาพ (Qualitative data) เปนขอมูลที่แสดงถึง คุณสมบัติ สภาพ สถานะ หรือความคิดเห็น เชน ความสวย ระดับการศึกษา เพศ อาชีพ เปนตน 2. ขอมูลเชิงปริมาณ (Qualitative data ) เปนขอมูลที่เปนตัวเลข เชน ขอมูลที่เกิดจากการ ชั่ง ตวง หรือ คาของขอมูลที่นําปริมาณมาเปรียบเทียบกันได เชน ความยาว น้ําหนัก สวนสูง สถิติของ คนงานแยกตามเงินเดือน เปนตน

116

นอกจากนี้ยังมีขอมูลซึ่งสามารถแยกตามกาลเวลาและสภาพภูมิศาสตรอีกดวย แหลงที่มาของขอมูล โดยปกติขอมูลที่ไดมาจะมาจากแหลงตาง ๆ อยู 2 ประเภท คือ - ขอมูลปฐมภูมิ ( Primary data ) หมายถึง ขอมูลที่รวบรวมมาจากผูใหหรือแหลงที่ เปนขอมูลโดยตรง เชน การสํารวจนับจํานวนพนักงานในบริษัทแหงหนึ่ง - ขอมูลทุติยภูมิ ( Secondary data ) หมายถึง ขอมูลที่รวบรวมหรือเก็บมาจาก แหลงขอมูลที่มีการรวบรวมไวแลว เชน การคัดลอกจํานวนสินคาสงออกที่การทาเรือไดรวบรวมไว 1.2 การเก็บรวบรวมขอมูล การเก็บรวบรวมขอมูลในทางสถิติจะมีวิธีการเก็บรวบรวมขอมูลได 3 วิธี ตาม ลักษณะของการปฏิบัติ กลาวคือ 1) วิธีการเก็บขอมูลจากการสํารวจ การเก็บรวบรวมขอมูลวิธีนี้เปนที่ใ ชกัน อยาง แพรหลาย โดยสามารถทําไดตั้งแตการสํามะโน การสอบถาม / สัมภาษณจากแหลงขอมูลโดยตรง รวมทั้งการเก็บรวบรวมขอมูลที่เกิดเหตุจริง ๆ เชน การเขาไปสํารวจผูมีงานทําในตําบล หมูบาน การ แจงนับนักทองเที่ยวที่เขามาในจังหวัด หรืออําเภอ การสอบถามขอมูลคนไขที่นอนอยูในโรงพยาบาล เปนตน วิธีการสํารวจนี้สามารถกระทําไดหลายกรณี เชน 1.1 การสอบถาม วิธีที่นิยม คือ การสงแบบสํารวจหรือแบบขอคําถามที่ เหมาะสม เขาใจงายใหผูอานตอบ ผูตอบมีอิสระในการตอบ แลวกรอกขอมูลสงคืน วิธีการสอบถามอาจ ใชสื่อทางไปรษณีย ทางโทรศัพท เปนตน วิธนี ี้ประหยัดคาใชจาย 1.2 การสัมภาษณ เปนวิธีการรวบรวมขอมูลที่ไดคําตอบทันที ครบถวน เชื่อถือไดดี แตอาจเสียเวลาและคาใชจายคอนขางสูง การสัมภาษณทําไดทั้งเปนรายบุคคลและเปนกลุม 2) วิธีการเก็บขอมูลจากการสังเกต เปนวิธีการรวบรวมขอมูลโดยการบันทึกสิ่งที่ พบเห็นจริงในขณะนั้น ขอมูลจะเชื่อถือไดมากนอยอยูที่ผูรวบรวมขอมูล สามารถกระทําไดเปนชวง ๆ และเวลาที่ตอเนื่องกันได วิธีนี้ใชควบคูไปกับวิธีอื่นๆ ไดดวย 3) วิธีการเก็บขอมูลจากการทดลอง เปนการเก็บรวบรวมขอมูลที่มีการทดลอง หรือปฏิบัติอยูจริงในขณะนั้นขอดีที่ทําใหเราทราบขอมูล ขั้นตอน เหตุการณที่ตอเนื่องที่ถูกตองเชื่อถือได บางครั้งตองใชเวลาเก็บขอมูลที่นานมาก ทั้งนี้ตองอาศัยความชํานาญของผูทดลอง หรือผูถูกทดลองดวย จึงจะทําใหไดขอมูลที่มีความคลาดเคลื่อนนอยที่สุด อนึ่ง การเก็บรวบรวมขอมูล ถาเราเลือกมาจากจํานวนหรือรายการของขอมูลที่ ตองการเก็บมาทั้งหมดทุกหนวยจะเรียกวา “ประชากร” ( Population ) แตถาเราเลือกมาเปนบางหนวย และเปนตัวแทนของประชากรนั้น ๆ เราจะเรียกวา กลุมตัวอยางหรือ “ ตัวอยาง” ( Sample )

117

1.3 การวิเคราะหขอมูล การวิเคราะหขอมูล เปนการแยกขอมูลสถิติที่ไดมาเปนตัวเลขหรือขอความจากการรวบรวม ขอมูลใหเปนระเบียบพรอมที่จะนําไปใชประโยชนตามความตองการ ทั้งนี้รวมถึงการคํานวณหรือหา คาสถิติในรูปแบบตาง ๆ ดวย มีวีธกี ารดําเนินงานดังนี้ 1.3.1 การแจกแจงความถี่ ( Frequency distribution ) เปนวิธีการจัดขอมูลของสถิติที่มีอยู หรือ เก็บรวบรวมมาจัดเปนกลุมเปนพวก เพื่อความสะดวกในการที่นํามาวิเคราะห เชน การวิเคราะหคาเฉลี่ย คาความแปรปรวนของขอมูล เปนตน การแจกแจงความถี่จะกระทําก็ตอเมื่อมีความประสงคจะวิเคราะห ขอมูลที่มีจํานวนมาก ๆ หรือขอมูลที่ซ้ํา ๆ กัน เพื่อชวยในการประหยัดเวลา และใหก ารสรุปผลของ ขอมูลมีความรัดกุมสะดวกตอการนําไปใชและอางอิง รวมทั้งการนําไปใชประโยชนในดานอื่น ๆ ตอไป ดวย สวนคําวา “ตัวแปร” ( Variable ) ในทางสถิติ หมายถึง ลักษณะบางสิ่งบางอยางที่เราสนใจจะ ศึกษาโดยลักษณะเหลานั้นสามารถเปลี่ยนคาได ไมวาสิ่งนั้นจะเปนขอมูลเชิงปริมาณหรือคุณภาพ เชน อายุของนักศึกษาการศึกษาทางไกลที่วัดออกมาเปนตัวเลขที่แตกตางกัน หากเปนเพศมีทั้งเพศชายและ หญิง เปนตน การแจกแจงความถี่แบงออกเปน 4 แบบคือ 1. การแจกแจงความถี่ทั่วไป 2. การแจกแจงความถี่สะสม 3. การแจกแจงความถี่สัมพัทธ 4. การแจกแจงความถี่สะสมสัมพัทธ 1. การแจกแจงความถี่ทั่วไป จัดแบบเปนตารางได 2 ลักษณะ 1) ตารางการแจกแจงความถี่แบบไมจัดเปนกลุม เปนการนําขอมูลมาเรียงลําดับจากนอยไปหา มาก หรือมากไปหานอย แลวดูวาจํานวนในแตละตัวมีตัวซ้ําอยู กี่จํานวน วิธีนี้ขอมูลแตละชวงชั้นจะ เทากันโดยตลอด และเหมาะกับการแจกแจงขอมูลที่ไมมากนัก ตัวอยางที่ 1 คะแนนการสอบวิชาคณิตศาสตรของนักศึกษา 25 คน คะแนนเต็ม 15 คะแนน มีดังนี้ 12 9 10 14 6 13 11 7 9 10 7 5 8 6 11 4 10 2 12 8 10 15 9 4 7

118

เมื่อนําขอมูลมานับซ้ํา โดยทําเปนตารางมีรอยขีดเปนความถี่ ไดดังนี้ คะแนน

รอยขีด

ความถี่

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

/ // / // /// // /// //// // // / / /

0 1 0 2 1 2 3 2 3 4 2 2 1 1 1

รวม

25

หรืออาจนําเสนอเปนตารางเฉพาะคะแนนและความถี่ไดอกี ดังนี้ คะแนน ( x ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ความถี่ ( f ) 0 1 0 2 1 2 3 2 3 4 2 2 1 1 1

รวม 25

2) การแจกแจงความถี่แบบจัดเปนกลุม การแจกแจงความถี่แบบจัด เปนกลุมนี้เรียกวาจัดเปน อันตรภาคชั้น เปนการนําขอมูลมาจัดลําดับจากมากไปหานอย หรือนอยไปหามากเชนกัน โดยขอมูล แตละชั้นจะมีชวงชั้นที่เทากัน การแจกแจงแบบนี้เหมาะสําหรับจัดกระทํากับขอมูลที่มีจํานวนมาก ตัวอยางที่ 2 อายุของประชากรในหมูบานหนึ่งจํานวน 45 คน เปนดังนี้ 41 53 61 42 15 39 65 40 64 22 71 62 50 81 43 60 16 63 31 52 47 48 90 73 83 78 56 50 80 45 37 51 49 55 78 60 90 31 44 22 54 36 22 66 46

119

เมือ่ นําขอมูลมาทําเปนตารางแจกแจงความถี่แบบจัดเปนกลุม ไดดังนี้

1. การแจกแจงความถี่ที่เปนอันตรภาคชั้น มีคําเรียกความหมายของคําตาง ๆ ดังตอไปนี้ 1.1 อันตรภาคชั้น ( Class interval ) หมายถึง ขอมูลที่แบงออกเปนชวง ๆ เชน อันตรภาค ชัน้ 11-20 , 21 -30 ,61–70 ,81-90 เปนตน 1.2. ขนาดของอันตรภาคชั้น หมายถึง ความกวาง 1 ชวงของขอมูลในแตละชั้น จาก 11-20 หรือ 61-70 จะมีคาเทากับ 10 1.3 จํานวนของอันตรภาคชั้น หมายถึง จํานวนชวงชั้นทั้งหมดที่ไดแจกแจงไวในที่นี้ มี 10 ชั้น 1.4 ความถี่ ( Frequency ) หมายถึง รอยขีดที่ซ้ํากัน หรือจํานวนขอมูลที่ซ้ํากันในอันตรภาค ชั้นนั้น ๆ เชน อันตรภาคชั้น 41-50 มีความถี่เทากับ 11 หรือมีผูที่มีอายุในชวง 41-50 มีอยู 11 คน 1.4 การแจกแจงความถี่สะสม ความถี่สะสม ( Commulative frequency ) หมายถึง ความถี่สะสมของอันตรภาคใด ที่เกิด จากผลรวมของความถี่ของอันตภาคนั้น ๆ กับความถี่ของอันตรภาคชัน้ ที่มีชวงคะแนนต่ํากวาทั้งหมด ( หรือสูงกวาทั้งหมด ) ตัวอยางที่ 3 ขอมูลสวนสูง (เซนติเมตร) ของพนักงานคนงานโรงงานแหงหนึ่ง จํานวน 40 คนมีดังนี้ 142 145 160 174 146 154 152 157 185 158 164 148 154 166 154 175 144 138 174 168 152 160 141 148 152 145 148 154 178 156

120

166 164 130 158 162 159 180 136 135 172 เมื่อนํามาแจกแจงความถี่ไดดังนี้

หมายเหตุ ความถี่สะสมของอันตรภาคชั้นสุดทายจะเทากับผลรวมของความถี่ทั้งหมดและสิ่งที่ควรทราบ ตอไปไดแก ขีดจํากัดลาง ขีดจํากัดบนและจุดกึ่งกลางชัน้ 1.5 การแจกแจงความถี่สัมพัทธ ความถี่สัมพัทธ ( Relative frequency ) หมายถึง อัตราสวนระหวางความถี่ของอันตรภาค ชั้นนั้นกับผลรวมของความถี่ทั้งหมด ซึ่งสามารถแสดงในรูปจุดทศนิยม หรือรอยละก็ได ตัวอยางที่ 4 การแจกแจงความถี่สัมพัทธของสวนสูงนักศึกษา

หมายเหตุ ผลรวมของความถี่สัมพัทธตองเทากับ 1 และคารอยละความถี่สัมพัทธตองเทากับ 100 ดวย

121

1.6 การแจกแจงความถี่สะสมสัมพัทธ ความถี่สะสมสัมพัทธ ( Relative commulative frequency ) ของอันตภาคใด คือ อัตราสวนระหวางความถี่สะสมของอันตรภาคชั้นนั้นกับผลรวมของความถี่ทั้งหมด ตัวอยางที่ 5 การแจกแจงความถี่สะสมสัมพัทธของสวนสูงนักศึกษา

1.7 ขีดจํากัดชั้น ( Class limit ) หมายถึง ตัวเลขที่ปรากฏอยูในอันตรภาคชั้น แบงเปนขีดจํากัดบน และขีดจํากัดลาง ( ดูตารางในตัวอยางที่ 5 ประกอบ) 1.1 ขีดจํากัดบนหรือขอบบน ( Upper boundary ) คือ คากึ่งกลางระหวางคะแนนที่มาก ที่สุดในอันตรภาคชั้นนั้นกับคะแนนนอยที่สุดของอันตรภาคชั้นที่ติดกันในชวงคะแนนที่สูงกวา เชน อันตรภาคชั้น 140 -149 ขอบบน =

149  150  149.5 2

นั่นคือ ขีดจํากัดบนของอันตรภาคขั้น 140 – 149 คือ 149.5 1.2 ขีดจํากัดลางหรือขอบลาง ( Lower boundary ) คือ คากึ่งกลางระหวางคะแนนที่ นอยที่สุดในอันตรภาคชั้นนั้นกับคะแนนที่มากที่สุดของอันตรภาคชั้นที่อยูติดกันในชวงคะแนนที่ต่ํา กวา เชน ตัวอยางอันตรภาคชั้น 140 – 149 ขอบลาง =

140  139

 139.5

2

นั่นคือ ขีดจํากัดลางของอันตภาคขั้น 140 – 149 คือ 139.5

122

ตัวอยางที่ 6 การแจกแจงความถี่ของสวนสูงนักศึกษา ความสูง (ซม.) ความถี่ ความถี่สะสม ขีดจํากัดลาง 180 – 189 2 40 179.5 170 – 179 5 38 169.5 160 – 169 8 33 159.5 150 – 159 12 25 149.5 140 – 149 9 13 139.5 130 – 139 4 4 129.5 รวม 40

ขีดจํากัดบน 189.5 149.5 * 169.5 159.5 ** 149.5 * 139.5

จุดกึ่งกลางชั้น 184.5 174.5 164.5 154.5 144.5 134.5

1.8 จุดกึ่งกลางชั้น ( Mid point ) เปนคาหรือคะแนนที่อยูระหวางกลางของอันตรภาคชั้นนัน้ ๆ เชน อันตรภาคชั้น 150 -159 จุดกึ่งกลางของอันตรภาคชัน้ ดังกลาว 150  159  154.5 เปนตน 2 นอกจากนี้ยังสามารถแสดงการแจกแจงความถีข่ องขอมูลโดยใชฮิสโทแกรม (Histogram ) รูปหลายเหลี่ยมของความถี่ (Frequency polygon ) เสนโคงของความถี่ (Frequency curve )