Data Loading...

สถิติเบื้องต้นedit Flipbook PDF

สถิติเบื้องต้นedit


259 Views
174 Downloads
FLIP PDF 561.9KB

DOWNLOAD FLIP

REPORT DMCA

ค33101 สถิติเบื้องต้น | หน้าที่ 1

1. แนวคิดพื้นฐานทางสถิติ The Basic Idea of Statistics คําว่า “สถิติ” มีความหมาย 2 ประการ คือ 1. ตัวเลขสถิติ (Statistics) หมายถึงจํานวนหรือค่าที่ได้จากการรวบรวมข้อมูล แสดงถึงข้อเท็จจริงของสิ่งต่างๆ อย่างมีความหมาย เช่น ค่าเฉลี่ยของคะแนนวิชา คณิตศาสตร์ของนักเรียน ม.6 ภาคเรียนที่ 2 ปีการศึกษา 2561 2. วิชาสถิติหรือสถิติศาสตร์ (Statistics) หมายถึงศาสตร์ว่าด้วยระเบียบวิธีทาง สถิติ ซึ่งประกอบด้วย 4 ขั้นตอน คือ การเก็บรวบรวมข้อมูล การนําเสนอข้อมูล การ วิเคราะห์ข้อมูล และการแปลความหมายข้อมูล

ประเภทของสถิติ ในวิชาสถิติ แบ่งสถิติออกเป็น 2 ประเภทใหญ่ๆ คือ สถิติพรรณนา และสถิติอนุมาน 1. สถิติพรรณนา (Descriptive statistics) หรือเรียกอีกอย่างหนึ่งว่า “สถิติบรรยาย” เป็นสถิติที่มุ่งศึกษาเพื่อ อธิบายเรื่องราวต่างๆ ของกลุ่มประชากร (Population) กลุ่มใดกลุ่มหนึ่งโดยเฉพาะอาจเป็นกลุ่มใหญ่หรือกลุ่มเล็กก็ได้ โดย ทําการเก็บรวบรวมข้อมูลจากสมาชิกทุกหน่วยในกลุ่มประชากรนั้น ผลการศึกษาใช้อธิบายหรือสรุปเกี่ยวกับเรื่องราวของกลุ่ม ที่ศึกษาเท่านั้น ไม่สามารถนําผลการศึกษาไปสรุปอ้างอิงถึงกลุ่มอื่นๆ ที่ไม่ได้ศึกษา ตัวอย่าง เช่น ฝ่ายแนะแนวของโรงเรียนมหิดลวิทยานุสรณ์ การวัดสติปัญญา (I.Q.) ของนักเรียนชั้นมัธยมศึกษาปี ที่ 5 ทุกคนของโรงเรียนนี้ ได้ค่าเฉลี่ยเท่ากับ 115 เป็นค่าเฉลี่ยของนักเรียนชั้นมัธยมศึกษาปีที่ 6 ของโรงเรียนนี้เท่านั้น จะ สรุปว่านักเรียนชั้นมัธยมศึกษาปีที่ 6 ของโรงเรียนอื่นหรือของจังหวัด มีระดับสติปัญญาเฉลี่ยเท่ากับ 115 ด้วยไม่ได้ สถิติพรรณนา มีหลายชนิด ได้แก่ 1.1 สถิติพื้นฐาน เช่น ความถี่ สัดส่วน ร้อยละ 1.2 การวัดตําแหน่ง เช่น อันดับที่ ควอไทล์ เดไซล์ เปอร์เซ็นไทล์ 1.3 การวัดแนวโน้มเข้าสู่ส่วนกลาง เช่น ฐานนิยม มัธยฐาน ค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยเรขาคณิต ค่าเฉลี่ยฮาร์โมนิค 1.4 การวัดการกระจาย เช่น พิสัย พิสัยควอไทล์ ส่วนเบี่ยงเบนเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวน สัมประสิทธิ์กระจาย 1.5 การวัดความสัมพันธ์ เช่น สัมประสิทธิ์ถดถอย ค่าต่างๆ ที่คํานวณได้จากข้อมูล ที่เก็บรวบรวมจากสมาชิกทุกๆ หน่วยของกลุ่มประชากร เรียกว่า ค่าแท้ หรือค่า พารามิเตอร์ (Parameter) มีคุณสมบัติเป็นค่าคงที่ (Constant) 2. สถิติอ้างอิง (Inferential statistics) หรือที่เรียกอีกอย่างหนึ่งว่า สถิติอนุมาน เป็นสถิติที่มุ่งศึกษาเพื่อหา ข้อสรุปเรื่องราวของประชากร โดยเก็บรวบรวมข้อมูลจากกลุ่มย่อยที่เรียกว่า กลุ่มตัวอย่าง (Sample) แล้วนําผลการศึกษาไป สรุปอ้างอิงถึงกลุ่มใหญ่ที่เรียกว่า กลุ่มประชากร (Population) ซึ่งเป็นกลุ่ม เป้าหมายที่ต้องการศึกษา ค่าต่างๆ ที่คํานวณได้จากข้อมูลที่เก็บรวบรวมจากกลุ่มตัวอย่าง เรียกว่า ค่าสถิติ (Statistic) มีคุณสมบัติเป็น ตัวแปร (Variable) สถิติอ้างอิงแบ่งออกเป็น 2 ประเภท คือ การประมาณค่าและการทดสอบสมมติฐาน 2.1 การประมาณค่า (Estimation) เป็นการประมาณค่าแท้ของประชากร เรียกว่าค่าพารามิเตอร์ (Parameter) โดยใช้ค่าสถิติ (Statistic) ที่ได้จากกลุ่มตัวอย่าง 2.2 การทดสอบสมมติฐาน (Testing Statistical Hypothesis) เป็นการทดสอบสมมติฐานทางสถิติ เพื่อสรุป อ้างอิงค่าสถิติต่างๆ ไปยังกลุ่มประชากร กล่าวได้อีกอย่างหนึ่งว่า เป็นการทดสอบความมีนัยสําคัญทางสถิติ

ค33101 สถิติเบื้องต้น | หน้าที่ 2

ความหมายของคําที่เกี่ยวข้องกับวิชาสถิติ ประชากร (Population) หมายถึงกลุ่มของสมาชิกทุกหน่วยที่เราต้องการศึกษาลักษณะ (Characteristics) บางอย่าง ตัวอย่างเช่น ถ้าต้องการศึกษาอายุการใช้งานของหลอดไฟในโรงงานแห่งหนึ่ง ประชากร คือ จํานวนหลอดไฟ ทั้งหมดในโรงงานนี้นั้นเอง พารามิเตอร์ (Parameter) หมายถึง ตัวเลขซึ่งแสดงคุณสมบัติบางประการของประชากร ตัวอย่างเช่น ค่าเฉลี่ย ของประชากร (  ) ความแปรปรวนของประชากร (  ) ค่าส่วนเบี่ยงเบนมาตรฐานของประชากร (  ) เป็นต้น ตัวอย่าง (Sample) หมายถึง กลุ่มย่อยของสมาชิกในกลุ่มประชากรที่เลือกมาเพื่อศึกษาลักษณะที่สนใจ เช่น ศึกษาอายุการใช้งานหลอดไฟ อาจจะสุ่มตัวอย่างหลอดไฟฟ้ามา 20 หลอด จากทั้งหมด 1000 หลอดในโรงงานนั้น เป็นต้น ค่าสถิติ (Statistic) หมายถึง การวัดผลที่ได้จากตัวอย่าง ซึ่งพรรณนาลักษณะของตัวอย่าง เช่น ค่าเฉลี่ยของ ตัวอย่าง ( x ) ค่าความแปรปรวนของตัวอย่าง ( s ) ค่าส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง ( s ) เป็นต้น ข้อมูล (Data) หมายถึง ข้อเท็จจริงที่เป็นตัวเลขหรือข้อความที่รวบรวมมาได้จากเรื่องที่เรากําลังศึกษา ตัวแปร (Variable) หมายถึง ลักษณะของประชากรที่เราสนใจวิเคราะห์ โดยลักษณะนั้นๆ สามารถเปลี่ยนค่าได้ เช่น เพศ คะแนนสอบ 2

2

ประโยชน์ของสถิติ 1. 2. 3. 4.

เป็นสิ่งชี้ให้เห็นถึงข้อเท็จจริงของเหตุการณ์ และเรื่องราวที่สนใจอยู่ เป็นเครื่องมือในการวางแผนงานของโครงการและกิจการต่างๆ เป็นระเบียบวิธีสําหรับการวิเคราะห์ในงานวิจัยโดยทั่วๆ ไป เป็นเครื่องมือในการประเมินผลงานที่ได้ทําไปแล้ว

แผนภูมิแสดงมโนทัศน์เกี่ยวกับสถิติพรรณนาและสถิติอ้างอิง สถิติพรรณนา ประชากร (Population)

วัดค่าตัวแปร

สุ่มตัวอย่าง ตัวอย่าง (Sample)

พารามิเตอร์ (Parameter) เช่น  , 2 , 

ประมาณค่า ทดสอบสมติฐาน วัดค่าตัวแปร

ค่าสถิติ (Statistic) เช่น x , s , s 2

สถิติอ้างอิง

ค33101 สถิติเบื้องต้น | หน้าที่ 3

2. การเก็บรวบรวมข้อมูล Collecting Data Sensibly ข้อมูล หมายถึง ข้อความจริงซึ่งอาจเป็นตัวเลขหรืออาจไม่ใช่ตัวเลขก็ได้ การทําความเข้าใจข้อมูลที่เก็บรวบรวมมา ได้นั้นมีความสําคัญมาก เพราะจะนําไปสู่รูปแบบการวิเคราะห์ข้อมูล ดังนั้นหากพิจารณาถึงข้อดีข้อด้อยของข้อมูลทั้งสอง ประเภท กล่าวคือ ข้อมูลเชิงปริมาณ เป็นข้อมูลที่บอกลักษณะด้วยตัวเลขได้ดี มีข้อดี คือ เข้าใจง่าย สะดวก เนื่องจากเรา สามารถตีความได้ตามตัวเลข ส่วนข้อด้อย คือ อาจเกิดความคลาดเคลื่อนได้จากตัวเลข จากวิธีเก็บรวบรวม จากลักษณะของ ตัวเลขเองที่มีรูปแบบและขนาด รวมถึงหน่วยที่แตกต่างกัน ข้อมูลเชิงคุณภาพ เป็นข้อมูลที่บอกลักษณะทางธรรมชาติของ สังคมซึ่งมีความเกี่ยวโยงกันมากมาย ข้อดี คือ สามารถอธิบาย สะท้อนความคิด ความรู้สึกมีรายละเอียดมากผสมผสานกันเป็น ส่วนเดียวกัน หรืออาจจะแยกเป็นประเด็นต่างๆ ขึ้นอยู่กับเป้าหมายที่ต้องการ สามารถใช้ข้อมูลที่มีอยู่ในสภาพปกติ เช่น ระเบียบ ภาพถ่าย เทปบันทึกเสียง เทปบันทึกภาพ และบันทึกเอกสารต่างๆ ประกอบได้ ส่วนข้อด้อย ถ้าผู้สนใจศึกษามีอคติ จะขาดความตรงและความเชื่อมั่น ไม่มีแบบตายตัว ขึ้นอยู่กับความสามารถของผู้วิจัย อาจจะใช้เวลาในการเก็บรวบรวมข้อมูล นานและวิเคราะห์ข้อมูลได้ยาก

2.1 ประเภทของข้อมูล จําแนกประเภทตามวิธีการเก็บรวบรวมแบ่งเป็น 2 ประเภท 1. ข้อมูลปฐมภูมิ คือข้อมูลที่ผู้ใช้จะต้องเก็บรวบรวมจากผู้ให้ข้อมูล หรือแหล่งที่มาของข้อมูลโดยตรง 2. ข้อมูลทุติยภูมิ คือข้อมูลที่ผู้ใช้ไม่ต้องเก็บรวบรวมจากผู้ให้ข้อมูลหรือแหล่งที่มาของข้อมูลโดยตรง แต่ได้มาจากข้อมูลที่ ผู้อื่นเก็บรวบรวมไว้แล้ว จําแนกตามลักษณะของข้อมูลมี 2 ลักษณะ 1. ข้อมูลเชิงปริมาณ คือข้อมูลที่ใช้แทนขนาดหรือปริมาณซึ่ง วัดออกมาเป็นค่าตัวเลขที่สามารถนํามาใช้เปรียบเทียบ ขนาดได้โดยตรง 2. ข้อมูลเชิงคุณภาพ คือข้อมูลที่ไม่สามารถวัดออกมาเป็นค่า ตัวเลขได้โดยตรง แต่วัดออกมาในเชิงคุณภาพได้

2.2 วิธีเก็บรวบรวมข้อมูล การเก็บรวบรวมข้อมูลปฐมภูมิ มี 2 วิธีคือ การสํามะโน ซึ่งอาจทําได้โดย  การสัมภาษณ์  การสอบถามทางไปรษณีย์  การสอบถามทางโทรศัพท์  การสังเกต  การทดลอง การสํารวจจากกลุ่มตัวอย่าง การเลือกตัวอย่างจากประชากรอาจทําได้โดย  เลือกตัวอย่างชนิดที่ไม่ทราบโอกาส หรือความน่าจะเป็นที่แต่ละหน่วยถูกเลือกขึ้นมาเป็นตัวอย่าง  เลือกตัวอย่างชนิดที่ทราบโอกาส หรือความน่าจะเป็นที่แต่ละหน่วยถูกเลือกขึ้นมาเป็นตัวอย่าง การเก็บรวบรวมข้อมูลทุติยภูมิ ควรดําเนินการดังนี้  พิจารณาตัวบุคคลผู้เขียนรายงาน บทความว่า มีความรู้เชี่ยวชาญเรื่องใด  ควรรวบรวมข้อมูลจากหลายๆ แหล่ง เพื่อเปรียบเทียบและกันความผิดพลาด  พิจารณาจากลักษณะของข้อมูลที่ต้องการเก็บรวบรวมว่าเป็นข้อมูลที่เป็นความจริง หรือความเห็น  ถ้าข้อมูลที่จะเก็บรวบรวมได้มาจากการสํารวจตัวอย่างหรือต้องผ่านการวิเคราะห์มาแล้ว ควรพิจารณาถึงวิธีการ ที่ใช้ว่าเหมาะสมหรือไม่

ค33101 สถิติเบื้องต้น | หน้าที่ 4

แบบฝึกทักษะ 2 1. ข้อมูลต่อไปนี้เป็นข้อมูลเชิงปริมาณหรือข้อมูลเชิงคุณภาพ a. คะแนนสอบวิชาคณิตศาสตร์ b. จํานวนผู้โดยสารที่รอรถ c. เลขทะเบียนรถ d. หมายเลขโทรศัพท์ e. ราคาข้าวสารต่อกิโลกรัม f. หมายเลขประจําตัวนักเรียน g. ขนาดรองเท้าของนักเรียน h. รายได้ของคนในครอบครัว 2. “สํานักวิจัยโรงเรียนมหิดลวิทยานุสรณ์เปิดเผยว่า ผลการสํารวจความคิดเห็นของประชากรในจังหวัดนครปฐมต่อการ ยอมรับมาตรการประหยัดน้ํามัน พบว่าส่วนใหญ่ยอมรับที่จะปฏิบัติตามมาตรการเหล่านั้น” จากข้อความข้างต้น a. กลุ่มประชากรคือ b. กลุ่มตัวอย่างคือ 3. จงพิจารณาว่าควรใช้วิธีในการเก็บข้อมูลต่อไปนี้ a. รายได้เฉลี่ยต่อครัวเรือนของคนในจังหวัดนครปฐม b. จํานวนผู้ใช้บริการห้องสมุดโรงเรียนมหิดลวิทยานุสรณ์ c. ผลการเคลือบฟลูออไรด์บนผิวฟันที่มีผลต่อการป้องกันฟันผุ d. การเปรียบเทียบประสิทธิภาพของยาแก้ปวด e. การสํารวจความคิดเห็นกรณีคลื่นยักษ์ถล่มภาคใต้

ค33101 สถิติเบื้องต้น | หน้าที่ 5

3. การนําเสนอข้อมูล Graphical Methods for Describing Data ข้อมูลที่เก็บรวบรวมมาได้ และยังมิได้มีการจัดหมวดหมู่ข้อมูลชนิดนี้เรียกว่า ข้อมูลดิบ (Raw Data) ข้อมูลดิบเหล่านี้ ถ้ามีจํานวนมากเราจะไม่สามารถมองเห็นลักษณะของข้อมูลได้จึงต้องมีการจัดเตรียมข้อมูลดิบให้เป็นหมวดหมู่ ถ้าข้อมูลดิบมี จํานวนน้อย ก็ใช้วิธีเรียงข้อมูลจากมากไปหาน้อย หรือจากน้อยไปหามาก ข้อมูลที่เรียงลําดับแบบนี้ เรียกว่า Ungrouped Data แต่ถ้าข้อมูลดิบมีจํานวนมาก ต้องใช้วิธี การแจกแจงความถี่ (Frequency Distribution) การแจกแจงความถี่ เป็นการจัดเรียงลําดับข้อมูลดิบที่เก็บรวบรวมมาได้ โดยจัดให้เป็นหมวดหมู่ แล้วหาจํานวนของ ข้อมูลในแต่ละหมู่ ข้อมูลที่หาได้โดยวิธีการนี้ เรียกว่า ข้อมูลที่เป็นหมวดหมู่ (Grouped Data) รูปแบบของการแจกแจงความถี่ สามารถทําได้ 2 รูปแบบ คือแบบใช้ตาราง และแบบใช้แผนภูมิหรือกราฟ การแจกแจงความถี่แบบตาราง  ตารางแจกแจงความถี่ (Frequency Distribution)  ตารางแจกแจงความถี่สะสม (Cumulative Frequency Distribution)  ตารางแจกแจงความถี่สัมพัทธ์ (Relative Frequency Distribution)  ตารางแจกแจงความถี่สะสมสัมพัทธ์ (Relative Cumulative Frequency Distribution) การแจกแจงความถี่แบบใช้แผนภูมิหรือกราฟ  ฮิสโทแกรม (Histogram)  รูปหลายเหลี่ยมของความถี่ (Frequency Polygon)  โค้งความถี่ (Frequency Curves)  โค้งความถี่สะสม (Cumulative Frequency หรือ Ogive Curve)  แผนภาพต้น-ใบ (Stem-and-Leaf Plot หรือ Stem Plot)

3.1 การแจกแจงความถี่แบบตาราง (Frequency Distribution) ลักษณะของตารางแจกแจงความถี่โดยทั่วไป ประกอบด้วย ข้อมูล รอยขีด และความถี่ดังตัวอย่างต่อไปนี้ ตัวอย่างที่ 1 ในการทดสอบย่อยครั้งที่ 1 วิชาคณิตศาสตร์ ซึ่งมีคะแนนเต็ม 10 คะแนน มีนักเรียน 10 คน โดยได้คะแนน

ดังนี้ 5, 5, 0, 9, 2, 7, 8, 10, 8 และ 3 หากนํามาเขียนในรูปตารางแจกแจงความถี่สําหรับทุกค่าของคะแนนที่ เป็นไปได้ทั้ง 11 ค่าเป็นดังนี้ x f

จากตาราง

(คะแนน) (ความถี่)

0

ตัวแปร คือ ค่าจากการสังเกต คือ ค่าที่เป็นไปได้ คือ

1

2

3

4

5

6

7

8

9

10

ค33101 สถิติเบื้องต้น | หน้าที่ 6

ตัวอย่างที่ 2 คะแนนจากการสอบวิชาคณิตศาสตร์ของนักเรียน 60 คน ซึ่งมีคะแนนเต็ม 30 คะแนน เป็นดังนี้

28 22 20 17 16 25 18 22 19 22 22 21 19 27 27 25 28 26 21 18 24 21 24 22 24 28 16 23 22 25 24 22 17 28 24 27 23 22 22 29 21 21 26 27 28 24 28 16 จากข้อมูลข้างต้นสามารถสรุปให้กะทัดรัดได้โดยใช้ตารางแจกแจงความถี่ ดังนี้ คะแนน 16 17 18 19 20 21 22 23 24 25 26 27 28 29 รวม

รอยขีด (รอยคะแนน)

28 23 20 25 16 23

17 24 22 21 20 22

ความถี่

จากตารางแจกแจงความถี่ข้างต้นทั้ง 2 ตัวอย่าง จะเห็นว่าไม่ค่อยมีประโยชน์ต่อการวิเคราะห์ข้อมูลมากนัก การ แจกแจงความถี่ทุกค่าของข้อมูลทําให้เสียเวลา และยากที่จะสรุปผล ดังนั้นแทนที่จะแจกแจงความถี่ของทุกข้อมูล สามารถ สร้างตารางแจกแจงความถี่ได้อีกลักษณะหนึ่งโดยการจัดข้อมูลที่ใกล้เคียงกันเป็นหมู่หรือเป็นชั้น (Group or Class) ช่วงกว้าง ของข้อมูลในแต่ละชั้น เรียกว่า อันตรภาคชั้น (Class Interval) ตัวอย่างที่ 3 คะแนนการทดสอบวิชาคณิตศาสตร์ของนักเรียน 60 คน ซึ่งมีคะแนนเต็ม 100 คะแนน เป็นดังนี้

คะแนน 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 รวม

รอยขีด (รอยคะแนน) || |||| |||| |||| |||| |||| |||| ||| |

||| |||| |||| |||| |||| | |

ความถี่ 2 4 8 10 15 11 6 3 1 60

ค33101 สถิติเบื้องต้น | หน้าที่ 7

จากตาราง จะได้ว่าข้อมูลชุดนี้มี 9 อันตรภาคชั้น โดยอันตรภาคชั้นที่ 2 มีช่วงคะแนน 50 - 54 เรียกค่าทั้ง 2 นี้ ว่าขีดจํากัดล่างและขีดจํากัดบน ในชั้นนี้มีความถี่ หรือจํานวน นักเรียน 4 คน โดยมีคะแนนตั้งแต่ 49.5 ถึง 54.5 คะแนน เรา เรียกค่าทั้งสองนี้ว่า ขอบเขตล่างและขอบเขตบน

3.1.1 วิธีการสร้างตารางแจกแจงความถี่ 1. หาค่าพิสัย โดยคํานวณจาก พิสัย = ข้อมูลสูงสุด - ข้อมูลต่ําสุด 2. กําหนดจํานวนชั้นของข้อมูลตามความเหมาะสม 3. คํานวณหาค่าความกว้างของอันตรภาคชั้น จากสูตร ความกว้างของอันตรภาคชั้นเท่ากับพิสัยหารด้วยจํานวนชั้น กําหนดความกว้างของอันตรภาคชั้นเป็นจํานวนเต็มโดยปัดขึ้นเสมอ (ถ้าหารลงตัวให้บวกเพิ่ม 1 เสมอ) 4. ตีตาราง 3 ช่อง ประกอบด้วย ข้อมูลหรืออันตรภาคชั้น รอยขีดและความถี่ 5. เขียนอันตรภาคชั้นของแต่ละชั้น โดยอาศัยความกว้างของอันตรภาคชั้นเป็นเครื่องช่วยจะเริ่มจากชั้นข้อมูลค่า ต่ําสุด หรือชั้นข้อมูลค่าสูงสุดก็ได้ โดยมีหลักว่าขีดจํากัดล่างของชั้นข้อมูลค่าต่ําสุดและขีดจํากัดบนของชั้นข้อมูล ค่าสูงสุดจะต้องคลุมค่าของข้อมูลทั้งหมด 6. ตรวจดูว่าข้อมูลแต่ละตัวอยู่ในอันตรภาคชั้นใด แล้วขีดรอยขีดให้ตรงกับชั้นนั้นตัวละขีด 7. นับจํานวนรอยขีดใส่ในช่องความถี่ ตัวอย่างที่ 4 คะแนนจากการสอบของนักเรียน 60 คน เป็นดังนี้ 38 22 20 17 16 25 18 22 28 17 19 22 22 31 19 27 37 25 23 44 28 36 41 18 24 21 24 22 20 32 24 28 16 23 22 35 24 42 25 31 17 28 24 27 23 22 22 39 16 20 21 21 26 27 28 24 28 16 23 22 จงสร้างตารางแจกแจงความถี่ให้มีจํานวนชั้น 5 ชั้น วิธีทํา 1. พิสัย คือ 2. จํานวนชั้น 5 ชั้น 3. ความกว้างของอันตรภาคชั้น คือ คะแนน

รอยขีด

จํานวนคน

รวม

ในการกําหนดจํานวนและความกว้างของอันตรภาคชั้นมีข้อสังเกตดังนี้ 1. ความกว้างของแต่ละอันตรภาคชั้นไม่จําเป็นต้องเท่ากันหมด ขึ้นอยู่กับวัตถุประสงค์ของการใช้ข้อมูล 2. ค่าที่สังเกตได้บางค่าอาจต่างไปจากค่าอื่นมาก เช่น ในการสอบครั้งหนึ่งมีผู้สอบได้ 2 คะแนน ในขณะที่คนอื่น ได้คะแนน มากกว่า 50 คะแนน ควรกําหนดอันตรภาคชั้นแรกเป็นอันตรภาคชั้นเปิด (Open-Ended Class Interval) 3. การกําหนดจํานวนอันตรภาคชั้นในการสร้างตารางแจกแจงความถี่ไม่มีกฎเกณฑ์แน่นอนตายตัว ขึ้นอยู่กับ ลักษณะการกระจายของข้อมูล รายละเอียดของข้อมูลที่ต้องการทราบด้วย เช่น ถ้าค่าที่สังเกตได้มีความ แตกต่างกันมาก มักจะกําหนดให้มีอันตรภาคชั้นน้อย เพื่อไม่ให้มีอันตรภาคชั้นที่มีความถี่เป็นศูนย์ หรือหาก ต้องการทราบรายละเอียดของข้อมูลอย่างละเอียด ก็ควรกําหนดให้มีจํานวนอันตรภาคชั้นมาก โดยทั่วไปนิยม ใช้อยู่ 7-15 ชั้น

ค33101 สถิติเบื้องต้น | หน้าที่ 8

ตัวอย่างที่ 5 ตารางแสดงจํานวนผู้ป่วยในเขตตําบลศาลายา พ.ศ. 2554 จําแนกตามระยะเวลาป่วย

ระยะเวลาป่วย (วัน) จํานวนผู้ป่วย น้อยกว่า 8 วัน 441,250 8 - 14 50,650 15 - 28 12,560 29 - 42 8,720 มากกว่า 42 22,110 ไม่ทราบข้อมูล 7,850 รวม 543,140 จากตัวอย่าง จะเห็นได้ชัดว่าความกว้างของแต่ละอันตรภาคชั้นไม่เท่ากัน และมีอันตรภาคชั้นเปิด ตัวอย่างที่ 6 จากการสอบถามข้อมูลเกี่ยวกับจํานวนชั่วโมงเฉลี่ยของการทํางานในหนึ่งสัปดาห์ของคนจํานวน 24 คน ดังนี้

35.0 48.0 45.0 43.0 38.2 50.0 39.8 40.0 50.0 35.4 38.8 40.2 45.0 45.0 43.0 48.0 43.3 53.1 35.6 41.1 34.8 จงสร้างตารางแจกแจงความถี่ให้มีจํานวน 5 อันตรภาคชั้น รอยขีด ความถี่ จํานวนชั่วโมง 30.0 - 34.9

40.7 40.0 51.0

รวม ตัวอย่างที่ 7 จากตัวอย่างข้างต้น ค่าที่สังเกตได้มีจุดทศนิยมอยู่ด้วย การกําหนดอันตรภาคชั้นอาจกําหนดให้อยู่ในช่วงดังนี้

จํานวนชั่วโมง (x) 30 < x < 35

รวม

ความถี่

ค33101 สถิติเบื้องต้น | หน้าที่ 9

3.1.2 ตารางแจกแจงความถี่สะสม (Cumulative Frequency Distribution) ความถี่สะสม (Cumulative Frequency) คือผลรวมของความถี่ของค่านั้นหรือของอันตรภาคชั้นนั้น กับความถี่ ของค่า หรือของอันตรภาคชั้นที่มีช่วงคะแนนต่ํากว่าทั้งหมด (หรือสูงกว่าทั้งหมดอย่างใดอย่างหนึ่ง) ตัวอย่างที่ 8 จากตารางแจกแจงความถี่ของคะแนนการทดสอบวิชาคณิตศาสตร์ของนักเรียน 60 คน ซึ่งมีคะแนนเต็ม

100 คะแนน (ตัวอย่างที่ 3) จงสร้างตารางแจกแจงความถี่สะสม คะแนน 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 รวม

ความถี่ 2 4 8 10 15 11 6 3 1 60

ความถี่สะสม

3.1.3 ตารางแจกแจงความถี่สัมพัทธ์ (Relative Frequency Distribution) ความถี่สัมพัทธ์ (Relative Frequency) คืออัตราส่วนระหว่างความถี่ของค่านั้น หรือของอันตรภาคชั้นนั้นกับ ผลรวมของความถี่ทั้งหมด อาจอยู่ในรูปเศษส่วน ทศนิยมหรือร้อยละ วัตถุประสงค์ในการสร้างเพื่อหาว่าความถี่ของแต่ละ ค่าที่เป็นไปได้ หรือของแต่ละอันตรภาคชั้นมีจํานวนมากน้อยเพียงใดเมื่อเทียบกับความถี่ทั้งหมด ตัวอย่างที่ 9 จากตารางแจกแจงความถี่ของคะแนนการทดสอบวิชาคณิตศาสตร์ของนักเรียน 60 คน ซึ่งมีคะแนนเต็ม

100 คะแนน (ตัวอย่างที่ 3) จงสร้างตารางแจกแจงความถี่สัมพัทธ์ และร้อยละของความถี่สัมพัทธ์ คะแนน 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 รวม

ความถี่ 2 4 8 10 15 11 6 3 1 60

ความถี่สมั พัทธ์

ร้อยละของความถี่สมั พัทธ์

ค33101 สถิติเบื้องต้น | หน้าที่ 10

3.1.4 ตารางแจกแจงความถี่สะสมสัมพัทธ์ (Relative Cumulative Frequency Distribution) ความถี่สะสมสัมพัทธ์ (Relative Cumulative Frequency) คืออัตราส่วนระหว่างความถี่สะสมของค่านั้นหรือของ อันตรภาคชั้นนั้นกับผลรวมของความถี่ทั้งหมด ซึ่งอาจแสดงในรูปเศษส่วน ทศนิยมหรือร้อยละ ตารางนี้ใช้เพื่อหาว่าแต่ละ ค่าที่เป็นไปได้หรือแต่ละอันตรภาคชั้นที่มีความถี่สะสมเป็นจํานวนมากน้อยเพียงใดเมื่อเทียบกับความถี่ทั้งหมด ตัวอย่างที่ 10 จากตารางแจกแจงความถี่ของคะแนนการทดสอบวิชาฟิสิกส์ของนักเรียน 50 คน ซึ่งมีคะแนนเต็ม 50 คะแนน

จงสร้างตารางแจกแจงความถี่สะสมสัมพัทธ์ และร้อยละของความถี่สะสมสัมพัทธ์ คะแนน

ความถี่

0 < x