Data Loading...
บทที่12(สถิติไม่อิงพารามิเตอร์) Flipbook PDF
บทที่12(สถิติไม่อิงพารามิเตอร์)
840 Views
209 Downloads
FLIP PDF 1.08MB
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
12
หน้าที่ - 321 -
สถิติไม่อิงพารามิเตอร์ (Nonparametric Statistics)
โวลโฟวิท (Wolfowitz) เป็นบุคคลแรกที่ได้นาสถิติไม่อิงพารามิเตอร์มาใช้ในปี คศ. 1942 สถิติประเภทนี้บางครั้งเรียกว่า สถิติการแจกแจงอิสระ(Distribution-Free Statistics) นั่นคือ ในการทดสอบจะไม่คานึงถึงลักษณะการแจกแจงของประชากรว่าจะมีลักษณะเช่นไร การทดสอบ สมมติฐานจะไม่เกี่ยวข้องกับพารามิเตอร์ของประชากร เช่นการทดสอบไคสแควร์ใช้ทดสอบเกี่ยวกับ ภาวะสารรูปสนิทดี(goodness of fit) ความเป็นอิสระ(independence) และความเป็นอันหนึ่งอัน เดียวกัน(homogeneous) นอกจากนี้แล้วสถิติไม่อิงพารามิเตอร์ยังสามารถใช้ได้กับข้อมูลที่มีการวัด ระดับต่าสุด คือ ระดับมาตรานามบัญญัติ ความแตกต่างในการใช้สถิติอิงพารามิเตอร์กบั สถิติไม่อิงพารามิเตอร์ การใช้สถิติอิงพารามิเตอร์ทดสอบสมมติฐาน โดยทั่วไปมีข้อตกลงเบื้องต้นที่สาคัญดังนี้ 1. การแจกแจงของประชากรเป็นแบบปกติ 2. ความแปรปรวนของข้อมูลแต่ละประชากรที่ศึกษามีค่าเท่ากัน 3. ระดับการวัดของตัวแปรเป็นระดับอันตรภาค (Interval scale) ขึ้นไป สาหรับการใช้สถิติไม่อิงพารามิเตอร์ทดสอบสมมติฐาน มีลักษณะดังนี้ 1. การแจกแจงของประชากรไม่จาเป็นต้องเป็นแบบปกติ 2. สามารถใช้ได้กับกรณีที่ตัวอย่างมีขนาดเล็ก 3. ระดับการวัดของตัวแปรเป็นมาตราเรียงอันดับ (Ordinal scale) หรือมาตราแบบ ช่วง (Interval scale) หรือมาตรา อัตราส่วน (Ratio scale) ที่สามารถนามาจัดอันดับที่ (Rank) ได้ หรือเป็นเพียงมาตรานามบัญญัติ (Nominal scale) ที่สามารถนับเป็นความถี่ได้ 12.1 ข้อดีข้อเสียของสถิติไม่อิงพารามิเตอร์ ข้อดี 1. สามารถใช้ได้กับข้อมูลที่มีระดับการวัดต่า ตั้งแต่มาตรานามบัญญัติที่สามารถนับเป็น ความถี่ได้ มาตราเรียงอันดับหรือตัวเลขใด ๆ ที่สามารถนามาจัดอันดับที่ได้ 2. สามารถใช้ได้ผลดีกับกลุ่มตัวอย่างที่มีขนาดเล็ก โดยให้ผลดีและมีความถูกต้องมาก กว่าเมื่อเปรียบเทียบกับการใช้สถิติอิงพารามิเตอร์ในกลุ่มตัวอย่างขนาดเดียวกัน
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 322 -
3. สูตรต่าง ๆ เรียนรู้และเข้าใจง่ายไม่ซับซ้อนเหมือนสถิติอิงพารามิเตอร์ 4. คานวณได้ง่ายไม่ยุ่งยากซับซ้อน สามารถคานวณได้รวดเร็วโดยใช้วธิ ีการทางคณิตศาสตร์อย่างง่าย ๆ เช่น การจัดลาดับ การนับ การบวก การลบ 5. มีเงื่อนไขการใช้ภายใต้ข้อตกลงเบื้องต้นเพียงไม่กี่ข้อและที่สาคัญไม่จาเป็นต้องทราบ รูปแบบการแจกแจงของประชากร 6. สามารถประยุกต์ใช้ได้ในหลาย ๆ กรณีทสี่ ถิติอิงพารามิเตอร์ไม่สามารถใช้ได้ เช่น เป็นข้อมูลเกี่ยวกับตาแหน่ง การแยกประเภท หรือ การเรียงอันดับ หรือ ต้องการทดสอบความ แตกต่างอื่น ๆ นอกเหนือจากค่าเฉลี่ยของกลุ่มตัวอย่าง ข้อเสีย 1. อานาจการทดสอบ (Power of test) เมื่อข้อมูลไม่เป็นไปตามข้อตกลงเบื้องต้น สาหรับสถิติอิงพารามิเตอร์ การใช้สถิติไม่อิงพารามิเตอร์จะให้อานาจการทดสอบสูงกว่า ในทาง กลับกันถ้าข้อมูลเป็นตามข้อตกลงของการใช้สถิติอิงพารามิเตอร์ การใช้สถิติไม่อิงพารามิเตอร์จะให้ อานาจการทดสอบต่ากว่า การใช้สถิติอิงพารามิเตอร์ 2. กลุ่มตัวอย่างที่ใช้ หากกลุ่มตัวอย่างมีขนาดใหญ่ การทดสอบโดยใช้สถิติไม่อิงพารามิเตอร์จะมีความยุ่งยาก ต้องใช้เวลาในการคานวณมากขึ้น และประสิทธิภาพจะลดลงเมื่อเทียบกับ สถิติอิงพารามิเตอร์ 3. ตารางค่าสถิติ ของสถิติไม่อิงพารามิเตอร์มีจานวนมาก และมีรูปแบบที่แตกต่างกัน หลายรูปแบบ ทาให้ไม่สะดวกในการเปิดตารางเพื่อหาบริเวณวิกฤตในการทดสอบสมมติฐาน 12.2 การเปรียบเทียบวิธีการทดสอบระหว่างสถิติอิงพารามิเตอร์กบั สถิติไม่อิงพารามิเตอร์ การเปรียบเทียบวิธีการทดสอบทั้งสองแบบ ระหว่างสถิติอิงพารามิเตอร์กับสถิติไม่อิงพารามิเตอร์ ภายใต้ข้อตกลงเบื้องต้นที่แตกต่างกัน มีรายละเอียดดังตาราง ลักษณะกลุ่ม/ตัวอย่าง การทดสอบสถิติอิงพารามิ- การทดสอบสถิติไม่อิงพารามิเตอร์ /การทดสอบ เตอร์ (Parametric Test) (Nonparametric Test) ก. กลุ่มตัวอย่างเดียว Z – test ก.1 การทดสอบทวินาม t – test ก.2 การทดสอบไคสแควร์ ก.3 การทดสอบโคโมโกรอฟ – สไมร์นอฟ ก.4 การทดสอบรัน ข. กลุ่มตัวอย่างสอง t – test Dependent ข.1 การทดสอบแมกนีมาร์ กลุ่มที่สัมพันธ์กัน ข.2 การทดสอบเครื่องหมาย ข.3 การทดสอบอันดับที่มีเครื่องหมาย กากับของวิลคอกซัน
บทที่ 12 : สถิติไม่อิงพารามิเตอร์ ลักษณะกลุ่ม/ตัวอย่าง /การทดสอบ ค. กลุ่มตัวอย่างสอง กลุ่มที่เป็นอิสระกัน
การทดสอบสถิติอิงพารามิเตอร์ (Parametric Test) Z – test t – test Independent
ง.กลุ่มตัวอย่างมากกว่า Repeated Onewayสองกลุ่มที่สัมพันธ์กัน ANOVA จ.กลุ่มตัวอย่างมากกว่า One way ANOVA สองกลุ่มที่เป็นอิสระกัน
หน้าที่ - 323 การทดสอบสถิติไม่อิงพารามิเตอร์ (Nonparametric Test) ค.1 การทดสอบของฟิเชอร์ ค.2 การทดสอบไคสแควร์ ค.3 การทดสอบมัธยฐาน ค.4 การทดสอบโคโมโกรอฟสไมร์นอฟ ค.5 การทดสอบวิลคอกซัน-แมนน์วิทนี ค.6 การทดสอบรันของ วอล์ด วูล์ฟอวิทซ์ ง.1 การทดสอบของคอคแรนคิว ง.2 การทดสอบของฟรีดแมน จ.1 การทดสอบไคสแควร์ จ.2 การทดสอบมัธยฐาน จ.3 การทดสอบครุสคัล-วอลลิส
ก. กลุ่มตัวอย่างเดียว การทดสอบนอนพาราเมตริกกรณีตัวอย่างกลุ่มเดียว (the one sample case) มีหลายวิธี แต่ละวิธีมีจุดประสงค์ของการทดสอบสมมติฐานแตกต่างกัน ในการเลือกวิธีการทดสอบจะต้องคานึง ถึงระดับของการวัดของข้อมูลและข้อตกลงเบื้องต้นของการทดสอบ ตลอดจนคาตอบหรือผลการ ทดสอบที่จะได้รับว่าสามารถตอบคาถามได้ตรงตามความต้องการหรือไม่ สาหรับสถิติไม่ใช้พารามิเตอร์ที่ใช้ทดสอบกรณีกลุ่มตัวอย่างเดียว มีดังนี้ ก.1 การทดสอบทวินาม (Binomial Test) ก.2 การทดสอบไคสแควร์ (Chi-Square Test) ก.3 การทดสอบโคโมโกรอฟ-สไมร์นอฟ (Kolmogorov-Smirnov Test) ก.4 การทดสอบรัน (Runs Test) ก.1 การทดสอบทวินาม (Binomial Test) เป็นการทดสอบเกี่ยวกับสัดส่วนหรือร้อยละ ของประชากร ก.1.1 ข้อตกลงเบื้องต้น ก.1.1.1 ข้อมูลเป็นแบบไม่ต่อเนื่อง อยู่ในมาตรานามบัญญัติ ก.1.1.2 มีกลุ่มตัวอย่างเดียวแต่แบ่งออกเป็น 2 ประเภท 2 รายการ เช่น ชายหญิง ได้-ตก เห็นด้วย-ไม่เห็นด้วย โสด-แต่งงาน เป็นต้น ก.1.1.3 ประชากรเป็นแบบทวิภาค (binary population) ซึ่งสมาชิกแต่ละสมาชิกของประชากรต้องสามารถจัดอยู่ในประเภทใดประเภทเดียวเท่านั้น
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 324 -
ก.1.2 สมมติฐาน (Statistical hypothesis) การทดสอบ 2 ทาง (2 tailed test) H0 : P = p* vs H1 : P p* การทดสอบทางเดียวด้านมาก H0 : P = p* vs H1 : P > p* การทดสอบทางเดียวด้านน้อย H0 : P = p* vs H1 : P < p* ก.1.3 สถิติทดสอบ (Statistical Test) Tcal = จานวนครั้งที่ได้ผลสาเร็จ = O1 ก.1.4 อาณาเขตวิกฤต (Critical Regions) ที่ระดับนัยสาคัญ กรณีการทดสอบ 2 ทาง จะกาหนดค่าวิกฤตทั้งด้านซ้าย (t1) และ (t2) นั่น คือ เขตวิกฤต : T t1 หรือ T > t2 สาหรับตัวอย่างขนาดเล็ก (n 20) ใช้ตารางทวินามที่ค่า p* และ n ทาการพิจารณาค่าที่ทาให้ 1 = 2 Pr(Y t1) = 1 และ Pr(Y > t2) = 1 หรือ Pr(Y t2) = 1 – 2 สาหรับตัวอย่างขนาดใหญ่ ประมาณค่า t np * Z np *(1 p*) และ 1 /2 t
2
np * Z
1 / 2
np * (1 p*)
ตัวอย่างที่ ก.1.1 ครูยาใจตั้งสมมติฐานไว้ว่า ถ้าสอนโดยใช้นิทานจะทาให้สัดส่วนของนักเรียนที่สอบ ได้มากกว่านักเรียนที่สอบตก จึงได้ทาการทดลองสอนนักเรียน ป. 5 จานวน 20 คน ภายหลังสอน เสร็จแล้ววัดผล ปรากกฎว่านักเรียนที่สอบได้หรือได้คะแนนผ่านเกณฑ์มีจานวน 15 คน จงทาการ ทดสอบสมมติฐานนี้ ที่ α = 0.05 วิธีทา พิจารณาลักษณะข้อมูล – เป็นข้อมูลทดสอบนักเรียน 20 คน ผลการสอบแต่ละคนมีผลเป็น ได้ หรือ ตก (เป็นการ ทดลองทวินาม) – ข้อมูลอยู่ในมาตรนามบัญญัติ – ต้องการทดสอบสัดส่วนที่สอบได้เกินกว่า 50% หรือไม่ นั่นคือ P > 0.50 หรือไม่ สมมติฐาน H0 : P = 0.50 H1 : P > 0.50 สถิติทดสอบ Tcal = จานวนนักเรียนที่สอบผ่าน = 15 (n = 20) อาณาเขตวิกฤต กาหนด ระดับนัยสาคัญ ทดสอบทางเดียวด้านมาก, n = 20, p*=0.50 จากตารางทวินาม P(Y 10) = 0.588 เขตวิกฤต คือ T > 10 สรุปผล จาก Tcal ตกในเขตวิกฤต จึงปฏิเสธ H0 นั่นคือ ที่ = 0.05 การสอนโดยใช้นิทานทา ให้สัดส่วนของนักเรียนที่สอบได้มากกว่านักเรียนสอบตกจริง
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 325 -
ตัวอย่างที่ ก.1.2 เครื่องจักรเครื่องหนึ่งยังสามารถทางานได้ ถ้า 5% หรือ น้อยกว่าของส่วนประกอบ (ชิ้นส่วน) เสีย แต่ถ้าเสียมากกว่า 5% ก็ต้องได้รับการซ่อมแซม ถ้าหยิบชิ้นส่วนมา 10 ชิ้นจาก เครื่องจักรหนึ่ง แล้วพบชิ้นส่วนเสียหรือชารุด 1 ชิ้น จะสรุปได้อย่างไร วิธีทา พิจารณาลักษณะข้อมูล – เป็นข้อมูลทดลองหยิบชิ้นส่วน 10 ชิ้น ตรวจสอบแต่ละชิ้นได้ผลเป็น ดี หรือ เสีย (เป็น การทดลองทวินาม) – ข้อมูลอยู่ในมาตรนามบัญญัติ – ต้องการทดสอบสัดส่วนที่เสียเกินกว่า 5% หรือไม่ นั่นคือ P > 0.05 หรือไม่ สมมติฐาน H0 : P = 0.05 H1 : P > 0.05 สถิติทดสอบ Tcal = จานวนชิ้นส่วนที่เสีย = 1 (n = 10) อาณาเขตวิกฤต กาหนด ระดับนัยสาคัญ ทดสอบทางเดียวด้านมาก, n = 10, p*=0.05 จากตารางทวินาม P(Y 1) = 0.9139 เขตวิกฤต คือ T > 1 สรุปผล จาก Tcal ไม่ตกในเขตวิกฤต จึงยอมรับ H0 นั่นคือ ที่ = 0.05 เครื่องจักรนี้ยังสามารถ ทางานได้อยู่ ตัวอย่างที่ ก.1.3 ในการผสมพันธุพืช 2 ชนิด ภายใตทฤษฎีอยางงายของ Mendel จะไดวา ¼ ของตนไมจะเปนพันธุเตี้ยและ ¾ ของตนไมจะเปนพันธุสูง ในการทดลองเพื่อทดสอบดูวาขอสมมติ ตามทฤษฎีดังกลาวจะเปนจริงหรือไม พบวามีตนไมพันธุเตี้ย 243 ตน และพันธุสูง 682 ตน ทานจะ สรุปผลอยางไร ที่ระดับนัยสาคัญ 0.05 วิธีทา พิจารณาลักษณะขอมลู – เปนขอมูลทดลองปลูกไม 925 ตน ผลการปลูกแตละตนเปนตนเตี้ย หรือตนสูง (การ ทดลองทวินาม – ขอมูลอยูในมาตรนามบัญญัติ – ตองการทดสอบวา ทฤษฎี Mendel เปนจริงหรือไม สัดสวนตนเตี้ย (P) = ¼ ? สัดสวนตนสูง (Q) = ¾ ? สมมติฐาน H0 : P = 0.25 H1 : P > 0.25 สถิติทดสอบ Tcal = จานวนต้นเตี้ยที่ได้ = 243 (n = 925) อาณาเขตวิกฤต กาหนด ระดับนัยสาคัญ ทดสอบทางเดียวด้านมาก, n = 925, p*=0.25 ประมาณ t np * Z / 2 np * (1 p*) t 925(0.25) 1.96 925(0.25)(0.75) 205.44 และ 1 t
2
925(0.25) + 1.96 925(0.25)(0.75)
257.06
สรุปผล จาก Tcal ไม่ตกในเขตวิกฤต จึงยอมรับ H0 นั่นคือ ที่ = 0.05 ทฤษฏี Mendel เป็นจริง
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 326 -
ก.2 การทดสอบไคสแควร์ (Chi-Square Test) เป็นการทดสอบว่าความถี่ที่เก็บ รวบรวมได้ที่แบ่งเป็นพวกเป็นกลุ่มนั้นแตกต่างไปจากความถี่ที่คาดหวังไว้ หรือแตกต่างไปจากทฤษฎี หรือไม่ ซึ่งข้อมูลที่ได้จากการเก็บรวบรวมอยู่ในมาตราวัดระดับนามบัญญัติเป็นอย่างต่า และข้อมูล นั้นถูกจัดเข้าไว้ในกลุ่มใดกลุ่มหนึ่ง เช่น จานวนอาจารย์ที่มีวุฒิสูงสุดเป็นปริญญาตรี ปริญญาโทและ ปริญญาเอก หรือ จานวนข้าราชการที่กระทาผิดวินัยระดับต่าง ๆ ก.2.1 ข้อตกลงเบื้องต้น ก.2.1.1 ระดับของการวัดอยู่ในมาตรานามบัญญัติ หรือมาตราเรียงอันดับ โดย การวัดเป็นจานวนหรือความถี่ออกมาได้ ก.2.1.2 ไม่คานึงถึงลักษณะการแจกแจงประชากร ก.2.2 สมมติฐาน H0 : Oi = Ei H1 : Oi Ei , i = 1,2,…, k ก.2.3 สถิติที่ใช้ทดสอบ k (O E )2 i i E i i 1
2 cal
;df k 1
เมื่อ Oi = ความถี่ที่ได้จากการรวบรวมข้อมูลจริงในกลุ่มที่ i Ei = ความถี่ที่คาดว่าจะเป็นในกลุ่มที่ i k = จานวนกลุ่ม โดยที่ Ei = Npi เมื่อ N เป็นจานวนข้อมูล และ pi เป็นความน่าจะเป็นของการเกิดเหตุการณ์ในกลุ่มที่ i ก.2.4 อาณาเขตวิกฤต 2 2 กาหนด = 0.05, 0.05, อาณาเขตวิกฤต 2 0.05, df n 1 df n 1 2 จะปฏิเสธสมมติฐาน H0 เมื่อค่า cal ที่ คานวณได้มากกว่าหรือเท่ากับค่า 2 , k 1 จากตาราง
2 , k 1
อาณาเขตวิกฤต
ตารางค่าวิกฤตของไคสแควร์ df 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0.05 3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00
0.025 5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.53 19.02 20.48 21.92 23.34 24.74 26.12 27.49
0.01 6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.73 26.22 27.69 29.14 30.58
0.005 7.88 10.60 12.84 14.86 16.75 18.55 20.28 21.95 23.59 25.19 26.76 28.30 29.82 31.32 32.80
0.001 10.83 13.82 16.27 18.47 20.51 22.46 24.32 26.12 27.88 29.59 31.26 32.91 34.53 36.12 37.70
df 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0.05 26.30 27.59 28.87 30.14 31.41 32.67 33.92 35.17 36.41 37.65 38.89 40.11 41.34 42.56 43.77
0.025 28.85 30.19 31.53 32.85 34.17 35.48 36.78 38.08 39.36 40.65 41.92 43.19 44.46 45.72 46.98
0.01 32.00 33.41 34.81 36.19 37.57 38.93 40.29 41.64 42.98 44.31 45.64 46.96 48.28 49.59 50.89
0.005 34.27 35.72 37.16 38.58 40.00 41.40 42.80 44.18 45.56 46.93 48.29 49.64 50.99 52.34 53.67
0.001 39.25 40.79 42.31 43.82 45.31 46.80 48.27 49.73 51.18 52.62 54.05 55.48 56.89 58.30 59.70
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 327 -
ตัวอย่างที่ ก.2.1 ในการทดสอบความรู้ทางสถิติของนักศึกษาปริญญาเอก จานวน 20 คน ผู้สอนคาด ว่าแบบทดสอบฉบับนี้แบ่งความสามารถของนักศึกษาปริญญาเอก ออกเป็น 3 ระดับ คือ เก่ง ปาน กลาง และอ่อน เป็นอัตราส่วน 5 : 3 : 2 พบว่าอยู่ในระดับเก่งมี 9 คน ระดับปานกลางมี 7 คน และ ระดับอ่อนมี 4 คน จงทดสอบสมมติฐานว่าผลการทดสอบที่ได้เป็นไปตามอัตราส่วนที่ผู้สอนคาดหวัง ไว้หรือไม่ วิธีทา 1. ตั้งสมมุติฐาน H0 : ผลการทดสอบที่ได้เป็นไปตามอัตราส่วน 5:3:2 H1 : ผลการทดสอบที่ได้ไม่เป็นไปตามอัตราส่วน 5:3:2 2. สร้างรหัสตัวแปร ให้ grad แทน ระดับความสามารถ โดย ให้ 3 แทน เก่ง ให้ 2 แทน ปานกลาง ให้ 1 แทน อ่อน 3. ทดสอบไคสแควร์ (Chi-Square Test) โดยการคานวณค่าสถิติ ระดับความรู้ทางสถิติของนักศึกษา เหตุการณ์ เก่ง ปานกลาง อ่อน รวม Oi 9 7 4 20 5 3 2 Ei 20 x20 = 10 x20 = 6 x20 = 4 10
10
10
k (O E )2 (9 10)2 (7 6)2 (4 4)2 i i = Ei 10 6 4 i 1
2 cal
= 0.267
2 4. สรุปผลได้ว่า ค่า cal ที่ได้จากการคานวณมีค่า 0.267 มีค่าน้อยกว่าค่า 2 ที่เปิด 2 จากตาราง ( 0.05,2 = 5.99) ตกนอกอาณาเขตวิกฤต จึงยอมรับ H0 : Oi = Ei สรุปได้ว่าอัตราส่วน ความสามารถความรู้ทางสถิติของนักศึกษาปริญญาเอก เป็นไปตามที่ผู้สอนคาดหวังไว้
ตัวอย่างที่ ก.2.2 นักสถิติของธนาคารเลือดมีความสงสัยว่ากรุ๊ปเลือด A, B, AB และ O เป็นไปตาม อัตราส่วน 2 : 2 : 1 : 3 หรือไม่ จึงทาการสุ่มตัวอย่างคนทั่วไป จานวน 100 คน ตรวจสอบกรุ๊ปเลือด พบว่า เป็นเลือด กรุ๊ป A, B, AB และ O จานวน 20, 25, 10 และ 45 คน ตามลาดับ จะสรุปได้ หรือไม่ว่าเป็นไปตามอัตราส่วนที่นักสถิติผู้นี้ระบุไว้ ที่ระดับนัยสาคัญ 0.05 วิธีทา 1. ตั้งสมมุติฐาน H0 : อัตราส่วนเลือด A : B : AB : O คือ 2 : 2 : 1 : 3 H1 : อัตราส่วนเลือด A : B : AB : O ไม่ใช่ 2 : 2 : 1 : 3 2. สถิติที่ใช้ทดสอบ สถิติไคสแควร์ 3. ทดสอบไคสแควร์ (Chi-Square Test) โดยการคานวณค่าสถิติ กรุ๊ปเลือก เหตุการณ์ A B AB O รวม Oi 20 25 10 45 100 3 2 2 1 Ei 100 x100 = 25 x100 = 25 x100 = 12.5 8 x100 = 37.5 8
8
8
k (O E )2 (20 25)2 (25 25)2 (10 12.5) 2 (45 37.5) 2 2 i cal i = 3.0 Ei 25 25 12.5 37.5 i 1
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 328 -
2 4. สรุปผลได้ว่า ค่า cal ที่ได้จากการคานวณมีค่า 3.0 มีค่าน้อยกว่าค่า 2 ที่เปิดจาก 2 ตาราง ( 0.05,3 = 7.81) ตกนอกอาณาเขตวิกฤต จึงยอมรับ H0 : Oi = Ei สรุปได้ว่าอัตราส่วนของ กรุ๊ปเลือด เป็นไปตามที่นักสถิติผู้นี้ระบุไว้ กล่าวคืออัตราส่วน A : B : AB : O คือ 2 : 2 : 1 : 3
ตัวอย่างที่ ก.2.3 การสอบเข้าศึกษาในมหาวิทยาลัยแห่งหนึ่งมีผู้สมัครได้ 126 คน มาจากจังหวัด ต่างๆ 6 จังหวัด คือ ขอนแก่น มหาสารคาม นครราชสีมา ร้อยเอ็ด อุดรธานี และเลย มีจานวน 25,18,20,12,27 และ 24 ตามลาดับ อยากทราบว่าจานวนผู้สอบได้ที่มีจากจังหวัดต่างๆ แตกต่างกัน อย่างมีนัยสาคัญหรือไม่ ที่ระดับนัยสาคัญ 0.05 วิธีทา 1. ตั้งสมมุติฐาน H0 : Oi = Ei H1 : Oi Ei 2. สถิติที่ใช้ทดสอบ สถิติไคสแควร์ 3. ทดสอบไคสแควร์ (Chi-Square Test) โดยการคานวณค่าสถิติ ความถี่คาดหวัง Ei 126 21 6
k (O E ) i i E i i 1
2 cal
2
=
(25 21)2 (18 21)2 (24 21)2 ... 7.24 21 21 21
2 4. สรุปผลได้ว่า ค่า cal ที่ได้จากการคานวณมีค่า 7.24 มีค่าน้อยกว่าค่า 2 ที่เปิด 2 จากตาราง ( 0.05,5 = 11.07) ตกนอกอาณาเขตวิกฤต จึงยอมรับ H0 : Oi = Ei สรุปได้ว่า จานวน ผู้สอบได้ที่มาจากจังหวัดต่างๆ มีจานวนไม่แตกต่างกัน
ตัวอย่างที่ ก.2.4 จากการศึกษาความคิดเห็นเกี่ยวกับการกาหนดให้นักศึกษาปริญญาเอกทุกสาขา ต้องผ่านการศึกษาดูงานต่างประเทศ จากการศึกษานักศึกษาจานวน 10 คน ปรากฏผลดังนี้ ความคิดเห็น เหตุการณ์ เห็นด้วย เห็นด้วย เฉยๆ ไม่เห็น ไม่เห็นด้วย รวม อย่างยิง ปานกลาง ด้วย อย่างยิ่ง Oi 2 4 3 1 0 10 Ei 2 2 2 2 2 10 วิธีทา 1. ตั้งสมมติฐาน H0 : ความคิดเห็นของนักศึกษาปริญญาเอกไม่แตกต่างกัน H1 : ความคิดเห็นของนักศึกษาปริญญาเอกแตกต่างกัน 2. สถิติที่ใช้ทดสอบ สถิติไคสแควร์ 3. ทดสอบไคสแควร์ (Chi-Square Test) โดยการคานวณค่าสถิติ ความถี่คาดหวัง Ei 105 2 k (O E )2 (2 2)2 (4 2)2 (3 2)2 (1 2) 2 (0 2) 2 i i = 5.0 Ei 2 2 2 2 2 i 1
2 cal
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 329 -
2 4. สรุปผลได้ว่า ค่า cal ที่ได้จากการคานวณมีค่า 5.0 มีค่าน้อยกว่าค่า 2 ที่เปิดจาก 2 ตาราง ( 0.05,5 = 9.49) ตกนอกอาณาเขตวิกฤต จึงยอมรับ H0 : Oi = Ei สรุปได้ว่า ความคิดเห็น ของนักศึกษาปริญญาเอกไม่แตกต่างกัน
ก.3 การทดสอบโคโมโกรอฟ-สไมร์นอฟ (Kolmogorov-Smirnov Test) การทดสอบโคโมโกรอฟ-สไมร์นอฟ เป็นการทดสอบเกี่ยวกับกลุ่มตัวอย่างว่ามีการ แจกแจงที่สังเกตได้ต่างกับการแจกแจงตามทฤษฎีหรือตามที่คาดหวังในสมมติฐานหรือไม่ หรือเพื่อ ทดสอบว่าความถี่ที่สังเกตได้ เป็นไปตามความถี่ที่คาดหวังไว้หรือไม่ โดยใช้ความถี่สะสมของกลุ่ม ตัวอย่างที่แบ่งเป็นช่วง ๆ แบบต่อเนื่อง (Continuous) เช่น ชอบมากที่สุด ชอบมาก ชอบ ไม่ชอบ ไม่ชอบมากที่สุด เป็นต้น ก.3.1 ข้อตกลงเบื้องต้น ก.3.1.1 ระดับของการวัดอยู่ในมาตรานามบัญญัติ หรือมาตราเรียงอันดับ โดย การวัดเป็นจานวนหรือความถี่ออกมาได้ ก.3.1.2 ไม่คานึงถึงลักษณะการแจกแจงประชากร ก.3.2 สมมติฐาน H0 : F0(X) = F(X) [ไม่มีความแตกต่างกันระหว่างความถี่ที่สังเกตได้กับความถี่ คาดหวัง] H1 : F0(X) F(X) [มีความแตกต่างกันระหว่างความถี่ที่สังเกตได้กับความถี่ คาดหวัง] เมื่อ F0(X) เป็นสัดส่วนของความถี่สะสมของข้อมูลที่สังเกตได้ [เป็นฟังก์ชันการ แจกแจงความถี่สะสมสัมพัทธ์ของตัวอย่าง] F(X) เป็นสัดส่วนของความถี่สะสมของข้อมูลที่มีลักษณะการแจกแจงตามที่ คาดหวัง(ตามทฤษฎี) [เป็นฟังก์ชันการแจกแจงความถี่สะสมภายใต้ ทฤษฎี] ก.3.3 สถิติที่ใช้ทดสอบ เป็นการทดสอบแบบสองทาง คานวณหาค่า D โดยใช้สูตร D = Maximum|F0(X) – SN(X)| เมื่อ D คือค่าสูงสุดของความแตกต่างระหว่าง F0(X) กับ SN(X) โดยไม่ คิดเครื่องหมาย SN(X) เป็นฟังก์ชันการแจกแจงความถี่สะสมภายใต้ทฤษฎี ก.3.4 อาณาเขตวิกฤตและการสรุปผล จะปฏิเสธสมมติฐาน H0 เมื่อค่า D ที่คานวณได้มีค่ามากกว่าหรือเท่ากับ ค่า D ทีเ่ ปิดได้จากตารางค่าวิกฤตของ D
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 330 -
ตาราง ค่าวิกฤตของ D ในการทดสอบ Kolmogorov-Smirnov สาหรับกลุ่มตัวอย่าง กลุ่มเดียว Sample Size (N) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 Over 35
0.20 0.900 0.684 0.565 0.494 0.446 0.410 0.381 0.358 0.339 0.322 0.307 0.295 0.284 0.274 0.266 0.258 0.250 0.244 0.237 0.231 0.210 0.190 0.180 1.07 N
Level of significance for D 0.15 0.10 0.05 0.925 0.950 0.975 0.726 0.776 0.842 0.597 0.642 0.708 0.525 0.564 0.624 0.474 0.510 0.565 0.436 0.470 0.521 0.405 0.438 0.486 0.381 0.411 0.457 0.360 0.388 0.432 0.342 0.368 0.410 0.326 0.352 0.391 0.313 0.338 0.375 0.302 0.325 0.361 0.292 0.314 0.349 0.283 0.304 0.338 0.274 0.295 0.328 0.266 0.286 0.318 0.259 0.278 0.309 0.252 0.272 0.301 0.246 0.264 0.294 0.220 0.240 0.270 0.200 0.220 0.240 0.190 0.210 0.230 1.14 N
1.22 N
1.36 N
0.01 0.995 0.929 0.828 0.733 0.669 0.618 0.577 0.543 0.514 0.490 0.468 0.450 0.433 0.418 0.404 0.392 0.381 0.371 0.363 0.356 0.320 0.290 0.270 1.63 N
การทดสอบโคลโมโกรอฟ-สไมร์นอฟ สาหรับตัวอย่างกลุ่มเดียวมีประสิทธิภาพมากกว่าการ ทดสอบไคกาลังสอง และใช้ได้กับข้อมูลทุกกรณีแม้ว่าความถี่จะมีค่าน้อยกว่า 5 หรือ เป็น 0 ก็ตาม การทดสอบ Kolmogorov-Smirnov สาหรับกลุ่มตัวอย่างกลุ่มเดียว มีลาดับขั้นในการคิดดังนี้ 1. ตั้งสมมติฐาน 2. กาหนดระดับนัยสาคัญ 3. การคานวณค่า D ให้ทาเป็นขั้นตอนดังนี้ 3.1 หาความถี่ที่สังเกตได้ หาความถี่สะสมและหาความถี่สะสมสัมพัทธ์ 3.2 หาความถี่คาดหวัง หาความถี่สะสมและหาความถี่สะสมสัมพัทธ์ 3.3 นาความถี่สะสมสัมพัทธ์ของความถี่ที่สังเกตได้และของความถี่คาดหวังมาลบกันเพื่อหาค่า ความแตกต่าง 3.4 หาค่า D โดยดูค่าความแตกต่างที่มากที่สุด (ไม่คิดเครื่องหมายบวก ลบ) 4. นาค่า D ที่ได้ไปเปรียบเทียบกับค่า D ที่ได้จากการเปิดตาราง 5. ตัดสินใจ และสรุปผล
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 331 -
ตัวอย่างที่ ก.3.1 จากการศึกษาความคิดเห็นเกี่ยวกับการกาหนดให้นักศึกษาปริญญาเอกทุกสาขา ต้องผ่านการศึกษาดูงานต่างประเทศ จากการศึกษาจานวน 10 คน ปรากฏผลดังนี้ ความคิดเห็น เห็นด้วยอย่างยิ่ง เห็นด้วย เฉย ๆ ไม่เห็นด้วย ไม่เห็นด้วยอย่างยิ่ง ความถี(่ f) 2 4 3 1 0 วิธีทา 1. ตั้งสมมุติฐาน H0 : ความคิดเห็นของนักศึกษาปริญญาเอกไม่แตกต่างกัน H1 : ความคิดเห็นของนักศึกษาปริญญาเอกแตกต่างกัน 2. สถิติที่ใช้ทดสอบ Kolmogorov-Smirnov One-sample 3. อาณาเขตวิกฤต กาหนดค่า = 0.05 ค่าวิกฤต D = 0.410 อาณาเขตวิกฤต D 0.410 ความคิดเห็น ความถี่ที่ ความถี่ F0(X) ความถี่ ความถี่ SN(X) สังเกตได้ สะสม คาดหวัง สะสม เห็นด้วยอย่างยิ่ง 2 2 0.20 2 2 0.20 เห็นด้วย 4 6 0.60 2 4 0.40 เฉยๆ 3 9 0.90 2 6 0.60 ไม่เห็นด้วย 1 10 1.00 2 8 0.80 ไม่เห็นด้วยอย่างยิ่ง 0 10 1.00 2 10 1.00
D 0.00 0.20 0.30 0.20 0.00
D = Maximum|F0(X) – SN(X)| = 0.30 4. สรุปผลได้ว่า ค่า D ที่คานวณได้มีค่า 0.30 น้อยกว่าค่าวิกฤต (0.410) จึงตกนอก อาณาเขตวิกฤต จึงยอมรับ H0 กล่าวคือความคิดเห็นของนักศึกษาปริญญาเอกไม่แตกต่างกัน ตัวอย่างที่ ก.3.2 นักการศึกษาผู้หนึ่งต้องการทดสอบว่าผลการเรียนของนักศึกษาระดับปริญญาตรี ของรายวิชาหนึ่งว่ามีอัตราส่วนของนักศึกษาที่ได้เกรด A:B:C เป็น 1:1:2 หรือไม่ (ให้เกรดต่าสุดที่ นักศึกษาจะได้คือ C) จึงทาการสารวจนักศึกษาในรายวิชานี้จานวน 270 คน พบว่ามีนักศึกษาที่ได้ A อยู่ 75 คน ได้เกรด B จานวน 85 คน นอกนั้นได้เกรด C จงทดสอบความเชื่อของนักการศึกษาผู้นี้ กาหนดระดับนัยสาคัญ 0.05 วิธีทา 1. ตั้งสมมุติฐาน H0 : อัตราส่วนของนักศึกษาที่ได้เกรด A:B:C เป็น 1:1:2 H1 : อัตราส่วนของนักศึกษาที่ได้เกรด A:B:C ไม่เป็น 1:1:2 2. สถิติที่ใช้ทดสอบ Kolmogorov-Smirnov One-sample 3. อาณาเขตวิกฤต กาหนด = 0.05 ค่าวิกฤต D = 1.36 1.36 0.083 N
อาณาเขตวิกฤต D 0.083
270
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 332 -
คานวณค่าสถิติ เกรด ความถี่ที่ ความถี่ F0(X) ความถี่ ความถี่ สังเกตได้ สะสม คาดหวัง สะสม A B C
75 85 110
75 160 270
0.278 0.593 1.000
67.5 67.5 135
67.5 135 270
SN(X)
D
0.250 0.500 1.000
0.028 0.093 0.000
D = Maximum|F0(X) – SN(X)| = 0.093 4. สรุปผลได้ว่า ค่า D ที่คานวณได้ มีค่า 0.093 มีค่ามากกว่า ค่า D ที่เปิดจากตาราง ซึ่งมีค่า 0.083 แสดงว่าค่าที่คานวณได้จากข้อมูลนั้นตกในอาณาเขตวิกฤต จึงปฏิเสธ Ho ดังนั้นที่ ระดับนัยสาคัญ 0.05 อัตราส่วนของนักเรียนที่ได้เกรด A:B:C ไม่เป็น 1:1:2 เมื่อเปรียบเทียบกับการทดสอบโดยใช้ไคสแควร์ วิธีทา 1. ตั้งสมมุติฐาน H0 : อัตราส่วนของนักศึกษาที่ได้เกรด A:B:C เป็น 1:1:2 H1 : อัตราส่วนของนักศึกษาที่ได้เกรด A:B:C ไม่เป็น 1:1:2 2. สถิติที่ใช้ทดสอบ สถิติไคสแควร์ 2 3. อาณาเขตวิกฤต กาหนด = 0.05 ค่าที่เปิดจากตาราง 0.05,2 = 5.99 อาณาเขตวิกฤต 2 5.99 คานวณค่าสถิติ เหตุการณ์ A B C Oi 75 85 110 Ei 67.5 67.5 135 k (O E )2 (75 67.5)2 (85 67.5) 2 (110 135) 2 i i = Ei 67.5 67.5 135 i 1
2 cal
10.0
2 4. สรุปผลได้ว่า ค่า cal ที่ได้จากการคานวณมีค่า 10.0 มีค่ามากกว่าค่า 2 ที่เปิด 2 จากตาราง ( 0.05,2 = 5.99) ตกในอาณาเขตวิกฤต จึงปฏิเสธ H0 : Oi = Ei หรือยอมรับ H1: Oi Ei สรุปได้ว่า ที่ระดับนัยสาคัญ 0.05 อัตราส่วนของนักศึกษาที่ได้เกรด A:B:C ไม่เป็น 1:1:2
ตัวอย่างที่ ก.3.3 ในการสอบกลางภาคของนักศึกษาในรายวิชา 1109241 หลักสถิติ ครั้งหนึ่ง อยากทราบว่าคะแนนสอบของนักศึกษามีการแจกแจงแบบปกติหรือไม่ จึงทาการสุ่มตัวอย่างคะแนน สอบของนักศึกษาจานวน 12 คน มีคะแนนดังนี้ 55, 67, 60, 70, 66, 70, 75, 70, 75, 79, 80, 85 กาหนดระดับนัยสาคัญ 0.05 วิธีทา 1. ตั้งสมมุติฐาน H0 : F0(X) = F(X) [คะแนนสอบของนักศึกษามีการแจกแจงแบบปกติ] H1 : F0(X) F(X) [คะแนนสอบของนักศึกษาไม่มีการแจกแจงแบบปกติ] 2. สถิติที่ใช้ทดสอบ Kolmogorov-Smirnov One-sample 3. อาณาเขตวิกฤต กาหนด = 0.05 ค่าวิกฤต D = 0.375 อาณาเขตวิกฤต D 0.375
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 333 -
คานวณค่าสถิติ X = 71 และ S = 8.496 คะแนน ความถี่ที่ ความถี่ F0(X) ความถี่ SN(X) สังเกตได้ สะสม คาดหวัง 55 60 66 67 70 70 70 75 75 79 80 85
1 1 1 1 1 1 1 1 1 1 1 1
1 2 3 4 5 6 7 8 9 10 11 12
0.083 0.167 0.250 0.333 0.417 0.500 0.583 0.667 0.750 0.833 0.917 1.000
-1.88 -1.29 -0.59 -0.47 -0.12 -0.12 -0.12 0.47 0.47 0.94 1.06 1.65
0.0301 0.0985 0.2776 0.3192 0.4522 0.4522 0.4522 0.6808 0.6808 0.8264 0.8554 0.9505
D 0.0529 0.0685 0.0276 0.0138 0.0352 0.0478 0.1308 0.0138 0.0692 0.0066 0.0616 0.0495
D = Maximum|F0(X) – SN(X)| = 0.1308 4. สรุปผลได้ว่า ค่า D ที่คานวณได้ มีค่า 0.1308 มีค่าน้อยกว่า ค่า D ที่เปิดจากตาราง ซึ่งมีค่า 0.375 แสดงว่าค่าที่คานวณได้จากข้อมูลนั้นตกนอกอาณาเขตวิกฤต จึงยอมรับ Ho ดังนัน้ สรุปได้ว่าที่ระดับนัยสาคัญ 0.05 คะแนนสอบของนักศึกษามีการแจกแจงแบบปกติ ก.4 การทดสอบรัน (Runs Test) การทดสอบรัน(Runs Test) หรือการทดสอบของวอลด์วูลฟอวิทซ์ (WaldWolfowitz run test) สาหรับตัวอย่างกลุ่มเดียว เป็นการทดสอบว่ากลุ่มตัวอย่างที่ได้มานั้นเกิดขึ้น อย่างสุ่มหรือไม่โดยดูจากการเกิดซ้าๆ ของกลุ่มตัวอย่าง ซึ่งการจัดเรียงอย่างสุ่มแสดงว่าตัวอย่างที่ได้ มาจากประชากรได้มาอย่างสุ่มหรือไม่ หรืออีกนัยหนึ่งคือตัวอย่างที่ได้จากประชากรเป็นตัวอย่างสุ่ม หรือไม่ ในการทดสอบได้อาศัยจานวนรัน(runs) โดยรันหนึ่งๆ หมายถึงอนุกรมของสัญลักษณ์ที่ กาหนดให้เหมือนกัน ถ้าการเกิดซ้า ๆ อย่างมีระบบก็แสดงว่ากลุ่มตัวอย่างนั้นได้มาอย่างสุ่ม เช่น a b aa b a bbb a รันที่ 1 2 3 4 5 6 7 จานวนรันเท่ากับ 7 ถ้าปรากฏว่าจานวนรันมีมากหรือน้อยเกินไป แสดงว่าการจัดเรียงของข้อมูลไม่เป็นไปอย่าง สุ่ม เช่น a b a b a b a b a b จานวนรัน r = 10 a a a a a b b b b b จานวนรัน r = 2 ก.4.1 ข้อตกลงเบื้องต้น มีตัวอย่างกลุ่มเดียวแต่แบ่งได้เป็นสองลักษณะโดยใช้เกณฑ์อย่างใดอย่างหนึ่ง เช่น ให้กลุ่มหนึ่งมีเครื่องหมายเป็น บวก (+ ) อีกกลุ่มหนึ่งมีเครื่องหมายเป็น ลบ ( – ) ก.4.2 สมมติฐานการทดสอบ คือ H0: ข้อมูลมีการจัดเรียงอย่างสุ่ม H1: ข้อมูลไม่ได้มีการจัดเรียงอย่างสุ่ม โดยให้ n1 = เป็นจานวนสมาชิกของลักษณะที่ 1 n2 = เป็นจานวนสมาชิกของลักษณะที่ 2 และ n1 + n2 = n
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 334 -
ค่าวิกฤตจานวนรัน r ได้แสดงไว้ในตารางที่ ..... ภาคผนวก ถ้า r ที่สังเกตได้มีค่าน้อยกว่าหรือเท่ากับ ค่าวิกฤตในตารางที่ 7.1 หรือมากกว่าหรือเท่ากับค่าวิกฤตในตารางที่ 7.2 แสดงว่าปฏิเสธสมมติฐาน H0 ที่ระดับนัยสาคัญ 0.05 ในกรณีที่ตัวอย่างขนาดใหญ่ คือ n1 > 20 และ n2 = 20 จานวนรัน r มีการแจกแจงใกล้เคียงการ แจกแจงปกติที่มี 2n1n2 ค่าเฉลี่ย r 1 และความแปรปรวน
n 2n1n2 (2n1n2 n) r2 n2 (n 1)
ดังนั้นค่าสถิติการทดสอบเป็น
Zcal
r r
r
และ Z มีการแจกแจงใกล้เคียง N(0,1) ค่าวิกฤตเป็น 1.96 ที่ระดับนัยสาคัญ 0.05 และ จะปฏิเสธสมมติฐาน H0 ที่ระดับนัยสาคัญ 0.05 เมื่อค่าสัมบูรณ์ของสถิติการทดสอบที่คานวณได้มีค่า มากกว่าหรือเท่ากับ 1.96 หรือ Zcal 1.96 ตัวอย่างที่ ก.4.1 บริษัทได้ประกาศรับสมัครพนักงาน 1 ตาแหน่ง ปรากฏว่ามีผู้มาสมัครเป็นชาย 5 คนและหญิง 6 คนตามลาดับดังนี้ ชาย หญิง ชาย หญิง หญิง ชาย ชาย หญิง หญิง ชาย หญิง จง ทดสอบว่า การสมัครงานของผู้สมัครที่เป็นชายและหญิงเป็นไปอย่างสุ่มหรือไม่ วิธีทา 1. ตั้งสมมุติฐาน H0 : การสมัครงานของผู้สมัครที่เป็นชายและหญิงเป็นไปอย่างสุ่ม H1 : การสมัครงานของผู้สมัครที่เป็นชายและหญิงไม่ได้เป็นไปอย่างสุ่ม 2. สร้างรหัสตัวแปร n1 = เป็นจานวนผู้สมัครที่เป็นชาย เท่ากับ 5 n2 = เป็นจานวนผู้สมัครที่เป็นหญิง เท่ากับ 6 และ n = 11 3. ข้อมูลผู้สมัครเป็น ชาย หญิง ชาย หญิง หญิง ชาย ชาย หญิง หญิง ชาย หญิง ตรวจสอบจานวน run ได้ r = 8 4. ค่าวิกฤต run ในตารางที่ 7.1 และ 7.2 ภาคผนวก ได้ค่าเป็น 3 และ 10 ตามลาดับ ค่าสังเกต r = 8 มีค่าระหว่างค่าวิกฤต 3 และ 10 แสดงว่าไม่ปฏิเสธสมมติฐาน H0 ดังนั้นการสมัครงานของผู้สมัครที่เป็นชายและหญิงเป็นไปอย่างสุ่ม ที่ระดับนัยสาคัญ 0.05 ตัวอย่างที่ ก.4.2 ห้างสรรพสินค้าแห่งหนึ่งต้องการทราบว่าลูกค้าที่ซื้อและไม่ซื้อสบู่ตราดอกบัวคู่ เป็นไปอย่างสุ่มหรือไม่ จึงทาการบันทึกการซื้อและไม่ซื้อสบู่ของลูกค้าจานวน 50 ราย โดยใช้ เครื่องหมาย + แทนลูกค้าที่ซื้อและ – แทนลูกค้าที่ไม่ซื้อ ได้ข้อมูลดังนี้ ––+++–––+––++––––– +++––+++––––+++––––++++–+++++–++ วิธีทา 1. ตั้งสมมุติฐาน H0 : การซื้อและไม่ซื้อสบู่ตราดอกบัวคู่ของลูกค้าเป็นไปอย่างสุ่ม H1 : การซื้อและไม่ซื้อสบู่ตราดอกบัวคู่ของลูกค้าไม่ได้เป็นไปอย่างสุ่ม 2. สร้างรหัสตัวแปร n1 = เป็นจานวนลูกค้าที่ซื้อสบู่ เท่ากับ 26 n2 = เป็นจานวนลูกค้าที่ไม่ซื้อสบู่ เท่ากับ 24 และ n = 50
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 335 -
3. ข้อมูลลูกค้าเป็นดังนี้ ––+++–––+––++–––––+++––+++––––+++––––++++ –+++++–++ ตรวจสอบจานวน run ได้ r = 18 4. ในกรณีตัวอย่างขนาดใหญ่ คือ n1 > 20 และ n2 > 20 จานวนรัน r มีการแจกแจง ใกล้เคียงการแจกแจงปกติที่มีค่าเฉลี่ย r 2n1n2 1 = 2 x 26 x 24 1 25.96 และความ แปรปรวน
2n n (2n n n) r2 1 2 1 2 n2 (n 1)
ค่าสถิติการทดสอบเป็น
Zcal
n 50 2 x 26 x 24(2 x 26 x 24 50) = 12.2049 502 (50 1)
r r
r
18 25.96 2.28 3.4936
หรือ
r2
3.4936
ที่ระดับนัยสาคัญ 0.05 ค่าวิกฤต
ของ Z คือ 1.96 ค่าสถิติการทดสอบที่คานวณได้เป็น |–2.28| มีค่ามากกว่า 1.96 จึงปฏิเสธ สมมติฐาน H0 ที่ระดับนัยสาคัญ 0.05 ดังนั้นการซื้อและไม่ซื้อสบู่ตราดอกบัวคู่ของลูกค้าไม่เป็นไป อย่างสุ่ม ที่ระดับนัยสาคัญ 0.05 การทดสอบรันสามารถประยุกต์กับการทดสอบข้อมูลที่มีค่าสูงหรือต่ากว่าค่ามัธยฐาน โดย ข้อมูลที่มีค่ามากกว่าหรือเท่ากับมัธยฐานให้มีเครื่องหมายเป็นบวก(+) และข้อมูลที่มีค่าน้อยกว่ามัธยฐานให้มีเครื่องหมายเป็นลบ (–) แล้วทาการทดสอบเช่นเดียวกันกับการทดสอบรัน ในกรณีที่ n1 = n2 = n / 2 หมายความว่าขนาดของตัวอย่างเป็นจานวนคู่และตัวอย่างมี ขนาดใหญ่ โดยที่ n1 > 20 และ n2 > 20 จานวนรัน r มีการแจกแจงใกล้เคียงการแจกแจงปกติที่มี ค่าเฉลี่ย r n2 1 และความแปรปรวน r2 n4((nn 1)2) ดังนั้นค่าสถิติทดสอบเป็น Zcal r r r
และ Z มีการแจกแจงใกล้เคียง N(0,1) ค่าวิกฤตเป็น 1.96 ที่ระดับนัยสาคัญ 0.05 และจะปฏิเสธ สมมติฐาน H0 เมื่อค่าสัมบูรณ์ของสถิติการทดสอบที่คานวณได้มีค่ามากกว่าหรือเท่ากับ 1.96; |Hcal| มีค่ามากกว่า 1.96 ตัวอย่างที่ ก.4.3 ในการสอบสัมภาษณ์นักศึกษาปริญญาโท ผู้สัมภาษณ์เรียกผู้มาเข้าสอบทีละคน และไม่มีการกักตัวผู้เข้าสอบ เมื่อสอบครบ 24 คน แล้ว ผู้สัมภาษณ์สงสัยว่าผู้สอบคนแรก ๆ คงจะ แอบบอกคนหลัง ๆ ถ้าคะแนนของผู้เข้าสอบเรียงตามลาดับการสอบข้างล่างนี้ จงทดสอบว่าคะแนน ที่ได้สูงและต่ากว่ามัธยฐานเป็นไปอย่างสุ่มหรือไม่ คนที่ 1 2 3 4 5 6 7 8 9 10 11 12 คะแนน 31 23 36 43 51 44 12 26 43 75 12 2 Run + – + + + + – + + + – – คนที่ 13 14 15 16 17 18 19 20 21 22 23 24 คะแนน 3 16 78 24 13 27 86 61 13 7 6 8 Run – – + – – + + + – – – –
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 336 -
วิธีทา 1. ตั้งสมมุติฐาน
H0 : การได้คะแนนสูงหรือต่ากว่ามัธยฐานเป็นไปอย่างสุ่ม H1 : การได้คะแนนสูงหรือต่ากว่ามัธยฐานไม่เป็นไปอย่างสุ่ม 2. สร้างรหัสตัวแปร เมื่อนาคะแนนไปหาค่ามัธยฐานได้ค่า 25 n1 = เป็นคะแนนมากกว่าหรือเท่ากับมัธยฐาน เท่ากับ 12 n2 = เป็นคะแนนน้อยกว่ามัธยฐาน เท่ากับ 12 n = 24 3. ตรวจสอบจานวน run +–++++–+++––––+––+++–––– ได้ r = 10 4. ค่าวิกฤต run ในตารางภาคผนวกที่.... ได้ค่า 7 หรืออาจจะประมาณด้วยการแจกแจงปกติ จะได้ r n2 1 242 1 13 และ ความแปรปรวน r2 Zcal
r r
r
n(n 2) 24(24 2) 5.739 4(n 1) 4(24 1)
10 13 1.252 2.3956
หรือ r
2.3956 จะได้
ซึ่งค่าสถิติการทดสอบ |Hcal| = 1.252 มีค่าน้อยกว่า
1.96 จึงยอมรับ H0 : การได้คะแนนสูงหรือต่ากว่ามัธยฐานเป็นไปอย่างสุ่ม ตัวอย่างที่ ก.4.4 บริษทั ผลิตยาได้ชักตัวอย่างผู้ใช้ยาจานวน 10 คน และได้บันทึกน้าหนักของผู้ใช้ยา หน่วยเป็นกิโลกรัม ดังนี้ 80 65 67 76 82 60 61 64 69 58 จงทดสอบว่าตัวอย่างที่ได้เป็น ตัวอย่างสุ่มหรือไม่ วิธีทา 1. ตั้งสมมุติฐาน H0 : ตัวอย่างที่ได้เป็นตัวอย่างสุ่ม H1 : ตัวอย่างที่ได้ไม่เป็นตัวอย่างสุ่ม 2. สร้างรหัสตัวแปร เมื่อนาคะแนนไปหาค่ามัธยฐานได้ค่า 66 n1 = เป็นคะแนนมากกว่าหรือเท่ากับมัธยฐาน เท่ากับ 5 n2 = เป็นคะแนนน้อยกว่ามัธยฐาน เท่ากับ 5 3. ตรวจสอบจานวน run +–+++–––+– ได้ r = 6 4. ค่าวิกฤต run ในตารางที่ 7.1 และ 7.2 ภาคผนวก ได้ค่าเป็น 3 และ 10 ตามลาดับ ค่าสังเกต r = 6 มีค่าระหว่างค่าวิกฤต 3 และ 10 แสดงว่าไม่ปฏิเสธสมมติฐาน H0 ที่ ระดับนัยสาคัญ 0.05 ดังนั้น ตัวอย่างที่ได้เป็นตัวอย่างสุ่ม
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 337 -
ข. กลุ่มตัวอย่างสองกลุ่มที่สัมพันธ์กัน ตัวอย่างสองกลุ่มที่มีความสัมพันธ์กัน (The Case of Two Related Samples) หมายถึง กลุ่มตัวอย่าง 2 กลุ่มที่ถูกจัดเข้าคู่กัน เพื่อให้มีความเท่าเทียมกันโดยอาศัยตัวแปรภายนอก เช่น เพศ ระดับสติปัญญา เป็นต้น หรืออาจหมายถึงกลุ่มตัวอย่างเดียว แต่มีการจัดกระทาและถูกวัดซ้าใน ช่วงเวลาที่แตกต่างกัน เช่น การสอบก่อนเรียน และหลังเรียน เป็นต้น โดยปกติแล้วการวิเคราะห์ข้อมูลกรณีตัวอย่างสองกลุ่มที่มีความสัมพันธ์กัน (The Case of Two Related Samples) ในสถิติอิงพารามิเตอร์ใช้การทดสอบแบบที (t – test Dependent) ซึ่ง มีข้อตกลงเบื้องต้นว่าประชากรทั้งสองกลุ่มต้องมีการแจกแจงปกติ และการวัดต้องอยู่ในมาตรอันตร ภาค เป็นอย่างน้อย ในบางกรณีที่ข้อมูลของเราไม่สอดคล้องกับข้อตกลงดังกล่าว ก็อาจเลือกใช้สถิติ ไม่อิงพารามิเตอร์ในการทดสอบ ได้แก่ ข.1 การทดสอบแมกนีมาร์ (The McNemar Test for the Significance of Changs) ข.2 การทดสอบเครื่องหมาย (The Sign Test) ข.3 การทดสอบอันดับที่มีเครื่องหมายกากับของวิลคอกซัน(The Wilcoxon Signed Ranks Test) ข.1 การทดสอบแมกนีมาร์ (The McNemar Test for the Significance of Changs) การทดสอบแมกนีมาร์ ใช้ทดสอบเพื่อประเมินผลการเปลี่ยนแปลง (change) เรื่องใด เรื่องหนึ่งของสมาชิกกลุ่มเดียวกันในช่วงเวลาที่แตกต่างกันสองช่วง การทดสอบนี้ใช้ประยุกต์กับ ข้อมูลที่มีแบบแผนในรูป “ก่อนและหลัง” (before and after) ใช้กับตัวอย่างชุดเดียวกัน ทาการ ทดลอง 2 ครั้ง แล้วมาดูว่าการทดลองก่อนและหลังมีความเปลี่ยนแปลงอย่างไรบ้าง ตัวอย่างเช่น สอบถามความคิดเห็นต่อการเลิกสูบบุหรี่ ก่อนและหลังการให้ความรู้เกี่ยวกับผลของการสูบบุหรี่เป็น ประจา ในการทดลอบจะต้องจัดข้อมูลให้อยู่ในรูปตาราง 2x2 ก่อน ซึ่งมีลักษณะดังนี้ หลัง – + + A B ก่อน – C D ข้อมูลในตาราง 2x2 นี้ A หมายถึง จานวนข้อมูลที่มีลักษณะก่อนเป็น + และหลังเป็น – (มีการเปลี่ยนแปลง) B หมายถึง จานวนข้อมูลที่มีลักษณะก่อนเป็น + และหลังเป็น + (ไม่มีการเปลี่ยนแปลง) C หมายถึง จานวนข้อมูลที่มีลักษณะก่อนเป็น – และหลังเป็น + (มีการเปลี่ยนแปลง) D หมายถึง จานวนข้อมูลที่มีลักษณะก่อนเป็น – และหลังเป็น – (ไม่มีการเปลี่ยนแปลง) ข.1.1 ข้อตกลงเบื้องต้น ข.1.1.1 ระดับของการวัดอยู่ในมาตรานามบัญญัติ เป็นอย่างน้อย ข.1.1.2 ข้อมูลมี 2 ชุด ได้จากกลุ่มตัวอย่างกลุ่มเดี่ยวกัน และเป็นเรื่องเดียวกัน สามารถจัดข้อมูลให้อยู่ในรูปตาราง 2x2 ได้
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 338 -
ข.1.2 สมมติฐาน ความน่าจะเป็นของการเปลี่ยนแปลงในเหตุการณ์ครั้งแรกและในเหตุการณ์ครั้ง หลังไม่แตกต่างกัน และต่างมีความน่าจะเป็นเท่ากับ ½ H0 : P A = P D ( = ½ ) H1 : P A ≠ P D ( ≠ ½ ) ข.1.3 สถิติที่ใช้ทดสอบ 2
(| A D | 1)2 A+D
เมื่อ A และ D เป็นจานวนข้อมูลในช่อง A และ D
ตามลาดับ ข.1.4 อาณาเขตวิกฤตและการสรุปผล จะปฏิเสธสมมติฐาน H0 เมื่อค่า 2 ที่คานวณได้มีค่ามากกว่าหรือเท่ากับ ค่า 2 ,1 ทีเ่ ปิดได้จากตาราง หมายเหตุ หาก n มีค่าน้อย (n = A + D) หรือ (A + D)/2 มีค่าน้อยกว่า 5 แนะนา ให้ใช้ Binomial test ตัวอย่างที่ ข.1.1 ในการฝึกอบรมครั้งหนึ่งมีผู้เข้ารับการอบรม 100 คน ผู้จัดการ อบรมได้ทาการทดสอบความรู้ของผู้เข้ารับการอบรมทั้งก่อนและหลังการอบรม ปรากฏว่าผู้เข้ารับ การอบรม 43 คน มีคะแนนอยู่ในเกณฑ์ผ่านทั้งก่อนและหลังการอบรม มี 31 คน มีคะแนนอยู่ใน เกณฑ์ไม่ผ่านก่อนการอบรมแต่ผ่านหลังการอบรม มี 12 คนมีคะแนนไม่ผ่านทั้งก่อนและหลังการ อบรม นอกนั้นเป็นกรณีสุดท้าย จงทดสอบว่ามีการเปลี่ยนแปลงความรู้ของผู้เข้ารับการอบรมหรือไม่ ที่ระดับนัยสาคัญ 0.05 วิธีทา สมมติฐาน H0 : P A = P D ( = ½ ) H1 : P A ≠ P D ( ≠ ½ ) สถิติที่ใช้ทดสอบ McNemar อาณาเขตวิกฤตและการสรุปผล 2 กาหนด α = 0.05 ค่าวิกฤต 0.05,1 3.84 อาณาเขตวิกฤต 2 ≥ 3.84 คานวณค่าสถิติ จัดข้อมูลให้อยู่ในรูปตาราง 2x2 ได้ดังนี้ หลัง ไม่ผ่าน ผ่าน 14 43 ก่อน ไม่ผ่ผาน่าน 12 31 จากสูตร
2
(| A D | 1)2 A+D
(|14 31| 1)2 14 + 31
256 5.689 45
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 339 -
การสรุปผล 2 ค่า 2 ที่คานวณได้เท่ากับ 5.689 มีค่ามากกว่า 0.05,1 3.84 แสดงว่าตกใน อาณาเขตวิกฤต ดังนั้น ที่ระดับนัยสาคัญ 0.05 ความรู้ของผู้เข้ารับการอบรมก่อนและหลังการอบรม มีการเปลี่ยนแปลง ตัวอย่างที่ ข.1.2 จากการสังเกตนักศึกษาปริญญาเอกที่เข้าใหม่จานวน 20 คน พบว่า 15 คน มีความวิตกกังวล เมื่อผ่านไป 1 เดือน ก็สังเกตพบว่านักศึกษาที่เคยวิตกกังวล ได้หายวิตก กังวล 10 คน แต่อีก 5 คนยังคงวิตกกังวลเหมือนเดิม ส่วนผู้ที่ไม่วิตกกังวลตั้งแต่แรก 4 คน เปลี่ยน มาวิตกกังวล 2 คน ยังไม่วิตกกังวล 3 คน จงทดสอบดูว่า เมื่อเวลาผ่านไป 1 เดือน นักศึกษา ปริญญาเอกจะหายวิตกกังวลหรือไม่ วิธีทา สมมติฐาน H0 : P A = P D ( = ½ ) H1 : P A ≠ P D ( ≠ ½ ) สถิติที่ใช้ทดสอบ McNemar อาณาเขตวิกฤตและการสรุปผล 2 กาหนด α = 0.05 ค่าวิกฤต 0.05,1 3.84 อาณาเขตวิกฤต 2 ≥ 3.84 คานวณค่าสถิติ จัดข้อมูลให้อยู่ในรูปตาราง 2x2 ได้ดังนี้ หลัง ไม่วิตก วิตก 10 5 ก่อน ไม่วิวติตกก 3 2 จากสูตร
2
(| A D | 1)2 A+D
(|10 2 | 1)2 10 + 2
49 4.083 12
การสรุปผล 2 ค่า 2 ที่คานวณได้เท่ากับ 4.083 มีค่ามากกว่า 0.05,1 3.84 แสดงว่าตกใน อาณาเขตวิกฤต ดังนั้น ที่ระดับนัยสาคัญ 0.05 ความวิตกกังวลของนักศึกษาปริญญาเอกเมื่อเวลา ผ่านไป 1 เดือนมีการเปลี่ยนแปลง ตัวอย่างที่ ข.1.3 ในการฝึกอบรมครั้งหนึ่งมีผู้เข้ารับการอบรม 20 คน ผู้จัดอบรม ได้ทดสอบผู้เข้ารับการอบรมทั้งก่อนและหลังการอบรม ปรากฏว่า ผู้เข้ารับการอบรม 7 คน มี คะแนนอยู่ในเกณฑ์ผ่านทั้งก่อนและหลังการอบรม จานวน 5 คน มีคะแนนอยู่ในเกณฑ์ไม่ผ่านก่อน การอบรมแต่ผ่านหลังการอบรม จานวน 5 คน มีคะแนนไม่ผ่านเกณฑ์ทั้งก่อนและหลังการอบรม และจานวน 3 คน มีคะแนนผ่านเกณฑ์ก่อนการอบรมแต่ไม่ผ่านหลังการอบรม จงทดสอบการ เปลี่ยนแปลงนี้
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 340 -
วิธีทา สมมติฐาน H0 : P A = P D ( = H1 : P A ≠ P D ( ≠
½) ½)
สถิติที่ใช้ทดสอบ McNemar อาณาเขตวิกฤตและการสรุปผล 2 กาหนด α = 0.05 ค่าวิกฤต 0.05,1 3.84 อาณาเขตวิกฤต คานวณค่าสถิติ จัดข้อมูลให้อยู่ในรูปตาราง 2x2 ได้ดังนี้ หลัง ไม่ผ่าน ผ่าน 3 7 ก่อน ไม่ผ่ผาน่าน 5 5 จากสูตร
2
(| A D | 1)2 A+D
(| 3 5 | 1)2 3+5
2
≥ 3.84
1 0.125 8
การสรุปผล 2 ค่า 2 ที่คานวณได้เท่ากับ 0.125 มีค่าน้อยกว่า 0.05,1 3.84 แสดงว่าตกนอก อาณาเขตวิกฤต ดังนั้น ที่ระดับนัยสาคัญ 0.05 ความรู้ของผู้เข้ารับการอบรมก่อนและหลังการอบรม ไม่มีการเปลี่ยนแปลง ข.2 การทดสอบเครื่องหมาย (The Sign Test) การทดสอบเครื่องหมาย เป็นการทดสอบความแตกต่างของข้อมูลที่สุ่มมาเป็นคู่ ๆ โดยไม่คานึงว่าข้อมูลแต่ละคู่จะมีความแตกต่างกันมากน้อยเพียงใด คานึงถึงแต่เฉพาะทิศทางของ ความแตกต่างที่เป็นเครื่องหมายบวกและลบเท่านั้น ถ้าข้อมูลที่สุ่มมาไม่แตกต่างกันก็จะเป็นศูนย์ การ ทดสอบแบบนี้มีประโยชน์ต่อการวิจัยที่ประกอบด้วยข้อมูลที่ไม่สามารถวัดเป็นปริมาณออกมาได้ หรือ ไม่แน่ใจว่าข้อมูลเชิงปริมาณนั้นจะแทนคุณลักษณะของสิ่งที่วัดได้อย่างถูกต้อง แต่สามารถเรียงลาดับ ได้ เมื่อเปรียบเทียบกันระหว่างสมาชิกทั้งสองในแต่ละคู่ ข.2.1 ข้อตกลงเบื้องต้น ข.2.1.1 ตัวแปรที่ใช้ต้องมีการแจกแจงแบบต่อเนื่อง แต่จะมีรูปทรงอย่างไรก็ได้ ข.2.1.2 กลุ่มตัวอย่างจะมาจากคนละกลุ่มก็ได้ เช่น คนละเพศ หรือคนละอายุ แต่กลุ่มตัวอย่างแต่ละคู่จะต้องจับคู่กัน หรือใช้กลุ่มตัวอย่างเดิมทาการ ทดลองซ้า ข.2.2 สมมติฐาน H0 : มัธยฐานของความแตกต่างเท่ากับ 0 หรือ [P( + ) = P( – )] H1 : มัธยฐานของความแตกต่างเป็นลบ หรือ [P( + ) < P( – )] ข.2.3 สถิติทดสอบ จานวนเครื่องหมาย + ซึ่งมีจานวนน้อยกว่าเครื่องหมาย – คานวณสถิติทดสอบ k โดยกาหนดให้ k คือจานวนเครื่องหมาย +
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 341 -
ข.2.4 อาณาเขตวิกฤตและการสรุปผล จะตัดสินใจปฏิเสธ H0 ถ้าความน่าจะเป็นที่จะเกิดเครื่องหมาย + น้อยกว่าหรือ เท่ากับ α ตัวอย่างที่ ข.2.1 ทีมหมดฟันอยากทราบว่า การสอนประชาชนเกี่ยวกับการแปลงฟัน ได้ผลหรือไม่ กลุ่มตัวอย่างคือคนไข้ในคลินิกฟันจานวน 12 คู่ จับคู่กันด้วยปัจจัยด้านอายุ เพศ ความ ฉลาดและคะแนนตั้งต้นเกี่ยวกับความสะอาดของช่องปาก สมาชิกคนหนึ่งของแต่ละคู่จะได้รับการ สอนเกี่ยวกับการแปรงฟันและการรักษาความสะอาดของช่องปาก หลังจากนั้น 6 เดือนทาการตรวจ และให้คะแนนความสะอาดของช่องปากตัวอย่างคนไข้ทั้ง 24 คน คะแนนน้อยหมายความว่ามีความ สะอาดในช่องปากมาก ได้เครื่องหมายของความแตกต่างของคะแนนความสะอาดของตัวอย่างทั้ง 12 คู่ ดังตาราง ตารางเครื่องหมายของความแตกต่าง(xi – yi) ของคะแนนความสะอาดในช่องปากของตัวอย่าง 12 คู่ คนไข้โดย xi คือคะแนนของคนที่ได้รับการสอน และ yi คือคะแนนของคนที่ไม่ได้รับการสอน คู่ที่ 1 2 3 4 5 6 7 8 9 10 11 12 ความแตกต่างของคะแนน – 0 – + – – – – – – + – วิธีทา 1. ข้อตกลงเบื้องต้น คือ ประชากรเป็นตัวแปรแบบต่อเนื่อง 2. สมมติฐานทางสถิติ การสอนวิธีแปรงฟันและรักษาความสะอาดช่องปากได้ผล จะได้ ความแตกต่างของคะแนน เป็นเครื่องหมาย มากกว่า + แต่ถ้าการสอนไม่ได้ผลค่ามัธยฐานของคะแนนของประชากรเท่ากับ 0 เขียนสมมติฐานทางสถิติได้ดังนี้ H0 : มัธยฐานของความแตกต่างเท่ากับ 0 หรือ [P( + ) = P( – )] H1 : มัธยฐานของความแตกต่างเป็นลบ หรือ [P( + ) < P( – )] 3. สถิติทดสอบ จานวนเครื่องหมาย + ซึ่งมีจานวนน้อยกว่าเครื่องหมาย – คานวณสถิติทดสอบ k โดยกาหนดให้ k คือจานวนเครื่องหมาย + 4. การแจกแจงของสถิติทดสอบ คือการแจกแจงของตัวอย่างของ k เป็นการแจกแจงแบบไบโนเมียลมี พารามิเตอร์ p = 0.5 ถ้า H0 เป็นจริง 5. กฏการตัดสินใจ จะตัดสินใจปฏิเสธ H0 ถ้าความน่าจะเป็นที่จะเกิดเครื่องหมาย + น้อยกว่าหรือ เท่ากับ α ปฏิเสธ H0 ถ้า P(k ≤ 2 | 11, 0.5) ≤ 0.05 6. การตัดสินใจ จากตารางเครื่องหมายของความแตกต่าง (xi – yi) มี 0 จานวน 1 คู่ มี เครื่องหมาย + จานวน 2 คู่ และมีเครื่องหมาย – จานวน 9 คู่ จึงจะตัด 0 ออกไป และ ลด n ลงเหลือ 11 คู่ และ k = 2
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 342 -
การตัดสินใจทางสถิติ จึงต้องการทราบความน่าจะเป็นที่จะเกิดเครื่องหมาย + ไม่มากกว่า 2 จากตัวอย่าง 11 คู่ เมื่อสมมติฐาน H0 เป็นจริง คานวณความน่าจะเป็นจากการแจกแจงแบบไบโนเมียลคือ 2 P(k ≤ 2 | n = 11, p = 0.5) = 11k (0.5)k (0.5)11 k k 0
เมื่อเปิดตาราง Cumulative Binomial Probability Distribution ได้ความน่าจะเป็น เท่ากับ 0.0327 ซึ่งน้อยกว่า 0.05 ดังนั้นจึงตัดสินใจปฏิเสธ H0 7. สรุปผล มัธยฐานของความแตกต่างของคะแนนความสะอาดในช่องปากของกลุ่มตัวอย่างเป็น ลบ ตัวอย่างที่ ข.2.2 ครูณรงค์ศักดิ์ทดลองสอนนักเรียน 12 คน ด้วยชุดการสอนแบบอิง ประสบการณ์ ก่อนสอนได้วัดทักษะความคิดสร้างสรรค์ของนักเรียนไว้ก่อน พอทดลองสอนจบ แล้วได้วัดความคิดสร้างสรรค์อีกครั้งหนึ่ง อยากทราบว่าชุดการสอนแบบอิงประสบการณ์ของครู ณรงค์ศักดิ์สามารถทาให้นักเรียนมีความคิดสร้างสรรค์แตกต่างจากเดิมหรือไม่ ที่ α = 0.05 นักเรียน คะแนนก่อนใช้ คะแนนหลังใช้ ทิศทางความ เครื่องหมาย คนที่ ชุดการสอน (Xi) ชุดการสอน(Yi) แตกต่าง 1 24 25 Y i > Xi + 2 23 26 Y i > Xi + 3 22 24 Y i > Xi + 4 24 24 Y i = Xi 0 5 23 25 Y i > Xi + 6 21 23 Y i > Xi + 7 24 26 Y i > Xi + 8 25 24 Y i < Xi 9 26 25 Y i < Xi 10 25 28 Y i > Xi + 11 26 25 Y i < Xi 12 24 24 Y i = Xi 0 1. สมมติฐานทางสถิติ วิธีการสอนแบบอิงประสบการณ์ก่อนและหลังของการใช้ชุดการสอน จะได้ความแตกต่างของคะแนนให้หลังมากขึ้นให้เครื่องหมายเป็น + แต่ถ้าหลังการ สอนคะแนนลดลงให้เป็น – เขียนสมมติฐานทางสถิติได้ดังนี้ H0 : มัธยฐานของความแตกต่างเท่ากับ 0 หรือ [P( – ) = P( + )] H1 : มัธยฐานของความแตกต่างเป็นลบ หรือ [P( – ) < P( + )] 2. สถิติทดสอบ จานวนเครื่องหมาย – ซึ่งมีจานวนน้อยกว่าเครื่องหมาย +
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 343 -
คานวณสถิติทดสอบ k โดยกาหนดให้ k คือจานวนเครื่องหมาย – 3. การแจกแจงของสถิติทดสอบ คือการแจกแจงของตัวอย่างของ k เป็นการแจกแจงแบบไบโนเมียลมี พารามิเตอร์ p = 0.5 ถ้า H0 เป็นจริง 4. กฏการตัดสินใจ จะตัดสินใจปฏิเสธ H0 ถ้าความน่าจะเป็นที่จะเกิดเครื่องหมาย – น้อยกว่าหรือ เท่ากับ α ปฏิเสธ H0 ถ้า P(k ≤ 3 | 10, 0.5) ≤ 0.05 5. การตัดสินใจ จากตารางเครื่องหมายของความแตกต่าง (xi – yi) มี 0 จานวน 2 คู่ มี เครื่องหมาย – จานวน 3 คู่ และมีเครื่องหมาย + จานวน 7 คู่ จึงจะตัด 0 ออกไป และ ลด n ลงเหลือ 10 คู่ และ k = 3 การตัดสินใจทางสถิติ จึงต้องการทราบความน่าจะเป็นที่จะเกิดเครื่องหมาย + ไม่มากกว่า 2 จากตัวอย่าง 11 คู่ เมื่อสมมติฐาน H0 เป็นจริง คานวณความน่าจะเป็นจากการแจกแจงแบบไบโนเมียลคือ 3 P(k ≤ 3 | n = 10, p = 0.5) = 10k (0.5)k (0.5)10 k k 0
เมื่อเปิดตาราง Cumulative Binomial Probability Distribution ได้ความน่าจะเป็น เท่ากับ 0.172 ซึ่งมากกว่า 0.05 ดังนั้นจึงตัดสินใจยอมรับ H0 : มัธยฐานของความแตกต่างเท่ากับ 0 หรือ [P( – ) = P( + )] 6. สรุปผล มัธยฐานของความแตกต่างของคะแนนวิธีการสอนแบบอิงประสบการณ์ก่อนและหลังของ การใช้ชุดการสอนไม่แตกต่างกัน ข.3 การทดสอบอันดับที่มีเครื่องหมายกากับของวิลคอกซัน (The Wilcoxon Signed Ranks Test) การทดสอบอันดับที่มีเครื่องหมายกากับของวิลคอกซัน แฟรงค์ วิลคอกซัน (Frank Wilcoxon) เป็นผู้คิดค้นขึ้นเมื่อ ค.ศ.1945 ในกรณีที่ข้อมูลที่มีอยู่เป็นการวัดในรูปของหน่วย ใดหน่วยหนึ่งมิใช่แต่เพียงจัดอันดับ ใช้ทดสอบสมมติฐานลักษณะเดียวกันกับการทดสอบเครื่องหมาย แต่การทดสอบอันดับที่มีเครื่องหมายกากับของวิลคอกซันจะดีกว่าการทดสอบเครื่องหมาย ตรงที่ได้ นาขนาดของความแตกต่างในข้อมูลแต่ละคู่มาพิจารณาพร้อมกับเครื่องหมาย ในขณะที่การทดสอบ เครื่องหมายจะดูแค่ทิศทางการบวกและลบเท่านั้น ข.3.1 ข้อตกลงเบื้องต้น ข.3.1.1 ข้อมูลต้องมีระดับการวัดอยู่ในมาตราอันตรภาค ข.3.1.2 ข้อมูลทั้งสองชุดมาจากกลุ่มตัวอย่างเดียวกันที่มีการวัดซ้าหรือเป็นกลุ่ม ตัวอย่างสองกลุ่มที่สัมพันธ์กัน เช่น การใช้คู่แฝด การจับคู่ให้สมาชิกมี ความเท่าเทียมกันเป็นคู่ ๆ โดยอาศัยคะแนนเฉลี่ยสะสม หรือประสบการณ์ในการทางาน เป็นต้น
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 344 -
ข.3.2 สมมติฐาน สมมติฐานทางสถิติสามารถทดสอบได้ 3 แบบ คือ H0 : µ = µ0 ขัดแย้งกับ H1 : µ < µ0 H0 : µ = µ0 ขัดแย้งกับ H1 : µ > µ0 H0 : µ = µ0 ขัดแย้งกับ H1 : µ ≠ µ0 ข.3.3 ขั้นตอนการคานวณ 1. คานวณค่าความแตกต่างของค่าสังเกตแต่ละตัว xi กับค่าเฉลี่ย µ0 คือ di = xi – µ0 ถ้า di = 0 จะเอาค่าสังเกตตัวนั้นออกและ ลด n ลงตามจานวนศูนย์ 2. เรียงลาดับ di จากน้อยที่สุดไปมากที่สุดโดยไม่สนใจเครื่องหมาย ถ้า |di| มี ค่าเท่ากันหลายตัวให้หาค่าเฉลี่ยของอันดับเป็นอันดับเฉลี่ย ตัวอย่างเช่น มี |di| ที่มีค่าน้อยที่สุด 3 ตัว ให้อันดับที่เป็น 1, 2 และ 3 คานวณหาอันดับเฉลี่ย ได้เท่ากับ (1+2+3)/3 = 2 ให้ค่าที่น้อยที่สุด 3 ตัวนั้นมีอันดับเป็น 2 ทุกตัว 3. ให้แต่ละอันดับมีเครื่องหมายของ di 4. หา T+ คือผลบวกของอันดับที่มีเครื่องหมายบวก T– คือผลบวกของอันดับที่มีเครื่องหมายลบ ข.3.4 สถิติทดสอบ สถิติทดสอบวิลค็อกซัน คือ T+ หรือ T– ขึ้นอยู่กับธรรมชาติของสมมติฐานแย้ง ถ้าสมมติฐาน H0 เป็นจริง นั่นคือ ถ้าค่าเฉลี่ยของประชากรมีค่าเท่ากับค่าที่คาดหวังและเป็นไปตาม ข้อตกลงเบื้องต้น ค่าคาดหวังของ T+ เท่ากับค่าคาดหวังของ T– สาหรับ H0 : µ = µ0 ขัดแย้งกับ H1 : µ < µ0 สถิติทดสอบคือ T+ สาหรับ H0 : µ = µ0 ขัดแย้งกับ H1 : µ > µ0 สถิติทดสอบคือ T– สาหรับ H0 : µ = µ0 ขัดแย้งกับ H1 : µ ≠ µ0 สถิติทดสอบคือ T+ หรือ T– ตัวที่มีค่าเล็กกว่า ค่าวิกฤตของสถิติทดสอบวิลค็อกซันเปิดจากตาราง Probability Levels for the Wilcoxon Signed Rank Test ข.3.5 กฏการตัดสินใจ กฎการตัดสินใจที่สมมติฐานแย้งแตกต่างกัน 3 แบบ คือ สาหรับสมมติฐานแย้ง H1 : µ < µ0 จะตัดสินใจปฏิเสธ H0 ที่ระดับนัยสาคัญ α ถ้า T+ น้อยกว่าหรือเท่ากับค่าวิกฤต T ที่เปิดจากตาราง ที่ตัวอย่างขนาด n และที่ความ น่าจะเป็น α สาหรับสมมติฐานแย้ง H1 : µ > µ0 จะตัดสินใจปฏิเสธ H0 ที่ระดับนัยสาคัญ α ถ้า T– น้อยกว่าหรือเท่ากับค่าวิกฤต T ที่เปิดจากตาราง ที่ตัวอย่างขนาด n และที่ความ น่าจะเป็น α สาหรับสมมติฐานแย้ง H1 : µ ≠ µ0 จะตัดสินใจปฏิเสธ H0 ที่ระดับนัยสาคัญ α ถ้าค่า T ที่คานวณได้น้อยกว่าหรือเท่ากับค่าวิกฤต T ที่เปิดจากตาราง Probability Levels for the Wilcoxon Signed Rank Test ที่ตัวอย่างขนาด n และที่ความน่าจะเป็น α/2
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 345 -
ตัวอย่างที่ ข.3.1 การศึกษาคนไข้ที่เป็น post cardiac โดยสุ่มคนไข้มาเป็นตัวอย่าง 15 คน แล้ววัด ค่า cardiac (ลิตร/นาที) ได้ข้อมูลดังนี้ 4.91 4.10 6.74 7.27 7.42 7.50 6.56 4.64 5.98 3.14 3.23 5.80 6.17 5.39 5.77 ต้องการทราบว่าค่าเฉลี่ยของประชากรแตกต่างจาก 5.05 หรือไม่ วิธีทา 1. สมมติฐานทางสถิติที่ต้องการทดสอบคือ H0 : µ = 5.05 ขัดแย้งกับ H1 : µ ≠ 5.05 ที่ระดับนัยสาคัญ 0.05 2. สถิติทดสอบคือ T+ หรือ T– ตัวที่มีค่าเล็กกว่า 3. ค่าวิกฤตของสถิติทดสอบเปิดจากตาราง Probability Levels for the Wilcoxon Signed Rank Test 4. กฎการตัดสินใจคือ จะปฏิเสธ H0 ถ้าค่า T ที่คานวณได้น้อยกว่าหรือเท่ากับค่าวิกฤตที่เปิด จากตารางที่มีจานวนตัวอย่าง n = 15 และ α/2 = 0.0240 ซึ่งเป็นค่าที่ใกล้ที่สุดกับค่า 0.0250 ใน ตารางได้ค่า T = 25 5. คานวณค่าสถิติทดสอบของตัวอย่าง ดังแสดงในตาราง ข.3.1 6. เนื่องจากค่า T ที่คานวณได้เท่ากับ 34 มากกว่าค่าวิกฤต T ที่เปิดจากตารางเท่ากับ 25 ดังนั้นจึงตัดสินใจยอมรับ H0 7. สรุปผลคือ ค่าเฉลี่ยของประชากรเท่ากับ 5.05 ตาราง ข.3.1 การคานวณค่าสถิติทดสอบของตัวอย่าง Cardiac Output di = xi – 5.05 ลาดับที่ของ di 4.91 4.10 6.74 7.27 7.42 7.50 6.56 4.64 5.98 3.14 3.23 5.80 6.17 5.39 5.77
– 0.14 – 0.95 +1.69 +2.22 +2.37 +2.45 +1.51 –0.41 +0.93 –1.91 –1.82 +0.75 +1.12 +0.34 +0.72
1 7 10 13 14 15 9 3 6 12 11 5 8 2 4
ค่าวิกฤต T คือ T+ หรือ T– ตัวที่มีค่าเล็กกว่าในตัวอย่างนี้คือ T–
เครื่องหมายลาดับที่ของ di –1 –7 +10 +13 +14 +15 +9 –3 +6 –12 –11 +5 +8 +2 +4
T+ = 86, T– = 34
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 346 -
ตัวอย่างที่ ข.3.2 ครูนิติธารทดลองสอนนักเรียนด้วยชุดฝึกทักษะการทางาน ก่อนทดลองได้สังเกต และบันทึกคะแนนทักษะการทางานไว้ก่อน หลังการทดลองทาการสังเกตและบันทึกคะแนนทักษะ การทางานไว้อีกครั้งดังข้อมูลในตาราง นักเรียนคนที่ 1 2 3 4 5 6 7 8 9 10 11 12 คะแนนทักษะการทางานก่อนสอน 4 3 2 4 3 1 4 5 6 5 6 4 คะแนนทักษะการทางานหลังสอน 5 6 4 4 5 3 6 4 5 8 5 4 จงทดสอบสมมติฐานที่ระดับ 0.05 ว่าคะแนนทักษะการทางาน หลังการสอนนักเรียน ด้วยชุดฝึกทักษะการทางานสูงกว่าก่อนสอนจริงหรือไม่ วิธีทา 1. ตั้งสมมุติฐาน H0 : มัธยฐานของคะแนนหลังสอนเท่ากับมัธยฐานของคะแนนก่อนสอน H1 : มัธยฐานของคะแนนหลังสอนสูงกว่ามัธยฐานของคะแนนก่อนสอน ที่ระดับนัยสาคัญ 0.05 2. สถิติทดสอบคือ T+ หรือ T– ตัวที่มีค่าเล็กกว่า 3. ค่าวิกฤตของสถิติทดสอบเปิดจากตาราง Probability Levels for the Wilcoxon Signed Rank Test 4. กฎการตัดสินใจคือจะปฏิเสธ H0 ถ้าค่า T ที่คานวณได้น้อยกว่าหรือเท่ากับค่าวิกฤตที่เปิด จากตารางที่มีจานวนตัวอย่าง n = 10 และ α/2 = 0.0240 ซึ่งเป็นค่าที่ใกล้ที่สุดกับค่า 0.0250 ใน ตารางได้ค่า T = 25 5. คานวณค่าสถิติทดสอบของตัวอย่าง ดังแสดงในตาราง ข.3.2 6. เนื่องจากค่า T ที่คานวณได้เท่ากับ 7.5 น้อยกว่าค่าวิกฤต T ที่เปิดจากตารางเท่ากับ 25 ดังนั้นจึงตัดสินใจปฏิเสธ H0 ตารางที่ ช.3.2 นักเรียนคนที่ 1 2 3 4 คะแนนทักษะการทางานก่อนสอน 4 3 2 4 คะแนนทักษะการทางานหลังสอน 5 6 4 4 di = yi – xi 1 3 2 0 2.5 9.5 6.5 T+ = 47.5 T- = 7.5
5 3 5 2 6.5
6 1 3 2 6.5
7 8 4 5 6 4 2 1 6.5 -2.5
9 6 5 1 -2.5
10 5 8 3 9.5
11 6 5 1 -2.5
12 4 4 0 -
7. สรุปผลคือปฏิเสธ H0 กล่าวคือมัธยฐานของคะแนนหลังเรียนสูงกว่ามัธยฐานของคะแนน ก่อนเรียน ที่ระดับนัยสาคัญ .05
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 347 -
ค. กลุ่มตัวอย่างสองกลุ่มที่เป็นอิสระกัน โดยปกติการทดสอบความแตกต่างระหว่างข้อมูลจากตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน จะใช้การเปรียบเทียบค่าเฉลี่ยของตัวอย่างทั้งสองกลุ่มโดยใช้การทดสอบแบบที (t–test Independent) ซึ่งมีข้อตกลงเบื้องต้นว่า คะแนนที่รวบรวมมาได้ทั้ง 2 กลุ่ม จะต้องเป็นอิสระต่อกัน และ ประชากรต้องมีการแจกแจงแบบปกติ ที่สาคัญข้อมูลที่ได้ต้องมีระดับการวัดอยู่ในมาตราอันตรภาค แต่ในบางครั้งจะพบว่าไม่สามารถใช้การทดสอบแบบทีได้ เนื่องจากข้อมูลมีระดับการวัดไม่ถึงมาตรา อันตรภาคและไม่เป็นไปตามข้อตกลงแบบที ดังนั้นจึงควรหันมาวิเคราะห์ข้อมูลโดยใช้การทดสอบ สถิติไม่อิงพาราเมเตอร์แทนซึ่ง ได้แก่ ค.1 การทดสอบของฟิเชอร์ (Fisher Exact Test for 2x2 Tables) ค.2 การทดสอบไคกาลังสองสาหรับตัวอย่างสองกลุ่มที่เป็นอิสระกัน (The Chi-Square Test for two Independent Samples) ค.3 การทดสอบมัธยฐาน (The Median Test) ค.4 การทดสอบโคโมโกรอฟ-สไมร์นอฟ สาหรับตัวอย่างสองกลุ่ม (The Kolmogorov – Smirnov Two sample Tes) ค.5 การทดสอบวิลคอกซัน-แมนน์-วิทนี (The Wilcoxon – Mann – Whitney Test) ค.6 การทดสอบรันของ วอล์ด วูล์ฟอวิทซ์ (The Wald Wolfowitz Run Test) ค.1 การทดสอบของฟิเชอร์ (Fisher Exact Test for 2x2 Tables) การทดสอบของฟิเชอร์ ใช้กับข้อมูลประเภทความถี่ที่สามารถจัดให้อยู่ในรูปตาราง การจรขนาด 2 2 เมื่อต้องการทดสอบว่าสัดส่วนหรือความน่าจะเป็นที่ประชากรสองกลุ่มจะถูกแบ่ง ออกเป็นสองประเภทเท่า ๆ กัน เป็นการทดสอบความแตกต่างของกลุ่มตัวอย่างที่เป็นอิสระจากกัน ค่าที่ได้จากการวัดแยกขาดจากกัน ข้อมูลจะต้องสามารถจัดให้อยู่ในรูปตาราง 2 x 2 ได้ดังนี้ กลุ่มตัวอย่าง กลุ่ม 1 กลุ่ม 2 ประเภท I A B ประเภท II C D เมื่อ A, B, C, D เป็นจานวนข้อมูลในแต่ละกลุ่ม แต่ละประเภท ค.1.1 ข้อตกลงเบื้องต้น ค.1.1.1 ระดับการวัดอยู่ในมาตรานามบัญญัติหรือมาตราเรียงอันดับ ค.1.1.2 กลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน โดยแต่ละกลุ่มแบ่งเป็นสอง ประเภท หรือสองลักษณะ เช่น ชาย – หญิง, พ่อ – แม่, พรรครัฐบาล – พรรคฝ่ายค้าน เป็นต้น และสามารถจัดอยู่ในตารางการจร ขนาด 2 2 ค.1.2 สมมติฐาน H0 : โอกาสที่กลุ่ม 2 กลุ่ม ถูกจาแนกประเภทเป็นประเภท I และ II เท่ากัน H1 : โอกาสที่กลุ่ม 2 กลุ่ม ถูกจาแนกประเภทเป็นประเภท I และ II แตกต่างกัน
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 348 -
ค.1.3 สถิติที่ใช้ทดสอบ
P
( A B)!(C D)!( A C )! ( B D)! N ! A1B !C ! D !
ค.1.4 อาณาเขตวิกฤตและการสรุปผล จะปฏิเสธสมมติฐาน H0 เมื่อค่า P ที่คานวณได้มีค่าน้อยกว่าค่า ที่กาหนด ตัวอย่างที่ ค.1.1 ในการสุ่มตัวอย่างนักศึกษาปริญญาเอกที่เรียนวิชาสถิติชั้นสูงมา 20 คน เป็นชาย 8 คน หญิง 12 คน ปรากฏว่า นักศึกษาชายสอบผ่าน 6 คน ส่วนนักศึกษาหญิงสอบผ่าน 10 คน จงทดสอบสมมติฐานว่าสัดส่วนของนักศึกษาชายที่สอบผ่านแตกต่างจากสัดส่วนของนักศึกษา หญิงที่สอบผ่านใช่หรือไม่ โดยใช้ระดับความมีนัยสาคัญ 0.01 เมื่อนาข้อมูลที่โจทย์กาหนดให้มาใส่ลงในตารางการจร ได้ดังนี้ จานวนนักศึกษา ผลการสอบ รวม ชาย หญิง ผ่าน A=6 B = 10 A+B = 16 ไม่ผ่าน C=2 D=2 C+D = 4 รวม A+C = 8 B+D = 12 N = A+B+C+D = 20 วิธีทา สมมติฐาน H0 : โอกาสที่นักศึกษาชายและหญิงจะสอบผ่านหรือไม่ผ่านมีเท่ากัน H1 : โอกาสทีน่ ักศึกษาชายและหญิงจะสอบผ่านหรือไม่ผ่านแตกต่างกัน อาณาเขตวิกฤต กาหนด = 0.05 สถิติที่ใช้ทดสอบ P
( A B)!(C D)!( A C )! ( B D)! 16!4!8!12! N ! A1B !C ! D ! 20!6!10!2!2! 352 0.218 1615
สรุปผล ค่า P ที่ได้จากการคานวณ มีค่า 0.218 ซึ่งมากกว่าค่า = 0.05 จึงตก นอกอาณาเขตวิกฤต จึงยอมรับ H0 สรุปว่าที่ระดับนัยสาคัญ 0.05 โอกาสที่นักศึกษาชายและหญิงจะ สอบผ่านหรือไม่ผ่านมีเท่ากัน ตัวอย่างที่ ค.1.2 ในการวิจัยเพื่อต้องการทราบว่านักศึกษาชายและหญิงมีความวิตกกังวลในการ เรียนต่างกันหรือไม่ ผลการสารวจปรากฏดังตาราง ความวิตกกังวล เพศ ชาย หญิง รวม ชาย 4 11 15 หญิง 7 3 10 รวม 11 14 25 วิธีทา สมมติฐาน H0 : โอกาสที่นักศึกษาชายและหญิงจะมีความวิตกกังวลสูงหรือต่ามีเท่ากัน H1 : โอกาสที่นักศึกษาชายและหญิงจะมีความวิตกกังวลสูงหรือต่าต่างกัน
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 349 -
สถิติที่ใช้ทดสอบ Fisher Exact Probability test อาณาเขตวิกฤต กาหนด = 0.05 สถิติที่ใช้ทดสอบ P
( A B)!(C D)!( A C )! ( B D)! 15!10!11!14! N ! A1B !C ! D ! 25!4!11!7!3!
0.037
สรุปผล ค่า P ที่ได้จากการคานวณ มีค่า 0.037 ซึ่งน้อยกว่าค่า = 0.05 จึงตกใน อาณาเขตวิกฤต จึงปฏิเสธ H0 สรุปว่าที่ระดับนัยสาคัญ 0.05 โอกาสที่นักศึกษาชายและหญิงจะมี ความวิตกกังวลสูงหรือต่าแตกต่างกัน ข้อสังเกตบางประการ การใช้สถิติทดสอบเป็น Fisher Exact Probability test เมื่อคานวณค่าสถิติที่ใช้ทดสอบ ซึ่งแทน ด้วยค่า P แล้วนาไปเปรียบเทียบกับค่าระดับนัยสาคัญ คือความน่าจะเป็นดังนั้นจึงคล้ายกับว่าตัว สถิติทดสอบนั้นจะให้ P-value ดังนั้นต้องพิสูจน์ให้ได้ว่า ( A B)!(C D)!( A C )! ( B D)! ให้ P-value แต่เนื่องจากสถิติทดสอบนี้มี P N ! A1B !C ! D !
ค่าโตเร็วมากเพราะคานวณจากแฟคตอเรียล ดังนั้นหากทาการทดสอบกับข้อมูลที่มีจานวนมากก็คง จะมีปัญหาในการคานวณ จึงเป็นข้อจากัดของสถิติทดสอบนี้ ค.2 การทดสอบไคสแควร์สาหรับตัวอย่างสองกลุ่มที่เป็นอิสระกัน (The Chi-Square Test for two Independent Samples) การทดสอบไคสแควร์ เป็นการทดสอบเพื่อดูว่าความถี่ระหว่างประชากรทั้งสอง กลุ่มที่แยกเป็นหลาย ๆ ลักษณะมีความแตกต่างกันหรือไม่ เป็นอิสระจากกันหรือไม่ หรือมีความ สัมพันธ์กันหรือไม่ ระดับของตัวแปรมีมาตรวัดอยู่ในระดับนามบัญญัติหรืออันดับ การนาเสนอข้อมูล อยู่ในรูปตารางแจกแจงความถี่แบบสองทางมีขนาดเป็น 2 x c (หรือ r x 2) ซึ่งเรียกลักษณะตาราง แจกแจงความถี่แบบสองทางที่ใช้ในการทดสอบไคสแควร์ว่าตารางการณ์จร (Contingency table) ดังนั้นในการทดสอบจะดูความสอดคล้องของจานวนที่อยู่ในตารางการณ์จร ค.2.1 ข้อตกลงเบื้องต้น ค.2.1.1 ระดับการวัดอยู่ในมาตรานามบัญญัติหรือเป็นข้อมูลประเภทความถี่ ค.2.1.2 กลุ่มตัวอย่าง 2 กลุ่ม เป็นอิสระจากกัน หรือข้อมูลประกอบด้วยตัว แปร 2 ชุด ซึ่งสามารถจัดให้อยู่ในรูปของตารางการณ์จร 2 x c (หรือ r x 2) ได้ ค.2.2 สมมติฐาน H0 : Oij = Eij H1 : Oij Eij , i = 1,2,…, r ; j = 1,2,…, c หรือ H0 : สัดส่วนของลักษณะต่างๆ ที่ปรากฏในตัวอย่าง 2 กลุ่มมีเท่ากัน H1 : สัดส่วนของลักษณะต่างๆ ที่ปรากฏในตัวอย่าง 2 กลุ่มมีไม่เท่ากัน
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 350 -
ค.2.3 สถิติที่ใช้ทดสอบ c (Oij Eij )2 Eij i 1 j 1 r
2 cal
; df ( r 1)(c 1)
เมื่อ Oij = ความถี่ที่ได้จากการรวบรวมข้อมูลจริงในแถวที่ i และ หลักที่ j ในตารางการณ์จร Eij = ความถี่ที่คาดว่าจะเป็นในแถวที่ i และหลักที่ j ในตาราง การณ์จร n n โดยที่ Eij i j ; N เป็นจานวนข้อมูล N
ni
nj
เป็นจานวนข้อมูลในแถวที่ i เป็นจานวนข้อมูลในแถวที่ j
ค.2.4 อาณาเขตวิกฤตและการสรุปผล จะปฏิเสธสมมติฐาน H0 เมื่อค่า 2 ที่คานวณได้มีค่ามากกว่าหรือเท่ากับ ค่า 2 (r 1)(c 1) จากตาราง (ใช้ตารางเดียวกันกับการทดสอบไคสแควร์ กรณี 1 กลุ่มตัวอย่าง
ตัวอย่างที่ ค.2.1 ในการวิจัยเพื่อต้องการทราบว่านักศึกษาชายและหญิงมีความวิตกกังวล ในการเรียนต่างกันหรือไม่ ผลการสารวจปรากฏดังตาราง ความวิตกกังวล เพศ สูง ต่า ชาย 62 48 หญิง 73 42 วิธีทา สมมติฐาน H0 : สัดส่วนความวิตกกังวลสูงหรือต่าในกลุ่มนักเรียนชายเท่ากันกับในกลุ่ม นักเรียนหญิง H1 : สัดส่วนความวิตกกังวลสูงหรือต่าในกลุ่มนักเรียนชายไม่เท่ากันกับในกลุ่ม นักเรียนหญิง สถิติที่ใช้ทดสอบ สถิติไคสแควร์ 2 3.84 อาณาเขตวิกฤต 2 3.84 อาณาเขตวิกฤต กาหนด = 0.05 ได้ 0.05,1
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 351 -
คานวณค่าสถิติ ความวิตกกังวล เพศ ชาย หญิง รวม
สูง 62
ต่า 48
110x135 66 225
110x90 44 225
73
42
115x135 69 225
115x90 46 225
135
90
รวม 110 115 225
c (Oij Eij )2 (62 66)2 (48 44) 2 (73 69) 2 (42 46) 2 = Eij 66 44 69 46 i 1 j 1 16 16 16 16 = = 1.186 66 44 69 46 r
2 cal
การสรุปผล ค่า 2 ที่ได้จากการคานวณมีค่า 1.186 ซึ่งน้อยกว่าค่า 2 ที่เปิดจากตาราง 2 ( 0.05,1 3.84 ) ซึ่งไม่ตกในอาณาเขตวิกฤต จึงยอมรับ H0 สรุปได้ว่าสัดส่วนความ วิตกกังวลสูงหรือต่าในกลุ่มนักเรียนชายเท่ากันกับในกลุ่มนักเรียนหญิง จากข้อมูลของตัวอย่างนี้ หากใช้การทดสอบของฟิเชอร์ ได้ผลการทดสอบดังนี้ สมมติฐาน H0 : สัดส่วนความวิตกกังวลสูงหรือต่าในกลุ่มนักเรียนชายเท่ากันกับในกลุ่ม นักเรียนหญิง H1 : สัดส่วนความวิตกกังวลสูงหรือต่าในกลุ่มนักเรียนชายไม่เท่ากันกับในกลุ่ม นักเรียนหญิง สถิติที่ใช้ทดสอบ Fisher Exact Probability test อาณาเขตวิกฤต กาหนด = 0.05 สถิติที่ใช้ทดสอบ P
( A B)!(C D)!( A C )! ( B D)! 110!x115!x135!x90! N ! A1B !C ! D ! 225!x62!x48!x73!x42!
0.0600993118442729
= 0.06 สรุปผล ค่า P ที่ได้จากการคานวณ มีค่า 0.06 ซึ่งมากกว่าค่า = 0.05 จึงตกนอก อาณาเขตวิกฤต จึงยอมรับ H0 สรุปได้ว่าสัดส่วนความวิตกกังวลสูงหรือต่าในกลุ่มนักเรียน ชายเท่ากันกับในกลุ่มนักเรียนหญิง
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 352 -
ตัวอย่างที่ ค.2.2 จงทดสอบสมมติฐานที่ระดับ 0.05 ว่าเพศหญิงกับเพศชายจะมีความ ขยันแตกต่างกันหรือไม่ และถ้าผลสารวจได้ข้อมูล ดังตารางต่อไปนี้ ความขยัน หญิง ชาย รวม ขยัน 12 32 44 ไม่ขยัน 22 14 36 ไม่แน่ 9 6 15 รวม 43 52 95 วิธีทา สมมติฐาน H0 : สัดส่วนความขยันในกลุ่มเพศชายเท่ากันกับในกลุ่มเพศหญิง H1 : สัดส่วนความขยันในกลุ่มเพศชายไม่เท่ากันกับในกลุ่มเพศหญิง สถิติที่ใช้ทดสอบ สถิติไคสแควร์ 2 อาณาเขตวิกฤต กาหนด = 0.05 ได้ 0.05,2 5.99 อาณาเขตวิกฤต 2 5.99 คานวณค่าสถิติ ความขยัน หญิง ชาย รวม ขยัน 12 32 44 ไม่ขยัน ไม่แน่ รวม
44x43 19.92 95
44x52 24.08 95
22
14
36x43 16.29 95
36x52 19.71 95
9
6
15x43 6.79 95
15x52 8.21 95
43
52
36 15 95
c (Oij Eij )2 (12 19.92)2 (32 24.08) 2 (22 16.29) 2 = Eij 19.92 24.08 16.29 i 1 j 1 r
2 cal
(14 19.71)2 (9 6.79)2 (6 8.21)2 19.71 6.79 8.21 = 3.149 2.605 2.001 1.654 0.719 0.595
= 10.724
การสรุปผล ค่า 2 ที่ได้จากการคานวณมีค่า 10.724 ซึ่งมากกว่าค่า 2 ที่เปิดจากตาราง 2 ( 0.05,2 5.99 ) ซึ่งตกในอาณาเขตวิกฤต จึงปฏิเสธ H0 สรุปได้ว่าสัดส่วนความ ขยันในกลุ่มนักเรียนชายแตกต่างกับกลุ่มนักเรียนหญิง ที่ระดับนัยสาคัญ 0.05
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 353 -
ข้อแนะนาในการใช้การทดสอบไคสแควร์ 1. การทดสอบด้วยไคสแควร์ เหมาะสมกับตัวอย่างขนาดใหญ่ ถ้าขนาดตัวอย่างเป็น 4 หรือ 5 เท่า ของจานวนเหตุการณ์ ค่าไคสแควร์จะประมาณได้ค่อนข้างดี แม้ว่าความถี่คาดหวังจะน้อย 2. ในกรณีที่ความถี่คาดหวังมีค่าน้อยกว่า 5 อยู่เกินกว่า 20% การทดสอบด้วยไคสแควร์จะไม่เหมาะ สม ดังนั้นในทางปฏิบัติอาจใช้การทดสอบแบบอื่นมาแทน หรือถ้าจะใช้การทดสอบด้วยไคสแควร์ จะต้องจัดให้แต่ละเซลล์มีความถี่คาดหวังน้อยกว่า 5 นั้นเข้ากับเซลล์ที่อยู่ติดกัน (อาจรวมใน แนวนอนหรือแนวตั้งก็ได้ตามความเหมาะสม) เพื่อให้ความถี่คาดหวังที่ได้มีค่ามากพอที่จะทดสอบ ไคสแควร์ อย่างไรก็ตามจะต้องพิจาณาว่าการกระทาเช่นนี้จะไม่ทาให้ความหมายของการแบ่งช่อง เปลี่ยนไป หรือไม่ขัดกับสมมติฐานที่ตั้งไว้ 3. กรณีที่ดีกรีความเป็นอิสระ (df) เท่ากับ 1 การประยุกต์ไคสแควร์จะใช้ได้ไม่ค่อยดี Yate ได้ปรับแก้ ตัวสถิติไคสแควร์ เพื่อให้ใช้ได้ดีขึ้น ดังนี้ 2 cal
1 2 r c (| Oij Eij | ) 2 E ij i 1 j 1
หรือ
2 cal
N 2 ) 2 ( A B)(C D)( A C )( B D) N (| AD BC |
เมื่อ A, B, C, D เป็นความถี่ที่ได้จากข้อมูลจริงในตาราง 2x2 ดังรูป (ตารางการณ์จร) รวม A C (A+C)
B D (B+D)
(A+B) (C+D) N
โดยที่ N = n1 + n2 4. กรณีตารางการณ์จรมีลักษณะเป็น 2x2 หากข้อมูลมีจานวนน้อย หรือมีความถี่น้อย หรือความถี่ คาดหวังมีค่าน้อยกว่า 5 อยู่เกินกว่า 20% ควรเลือกใช้ Fisher Exact Probability Test
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 354 -
ค.3 การทดสอบมัธยฐาน (The Median Test) การทดสอบมัธยฐานเป็นการทดสอบว่ากลุ่มตัวอย่างอิสระ 2 กลุ่มมีแนวโน้มเข้าสู่ ส่วนกลางแตกต่างกันหรือไม่ หรือกลุ่มตัวอย่างสองกลุ่มมาจากประชากรที่มีค่ามัธยฐานเท่ากันหรือไม่ โดยใช้วิธีการแบ่งข้อมูลแต่ละกลุ่มออกเป็นสองกลุ่มย่อย คือ กลุ่มที่อยู่เหนือมัธยฐานกับกลุ่มที่อยู่ใต้ มัธยฐาน แล้วทดสอบว่ากลุ่มตัวอย่างทั้งสองกลุ่มนั้นสุ่มมาจากประชากรที่มีมัธยฐานเท่ากันหรือไม่ ค.3.1 ข้อตกลงเบื้องต้น ค.3.1.1 ระดับการวัดอยู่ในมาตราเรียงอันดับขึ้นไป ค.3.1.2 กลุ่มตัวอย่าง 2 กลุ่ม (n1, n2) เป็นอิสระจากกัน ค.3.1.3 ค่าของตัวแปรสุ่มต้องเป็นค่าต่อเนื่อง ค.3.1.4 ถ้าประชากรทั้ง 2 กลุ่มมีค่ามัธยฐานเท่ากันแล้วความน่าจะเป็นที่ค่า สังเกตจะมีค่าสูงกว่าค่ามัธยฐานรวม (combined median) จะมีค่า เท่ากัน ค.3.2 สมมติฐาน H0 : M1 = M2 H1 : M1 M2 หรือ H0 : ตัวอย่างทั้ง 2 ชุดมาจากประชากรที่มีค่ามัธยฐานเท่ากัน H1 : ตัวอย่างทั้ง 2 ชุดมาจากประชากรที่มีค่ามัธยฐานไม่เท่ากัน หรือ H1 อาจตั้งในลักษณะทดสอบทางเดียวก็ได้ เช่น ค่ามัธยฐานของ ประชากรหนึ่งมากกว่าอีกประชากรหนึ่ง ค.3.3 วิธีการทดสอบ โดยมีขั้นตอนการทดสอบดังนี้ 1. นาข้อมูลทั้ง 2 กลุ่มมารวมกัน (n1 + n2) และหาค่ามัธยฐานรวม (combined median) 2. จากข้อมูลตัวอย่างแต่ละกลุ่มหาจานวนข้อมูลที่มีค่าสูงกว่าและต่ากว่ามัธยฐาน รวม และจัดลงในตารางได้ดังนี้ ตัวอย่างที่ 1 ตัวอย่างที่ 2 รวม จานวนข้อมูลที่มีค่ามากกว่ามัธยฐานรวม A+B A. B. จานวนข้อมูลที่มีค่าต่ากว่ามัธยฐานรวม D. C+D C. ถ้าทั้ง 2 กลุ่มเป็นตัวอย่างมาจากประชากรที่มีค่ามัธยฐานเท่ากัน ซึ่งจะคาดได้ว่าครึ่งหนึ่ง ของแต่ละกลุ่มจะต้องมีค่าสูงกว่ามัธยฐานรวมและอีกครึ่งหนึ่งจะมีค่าต่ากว่ามัธยฐานรวม ดังนั้นจึง คาดว่าจานวน A และ C เกือบจะมีจานวนเท่ากัน และจานวน B และ D ก็น่าจะมีจานวนใกล้เคียง กัน Mood (1950) ได้พิสูจน์ว่า ถ้า A เป็นจานวนที่มีค่ามากกว่ามัธยฐานรวมของตัวอย่างกลุ่มที่ 1 และ B เป็นจานวนที่มีค่ามากกว่ามัธยฐานรวมของตัวอย่างที่ 2 ภายใต้ข้อสมมติฐานเบื้องต้น H0 จะ ได้ A = 1/2n1 และ B = 1/2n2 แล้วการแจกแจงตัวอย่าง (Sampling distribution) ของ A และ B จะเป็นการแจกแจงแบบไฮเปอร์จิออมิตริก (Hypergeometric distribution) ซึ่งสามารถหาความ น่าจะเป็นที่จะมีจานวน A และ B ในตาราง 2x2 ดังนี้
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 355 -
A C B D A B P( A, B) n1 n2 A B
จะสังเกตเห็นว่าคล้ายการทดสอบของฟิสเซอร์ ดังนั้นถ้าตัวอย่าง (n1+n2) มีค่าน้อยๆ (20) ก็สามารถใช้การทดสอบของฟิสเชอร์สรุปผลได้ แต่ถ้าตัวอย่างมีขนาดใหญ่ สามารถประมาณ การแจกแจงแบบไฮเปอร์จิออมิตริก ได้ด้วยการแจกแจงทวินาม และยังสามารถประมาณการแจก แจงทวินามได้ด้วยการแจกแจงปกติ ดังนั้นตัวทดสอบคือ A Z
B
n1 n2 1
p(1 p)
n1
1 n2
เมื่อ
p
A B n1 n2
ซึง่ Z จะมีการแจกแจงประมาณด้วยการแจกแจงปกติมาตรฐาน ดังนั้นสามารถหาอาณา เขตวิกฤต จากการทดสอบสองทางและทางเดียวได้ นอกจากนี้ ในกรณีที่ตัวอย่างมีขนาดใหญ่ ยังสามารถใช้การทดสอบด้วยไคสแควร์ได้ โดย ดูความแตกต่างของความถี่ที่สังเกตได้และความถี่ที่คาดหวังตาม H0 นั่นคือ ความถี่ในเซล A ควรมีคา่ 2 เท่ากับ n21 และความถี่ในเซล B ควรมีค่าเท่ากับ n22 จะได้ตัวสถิติทดสอบของ cal ดังนี้ 2 cal
N 2 ) 2 ( A B)(C D)( A C )( B D) N (| AD BC |
โดยที่ N = n1 + n2
2 ซึง่ cal นี้จะมีการแจกแจงประมาณได้ด้วยการแจกแจงไคสแควร์ที่ df = 1 แต่การทดสอบ 2 ด้วย cal นี้มีข้อเสียคือ ใช้ทดสอบได้เฉพาะ 2 ทางเท่านั้น ในการณีที่มีคะแนนที่มีค่าเท่ากับมัธยฐานรวมพอดี ไม่สามารถจัดคะแนนค่านั้นให้อยู่ในกลุ่ม ใดได้ อาจทาได้ 2 วิธี คือ ก. ถ้า n1 + n2 มีค่ามาก และมีจานวนคะแนนที่มีค่าเท่ากับมัธยฐานรวมไม่มากให้ตัดคะแนนค่า นั้นทิ้งไป ข. การแบ่งกลุ่มของตัวอย่างทั้ง 2 ชุดใหม่ให้เป็นดังนี้ กลุ่มที่ 1 คือกลุ่มที่มีค่ามากกว่ามัธยฐาน รวม อีกกลุ่มหนึ่งคือกลุ่มที่มีค่าไม่มากกว่ามัธยฐานรวม (รวมถึงค่าเท่ากับมัธยฐานรวมด้วย)
ตัวอย่างที่ ค.3.1 พ่อค้าคนหนึ่งมีร้านค้าขายของจานวน 2 แห่ง เพื่อพิจารณายอดการขาย ในแต่ละแห่งจึงได้เก็บข้อมูลยอดขายเมื่อหักค่าเช่าแล้วหน่วยเป็นพันบาทต่อวัน ได้ข้อมูลดังนี้ แห่งที่ 1 ยอดขายคือ 2 7 1 8 0 0 3 8 2 4 5 7 9 3 แห่งที่ 2 ยอดขายคือ 9 7 3 6 0 3 6 2 0 8 8 2 อยากทราบว่ายอดขายแต่ละแห่งแตกต่างกันหรือไม่ (อมรรัตน์ แมกไม้รักษา, 2550) วิธีทา ให้ M1 , M2 เป็นมัธยฐานของยอดขายเมื่อหักค่าเช่าแล้วของแห่งที่ 1, 2 ตามลาดับ ระดับนัยสาคัญ 0.05
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 356 -
สมมติฐาน
H0 : M1 = M2 H1 : M1 M2 หาค่ามัธยฐานร่วมโดยเรียงลาดับข้อมูลทั้งหมดได้ดังนี้ 0,0,0,0,1,2,2,2,2,3,3,3,3,4,5,6,6,7,7,7,8,8,8,8,9,9 n1 = 14, n2 = 12, ดังนั้น N = 14 + 12 = 26 ตาแหน่งมัธยฐานคือ n 21 2621 13.5 ดังนั้นมัธยฐานร่วมคือ 3.5 เมื่อเปรียบเทียบค่าของข้อมูลกับมัธยฐานรวมแล้วนามาจัดลงในตารางการณ์จร 2x2 ได้ดังนี้ ยอดขาย ร้านค้าแห่งที่ รวม 1 2 มากกว่ามัธยฐาน 7 6 13 น้อยกว่ามัธยฐาน 7 6 13 รวม 14 12 26 คานวณค่า
E11
14x13 7, 26
E12
12x13 6 26
E21
14x13 7, 26
E22
12x13 6 26
โดยที่ 20 < n < 40 ความถี่คาดหมายมีค่า 5 ค่าสถิติการทดสอบ
2 cal
N 2 ) 2 ( A B)(C D)( A C )( B D) N (| AD BC |
ค่าวิกฤต
2 0.05,1
3.841
26 2 ) 2 14x12x13x13
26(| 7x6 7x6 |
0.155
ซึ่งค่าสถิติที่คานวณได้มีค่า 0.155 ซึ่งมีค่าน้อยกว่าค่าวิกฤต
ดังนั้นจึงไม่ปฏิเสธสมมติฐาน H0 ที่ระดับนัยสาคัญ 0.05 แสดงว่ายอดขายแต่ละแห่งไม่ แตกต่างกัน ที่ระดับนัยสาคัญ 0.05 ซึ่งเมื่อพิจารณาโดยใช้สถิติทดสอบเป็น 2 cal
1 2 r c (| Oij Eij | ) 2 E ij i 1 j 1
จะมีค่าน้อยมากจะได้ผลการทดสอบเหมือนกัน
ตัวอย่างที่ ค.3.2 เพื่อทดสอบคะแนนสอบวิชาคณิตศาสตร์ของนักเรียนจากโรงเรียน 2 แห่ง ว่ามีค่ากลางแตกต่างกันหรือไม่ จึงสุ่มตัวอย่างนักเรียนทั้ง 2 แห่งและบันทึกคะแนนวิชาคณิตศาสตร์ ได้ผลดังนี้ โรงเรียนแห่งที่ 1 มีค่า 43 80 99 86 68 70 85 93 98 96 75 81 32 92 96 64 79 97 76 80 โรงเรียนแห่งที่ 2 มีค่า 76 65 73 95 77 97 55 35 72 83 70 65 86 60 62 90 71 65 89 71 80 76 93 94 จงหาผลสรุปจากข้อสงสัยดังกล่าวข้างต้น (อุมาพร จันทศร ; 2542)
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 357 -
วิธีทา จะใช้การทดสอบแบบมัธยฐานเนื่องจากเป็นกรณี 2 กลุ่มตัวอย่างที่เป็นอิสระต่อกัน และ ต้องการทดสอบค่ากลาง นาคะแนนทั้ง 2 กลุ่มมารวมกัน แล้วหาค่ามัธยฐานรวมได้ค่า 78 จัดแบ่ง คะแนนออกเป็น 2 กลุ่มใหม่ ดังนี้ โรงเรียนที่ 1 โรงเรียนที่ 2 รวม จานวนที่มีค่ามากกว่ามัธยฐานรวม 13 9 22 จานวนที่มีค่าน้อยกว่ามัธยฐานรวม 7 15 22 รวม 20 24 44 เนื่องจาก N = 20 + 24 = 44 มีค่าใหญ่ และเป็นการทดสอบ 2 ทาง ดังนั้นจะใช้การทดสอบแบบ ไคสแควร์ โดยสถิติทดสอบมีสูตร ดังนี้ 2 cal
N 2 ) 44 |13x15 9x7 | 22) 2 2 2.29 ( A B)(C D)( A C )( B D) 22x22x20x24 N (| AD BC |
ที่ระดับนัยสาคัญ 0.05 ได้ค่าวิกฤต
2 0.05,1
3.841
ซึ่งค่าสถิติที่คานวณได้มีค่า 2.29 มีค่าน้อยกว่า
ค่าวิกฤตจึงไม่ตกในอาณาเขตวิกฤต จึงยอมรับ H0 นั่นคือ นักเรียนจาก 2 โรงเรียนมีค่ามัธยฐานของ คะแนนสอบวิชาคณิตศาสตร์ไม่แตกต่างกัน ที่ระดับนัยสาคัญ 0.05 ตัวอย่างที่ ค.3.3 ในการสารวจความเอาใจใส่ต่อการเรียนของนักเรียนหญิงและนักเรียนชาย ในห้องหนึ่งพบว่า เมื่อจัดลาดับความเอาใจใส่ นักเรียนทั้งหมด 39 คน เป็นชาย 16 คน หญิง 23 คน นั้น ปรากฏว่านักเรียนชาย 3 คน และหญิง 17 คน ได้คะแนนความเอาใจใส่ต่อการเรียนสูงกว่า ค่ามัธยฐานร่วม จงทดสอบว่ามัธยฐานของคะแนนความเอาใจใส่ของนักเรียนหญิงสูงกว่าของนักเรียน ชาย แบ่งข้อมูลแต่ละกลุ่มออกเป็นสองกลุ่มย่อยได้ ดังนี้ ชาย หญิง รวม เหนือมัธยฐาน 3 17 20 ใต้มัธยฐาน 13 6 19 รวม 16 23 39 เนื่องจาก N = 39 ซึ่งมีค่ามาก และเป็นการทดสอบทางเดียวหรือมีทิศทาง ซึ่งหากเป็นการทดสอบ 2 ทาง อาจจะใช้ตัวทดสอบเหมือนกันกับตัวอย่างที่ผ่านมา ซึ่งเว้นไว้ให้ผู้อ่านได้ลองฝึกทา และยังให้ พิจารณาต่อไปในกรณีที่เป็นการทดสอบที่มีทิศทางหรือทดสอบทางเดียว อาจจะเป็นมากกว่าหรือ น้อยกว่า ซึ่งได้เว้นไว้ให้ผู้อ่านได้คิดพิจารณา
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 358 -
ค.4 การทดสอบโคโมโกรอฟ-สไมร์นอฟ สาหรับตัวอย่างสองกลุ่ม (The Kolmogorov – Smirnov Two sample Test) เป็นการทดสอบกลุ่มตัวอย่าง 2 กลุ่มเป็นอิสระจากกันว่าถูกสุ่มมาจาก ประชากรเดียวกันหรือไม่หรือการทดสอบว่ามาจากประชากร 2 ประชากรที่มีการแจกแจงเหมือนกัน หรือไม่ การทดสอบแบบสองทางใช้ทดสอบว่า การแจกแจงของประชากรสองกลุ่มแตกต่างกันหรือไม่ ส่วนการทดสอบแบบทางเดียวใช้การทดสอบว่าค่าของประชากรกลุ่มหนึ่งมีค่ามากกว่าค่าของประชากรอีกกลุ่มหนึ่งหรือไม่ เช่น คะแนนของกลุ่มทดลองมากกว่าคะแนนของกลุ่มควบคุมหรือไม่ วิธีการทดสอบพิจารณาจากการแจกแจงความถี่สัมพัทธ์สะสม 2 ชุด ถ้ากลุ่มตัวอย่างสอง กลุ่มสุ่มมาจากประชากรเดียวกันหรือมาจากประชากรที่มีการแจกแจงเหมือนกันแล้ว ลักษณะของ ความถี่สะสมของ 2 กลุ่มควรเหมือน ๆ กันหรือใกล้เคียงกัน ค.4.1 ข้อตกลงเบื้องต้น ค.4.1.1 ค่าตัวแปรทั้งสองเป็นแบบต่อเนื่อง อยู่ในมาตราเรียงลาดับ (Ordinal Scale) เป็นอย่างน้อย ค.4.1.2 กลุ่มตัวอย่าง 2 กลุ่ม เป็นอิสระจากกัน ค.4.2 สมมติฐาน การทดสอบแบบสองทาง H0 : ประชากรกลุ่มที่ 1 และ 2 มีลักษณะการแจกแจงเหมือนกัน H1 : ประชากรกลุ่มที่ 1 และ 2 มีลักษณะการแจกแจงแตกต่างกัน การทดสอบแบบทางเดียว H0 : ประชากรกลุ่มที่ 1 และ 2 ไม่แตกต่างกัน H1 : ประชากรกลุ่มที่ 1 มีค่ามากกว่าประชากรกลุ่มที่ 2 หรือ H0 : ประชากรกลุ่มที่ 1 และ 2 ไม่แตกต่างกัน H1 : ประชากรกลุ่มที่ 1 มีค่าน้อยกว่าประชากรกลุ่มที่ 2 ค.4.3 สถิติที่ใช้ทดสอบ การทดสอบแบบสองทาง คานวณหาค่า D โดยใช้สูตร D = Maximum|S1(X) – S2(X)| การทดสอบแบบทางเดียว คานวณหาค่า D โดยใช้สูตร D = Maximum(S1(X) – S2(X)) เมื่อ S1(X) และ S2(X) เป็นฟังก์ชันความถี่สะสมสัมพัทธ์ของกลุ่มตัวอย่างที่ 1 และ 2 ค.4.4 อาณาเขตวิกฤตและการสรุปผล กรณีที่ n1 = n2 = n 40 จะปฏิเสธสมมติฐาน H0 เมื่อค่า D ที่คานวณได้มีค่ามากกว่าหรือเท่ากับค่า D ที่เปิดได้จากตารางค่าวิกฤตของ D
บทที่ 12 : สถิติไม่อิงพารามิเตอร์ กรณีที่
หน้าที่ - 359 -
n1 = n2 = n 40
ตารางค่าวิกฤตของ D ในการทดสอบ Kolmogorov – Smirnov สาหรับกลุ่มตัวอย่าง สองกลุ่ม (กรณีกลุ่มตัวอย่างมีขนาดเล็ก) N 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
One-tailed test = 0.01 3 4 4 5 5 6 5 6 5 6 6 7 6 7 6 8 6 8 7 8 7 8 7 9 7 9 8 9
Two-tailed test = 0.01 4 5 5 5 6 6 6 6 7 6 7 7 8 7 8 7 8 7 9 8 9 8 9 8 10 8 10
= 0.05
= 0.05
N 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40
One-tailed test = 0.01 8 10 8 10 8 10 8 10 9 11 9 11 9 11 9 11 9 11 9 12 10 12 10 12 10 12 11 13 11 14
= 0.05
Two-tailed test = 0.01 9 10 9 10 9 11 9 11 9 11 10 11 10 12 10 12 10 12 10 12 11 13 11 13 11 13 12 13
= 0.05
กรณีที่กลุ่มตัวอย่างมีขนาดใหญ่ (คือ n1 > 40, n2 > 40 โดยที่ n1 กับ n2 ไม่จาเป็นต้องเท่ากัน) การทดสอบแบบสองทาง หาค่าวิกฤตจาก ระดับนัยสาคัญ ค่าวิกฤตของ D n n2 0.10 1.22 1 n1n2
0.05
1.36
n1 n2 n1n2
0.025
1.48
n1 n2 n1n2
0.01
1.63
n1 n2 n1n2
0.005
1.73
n1 n2 n1n2
0.001
1.95
n1 n2 n1n2
การทดสอบแบบทางเดียว นาค่า D ที่ได้จากสูตร D = Maximum(S1(X) – S2(X)) มาคานวณหาค่า 2 จากสูตร nn 2 4D2 1 2 จะปฏิเสธสมมติฐาน H0 เมื่อ 2 ที่คานวณได้มีค่ามากกว่าหรือเท่ากับ n n 1
,2 2
2
ที่ได้จากการเปิดตาราง
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 360 -
การทดสอบ Kolmogorov – Smirnov two-sample test มีลาดับขั้นในการคิดดังนี้ 1. ตั้งสมมติฐาน 2. กาหนดระดับนัยสาคัญ 3. การคานวณค่า D ให้ทาเป็นขั้นตอนดังนี้ 3.1 นาข้อมูลทั้ง 2 กลุ่มมาเรียงจากน้อยไปมาก จาแนก 2 กลุ่ม 3.2 หาความถี่ที่สังเกตได้ หาความถี่สะสม และหาความถี่สะสมสัมพัทธ์ ของแต่ละกลุ่ม 3.3 นาความถี่สะสมสัมพัทธ์ของแต่ละกลุ่มมาลบกันเพื่อหาค่าความแตกต่าง 3.4 หาค่า D โดยดูค่าความแตกต่างที่มากที่สุด 4. นาค่า D ที่ได้ไปเปรียบเทียบกับค่า D ที่เปิดจากตาราง 5. ตัดสินใจ และสรุปผล ตัวอย่างที่ ค.4.1 จากข้อมูลในตาราง Scores on a perceived maternal competence scale for two groups of mothers ให้ทาการทดสอบว่าข้อมูลทั้ง 2 กลุ่มมาจากประชากร ที่มีลักษณะการแจกแจงเหมือนกันหรือไม่ (ระดับนัยสาคัญ 0.05) Scores on a perceived maternal competence scale for two groups of mothers Regular-Discharge Mothers Early-Discharge Mothers 23 17 22 18 20 26 16 13 21 14
30 27 25 20 24 32 17 18 28 29
วิธีทา สมมติฐาน H0 : Score ในกลุ่ม Regular-Discharge และกลุ่ม Early-Discharge มีลักษณะ การแจกแจงเหมือนกัน H1 : Score ในกลุ่ม Regular-Discharge และกลุ่ม Early-Discharge มีลักษณะ การแจกแจงแตกต่างกัน สถิติที่ใช้ทดสอบ Kolmogorov – Smirnov two-sample อาณาเขตวิกฤต กาหนด = 0.05 และ n1 = n2 = 10 ค่าวิกฤตจากตาราง KD = 7 อาณาเขต วิกฤตคือ D 7 คานวณค่าสถิติ ค่าของข้อมูล ความถี่ ความถี่สะสม ความถี่สะสม D สัมพัทธ์ Regular
Early
17 18 20
13 14 16 17 18 20
f1
f2
K1
K2
K1/n1
K2/n2
1 1 1
1 1 1 1 1 1
0 0 0 1 2 3
1 2 3 4 5 6
0 0 0 0.1 0.2 0.3
0.1 0.2 0.3 0.4 0.5 0.6
-0.1 -0.2 -0.3 -0.3 -0.3 -0.3
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 361 -
คานวณค่าสถิติ (ต่อ) ค่าของข้อมูล Regular
Early
ความถี่ f1
21 22 23 24 25
ความถี่สะสม สัมพัทธ์
f2
K1
K2
K1/n1
K2/n2
1 1 1
3 3 3 4 5 5 6 7 8 9 10
7 8 9 9 9 10 10 10 10 10 10
0.3 0.3 0.3 0.4 0.5 0.5 0.6 0.7 0.8 0.9 1.0
0.7 0.8 0.9 0.9 0.9 1.0 1.0 1.0 1.0 1.0 1.0
1 1 26
27 28 29 30 32
ความถี่สะสม
1 1 1 1 1 1
D -0.4 -0.5 -0.6 -0.5 -0.4 -0.5 -0.4 -0.3 -0.2 -0.1 0
D = Maximum |S1(X) – S2(X)| = 0.6
การสรุปผล ค่า D ที่คานวณได้เท่ากับ 0.6 มีค่าน้อยกว่า ค่า D ที่เปิดจากตาราง มีค่า 7 จึงตก นอกอาณาบริเวณวิกฤต จึงยอมรับ H0 สรุปได้ว่า Score ในกลุ่ม RegularDischarge และกลุ่ม Early-Discharge มีลักษณะการแจกแจงเหมือนกัน ตัวอย่างที่ ค.4.2 ในการทดสอบความสามารถในการเรียนรู้ของนักเรียนชั้นประถมศึกษา ปีที่ 3 ผู้วิจัยได้แบ่งนักเรียนชั้นประถมศึกษาปีที่ 3 ออกเป็น 2 กลุ่ม คือกลุ่มที่ 1 เป็นนักเรียนที่ เคยเรียนชั้นอนุบาล กลุ่มที่ 2 เป็นนักเรียนที่ไม่เคยเรียนชั้นอนุบาลมาก่อน ผู้วิจัยสุ่มตัวอย่าง นักเรียนมากลุ่มละ 10 คน ปรากฏผลการสอบดังนี้ กลุ่มที่1 14 11 13 8 13 11 10 13 17 16 กลุ่มที่2 10 13 8 10 11 4 12 8 11 9 จงทดสอบว่านักเรียนทั้ง 2 กลุ่ม มีความสามารถในการเรียนรู้ต่างกันหรือไม่ วิธีทา สมมติฐาน H0 : ความสามารถในการเรียนของกลุ่มที่ 1 และกลุ่มที่ 2 มีลักษณะการแจกแจง เหมือนกัน H1 : ความสามารถในการเรียนของกลุ่มที่ 1 และกลุ่มที่ 2 มีลักษณะการแจกแจง แตกต่างกัน สถิติที่ใช้ทดสอบ Kolmogorov – Smirnov two-sample อาณาเขตวิกฤต กาหนด = 0.05 และ n1 = n2 = 10 ค่าวิกฤตจากตาราง KD = 7 อาณาเขต วิกฤตคือ D 7
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 362 -
คานวณค่าสถิติ ค่าของข้อมูล กลุ่มที่ 1 กลุ่มที่ 2 8
10 11 11 13 13 13 14 16 17
4 8 8 9 10 10 11 11 12 13
ความถี่ f1 1
1 1 1 1 1 1 1 1 1
ความถี่สะสม
ความถี่สะสม สัมพัทธ์
f2
K1
K2
K1/n1
K2/n2
1 1 1 1 1 1 1 1 1 1
0 1 1 1 2 2 3 4 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
0 0.1 0.1 0.1 0.2 0.2 0.3 0.4 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
D -0.1 -0.1 -0.2 -0.3 -0.3 -0.4 -0.4 -0.4 -0.5 -0.5
D = Maximum |S1(X) – S2(X)| = 0.5
การสรุปผล ค่า D ที่คานวณได้เท่ากับ 0.5 มีค่าน้อยกว่า ค่า D ที่เปิดจากตาราง มีค่า 7 จึงตก นอกอาณาบริเวณวิกฤต จึงยอมรับ H0 สรุปได้ว่าความสามารถในการเรียนของกลุ่ม ที่ 1 และกลุ่มที่ 2 มีลักษณะการแจกแจงเหมือนกัน ค.5 การทดสอบแมนน์-วิทนี (The Mann – Whitney Test) การทดสอบแมนวิทนี เป็นการทดสอบว่ากลุ่มตัวอย่างที่สุ่มมาอย่างอิสระทั้ง 2 กลุ่ม นั้นมาจากประชากรที่มีการแจกแจงเหมือนกันหรือไม่ ข้อมูลที่นามาทดสอบอยู่ในมาตราเรียงอันดับ โดยวิธีการทดสอบจะพิจารณาจากอันดับที่วิธีนี้เป็นวิธีที่มีประสิทธิภาพสูงวิธีหนึ่งของสถิติไม่อิงพารามิเตอร์ ที่สามารถใช้แทน t – test ค.5.1 ข้อตกลงเบื้องต้น ค.5.1.1 ระดับของการวัดอยู่ในมาตราเรียงอันดับหรือสูงกว่า ค.5.1.2 กลุ่มตัวอย่าง 2 กลุ่ม เป็นอิสระจากกัน ค.5.2 สมมติฐานทางสถิติ สมมติฐานทางสถิติต้องการทดสอบเกี่ยวกับมัธยฐานของประชากร 2 ประชากร ถ้าแต่ละประชากรมีการแจกแจงเป็นแบบสมมาตร ค่าเฉลี่ยและมัธยฐานเป็นค่าเดี่ยวกัน ดังนั้นการทดสอบมัธยฐานของ 2 ประชากร ก็สามารถ ประยุกต์เป็นการทดสอบค่าเฉลี่ยของ 2 ประชากรได้ด้วย สมมติฐานทางสถิติ สามารถทดสอบได้ 3 แบบ คือ 1. H0 : Mx ≥ My VS H1 : Mx < My 2. H0 : Mx ≤ My VS H1 : Mx > My
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 363 -
3. H0 : Mx = My VS H1 : Mx ≠ My ค.5.3 สถิติทดสอบ คานวณค่าสถิติทดสอบโดยรวมกลุ่มตัวอย่าง 2 กลุ่ม แล้วให้อันดับ จากค่าที่น้อยที่สุดเรียงไปค่าที่มากที่สุด และหาค่าเฉลี่ยของอันดับสาหรับ ตัวอย่างที่มีค่าเท่ากันหลายค่า การทดสอบแบบทางเดียวหรือสองทางก็ได้ แล้วแต่กรณี คานวณหาค่า U จาก U = Minimum |U1, U2| (ค่าที่น้อยที่สุดระหว่าง U1 และ U2) โดยที่ U1 n1n2 n1 (n21 1) R1 U n1n2
n2 (n2 1)
2
เมื่อ
2
R2
เป็นขนาดของกลุ่มตัวอย่างที่ 1 n2 เป็นขนาดของกลุ่มตัวอย่างที่ 2 R1 เป็นผลรวมของอันดับของข้อมูลจากกลุ่มตัวอย่างที่ 1 R2 เป็นผลรวมของอันดับของข้อมูลจากกลุ่มตัวอย่างที่ 2
n1
กรณีที่กลุ่มตัวอย่างมีขนาดใหญ่ ( n1 หรือ n2 > 20) การแจกแจงของกลุ่มตัวอย่างจะมีลักษณะใกล้เคียงกับการแจกแจง ปกติ จะทาการเปลี่ยนค่า U เป็น Z ดังนี้ Z
U
n1n2 2
n1n2 (n1 n2 1) 12
การตรวจสอบความถูกต้องของการคานวณค่าของ U ทาได้โดยใช้สูตร / U = n1n2 – U เมือ่ U แทนค่า U ที่น้อยกว่าในค่า U1 และ U2 ที่คานวณได้ / U แทนค่า U ที่มากกว่าในค่า U1 และ U2 ที่คานวณได้ (จะเป็น ค่าที่นามาใช้เพื่อหาค่า U ในการเปรียบเทียบย้อนกลับไปหาค่า U1 หรือ U2) ค.5.4 อาณาเขตวิกฤตและการสรุปผล กรณีที่ใช้ค่า U กรณี n1 ≤ 8 และ n2 ≤ 8 กรณีเป็นการทดสอบทางเดียว จะปฏิเสธสมมติฐาน H0 เมื่อค่าความน่าจะเป็นที่เปิดได้จาก ตาราง (ตามค่า n1 , n2 และ U ที่คานวณได้) มีค่าน้อยกว่าหรือ เท่ากับระดับนัยสาคัญ (ค่า α ) ที่กาหนด
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 364 -
กรณีเป็นการทดสอบทางเดียว จะปฏิเสธสมมติฐาน H0 เมื่อค่าความน่าจะเป็นที่เปิดได้จาก ตาราง (ตามค่า n1 , n2 และ U ที่คานวณได้) มีค่าน้อยกว่าหรือ เท่ากับระดับนัยสาคัญ (ค่า α/2 ) ที่กาหนด กรณี 9 ≤ n1 ≤ 20 และ 9 ≤ n2 ≤ 20 จะปฏิเสธสมมติฐาน H0 เมื่อค่า U ที่คานวณได้น้อยกว่าหรือ เท่ากับค่าวิกฤตของ U จากตาราง กรณีที่ใช้ค่า Z (กรณีที่กลุ่มตัวอย่างมีขนาดใหญ่) จะปฏิเสธสมมติฐาน H0 เมื่อ ค่า Z ที่คานวณได้ (+) มีค่ามากกว่าหรือเท่ากับค่า Z (+) ที่เปิด ได้จากตาราง หรือ ค่า Z ที่คานวณได้ (–) มีค่าน้อยกว่าหรือเท่ากับค่า Z (–) ที่เปิดได้จากตาราง การคานวณค่าสถิติ มีขั้นตอนดังนี้ 1. ทาการรวมข้อมูลทั้งสองกลุ่มเข้าด้วยกัน และจัดอาดับ โดยให้ค่าน้อยที่สุดเป็นอันดับ 1 ค่าสูงสุดเป็นอาดับสุดท้าย (กรณีที่ค่าเท่ากันให้นาอันดับมาเฉลี่ย) 2. แยกอันดับที่ได้ทาการจัดแล้ว ลงในกลุ่มทั้ง 2 กลุ่ม จากนั้นทาการหาผลรวมของอันดับ ของข้อมูลในแต่ละกลุ่ม โดยกาหนดให้ R1 เป็นผลรวมของอันดับของข้อมูลจากกลุ่มตัวอย่างที่ 1 R2 เป็นผลรวมของอันดับของข้อมูลจากกลุ่มตัวอย่างที่ 2 3. คานวณค่า U1 และ U2 จากสูตรที่กล่าวมาข้างต้น 4. จากค่า U1 และ U2 เลือกค่าที่น้อยที่สุดให้เป็นค่า U 5. นาค่า U ที่ได้ไปเปิดตาราง (ตามเงื่อนไขที่กล่าวมาข้างต้น) เพื่อหาค่าวิกฤตในการสรุปผล กรณีที่กลุ่มตัวอย่างมีขนาดใหญ่ ( n1 หรื อ Z
U
n2
> 20) จะทาการเปลี่ยนค่า U เป็น Z ดังนี้
n1n2 2
n1n2 (n1 n2 1) 12
ตัวอย่างที่ ค.5.1 จาก coping ability scale ของคนไข้ชายและหญิงจานวน 14 ราย ต่อไป ชาย : 21 25 31 16 19 29 27 หญิง: 24 18 28 17 22 23 20 จงหาว่า coping ability scale ของคนไข้ชายและหญิงแตกต่างกันหรือไม่ วิธีทา (α = 0.05) สมมติฐาน H0 : coping ability scale ของคนไข้ชายและหญิงไม่แตกต่างกัน H1 : coping ability scale ของคนไข้ชายและหญิงแตกต่างกัน สถิติที่ใช้ทดสอบ Mann – Whitney U
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 365 -
Score on coping ability scale ชาย-หญิง ค่าอันดับ อันดับเมื่อแยกกลุ่ม ก่อนจัดอันดับ หลังจัด ชาย หญิง 21 25 31 16 19 29 27
1
U n1n2 2
1
17 18
2 3
19
4
20
5
21
6
25 27
10 11
28
12
29 31
13 14
22 23 24
24 18 28 17 22 23 20 U n1n2
16
n1 (n1 1) 2
R1
n2 (n2 1) 2
R2
7 8 9
1 4 6 10 11 13 14
2 3 5 7 8 9 12
59
46
7(8) 59 18 2 7(8) 7(7) 46 31 2
7(7)
อาณาเขตวิกฤต กาหนด α = 0.05 n1 =7 n2 =7 และ U = 18 (อยู่ในเงื่อนไข n1 < 8 n2 < 8) ความน่าจะเป็นที่ได้จากตาราง 0.228 คานวณค่าสถิติ จาก U = Minimum |U1, U2| = 18 ตรวจสอบค่า U จาก U = n1 n2 – U/ = 7(7) – 31 = 18 แสดงว่าค่า U ที่หาได้ถูกต้อง การสรุปผล ค่าความน่าจะเป็ นที่ได้ จากตาราง (0.228) มีคา่ มากกว่า α/2 (0.025) ไม่ตก ในอาณาเขตวิกฤต สรุปว่า coping ability scale ของคนไข้ชายและหญิงไม่แตกต่างกัน ตัวอย่างที่ ค.5.2 ครูพิเชษฐทดลองสอนวิชาเคมีนักศึกษาชั้นปีที่ 1 กลุ่มหนึ่งสอนแบบกลุ่มย่อย มีติวเตอร์ประจากลุ่ม และอีกกลุ่มเป็นกลุ่มควบคุมสอนตามปกติ ปรากฏผล ดังนี้ ชาย 30 35 40 76 32 37 38 42 45 46 40 45 30 32 43 หญิง 29 30 32 28 35 31 29 30 32 40 39 38 จากข้อมูลอยากทราบว่า กลุ่มทดลองจะมีผลสัมฤทธิ์ทางการเรียนสูงกว่ากลุ่มควบคุมหรือไม่ ที่ α = 0.05 วิธีทา 1. ตั้งสมมุติฐาน H0 : กลุ่มทดลองจะมีผลสัมฤทธิ์ทางการเรียนเท่ากับกว่ากลุ่มควบคุม H1 : กลุ่มทดลองจะมีผลสัมฤทธิ์ทางการเรียนสูงกว่ากลุ่มควบคุม 2. สถิติที่ใช้ทดสอบ Mann – Whitney U
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 366 -
Score on coping ability scale ชาย-หญิง ค่าอันดับ อันดับเมื่อแยกกลุ่ม ก่อนจัดอันดับ หลังจัด ชาย หญิง 30 35 40 76 32 37 38 42 45 46 40 45 30 32 43
29 30 32 28 35 31 29 30 32 40 39 38
U n1n2 1
U n1n2 2
n1 (n1 1) 2
n2 (n2 1) 2
28 29 29 30 30
1 2 3 4 5
30 30
6 7
31 32 32
8 9 10
32 32
11 12
35
13
35 37 38
14 15 16
38 39 40
17 18 19
40 40 42 43 45 45 46 76
20 21 22 23 24 25 26 27
R1 R2
6 7 11 12 14 15 16 20 21 22 23 24 25 26 27
1 2 3 4 5 8 9 10 13 17 18 19
269
109
12(13) 269 11 2 15(16) 12(15) 109 191 2
12(15)
อาณาเขตวิกฤต กาหนด α = 0.05 n1 =15 n2 =12 และ U = 55 (อยู่ในเงื่อนไข 9 ≤ n1 ≤ 20 และ 9 ≤ n2 ≤ 20) ค่าวิกฤต U ≤ 55 คานวณค่าสถิติ จาก U = Minimum |U1, U2| = 11 ตรวจสอบค่า U จาก U = n1 n2 – U/ = 12(15) – 191 = 11 แสดงว่าค่า U ที่หาได้ถูกต้อง การสรุปผล ค่า U ที่คานวณได้ (11) มีค่าน้อยกว่า ค่าวิกฤตของ U จากตาราง (55) แสดง ว่าตกในอาณาเขตวิกฤตจึงปฏิเสธ H0 สรุปว่า ที่ระดับนัยสาคัญ 0.05 กลุ่มทดลองจะมีผลสัมฤทธิ์ ทางการเรียนสูงกว่ากลุ่มควบคุม
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 367 -
ตัวอย่างที่ ค.5.3
A clinical trial is conducted at the gynecology unit of a major hospital to determine the effectiveness of drug A in preventing premature birth. In the trial 32 pregnant women are to be studied, 16 assignment group that will receive drug A and 16 assigned to a control group that will receive a placebo. The patients are to take a fixed does of each drug on a one-time-only basis between the 24th and 28th weeks of pregnancy. The patients are assigned to groups using a random number table, whereby for every 2 patients eligible for the study, one is assigned randomly to the treatment group and the other to the control group. (α = 0.05) Suppose the weights of the babies are those given in Table Treatment group Baby weight (lb) Receive Control group baby weight (lb) drug A 6.9 7.6 7.3 7.6 6.8 7.2 8.0 5.5 6.4 6.7 5.4 8.2 5.3 6.6 5.8 5.7 5.8 7.3 8.2 6.9 6.8 5.7 8.6 7.9 6.2 7.1 7.0 6.9 5.6 4.2 6.8 5.7
วิธีทา (α = 0.05) สมมติฐาน H0 : น้าหนักทารกในกลุ่มที่ได้รับยา A เท่ากับกลุ่มควบคุม H1 : น้าหนักทารกในกลุ่มที่ได้รับยา A มากกว่ากลุ่มควบคุม สถิติที่ใช้ทดสอบ Mann – Whitney U อาณาเขตวิกฤต กาหนด α = 0.05 n1 = 16 n2 = 16 (อยู่ในเงื่อนไข 9 ≤ n1 ≤ 20 และ 9 ≤ n2 ≤ 20) ค่า U ที่ได้จากการเปิดตาราง (ดู one-tailed) = 83 ค่าวิกฤต U ≤ 83 คานวณค่าสถิติ จาก U = Minimum |U1, U2| = 57 ตรวจสอบค่า U จาก U = n1 n2 – U/ = 16(16) – 199 = 57 แสดงว่าค่า U ที่หาได้ถูกต้อง การสรุปผล ค่า U ที่คานวณได้ (57) มีค่าน้อยกว่า ค่าวิกฤตของ U จากตาราง (83) แสดง ว่าตกในอาณาเขตวิกฤตจึงปฏิเสธ H0 สรุปว่า ที่ระดับนัยสาคัญ 0.05 น้าหนักทารกในกลุ่มที่ได้รับยา A จะสูงกว่ากลุ่มควบคุม การคานวณหา R1 , R2 , U1 และ U2 Rank of Drug A : 4 7 9.5 16 16 19 19 23 24.5 24.5 26.5 26.5 28 29 30.5 32 Control : 1 2 3 5 7 7 9.5 11 12 13 14 16 19 21 22 30.5 U n1n2 1
U n1n2 2
n1 (n1 1) 2
R1
n2 (n2 1) 2
R2
16(17) 335 57 2 16(17) 16(16) 193 199 2
16(16)
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 368 -
ตาราง ค่าวิกฤตของ U ในการทดสอบ Mann – Whitney U ทีร่ ะดับนัยสาคัญต่างๆ (a) Critical Values of U for a One-Tailed Test at 0.001 or for a Two-Tailed Test at 0.002
n2
9
10
11
12
13
14
15
16
17
18
19
20
0 2 4 6 8 10 12 15 17 20 22 24 27 29 32 34 37
0 2 4 7 9 12 14 17 20 23 25 28 31 34 37 40 42
1 3 5 8 11 14 17 20 23 26 29 32 35 38 42 45 48
1 3 6 9 12 15 19 22 25 29 32 36 39 43 46 50 54
1 4 7 10 14 17 21 24 28 32 36 40 43 47 51 55 59
2 5 8 11 15 19 23 27 31 35 39 43 48 52 56 60 65
0 2 5 9 13 17 21 25 29 34 38 43 47 52 57 61 66 70
0 3 6 10 14 18 23 27 32 37 42 46 51 56 61 66 71 76
0 3 7 11 15 20 25 29 34 40 45 50 55 60 66 71 77 82
0 3 7 12 16 21 26 32 37 42 48 54 59 65 70 76 82 88
n1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 2 3 5 7 8 10 12 14 15 17 19 21 23 25 26
0 1 3 5 6 8 10 12 14 17 19 21 23 25 27 29 32
(b) Critical Values of U for a One-Tailed Test at 0.01 or for a Two-Tailed Test at 0.02
n2
9
10
11
12
13
14
15
16
1 4 7 9 12 15 18 22 25 28 31 34 37 41 44 47 50 53
2 5 8 11 14 17 21 24 28 31 35 38 42 46 49 53 56 60
0 2 5 9 12 16 20 23 27 31 35 39 43 47 51 55 59 63 67
0 2 6 10 13 17 22 26 30 34 38 43 47 51 56 60 65 69 73
0 3 7 11 15 19 24 28 33 37 42 47 51 56 61 66 70 75 80
0 3 7 12 16 21 26 31 36 41 46 51 56 61 66 71 76 82 87
17
18
19
20
0 4 9 14 19 24 30 36 41 47 53 59 65 70 76 82 88 94 100
1 4 9 15 20 26 32 38 44 50 56 63 69 75 82 88 94 101 107
1 5 10 16 22 28 34 40 47 53 60 67 73 80 87 93 100 107 114
n1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 3 5 7 9 11 14 16 18 21 23 26 28 31 33 36 38 40
1 3 6 8 11 13 16 19 22 24 27 30 33 36 38 41 44 47
0 4 8 13 18 23 28 33 38 44 49 55 60 66 71 77 82 88 93
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 369 -
(c) Critical Values of U for a One-Tailed Test at 0.025 or for a Two-Tailed Test at 0.05
n2
9
10
11
12
13
14
15
16
17
18
19
20
0 3 6 9 13 16 19 23 26 30 33 37 40 44 47 51 55 58 62
1 4 7 11 14 18 22 26 29 33 37 41 45 49 53 57 61 65 69
1 4 8 12 16 20 24 28 33 37 41 45 50 54 59 63 67 72 76
1 5 9 13 17 22 26 31 36 40 45 50 55 59 64 67 74 78 83
1 5 10 14 19 24 29 34 39 44 49 54 59 64 70 75 80 85 90
1 6 11 15 21 26 31 37 42 47 53 59 64 70 75 81 86 92 98
2 6 11 17 22 28 34 39 45 51 57 63 67 75 81 87 93 99 105
2 7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 99 106 112
2 7 13 19 25 32 38 45 52 58 65 72 78 85 92 99 106 113 119
2 8 13 20 27 34 41 48 55 62 69 76 83 90 98 105 112 119 127
n1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0 2 4 7 10 12 15 17 20 23 26 28 31 34 37 39 42 45 48
0 3 5 8 11 14 17 20 23 26 29 33 36 39 42 45 48 52 55
(d) Critical Values of U for a One-Tailed Test at 0.05 or for a Two-Tailed Test at 0.10
n2
9
10
11
12
13
14
15
16
17
18
19
20
1 5 8 12 16 19 23 27 31 34 38 42 46 50 54 57 61 65 69
2 5 9 13 17 21 26 30 34 38 42 47 51 55 60 64 68 72 77
2 6 10 15 19 24 28 33 37 42 47 51 56 61 65 70 75 80 84
2 7 11 16 21 26 31 36 41 46 51 56 61 66 71 77 82 87 92
3 7 12 18 23 28 33 39 44 50 55 61 66 72 77 83 88 94 100
3 8 14 19 25 30 36 42 48 54 60 65 71 77 83 89 95 101 107
3 9 15 20 26 33 39 45 51 57 64 70 77 83 89 96 102 109 115
4 9 16 22 28 35 41 48 55 61 68 75 82 88 95 102 109 116 123
0 4 10 17 23 30 37 44 51 58 65 72 80 87 94 101 109 116 123 130
0 4 11 18 25 32 39 47 54 62 69 77 84 92 100 107 115 123 130 138
n1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54
1 4 7 11 14 17 20 24 27 31 34 37 41 44 48 51 55 58 62
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 370 -
ค.6 การทดสอบรันของวอล์ด วูล์ฟอวิทซ์ (The Wald Wolfowitz Run Test) การทดสอบรันของ วอล์ด วูล์ฟอวิทซ์ สาหรับตัวอย่างสองกลุ่มที่เป็นอิสระจาก กัน มีหลักการเช่นเดียวกับการทดสอบรันสาหรับตัวอย่างกลุ่มเดียว แต่ใช้ในการทดสอบว่าตัวอย่าง สองกลุ่มที่เป็นอิสระจากกันสุ่มจากประชากรเดียวกันหรือไม่ การทดสอบทาได้โดยนาข้อมูลทั้งสองกลุ่มมารวมกัน แล้วเรียงตามลาดับจากน้อย ไปหามากและนับจานวนรัน ( r ) โดยพิจารณาว่าข้อมูลแต่ละค่ามาจากกลุ่มใด จานวนรัน ในที่นี้ หมายถึง จานวนครั้งที่มีการเปลี่ยนกลุ่ม ถ้าตัวอย่างทั้งสองกลุ่มมาจากประชากรเดียวกันค่าของ ข้อมูลในตัวอย่างทั้งสองกลุ่มจะใกล้เคียงกันทาให้จานวนรันมีมาก r จะมีค่าสูง แต่ถ้าตัวอย่างทั้ง สองกลุ่มมาจากประชากรที่แตกต่างกันลักษณะใดลักษณะหนึ่ง ค่าของข้อมูลภายในแต่ละกลุ่ม ตัวอย่างจะใกล้เคียงกัน และจะแตกต่างกันระหว่างกลุ่มตัวอย่างจะทาให้จานวนรันมีน้อย r มีค่าต่า ค.6.1 ข้อตกลงเบื้องต้น ค.6.1.1 ระดับของการวัดอยู่ในมาตราเรียงอันดับหรือสูงกว่า ค.6.1.2 ข้อมูลมาจากกลุ่มตัวอย่าง 2 กลุ่ม ที่เป็นอิสระจากกัน และมีตัว แปร 1 ตัว ค.6.1.3 ข้อมูลมีการแจกแจงแบบต่อเนื่อง ค.6.2 สมมติฐานเพื่อการทดสอบ H0 : ตัวอย่าง 2 กลุ่มถูกสุ่มมาจากประชากรที่มีลักษณะการแจกแจงไม่ แตกต่างกัน H1 : ตัวอย่าง 2 กลุ่มถูกสุ่มมาจากประชากรที่มีลักษณะการแจกแจง แตกต่างกัน ค.6.3 ขั้นตอนการคานวณ ค.6.3.1 กรณีกลุ่มตัวอย่างมีขนาดเล็ก (n1 20 และ n2 20) 1. นาข้อมูลทั้ง 2 กลุ่ม มารวมกันแล้วเรียงลาดับจากค่าน้อยไปมาก 2. นับจานวนรันส์ (r) โดยพิจารณาการสลับค่าระหว่างข้อมูล 2 กลุ่ม ค.6.3.2 กรณีกลุ่มตัวอย่างมีขนาดใหญ่ (n1 > 20 และ n2 > 20) การแจกแจงของจานวนรันส์ สามารถประมาณได้ด้วยการแจกแจง ปกติ ซึ่งมีค่าเฉลี่ยของจานวนรันส์(r) คือ r n2n1nn2 1 และ 1
ส่วนเบี่ยงเบนมาตรฐานของจานวนรันส์(r ) คือ r
ค.6.4 สถิติทดสอบ เมื่อ
2n1n2 (2n1n2 n1 n2
(n1 n2 )2 (n1 n2 1) r r Z
r
แทน จานวนรันส์ n1 แทน ขนาดของตัวอย่างกลุ่มที่ 1 n2 แทน ขนาดของตัวอย่างกลุ่มที่ 2 r
2
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 371 -
ค.6.5 เกณฑ์การตัดสินใจ 1. n1 20 และ n2 20 จะปฏิเสธสมมติฐาน H0 ถ้าจานวนรันส์ ที่ได้มีค่า น้อยกว่าค่าวิกฤติจากตารางการทดสอบรันส์ 2. n1 > 20 และ n2 > 20 จะปฏิเสธสมมติฐาน H0 ถ้าค่า |Z| ที่คานวณได้มี ค่ามากกว่าค่า Z จากตารางการแจกแจงปกติมาตรฐาน ตัวอย่างที่ ค.6.1 ในการทดสอบวิชาภาษาไทยของนักเรียน 2 กลุ่ม ปรากฏคะแนนสอบ ดังนี้ กลุ่ม 1 : 20 25 24 22 44 18 41 30 36 28 15 24 32 61 74 31 กลุ่ม 2 : 69 51 66 52 69 80 61 66 50 53 51 58 62 75 89 76 จงทดสอบว่านักเรียน 2 กลุ่มนี้ มาจากกลุ่มนักเรียนที่มีความสามารถพอๆ กันหรือไม่ วิธีทา เรียงข้อมูลทั้ง 2 กลุ่มจากน้อยไปหามาก 15 18 20 22 24 24 25 28 30 31 32 36 41 44 50 51 51 52 53 58 61 61 62 66 66 69 69 74 75 76 89 เมื่อนับจานวนรันส์ โดยพิจารณาการสลับค่าระหว่างข้อมูล 2 กลุ่มได้ค่ารันส์เป็น 6 ค่าวิกฤตมีค่า 11 จะเห็นว่าค่ารันส์จากข้อมูลมีค่าน้อยกว่าค่าวิกฤต จึงปฏิเสธ H0 หรือ ยอมรับ H1:ตัวอย่าง 2 กลุ่มถูกสุ่มมาจากประชากรที่มีลักษณะการแจกแจงที่แตกต่าง กัน ตัวอย่างที่ ค.6.2
To determine if a new hybrid seeding produces a bushier flowering plant, following data was collected. Examine if the data indicate that new hybrid produces larger shrubs than the current variety? Shrubs (in inches) Hybrid Current Variety
Soln
x y
31.8 35.5
32.8 27.6
39.2 21.3
36.0 24.8
30.0 36.7
34.5 30.0
37.4
H0 : x and y populations are identical H1 : There is some difference in girth of x and y shrubs. Consider the combined ordered data.
21.3 y
24.8 y
27.6 y
30.0 y
30.0 x
31.8 x
32.8 x
34.5 x
35.5 y
36.0 x
36.7 y
37.4 x
39.2 x
Test statistics r = 6 (total number of runs). For n1 = 7 and n2 = 6, critical value rc at 5% level of significance is 3. Since r > rc, we accept H0 and conclude that x and y have identical distribution.
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 372 -
ง. กลุ่มตัวอย่างมากกว่าสองกลุ่มที่สัมพันธ์กัน การทดสอบสมมติฐานของกลุ่มตัวอย่างมากกว่า 2 กลุ่ม เป็นการทดสอบว่ากลุ่มตัวอย่าง นั้นมาจากประชากรเดียวกัน หรือทดสอบว่ามาจากประชากรหลายประชากรที่มีลักษณะเหมือนกัน หรือไม่ ในสถิติแบบใช้พารามิเตอร์ เทคนิคที่ใช้ทดสอบกลุ่มตัวอย่างหลาย ๆ กลุ่ม ( 3 กลุ่มขึ้นไป) ที่สัมพันธ์กันว่ามาจากประชากรเดียวกันหรือไม่ ใช้การวิเคราะห์ความแปรปรวนที่วัดซ้า (Repeated Oneway ANOVA) ซึ่งมีข้อตกลงเบื้องต้นมากมาย เช่น ค่าสังเกตหรือคะแนนต้องเป็นอิสระจากกัน สุ่มมาจากประชากรที่มีการแจกแจงแบบปกติ ประชากรทุกกลุ่มมีความแปรปรวนเท่ากัน และ ระดับการวัดอยู่ในมาตราอันตรภาค เป็นต้น เมื่อข้อมูลไม่เป็นไปตามข้อตกลงเบื้องต้นดังกล่าว เรา อาจหันมาเลือกใช้สถิติไม่อิงพารามิเตอร์ในการทดสอบสมมติฐานกลุ่มตัวอย่าง k กลุ่มที่สัมพันธ์กัน ซึ่งมีวิธีการทดสอบ ดังต่อไปนี้ ง.1 การทดสอบของคอคแรนคิว (The Cochran Q Test) ง.2 การทดสอบของฟรีดแมน(The Friedman Two – Way Analysis of Variance by Ranks) ง.1 การทดสอบของค็อกแครนคิว (The Cochran Q Test) การทดสอบของค็อกแครนคิว เป็นการทดสอบความแตกต่างระหว่างความถี่ หรือสัดส่วนเมื่อมีกลุ่มตัวอย่างตั้งแต่ 3 กลุ่มขึ้นไป และในแต่ละกลุ่มแบ่งออกได้เป็นสองประเภท เช่น ใช่ – ไม่ใช่, ชอบ – ไม่ชอบ, สอบได้ – สอบตก, ทาถูก – ทาผิด เป็นต้น โดยกาหนดให้ 1 แทน สิ่งที่ต้องการ ให้ 0 แทนสิ่งที่ไม่ต้องการ จึงใช้กับข้อมูลมาตรานามบัญญัติหรือมาตราอันดับที่ก็ได้ ง.1.1 ข้อตกลงเบื้องต้น ง.1.1.1 ข้อมูลอยู่ในมาตรานามบัญญัติหรือมาตราเรียงอันดับ หรือมาตรา อันตรภาค ง.1.1.2 กลุ่มตัวอย่างที่สัมพันธ์กัน ตั้งแต่ 3 กลุ่มขึ้นไป ในแต่ละกลุ่มแบ่งออก ได้เป็นสองประเภท เช่น ความสาเร็จ – ไม่สาเร็จ เป็นต้น ง.1.1.3 กลุ่มตัวอย่างแต่ละกลุ่มมีขนาดเท่ากัน ง.1.2 สมมติฐานเพื่อการทดสอบ H0:: ทุกสิ่งทดลองให้ผลการทดลองเหมือนกัน H1: มีอย่างน้อยหนึ่งสิ่งทดลองที่ให้ผลการทดลองแตกต่างจากสิ่งทดลองอื่น ๆ ง.1.3 ขั้นตอนการคานวณ 1. กาหนดตัวเลข 1 ให้กับหน่วยตัวอย่างที่ให้ผลการทดลองเป็นแบบ “สาเร็จ”
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 373 -
0 ให้กับหน่วยตัวอย่างที่ให้ผลการทดลองเป็นแบบ “ล้มเหลว” 2. จัดข้อมูลที่ได้ ซึ่งมีค่า 0 กับ 1 ในรูปตารางที่มี r แถว (บล็อก) k คอลัมน์ (สิ่ง ทดลอง) 3. หาผลรวมตามแนวสดมภ์หรือสิ่งทดลอง (Gj) 4. หาผลรวมตามแนวแถวหรือบล็อก (Li) ง.1.4 สถิติทดสอบ
k k (k 1) (k G 2j ) ( G j ) 2 j 1 j 1 Q n n 2 k L i Li i 1
i 1
ซึ่งการแจกแจงของ Q นี้ประมาณได้ด้วยการแจกแจงไคสแควร์ ที่ องศาความเป็นอิสระ k – 1 เมื่อ k แทน จานวนสิ่งทดลอง n แทน จานวนบล็อก Gj แทน ผลรวมตามแนวสดมภ์หรือสิ่งทดลอง ที่ j (j = 1,2,3,…,k) Lj แทน ผลรวมตามแนวแถวหรือบล็อก ที่ i ( i = 1,2,3,…,n) ง.1.5 เกณฑ์การตัดสินใจ ทาการปฏิเสธ H0 ถ้าค่าสถิติทดสอบ Q ที่คานวณได้มีค่ามากกว่าค่าวิกฤต จากตารางการแจกแจง 2 ที่องศาความเนอิสระเท่ากับ k – 1 และระดับ นัยสาคัญที่กาหนด ตัวอย่างที่ ง.1.1 ทดลองให้นักเรียนแก้ปัญหาทางคณิตศาสตร์ข้อหนึ่ง ซึ่งมีวิธีการแก้ปัญหา อยู่ 3 วิธี โดยสุ่มตัวอย่างนักเรียนมาจานวน 12 คน แล้วกาหนดโจทย์คณิตศาสตร์ให้ทั้ง 3 วิธี แล้วตรวจโดย กาหนดให้ 1 เมื่อแก้ปัญหาโจทย์คณิตศาสตร์วิธีนั้นได้สาเร็จ และให้ 0 เมือ่ แก้ปัญหาโจทย์คณิตศาสตร์วิธีนั้นไม่ได้ ผลการให้คะแนนปรากฏดังนี้ นักเรียน คนที่ 1 2 3 4 5 6
คะแนนจากการแก้ปัญหาโจทย์ คณิตศาสตร์โดย วิธีที่ 1 วิธีที่ 2 วิธีที่ 3 1 1 1 0 1 0 1 0 1 0 0 0 1 1 0 0 1 1
นักเรียน คนที่ 7 8 9 10 11 12
คะแนนจากการแก้ปัญหา โจทย์คณิตศาสตร์โดย วิธีที่ 1 วิธีที่ 2 วิธีที่ 3 1 0 0 0 1 1 1 1 0 1 0 1 0 0 0 1 1 1
จงทดสอบความน่าจะเป็นในการแก้ปัญหาโจทย์คณิตศาสตร์ของนักเรียนทั้ง 3 วิธี
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 374 -
วิธีทา เตรียมข้อมูล นักเรียน คนที่ 1 2 3 4 5 6 7 8 9 10 11 12 รวม
คะแนนจากการแก้ปัญหาโจทย์ คณิตศาสตร์โดย วิธีที่ 1 วิธีที่ 2 วิธีที่ 3 1 1 1 0 1 0 1 0 1 0 0 0 1 1 0 0 1 1 1 0 0 0 1 1 1 1 0 1 0 1 0 0 0 1 1 1 7 7 6
รวม
ยกกาลังสอง รวม
( Li )
( L2i )
3 1 2 0 2 2 1 2 2 2 0 3 20
9 1 4 0 4 4 1 4 4 4 0 9 44
ดังนั้น จึงแทนค่าต่างๆ ลงในการทดสอบของค็อกแครนคิว จะได้ผล ดังนี้ k
Gj j 1
7 7 6 20
k = 3, N = 20
และ
k 2 Gj j 1
72 72 62 134
แทนค่าต่างๆ ลงในสถิติทดสอบของค็อกแครนคิว จะได้ดังนี้
k k (k 1) (k G 2j ) ( G j ) 2 j 1 j 1 Q n n 2 k L i Li i 1
i 1
2 (3x134) 202 3x20 44
1 4
0.25
เกณฑ์การตัดสินใจ เปิดตารางไคสแควร์ที่ระดับนัยสาคัญ 0.05 และองศาความเป็นอิสระ (df) = 3 – 1 = 2 จะได้ค่าวิกฤตคือ 5.991 จะเห็นว่าค่าสถิติทดสอบของค็อกแครนคิวที่ คานวณได้เท่ากับ 0.25 มีค่าน้อยกว่าค่าวิกฤต 5.991 จึงยอมรับสมมติฐาน H0 กล่าวคือการแก้ปัญหาโจทย์คณิตศาสตร์ของนักเรียนทั้ง 3 วิธีไม่แตกต่างกัน
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 375 -
ง.2 การทดสอบของฟรีดแมน(The Friedman Two – Way Analysis of Variance by Rank) การทดสอบของฟรีดแมน ใช้วิธีการจัดอันดับข้อมูลในแต่ละชุดแล้วหาผลรวม ของอันดับในแต่ละกลุ่มหรือแต่ละสถานการณ์ ใช้กับข้อมูลที่มีการจับคู่ให้เท่าเทียมกันและอยู่ใน ระดับการวัดมาตราเรียงอันดับเป็นอย่างน้อย เพื่อทดสอบว่ากลุ่มตัวอย่างทั้ง k กลุ่มนั้นมาจาก ประชากรเดียวกันหรือมาจากประชากรที่มีมัธยฐานเหมือนกันหรือไม่ ถ้าประชากรทุกกลุ่มมีมัธยฐาน เท่ากัน หรือสถานการณ์ทั้ง k อย่างให้ผลไม่แตกต่างกัน การวิจัยเป็นอันสิ้นสุดลงได้ แต่ถ้าผลปรากฏ ว่ามีมัธยฐานของประชากรอย่างน้อย 1 คู่ ไม่เท่ากัน หรือมีสถานการณ์บางคู่อย่างน้อย 1 คู่ ให้ผล แตกต่างกัน ผู้วิจัยก็สามารถทาการเปรียบเทียบพหุคูณต่อไป เพื่อค้นหาว่าประชากรคู่ใดบ้างที่ แตกต่างกัน การทดสอบฟรีดแมนจะเหมือนกับการวิเคราะห์ความแปรปรวนแบบสองทางในแผนการ ทดลองแบบบล็อกสุ่ม (Randomized block design :RBD) ดังนั้นจึงนิยมเรียกวิธีทดสอบแบบนี้ว่า The Friedman Two-way ANOVA by Ranks หรือ The Friedman Two-way ANOVA ง.2.1 ข้อตกลงเบื้องต้น ง.2.1.1 ข้อมูลของการวัดอยู่ในระดับที่ไม่ต่ากว่ามาตราจัดอันดับ ง.2.1.2 มีกลุ่มตัวอย่างสัมพันธ์กันตั้งแต่ 3 กลุม่ ขึ้นไป ง.2.1.3 กลุ่มตัวอย่างแต่ละกลุ่มต้องมีขนาดเท่ากัน ง.2.1.4 ลักษณะของข้อมูลเป็นแบบต่อเนื่อง ง.2.2 สมมติฐาน H0 : กลุ่มตัวอย่างที่สัมพันธ์กันทั้ง k กลุ่ม มาจากประชากรที่มีการแจกแจง เหมือนกัน H1 : กลุ่มตัวอย่างที่สัมพันธ์กันทั้ง k กลุ่ม มาจากประชากรที่มีการแจกแจง ไม่เหมือนกัน (มีอย่างน้อย 2 กลุ่มที่มีค่าเฉลี่ยไม่เท่กัน) ง.2.3 สถิติทดสอบ k 2 เป็นการทดสอบแบบสองทาง 2 nk (12 Ri 3n(k 1) k 1) r
i 1
เมื่อ n เป็นขนาดของกลุ่มตัวอย่างในแต่ละกลุ่ม (หรือ treatment) k เป็นจานวนของการทดลอง หรือจานวนกลุ่มที่มีอยู่ทั้งหมด Ri เป็นผลรวมของอันดับในกลุ่มตัวอย่างที่ i ง.2.4 อาณาเขตวิกฤตและการสรุปผล กรณีที่กลุ่มตัวอย่าง 3 กลุ่ม (k =3) และขนาดของกลุ่มตัวอย่าง 2 ni 9 หรือ กรณีที่กลุ่มตัวอย่าง 4 กลุ่ม (k =4) และขนาดของกลุ่มตัวอย่าง 2 ni 9 หรือ ให้นาค่า 2 ที่คานวณได้ไปเปิดตาราง เพื่อหาค่าความน่าจะเป็น นาไป r
เปรียบเทียบกับระดับนัยสาคัญที่กาหนดไว้ จะปฏิเสธสมมติฐานหลัก H0 เมื่อค่า
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 376 -
ความน่าจะเป็นที่เปิดได้จากตารางมีค่าน้อยกว่าหรือเท่ากับค่า (ระดับนัยสาคัญ) ที่กาหนดไว้ ง.2.4 การคานวณค่าสถิติ มีขั้นตอนดังนี้ 1. จัดข้อมูลที่อยู่ในรูปตาราง 2 ทาง โดยมีจานวนแถว n แถว และจานวน คอลัมภ์ k คอลัมภ์ ให้แถวต่างๆ แทนจานวนของสิ่งที่จะทดสอบ และคอลัมภ์ ต่างๆ แทนเงื่อนไขหรือสถานการณ์ในการทดลอง 2. ทาการจัดอันดับ โดยในการจัดอันดับในแต่ละแถว ให้ค่าน้อยที่สุดเป็น อันดับ 1 ค่าสูงสุดเป็นอันดับ k (กรณีที่ค่าอันดับเท่ากันให้นาเอาอันดับมาเฉลี่ย) 3. หาผลรวมของอันดับของข้อมูล โดยจะทาการหาผลรวมในแต่ละกลุ่ม หรือสถานการณ์ทดลอง (หาผลรวมในแนวคอลัมภ์) โดยกาหนดให้ R1 เป็นผลรวมของอันดับของข้อมูลจากสถานการณ์ที่ 1 R2 เป็นผลรวมของอันดับของข้อมูลจากสถานการณ์ที่ 2 : : : Rk เป็นผลรวมของอันดับของข้อมูลจากสถานการณ์ที่ k 4. คานวณค่า 2 จากสูตรที่ให้มาข้างต้น r
ในกรณีที่ข้อมูลในแต่ละแถวมีจานวนซ้ากันมากๆ (จะเกิดขึ้นเมื่อมี k มีค่ามากๆ) จะทาการปรับค่า
2 r
ดังนี้
2 (C ) r
2
r 3 (t t ) 1 nk ( K 2 1)
ตัวอย่างที่ ง.2.1 (กรณีอันดับที่ไม่ซ้ากัน) การทดลองวิธีการสอนที่ต่าง ๆ กัน 4 วิธี ให้แก่ นักเรียนที่สุ่มมา 15 คน ปรากฏคะแนนผลสัมฤทธิ์ทางการเรียนหลังจากเสร็จสิ้นการสอนดังตาราง ต่อไปนี้ จงทดสอบว่านักเรียนชอบวิธีการสอนทั้ง 4 วิธีต่างกันหรือไม่ นักเรียน 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 วิธีที่ 1 14 17 18 11 18 17 23 17 19 32 18 13 17 10 14 วิธีที่ 2 31 36 28 21 13 27 25 22 16 14 22 14 29 22 31 วิธีที่ 3 22 32 31 28 23 24 27 20 26 25 24 27 19 16 32 วิธีที่ 4 18 22 37 12 17 24 22 17 21 18 19 26 22 28 17 วิธีทา 1. ตั้งสมมุติฐาน
H0 : นักเรียนชอบวิธีการสอนทั้ง 4 วิธี ไม่แตกต่างกัน H1 : นักเรียนชอบวิธีการสอนทั้ง 4 วิธี แตกต่างกัน 2. สร้างรหัสตัวแปร ให้ score 1 ถึง score 4 แทนคะแนนความชอบวิธีสอนทั้ง 4 วิธี 3. ทดสอบของฟรีดแมน(The Friedman Two – Way Analysis of Variance by Rank)
บทที่ 12 : สถิติไม่อิงพารามิเตอร์ เตรียมข้อมูล โดยให้อันดับของแต่ละวิธี นักเรียน 1 2 3 4 5 6 7 8 วิธีที่ 1 1 1 1 1 3 1 2 1.5 วิธีที่ 2 4 4 2 3 1 4 3 4 วิธีที่ 3 3 3 3 4 4 2.5 4 3 วิธีที่ 4 2 2 4 2 2 2.5 1 1.5 ในที่นี้ n = 15, 4. สถิติทดสอบ
k
หน้าที่ - 377 -
9 10 11 12 13 14 15 รวม(Ri) รวม( Ri2 ) 2 4 1 1 1 1 1 22.5 45.25 1 1 3 2 4 3 3 42 136 4 3 4 4 2 2 4 49.5 171.25 3 2 2 3 3 4 2 36 96.5
= 4 แทนค่าในสูตร เนื่องจากอันดับที่ไม่ซ้ากัน ดังนี้
2 r
k 2 12 Ri 3n(k 1) nk (k 1) i 1
12 (45.25 136 171.25 96.5) 3(15)(5) (15)(4)(5)
(0.04)(6016.5) 225
= 240.66 225 = 15.66
เปิดตาราง เพื่อหาค่าวิกฤตที่ระดับนัยสาคัญ 0.05 และองศาเสรี (df) = k – 1 = 3 จะได้ค่าวิกฤตเท่ากับ 7.815 5. สรุปผลการทดสอบ เนื่องจากค่าการทดสอบฟรีดแมนที่คานวณได้มีค่าเท่ากับ 15.66 ซึ่งมากกว่าค่า วิกฤตไคสแควร์ (7.815) ดังนั้นจึงปฏิเสธสมมติฐานว่าง (H0) หรือกล่าวคือนักเรียน ชอบวิธีการสอนทั้ง 4 วิธี แตกต่างกันที่ระดับนัยสาคัญ 0.05 2
ตัวอย่างที่ ง.2.2 (กรณีอันดับที่ซ้ากัน) ในการเปรียบเทียบประสิทธิภาพของน้ามันเครื่อง 5 ยี่ห้อในท้องตลาดว่ามีประสิทธิภาพแตกต่างกันหรือไม่ที่ระดับนัยสาคัญ 0.05 โดยการเปรียบเทียบ จากระยะทางที่รถแล่น หน่วยเป็นพันกิโลเมตร จึงทดสอบกับรถ 10 ยี่ห้อ ขนาด 1,600 ซีซี ได้ข้อมูล ดังนี้ ยี่ห้อรถ น้ามันเครื่อง(ทรีตเมนต์) (บล็อก) A(1) B(1) C(3) D(4) E(5) 1 6.2 8.1 7.1 7.4 5.9 2 5.4 8.3 7.1 7.4 5.0 3 5.8 6.2 5.1 8.5 5.4 4 4.3 4.8 5.0 5.8 5.0 5 5.8 7.3 4.2 8.1 8.3 6 5.4 7.9 4.2 8.1 8.1 7 6.1 8.2 4.8 8.8 8.5 8 7.1 7.8 4.6 8.0 5.5 9 8.1 5.4 7.6 5.3 8.0 10 9.3 8.3 7.2 5.0 8.9
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 378 -
วิธีทา 1. ตั้งสมมติฐานทางสถิติ H0 : 1 = 2 = 3 = 4 = 5 H1 : i j โดยที่ i j และ i, j = 1, 2, 3, 4, 5 หรือ H0 : ระยะทางโดยเฉลี่ยของรถยนต์ที่ใช้น้ามันเครื่องแต่ละชนิดไม่แตกต่างกัน H1 : ระยะทางโดยเฉลี่ยของรถยนต์ที่ใช้น้ามันเครื่องแต่ละชนิดแตกต่างกันอย่างน้อย 1 คู่ 2. กาหนดระดับนัยสาคัญ โจทย์กาหนดระดับนัยสาคัญ 0.05 3. กาหนดสถิติทดสอบ ใช้การวิเคราะห์ความแปรปรวนโดยใช้สถิติทดสอบฟรีดแมน ดังนี้ k 2 สถิติทดสอบ 2 nk (12 เมื่ออันดับที่ไม่ซ้ากัน Ri 3n(k 1) k 1) r
สถิติทดสอบ
i 1 2 2 r (C ) g1 r 3 (t j t j ) j 1 1 nk ( K 2 1)
โดยให้
เมื่ออันดับที่ซ้ากัน
g1 3 (t j t j ) j 1 C 1 nk ( K 2 1)
4. คานวณค่าสถิติทดสอบ ภายในแต่ละบล็อกให้เรียงลาดับข้อมูลจากน้อยไปมาก แล้วให้ค่าต่าสุดเป็นลาดับที่ 1 ดังนี้ ยี่ห้อรถ น้ามันเครื่อง(ทรีตเมนต์) (บล็อก) A(1) B(1) C(3) D(4) E(5) 1 2 5 3 4 1 2 2 5 3 4 1 3 3 4 1 5 2 4 1 2 3.5 5 3.5 5 2 3 1 4 5 6 2 3 1 4.5 4.5 7 2 3 1 5 4 8 3 4 1 5 2 9 4 2 3 1 5 10 5 3 2 1 4 ผลรวม (Ri) 26 34 19.5 38.5 32 676 1,156 380.25 1,482.25 1,024 ผลรวม ( Ri2 ) ในที่นี้ n = 10, k = 5 แทนค่าในสูตร เนื่องจากอันดับที่ซ้ากัน ได้ดังนี้
บทที่ 12 : สถิติไม่อิงพารามิเตอร์ 2 r
หน้าที่ - 379 -
k 2 12 Ri 3n(k 1) nk (k 1) i 1
12 (676 1156 380.25 1482.25 1024) (3)(10)(6) (10)(5)(6) g1 3 (t j t j ) {(23 2)} {(23 2)} j 1 C 1 1 0.99 nk ( K 2 1) (10)(53 5)
ดังนั้น
2 (C ) r
2
r g1 3 (t j t j ) j 1 1 nk ( K 2 1)
8.74 0.99
8.74
8.83
เปิดตารางไคสแควร์เพื่อหาค่าวิกฤตที่ระดับนัยสาคัญ 0.05 และค่าองศาอิสระ k – 1 = 5 – 1 = 4 จะได้ค่าวิกฤตคือ 2 = 9.488 สรุปผลการทดสอบ เนื่องจากค่าการทดสอบฟรีดแมนที่คานวณได้มีค่าเท่ากับ 8.83 ซึ่งน้อยกว่าค่า วิกฤตไคสแควร์ (9.488) ดังนั้นจึงยอมรับสมมติฐานว่าง (H0) หรือกล่าวคือระยะทาง โดยเฉลี่ยของรถยนต์ที่ใช้น้ามันเครื่องแต่ละชนิดไม่แตกต่างกันที่ระดับนัยสาคัญ 0.05 จ. กลุ่มตัวอย่างมากกว่า 2 กลุ่มที่เป็นอิสระกัน ในการทดสอบสมมติฐานของกลุ่มตัวอย่างมากกว่า 2 กลุ่มที่ไม่สัมพันธ์กันว่ามาจาก ประชากรเดียวกันหรือไม่ หรือทดสอบว่ามาจากประชากรที่มีลักษณะเหมือนกันหรือไม่นั้น โดย สามารถใช้สถิติอิงพารามิเตอร์โดยใช้การวิเคราะห์ความแปรปรวนชนิดทางเดียว(One way ANOVA) ที่ใช้การทดสอบแบบเอฟ ซึ่งมีข้อตกลงไว้ว่า ค่าสังเกตที่เป็นอิสระจากกันต้องสุ่มมาจากประชากรที่มี การแจกแจงแบบปกติและมีความแปรปรวนเท่ากัน ตลอดจนตัวแปรที่ใช้จะต้องอยู่ในระดับอันตร ภาคเป็นอย่างน้อย แต่ถ้าข้อมูลที่ได้จากการวัดไม่เป็นไปตามข้อกาหนดของการใช้แบบเอฟ เราต้อง ทาการทดสอบโดยใช้สถิติไม่อิงพารามิเตอร์แทน การทดสอบสมมติฐานของกลุ่มตัวอย่างที่มากกว่า 2 กลุ่มที่ไม่สัมพันธ์กันหรือเป็นอิสระ จากกันในสถิติไม่อิงพารามิเตอร์มีวิธีการทดสอบ ดังต่อไปนี้ จ.1 การทดสอบไคสแควร์สาหรับตัวอย่าง k กลุ่มที่เป็นอิสระจากกัน(The 2 Test for k Independent samples) จ.2 การทดสอบมัธยฐาน(The Extension of the Median Test) จ.3 การทดสอบครุสคัล-วอลลิส (The Kruskal – Wallis One – Way Analysis of Variance by Ranks)
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 380 -
จ.1 การทดสอบไคสแควร์สาหรับตัวอย่าง k กลุ่มที่เป็นอิสระจากกัน (The 2 Test for k Independent samples) การทดสอบไคสแควร์สาหรับหลายกลุ่มที่ไม่สัมพันธ์กัน มีวิธีการคล้ายกับการ ทดสอบไคสแควร์ที่กลุ่มตัวอย่าง 2 กลุ่มไม่สัมพันธ์กัน เพียงแต่เพิ่มจานวนกลุ่มมากขึ้น ข้อมูลที่ได้ จากการวัดเป็นข้อมูลแบบไม่ต่อเนื่อง (Discrete Categories) ซึ่งเป็นการวัดในมาตรานามบัญญัติ หรือเรียงอันดับการทดสอบไคสแควร์นี้ต้องการทดสอบว่ามีตัวแปรสองตัว ที่แต่ละตัวแบ่งออกเป็น หลายประเภทหรือหลายระดับมีความสัมพันธ์กันหรือไม่ จ.1.1 ข้อตกลงเบื้องต้น จ.1.1.1 มีกลุ่มตัวอย่าง k กลุ่มที่เป็นอิสระจากกัน จ.1.1.2 มีตัวแปรที่ต้องศึกษาสองตัวแปร แต่ละตัวแปรแบ่งออกเป็นหลาย ประเภทหรือหลายระดับ จ.1.1.3 ลักษณะของข้อมูลเป็นแบบไม่ต่อเนื่องที่จาแนกประเภท และอยู่ในรูป ของความถี่ จ.1.1.4 ตัวแปรทั้งสองอยู่ในระดับการวัดนามบัญญัติหรือเรียงอันดับ จ.1.2 สมมติฐานเพื่อการทดสอบ H0 : สัดส่วนของลักษณะที่สนใจศึกษาของประชากร k กลุ่มไม่แตกต่างกัน H1 : มีสัดส่วนของลักษณะที่สนใจศึกษาของประชากรอย่างน้อย 1 กลุ่มที่ แตกต่างจากกลุ่มอื่นๆ จ.1.3 ขั้นตอนการคานวณ 1. สร้างตารางขนาด 2 x k 2. นับความถี่ที่สังเกตได้ (Oij) และบันทึกลงในช่อง ของตารางขนาด 2 x k 3. หาผลรวมในแนวแถว (ni.) และสดมภ์(n.j) 4. หาความถี่ที่คาดหวังโดยใช้สูตร 2
n. j Oij i 1
เมื่อ
k Oij Eij
ni. n.j n
และ
Eij
ni.n. j n
โดยที่
k
ni. Oij j 1
2 k
n Oij i 1 j 1
แทน จานวนสดมภ์ (column) แทน ความถี่ที่สังเกตได้จากแถวที่ i สดมภ์ที่ j แทน ความถี่ที่คาดหวังว่าจะได้จากแถวที่ i สดมภ์ที่ j เมื่อ H0 เป็นจริง แทน ผลรวมของความถี่ที่สังเกตได้ในแถวที่ i แทน ผลรวมของความถี่ที่สังเกตได้ในสดมภ์ที่ j แทน ผลรวมของความถี่ที่สังเกตได้ทั้งหมด (i = 1,2, j = 1,2,3,…,k)
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 381 -
จ.1.4 เกณฑ์การตัดสินใจ จะปฏิเสธสมมติฐาน H0 ถ้าค่าสถิติทดสอบที่คานวณได้มีค่ามากกว่าค่าวิกฤต จากตารางการแจกแจงไคสแควร์ที่องศาความเป็นอิสระเท่ากับ (k – 1) และระดับความ มีนัยสาคัญที่กาหนด ตัวอย่างที่ จ.1.1 ครูวิชัยได้คิดค้นนวัตกรรมการพัฒนาทักษะการคิดโดยใช้แหล่งเรียนรู้ใน ชุมชน หลังจากทดลองใช้ 1 ภาคเรียน ครูวิชัยสารวจความคิดเห็นที่มีต่อนวัตกรรม กาหนดว่า 1 แสดงว่าชอบน้อยที่สุด และเพิ่มขึ้นเรื่อย ๆ จนถึง 5 แสดงว่าชอบมาก โดยสุ่มตัวอย่างจากผู้มีส่วน เกี่ยวข้อง 3 กลุ่ม ได้แก่ นักเรียน ผู้ปกครอง และครู ผลการสารวจได้ข้อมูลดังต่อไปนี้ ความคิดเห็นที่มีต่อนวัตกรรม ผู้มีส่วน รวม เกี่ยวข้อง 1 2 3 4 5 นักเรียน 45 63 95 32 25 260 ผู้ปกครอง 63 152 88 15 12 330 ครู 16 23 69 117 45 270 รวม 124 238 252 164 82 860 จงทดสอบสมมุติฐานว่าการชอบนวัตกรรมดังกล่าว ขึ้นอยู่กับกลุ่มของผู้มีส่วนเกี่ยวข้องหรือไม่ ที่ระดับความมีนัยสาคัญ 0.05 ผู้มีส่วนเกี่ยวข้อง นักเรียน (O) ค่าคาดหวัง (E) ผู้ปกครอง (O) ค่าคาดหวัง (E) ครู (O) ค่าคาดหวัง (E) รวม r
1 45 37.49 63 47.58 16 38.93 124
c (Oij Eij )2
2 cal
i 1 j 1
Eij
=
ความคิดเห็นที่มีต่อนวัตกรรม 2 3 4 63 95 32 71.95 76.19 49.58 152 88 15 91.33 96.70 62.93 23 69 117 74.72 79.12 51.49 238 252 164
5 25 24.79 12 31.47 45 25.74 82
รวม 260 330 270 860
(45 37.49)2 (63 71.95) 2 (95 76.19) 2 37.49 71.95 76.19 ...
(117 51.49)2 (45 25.74)2 51.49 25.74
256.495
สรุปผลการทดสอบ จะเห็นว่าค่าตัวสถิติทดสอบที่คานวณได้มีค่า 256.495 มีค่ามากกว่าค่า 2 15.5073 จึงปฏิเสธ H0 หรือยอมรับ H1 : การชอบนวัตกรรมดังกล่าวขึ้นอยู่กับกลุ่ม วิกฤต 0.05,8 ของผู้มีส่วนเกี่ยวข้อง
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 382 -
จ.2 การทดสอบมัธยฐาน(The Extension of the Median Test) การทดสอบโดยใช้มัธยฐานกรณีที่กลุ่มตัวอย่างมากกว่า 2 กลุ่มที่ไม่สัมพันธ์กัน มี วิธีการคล้ายกับการทดสอบมัธยฐาน กรณีที่มีกลุ่มตัวอย่าง 2 กลุ่มโดยการเพิ่มเป็นหลายกลุ่ม ข้อมูล ที่ได้จากการวัดอยู่ในมาตราเรียงอันดับ การทดสอบมัธยฐานนี้ต้องการทดสอบว่า กลุ่มตัวอย่าง k กลุ่มนั้นมาจากประชากรเดียวกันหรือทดสอบว่ามาจากประชากรที่มีค่ามัธยฐานเท่ากันหรือไม่ จ.2.1 ข้อตกลงเบื้องต้น จ.2.1.1 มีกลุ่มตัวอย่างที่เป็นอิสระจากกัน k กลุ่ม ขึ้นไป จ.2.1.2 ขนาดของตัวอย่างแต่ละกลุ่มไม่จาเป็นต้องเท่ากัน จ.2.1.3 ตัวแปรที่ศึกษาอยู่ในระดับการวัดมาตราเรียงอันดับเป็นอย่างน้อย จ.2.2 สมมติฐานเพื่อการทดสอบ H0 : กลุ่มตัวอย่าง k กลุ่มมาจากประชากรที่มีค่ามัธยฐานไม่แตกต่างกัน (หรือ ประชากรทั้ง k กลุม่ มีลกั ษณะการแจกแจงไม่แตกต่างกัน) H1: กลุ่มตัวอย่าง k กลุ่มมาจากประชากรที่มีค่ามัธยฐานแตกต่างกัน (หรือ ประชากรทั้ง k กลุม่ มีลกั ษณะการแจกแจงแตกต่างกัน) จ.2.3 ขั้นตอนการคานวณ 1. หาค่ามัธยฐานร่วมของข้อมูลทั้งหมด 2. นาข้อมูลของกลุ่มตัวอย่างไปเปรียบเทียบกับมัธยฐานร่วมโดยให้ a แทน จานวนข้อมูลของกลุ่มตัวอย่างกลุ่มที่ i ที่มีค่าสูงกว่าค่ามัธยฐาน b แทน จานวนข้อมูลของกลุ่มตัวอย่างกลุ่มที่ i ที่มีค่าต่ากว่าหรือเท่ากับ ค่ามัธยฐาน (i = 1,2,…,c) 3. จัดข้อมูลให้อยู่ในรูปของตารางขนาด 2 x c ดังนี้ จานวนข้อมูลที่มีค่า กลุ่มตัวอย่าง รวม กลุ่มที่1 กลุ่มที่2 กลุ่มที่3 ... กลุ่มที่ c ac สูงกว่ามัธยฐาน a1 a2 a3 ... m1 bc ต่ากว่า/เท่ากับมัธยฐาน b1 b2 b3 ... m2 n n c รวม n1 n2 n3 ... จ.2.4 คานวณค่าสถิติทดสอบ
2 cal
(n 1) c (nai ni m1 )2 m1m2 i 1 nni
จ.2.5 เกณฑ์การตัดสินใจ ปฏิเสธสมมติฐาน H0 ถ้าค่าสถิติทดสอบที่คานวณได้มีค่ามากกว่าค่าวิกฤต จากตารางการแจกแจงแบบ 2 ที่องศาความเป็นอิสระเท่ากับ (c – 1) และ ระดับความมีนัยสาคัญที่กาหนด
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 383 -
ตัวอย่างที่ จ.2.1 ในการทดสอบผลสัมฤทธิ์ทางการเรียนวิชาหนึ่งของนักเรียนมัธยมศึกษาปีที่ 3 ได้มีการสุ่มตัวอย่างนักเรียนมา 3 โรงเรียน โรงเรียนละ 8 คน ผลการทดสอบปรากฏดังนี้ โรงเรียน ก 15 17 14 19 12 20 14 12 โรงเรียน ข 17 14 16 15 13 12 13 17 โรงเรียน ค 18 15 14 16 17 16 17 15 จงทดสอบว่าคะแนนที่นักเรียนแต่ละโรงเรียนทาได้มีค่ามัธยฐานเท่ากันหรือมี การแจกแจงเหมือนกันหรือไม่ วิธีทา 1. หาค่ามัธยฐานร่วมของข้อมูลทั้งหมด โดยเรียงข้อมูลจากน้อยไปมาก ดังนี้ 12 12 12 13 13 14 14 14 14 15 15 15 15 16 16 16 17 17 17 17 17 18 19 20 ดังนั้นค่ามัธยฐาน คือ 15 2. เตรียมข้อมูลให้อยู่ในรูปตารางแจกแจงความถี่ จานวนข้อมูลที่มีค่า กลุ่มตัวอย่าง รวม โรงเรียน ก โรงเรียน ข โรงเรียน ค สูงกว่ามัธยฐาน 3 3 5 11 ต่ากว่า/เท่ากับมัธยฐาน 5 5 3 13 รวม 8 8 8 24 3. คานวณค่าสถิติทดสอบ
2 cal
(n 1) c (nai ni m1 )2 m1m2 i 1 nni
(24 1) (24x3 8x11) 2 (24x3 8x11) 2 (24x5 8x11) 2 (11)(13) (24x8) (24x8) (24x8) 0.160839 1.3333 1.3333 5.3333 1.2867
4. เกณฑ์การตัดสินใจ จากตารางการแจกแจงแบบ 2 ที่องศาความเป็นอิสระเท่ากับ 3 – 1 2 ได้ 0.05,2 จะเห็นว่าค่าสถิติทดสอบที่คานวณได้จากข้อมูลมีค่า 5.9915 1.2867 ซึ่งน้อยกว่าค่าวิกฤต จึงยอมรับ H0 กล่าวคือคะแนนที่นักเรียนแต่ ละโรงเรียนทาได้มีค่ามัธยฐานเท่ากันหรือมีdารแจกแจงเหมือนกันที่ระดับ นัยสาคัญ 0.05
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 384 -
จ.3 การทดสอบครุสคัล-วอลลิส (The Kruskal – Wallis One – Way Analysis of Variance by Ranks) การทดสอบความแปรปรวนของครุสคัล-วอลลิส นี้ ได้ปรับปรุงมาจากวิธีการทดสอบ ของ Mann – Whitney โดยมีจานวนกลุ่มตัวอย่างที่จะทดสอบมากกว่า 2 กลุ่มซึ่งเป็นอิสระจากกัน เพื่อทดสอบว่ากลุ่มตัวอย่างเหล่านั้นมาจากประชากรเดียวกันหรือไม่ โดยข้อมูลที่ได้จากการวัดนั้น เป็นมาตราเรียงอันดับ แล้วใส่ลงในตาราง 2 ทาง (Two – Way Table) มีลักษณะดังนี้ จ.3.1 ข้อตกลงเบื้องต้น จ.3.1.1 ข้อมูลของการวัดอยู่ในระดับที่ไม่ต่ากว่ามาตราเรียงอันดับ จ.3.1.2 มีกลุ่มตัวอย่างสัมพันธ์กันตั้งแต่ 3 กลุ่มขึ้นไป จ.3.1.3 กลุ่มตัวอย่างแต่ละกลุ่มต้องมีขนาดเท่ากัน จ.3.1.4 ลักษณะของข้อมูลเป็นแบบต่อเนื่อง จ.3.2 สมมติฐานเพื่อการทดสอบ H0 : กลุ่มตัวอย่าง k กลุ่มมาจากประชากรที่มีลักษณะการแจกแจงไม่ แตกต่างกัน H1: กลุ่มตัวอย่าง k กลุ่มมาจากประชากรทีม่ ีลกั ษณะการแจกแจงแตกต่าง กัน จ.3.3 ขั้นตอนการคานวณ 1. นาข้อมูลจากตัวอย่างทั้ง k กลุ่มมารวมกันแล้วเรียงลาดับจากค่าน้อยไป มาก โดยอันดับต่าที่สุดเป็น 1 กรณีที่ข้อมูลซ้ากันจะใช้ค่าเฉลี่ยของอันดับของข้อมูล ที่ซ้ากันเป็นค่าอันดับของข้อมูลแต่ละตัว 2. หาผลรวมของอันดับของข้อมูลในแต่ละกลุ่มตัวอย่าง (Ri) 3. คานวณค่าสถิติทดสอบ H
เมื่อ
k R2 12 i 3(n 1) n(n 1) i 1 ni
แทน ผลรวมของอันดับในกลุ่มตัวอย่างกลุ่มที่ i n แทน ผลรวมของจานวนตัวอย่างทั้ง k กลุ่ม ni แทน ขนาดของตัวอย่างกลุ่มที่ i k แทนจานวนกลุ่มตัวอย่าง
Ri
ในกรณีที่ข้อมูลมีตาแหน่งเท่ากันต้องทาการปรับแก้ โดยสถิติทดสอบที่ปรับแก้ (Hc) H คานวณได้จากสูตร Hc k 3 (ti ti ) 1 i 1 n 2 (n 1)
เมื่อ
ti
แทนจานวนซ้าของข้อมูลตัวที่ i
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 385 -
4. เกณฑ์การตัดสินใจ ปฏิเสธสมมติฐาน H0 ถ้าค่าสถิติทดสอบที่คานวณได้จากข้อมูลมีค่า มากกว่าค่าวิกฤติที่ได้จากตารางการแจกแจงไคสแควร์ 2 ที่องศาความเป็น อิสระเท่ากับ k – 1 และระดับนัยสาคัญที่กาหนด ตัวอย่างที่ จ.3.1 ในการสอนวิชาภาษาไทย ผู้สอนต้องการเปรียบเทียบวิธีสอน 3 วิธี ว่า จะได้ผลแตกต่างกันหรือไม่ หลังจากการสอนด้วยวิธีทั้ง 3 วิธี แล้วจึงทาการทดสอบ วัดผลสัมฤทธิ์ทางการเรียนของนักเรียนที่สอนแต่ละวิธี คะแนนจากการทดสอบเป็น ดังนี้ วิธีที่ 1 : 77 76 67 68 77 55 67 วิธีที่ 2 : 52 73 45 74 74 56 วิธีที่ 3 : 48 44 60 43 55 64 52 60 จงทดสอบว่าวิธีสอนต่างกันจะให้ผลสัมฤทธิ์ที่แตกต่างกันหรือไม่ วิธีทา 1. ตั้งสมมุติฐาน H0 : วิธีสอนที่แตกต่างกันให้ผลสัมฤทธิ์ทางการเรียนที่ไม่แตกต่างกัน H1 : วิธีสอนที่แตกต่างกันให้ผลสัมฤทธิ์ทางการเรียนที่แตกต่างกัน 2. ขั้นตอนการคานวณ เตรียมข้อมูลโดยให้อันดับข้อมูล ดังนี้ วิธีที่ 1 77 76 67 68 77 55 67 อันดับ 20.5 19 13.5 15 20.5 7.5 13.5 รวม 109.5 วิธีที่ 2 52 73 45 74 74 56 อันดับ 5.5 16 3 17.5 17.5 9 รวม 68.5 วิธีที่ 3 48 44 60 43 55 64 52 60 อันดับ 4 2 10.5 1 7.5 12 5.5 10.5 รวม 53.0 3. คานวณค่าสถิติทดสอบ H
k R2 12 12 109.52 68.52 532 ( ) 3x22 i 3(n 1) n(n 1) i 1 ni 21x22 7 6 8
0.025974(1712.893 782.042 351.125) 66
73.9236 66 7.9236
ในกรณีที่ข้อมูลมีตาแหน่งเท่ากัน จานวนค่าอันดับที่ที่มีจานวนซ้ากันคือค่าอันดับ k 5.5 7.5 10.5 13.5 และ 20.5 จานวน 12 ค่า ดังนั้น (ti3 ti ) = (53 5) i 1
(3 3) (4 4) 125+24+60 = 209 3
3
ต้องทาการปรับแก้ โดยสถิติทดสอบที่
ปรับแก้ (Hc) คานวณได้จากสูตร Hc
H k 3 (ti ti ) i 1 1 n2 (n 1)
1
7.9236 209 212 (21 1)
8.1159
บทที่ 12 : สถิติไม่อิงพารามิเตอร์
หน้าที่ - 386 -
4. เกณฑ์การตัดสินใจ จากตารางการแจกแจงแบบ 2 ที่องศาความเป็นอิสระเท่ากับ 3 – 1 ได้ 2 0.05,2 5.9915 จะเห็นว่าค่าสถิติทดสอบที่คานวณได้จากข้อมูลมีค่า 8.1159 ซึ่งมีค่ามากกว่าค่าวิกฤต จึงปฏิเสธสมมติฐาน H0 กล่าวคือวิธีสอนที่แตกต่างกัน ให้ผลสัมฤทธิ์ทางการเรียนที่แตกต่างกันที่ระดับนัยสาคัญ 0.05