การวิเคราะห์คุณภาพน้ำในแม่น้ำด้วยการใช้ ANOVA และ Tukey’s Test for Post-Hoc Analysis

ในบทความก่อนหน้า ผมได้ รีวิว ANOVA ไปบ้างแล้ว แต่ วิธีของ ANOVA ไม่ได้บอกว่า ค่า Means ของ ชุดไหน ดีกว่า หรือ มากกว่าอย่างมีนัยสำคัญ ซึ่งผมย้ำคำว่า อย่างมีนัยสำคัญนะครับ เพราะในยุคหลังๆ คนมักจะไม่กล่าวถึง

จากตัวอย่างสมมุติต่อไปนี้ เราสามารถเอา Tukey’s Test for Post-Hoc Analysis มาช่วยในการเปรียบเทียบ ค่า Means ของกลุ่มที่แตกต่างกันอย่างมีนัยสำคัญทางสถิติ

จากการ เก็บตัวอย่างน้ำเพื่อตรวจค่า BOD จากแม่น้ำสายหลัก 4 สาย ทุกสัปดาห์ เพื่อนำไปตรวจค่า BOD ได้ผลดังตารางต่อไปนี้

ค่า BOD ของแม่น้ำแต่ละสายทกุวันของสัปดาห์

อยากทราบว่า น้ำในแม่น้ำสายใดมีคุณภาพดีที่สุด เรียงลำดับจาก มากไปน้อย (ค่า BOD สูงกว่า 60 มิลิกรัมต่อลิตร จัดว่าเป็นน้ำเสีย) ระดับความเชื่อมั่น 95%

เริ่มต้นจาก

ตั้งสมมุติฐาน

H0: m1=m2=m3=m4 [ คุณภาพของน้ำในแม่น้ำ ทั้งสี่ เหมือนกัน ]

H1: m1 ⌿ m2 ⌿ m3⌿m4

รัน one way anova

ค่า P [0.00000000000000242] < 0.005 นั่นคือ ปฏิเสธ H0 แสดงว่า คุณภาพของน้ำในแม่น้ำ ทั้งสี่สาย ไม่เท่ากัน อย่างมีนัยสำคัญ แต่ Anova ไม่สามารถบอกได้ว่าคู่ใดที่แตกต่างกัน ต้องใช้ Post Hoc analysis ในกรณีนี้ เราใช้ Tukey’s Test for Post-Hoc Analysis

เพื่อดูการกระจายข้อมูล เราสามารถใช้ Seaborn library

สรุปได้ว่า แม่น้ำปิง > ยม > น่าน >วัง [คุณภาพดีที่สุด เรียงลำดับจาก มากไปน้อย]

เพราะ ค่า Meandiff ระหว่าง แม่น้ำปิง กับ แม่น้ำวัง มากที่สุด

Meandiff[Ping,Yom]=10.1

Meandiff[Ping,Nan]=15.8571 [ค่าติดลบ ในผลวิเคราะห์ เพราะ ตัวตั้งน้อยกว่า นั่นคือ ค่า Mean ของ แม่น้ำน่านน้อยกว่า]

Meandiff[Ping,Wan]=20.8571

--

--

รศ. ดร. เชฏฐเนติ ศรีสอ้าน
รศ. ดร. เชฏฐเนติ ศรีสอ้าน

Written by รศ. ดร. เชฏฐเนติ ศรีสอ้าน

รองอธิการบดีฝ่ายเทคโนโลยี มหาวิทยาลัยรังสิต

No responses yet