สร้างกราฟ อัตราการตายของ 10 วันอันตราย อย่างง่ายๆ ด้วย Data Analytics

จากเหตุผลการระบาดรอบที่ 3 เริ่มต้นจากการพบ Cluster ใหม่ ในสถานบันเทิง ต้นเดือนเมษายน 2564 ทำให้กรมควบคุมโรค เริ่มเผยแพร่ข้อมูลในรูปแบบ API-Json แต่เนื่องด้วย โครงสร้างของไฟล์ Json ที่ได้จากการอ่านค่าจะ web site รายวัน ในกรณีของ เมนูที่สองคือ ข้อมูลสรุปตามช่วงเวลา จะมีลักษณะ Nested Json กล่าวคือ มีโครงการของ List อยู่ใน List ของ Data อีกชั้น ดังรูป

[หมายเหตุ เปิด ด้วย Firefox browser]

เนื่องด้วยข้อมูลรายวัน ถูกซ้อนอยู่ใน list เดียวกัน ในขั้นต้น เราต้อง อ่านเข้ามาใน Data Frame ก่อน จะได้ ตารางที่มีแถวเดียว แต่ยาว 486 คอลัมน์

จากนั้นทำการ normalize เพื่อแยกคอลัมน์ ออกจากกัน จะได้คอมลัมน์ ดังต่อไปนี้

‘Date’, ‘NewConfirmed’, ‘NewRecovered’, ‘NewHospitalized’, ‘NewDeaths’,’Confirmed’, ‘Recovered’, ‘Hospitalized’, ‘Deaths’ สิ่งที่เราอยากได้คือ คอลัมน์ชื่อ ‘NewDeaths’ หรือ จำนวนคนการเสียชีวิตประจำวันนั้นๆ เพื่อนำไปวิเคราะห์และสร้างกราฟแนวโน้ม ซึ่งในอนาคต อาจจะใช้ Trend analysis มาช่วย หากข้อมูลมากพอ

[หมายเหตุ เริ่มเก็บข้อมูล รอบ 3 ตั้งแต่วันที่ 1 มกราคม 2564 ]

จะเห็นได้ว่า เราสร้าง ตารางเปล่าๆ เพื่อรอ วนลูป รับข้อมูลรายวันไว้แล้ว ในกรณีนี้เอาแค่ 10 วัน สังเกต df.size-10 ซึ่ง เสร็จจากนี้ เราจะได้ ตาราง Death_table จำนวน สิบวัน ในกรณีนี้ ที่ใช้ Seaborn จะสวยกว่า

สามารถ ดาวน์โหลด Source Code ได้ที่ https://bit.ly/2RjKaoq

--

--

รศ. ดร. เชฏฐเนติ ศรีสอ้าน
รศ. ดร. เชฏฐเนติ ศรีสอ้าน

Written by รศ. ดร. เชฏฐเนติ ศรีสอ้าน

รองอธิการบดีฝ่ายเทคโนโลยี มหาวิทยาลัยรังสิต

No responses yet