หน่วยงานรัฐ เป็นหน่วยงานที่มี Big Data และต้องใช้ Data มากที่สุดในประเทศไทยค่ะ เพราะมีข้อมูลของประชาชนทั้งหมด และมีความจำเป็นต้องนำข้อมูลจากหน่วยงานต่าง ๆ มาเชื่อมโยง เพื่อกำหนดเป็นยุทธศาสตร์ของประเทศต่อไป
แต่ การเชื่อมโยงข้อมูลของภาครัฐ ค่อนข้างมีความท้าทาย ด้วยสาเหตุดังต่อไปนี้
แต่ละหน่วยงาน มีระบบกระจัดกระจาย มี Application เยอะไปหมด ซึ่งมีเทคโนโลยี backend ที่ไม่เหมือนกัน โครงสร้างแตกต่างกัน และแต่ละระบบก็มี database ของตัวเอง ซึ่งแต่ละระบบก็มี MA มี Vendor ดูแลต่างกัน ทำให้การนำข้อมูลมาเชื่อมโยง มีข้อจำกัดค่อนข้างมาก
รัฐคุ้นเคยกับการจัดซื้อ มากกว่าการจัดจ้าง และมักจะคิดว่าการทำ Data Hub เป็นการลงทุนด้าน Infrastructure โดยไม่ได้ให้ความสำคัญเรื่อง Data เช่น ซื้อระบบก่อน แล้วค่อยเอา Data มาใส่ แต่พอถึงเวลา ก็ไม่มี Data ไม่รู้ว่าจะเอา Data อะไรมาใช้งานต่อ ทั้งที่จริงๆ แล้ว ต้องพิจารณาก่อน ว่าจะเอา Data อะไร ขนาดเท่าไร แล้วค่อยออกแบบ Infrastructure นอกจากนี้ เทคโนโลยีที่เปลี่ยนแปลงอย่างรวดเร็ว ทำให้การจัดซื้อโดยไม่มีโจทย์ เกิดความเสียหายมหาศาล และหลายหน่วยงานเกิดปัญหานี้บ่อยครั้งจนเป็นบาดแผลทำให้ไม่กล้าที่จะลงทุนด้าน Big Data ต่อ
การไม่มีเจ้าภาพ ไม่รู้ว่าใครต้องรับผิดชอบ Data Hub และไม่มีมาตรฐานว่าจะต้องทำอย่างไร ส่วนใหญ่คิดว่า Data Warehouse เดิม ก็เป็น Data Hub แล้ว ซึ่ง Data Warehouse ไม่ใช่ Data Hub และส่วนใหญ่เป็นข้อมูลที่ไม่สะอาด ไม่พร้อมใช้ แตกต่างจากหลักการของ Data Hub ที่มีการแบ่ง Zone เป็น Data Lake, Data Warehouse, Data Mart และให้ความสำคัญกับข้อมูลที่พร้อมใช้ และมีมาตรฐานด้าน Data Quality ที่ชัดเจน
ถามว่า ถ้าไม่มี Data Hub อะไรจะเกิดขึ้น คำตอบคือ เราก็จะไม่มี Single Source of Truth ที่รวมข้อมูลที่พร้อมใช้ เมื่อข้อมูลมันกระจัดกระจาย เวลาจะใช้งานก็จะต้องมานั่งทำความสะอาดอยู่ร่ำไป ทั้งๆ ที่เป็นข้อมูลชุดเดียวกัน และพอไม่มี Data Hub เวลาจะขอข้อมูลก็ต้องไปดึงจากแหล่งข้อมูลตั้งต้น ยิ่งทำให้การใช้ข้อมูลล่าช้า และยังมีโอกาสพบเจอปัญหา การหวงแหนข้อมูลอีกด้วย
Comments