ทุกวันนี้ เราได้เห็นคำว่า “Big Data” บ่อยมาก ทั้งในหน้าหนังสือพิมพ์ ในรายการคืนความสุขให้คนในชาติ รายการศาสตร์พระราชาสู่การพัฒนาอย่างยั่งยืน โครงการต่างๆ ของภาครัฐ หรือแม้แต่กลยุทธ์ภายในองค์กรต่างๆ ซึ่งคำนี้ เริ่มเข้ามามีบทบาทในประเทศไทยตั้งแต่ปี 2016 กันแล้ว เพียงแต่ในฐานะของผู้รับสารยังไม่สามารถระบุได้ชัดเจนว่า ควรใช้ข้อมูลอะไร เพื่อสร้างประโยชน์แก่ส่วนไหน และต้องมีการเตรียมการรับมืออย่างไรต่อไป
การที่สื่อประโคมข่าวเรื่อง Big Data บ่อยครั้ง ทำให้เกิดแรงกดดันที่ต้องหาความจริงให้ได้ว่ามันคืออะไร นำพามาซึ่งโครงการใหม่ๆ ที่เกิดขึ้น มักจะมีหัวข้อว่า “Big Data” เข้ามาเกี่ยวข้องด้วย เพื่อให้สามารถได้รับอนุมัติดำเนินโครงการ และทำให้เกิดความน่าสนใจในการพัฒนาเรื่องใหม่ๆ
ดังนั้น หากถามว่า “เมื่อไรที่เราควรเริ่มทำ Big Data Project?” ก็ตอบได้ง่ายๆ ว่า “ตอนนี้” เพราะทุกๆ ที่กำลังผลักดัน Big Data Project ใครทำได้ก่อนก็เดินเกมส์ได้ก่อน ใครล้าหลัง ก็ตกรถม้ากันไป การเริ่มต้นที่ถูกหลักที่สุด คือ เริ่มจากการมี “เป้าหมาย” ซึ่งส่วนใหญ่แล้ว จะไม่สามารถตั้งเป้าหมายได้ เพราะเข้าใจว่า Big Data Project คือ เรื่องของการมี “ข้อมูล” เท่านั้น ดังนั้นวันนี้จะขอพูดเรื่องปริมาณข้อมูลที่เหมาะสมต่อการเริ่มทำ Big Data Project ดังนี้
1. เมื่อมีข้อมูลจำนวนมาก
คนส่วนใหญ่มักจะเข้าใจว่า จะทำ Big Data Project ต้องขอให้มีข้อมูลจำนวนมากก่อน ซึ่งไม่ถูกซะทีเดียว เพราะการมีข้อมูลเอาไว้มากๆ แต่ไม่เคยนำมาใช้ ทำให้ความสกปรกเกิดขึ้น เมื่อถึงเวลานำมาใช้จริงๆ จะต้องมีขั้นตอนในการทำความสะอาดข้อมูลเหล่านั้น ซึ่งเป็นขั้นตอนที่ใช้เวลานาน และกินพลังงานอย่างมาก
โดยเฉพาะอย่างยิ่ง เมื่อข้อมูลที่มีเก็บเอาไว้ตามแหล่งข้อมูลต่างๆ ที่อยู่แยกกันคนละระบบ จะยิ่งสร้างปัญหาใหญ่ เพราะนอกจากระบบต่างๆ จะไม่เชื่อมต่อกันแล้ว ยังมีทั้งข้อมูลซ้ำซ้อน มีโครงต่างกันอีกด้วย แม้กระทั่งมีชนิดของไฟล์ต่างกัน เช่น Excel File หรือ PDF file เป็นต้น ดังนั้นหากเป็นไปได้ “อย่ารอให้ข้อมูลมีปริมาณมหาศาล ก่อนที่จะเริ่มทำ Big Data Project” เพราะสุดท้ายแล้วการมีข้อมูลเดิมอยู่จำนวนมาก ไม่ได้หมายความว่าข้อมูลนั้นเพียงพอ เพราะสิ่งที่เราต้องการไม่ใช่ข้อมูลเยอะๆ แต่เราต้องการข้อมูลที่มีคุณภาพ
กรณีตัวอย่างที่เหมาะที่สุดสำหรับหัวข้อนี้ คือ กรณีการจัดการข้อมูลของภาครัฐ เช่น การตั้งงบของโรงพยาบาล ที่มีทั้งกฎจากกระทรวงการคลัง ข้อมูลประกันสังคมจากกระทรวงแรงงาน ข้อมูลจำนวนผู้มีสิทธิตามพื้นที่จากสำนักงานหลักประกันสุขภาพแห่งชาติซึ่งขึ้นตรงกับกระทรวงสาธารณสุข และยังมีนโยบายอื่นๆ ที่เกี่ยวข้องกับกระทรวงอื่นๆ อีกด้วย ทำให้เจ้าของข้อมูลเป็นคนละภาคส่วนกัน จึงมีรูปแบบในการกรอกข้อมูล หรือการตั้งเบิกงบที่ไม่เหมือนกัน เป็นปัญหาที่แก้ได้ยาก และคงต้องใช้เวลานานถึงจะสามารถแก้ไขได้หมด
บทสรุปของกรณีมีข้อมูลจำนวนมาก คือ ควรเริ่มทำ Big Data Project โดยเร็วที่สุด เพราะยิ่งปล่อยให้มีข้อมูลจำนวนมากอยู่ในระบบ ยิ่งก่อให้เกิดความยุ่งยากของระบบ ในบางกรณีข้อมูลจำนวนมากที่คิดว่าพอ อาจจะไม่เพียงพอก็เป็นได้ ทำให้ต้องมีการเก็บข้อมูลเพิ่มเติม ทั้งนี้การเริ่มทำ Big Data Project อันดับแรก คือ ต้องเรียนรู้ก่อนว่า “Big Data” คืออะไร และจะใช้ประโยชน์ได้อย่างไรบ้าง โดยแยกออกเป็น 2 ส่วน ได้แก่ ส่วนการวางระบบเพื่อการใช้งาน กับการสร้างโมเดลเพื่อวิเคราะห์และประมวลผล และแน่นอนว่า Data Expert คือผู้เชี่ยวชาญที่สามารถเข้ามาแก้ปัญหาตรงนี้ได้ ซึ่งทางเลือกมีหลากหลายทาง ไม่มีทางใดที่ดีที่สุด ตามหลักการแล้ว ทางเลือกที่ทำได้จริงที่สุด ตามข้อจำกัดต่างๆ ไม่ว่าจะเป็น ราคา เวลา หรือความซับซ้อนในการวางระบบ ดังนั้น Data Expert ที่ว่านี้ อาจจะเป็น Data Scientist หรือ Data Engineer หรือบุคคลที่สามารถวางระบบการทำงานได้ตั้งแต่ต้นน้ำยันปลายน้ำนั่นเอง ส่วนในเรื่องของการตั้งเป้าหมาย อาจจะทำได้โดยการการคิดโจทย์เองภายในองกรค์ หรือให้ Data Expert เข้ามาช่วยออกแบบโจทย์ก็เป็นได้ เพราะบางครั้งโจทย์ก็เกิดจากการรู้ว่ามีวิธีการแก้ปัญหาได้อย่างไรบ้าง
2. เมื่อมีข้อมูลอยู่บางส่วน
สำหรับในกรณีมีข้ออยู่อยู่บางส่วน ถือว่าเป็นการเริ่มทำ Big Data Project ที่มีความเสี่ยงน้อยที่สุด เพราะอย่างน้อยก็มีข้อมูลที่พอจะทำไปขึ้นเป็นต้นแบบ หรือโมเดลได้บ้าง และระบบการได้มาซึ่งข้อมูลยังไม่ซับซ้อนเกินไป
ในความเป็นจริงแล้ว ไม่มีใครบอกได้ว่าข้อมูลแค่ไหนถึงจะพอ แต่โดยธรรมชาติแล้ว การมีข้อมูลจำนวนมาก จะทำให้มีตัวเลือกในการใช้งานได้มากกว่า และด้วยเหตุนี้ หลายๆ องค์กรจึงรอให้มีข้อมูลจำนวนมากพอก่อนที่จะเริ่มทำ Big Data Project การตัดสินใจว่าข้อมูลที่มีนั้นเพียงพอหรือไม่ ต้องมีการสร้างโมเดล และวัดผลจากโมเดลนั้นๆ แต่หากไม่มีการสร้างโมเดลเสียที ก็จะไม่สามารถบอกได้ว่า ข้อมูลที่นี้นั้นเพียงพอหรือยัง
ตัวอย่างเช่น กรณีลูกค้า SME กลุ่ม Retail มีการเก็บข้อมูลยอดสั่งซื้อสินค้ามา 3 ปี ถือว่ามีข้อมูลจำนวนหนึ่ง อาจไม่ได้ใหญ่โตมาก แต่เมื่อนำข้อมูลนั้นมาวิเคราะห์ ก็พบว่า ยอดขายที่เกิดขึ้น ไม่ใช่ยอดขายที่แท้จริง เนื่องจากมีของขาดตลาด ทำให้มีช่วงเวลาหนึ่งที่ไม่มีของขาย ส่งผลให้การสร้างโมเดลอาจมีความไม่แม่นยำเกิดขึ้น
หากไม่มีความคิดริเริ่มจะทำ Big Data Project เจ้าของกิจการท่านนี้จะไม่ทราบได้เลยว่า องค์กรของเขามีปัญหาเรื่องการวางแผนอุปสงค์และอุปทาน หรือ Demand and Supply Planning ซึ่งในกรณีนี้ การมีข้อมูลเก่า 3 ปี เป็นประโยชน์อย่างมาก เพราะมันทำให้ Data Scientist มองภาพออกว่าจะมีข้อมูลใดให้เก็บได้บ้าง รวมไปถึงไม่จำเป็นต้องออกแบบแนวทางในการเก็บข้อมูลใหม่
3. เมื่อไม่มีข้อมูลในระบบเลย
หลายองค์กรเป็นองค์กรเปิดใหม่ หรือเป็น Startup ที่มีกลยุทธ์ในการใช้ข้อมูล ทำให้ไม่มีข้อมูลประวัติใดๆ เก็บเอาไว้เลย แล้วแบบนี้จะเริ่มทำ Big Data Project ได้หรือไม่ คำตอบ คือ “เริ่มได้เลย” เพราะการทำ Big Data Project เริ่มจากการวางเป้าหมายในการทำงานเสียก่อน เรารู้ก่อนว่า เราต้องการทำธุรกิจประเภทไหน และต้องการข้อมูลอะไรบ้าง เพื่อวางแผนให้ได้ข้อมูลนั้นๆ เข้ามาในระบบ
กรณีตัวอย่าง ได้แก่ การวางแผนระบบคมนาคมขนส่งของประเทศสิงคโปร์ที่มีนโยบายในการออกแบบระบบคมนาคมขนส่งอย่างมีประสิทธิภาพโดยการใช้ Big Data สิ่งที่เขาทำ คือ มีการออกแบบระบบการเก็บเงินค่าโดยสารตามระยะทาง โดยให้ผู้โดยสารแตะบัตรขาขึ้น เพื่อเก็บข้อมูลจำนวนผู้โดยสารต่อป้าย และแตะบัตรโดยสารอีกครั้งตอนขาลงเพื่อคิดค่าโดยสาร ซึ่งระบบจะหักเงินค่าโดยสารในบัตรตามระยะทางที่มีการผูก GPS และคำนวณระยะทางในระบบเอาไว้ แนวทางนี้ทำให้รัฐบาลสิงคโปร์มีข้อมูลจำนวนผู้โดยสารขึ้น-ลงต่อป้ายอย่างชัดเจน จนสามารถนำไปต่อยอดทำ Smart City ต่อได้
ดังนั้นหากถามว่า “ไม่มีข้อมูลเก็บเอาไว้เลย จะสามารถทำ Big Data Project ได้หรือไม่” ก็ต้องตอบว่า “ทำได้” และในบางกรณีนี้ อาจจะดีกว่าการที่ไม่มีข้อมูลอยู่เลยก็เป็นได้ เพราะเมื่อมีเป้าหมายการทำงานที่ชัดเจน ก็สามารถวางระบบได้ว่าต้องการข้อมูลส่วนใดบ้าง ต้องเก็บข้อมูลจากส่วนไหนบ้าง ความยุ่งยากในการทำความสะอาดตัวข้อมูลก็น้อยลง รวมไปถึงการลงทุนซื้ออุปกรณ์ หรือ Software ต่างๆ ก็มีเหตุที่มาที่ไปมากขึ้นอีกด้วย
แต่ข้อเสียของการทำ Big Data Project โดยที่ไม่มีข้อมูลอยู่เลย นั้นคือ อาจต้องเสียเวลารอให้มีข้อมูลมากพอจะสร้างโมเดล หรืออาจต้องรอให้วางระบบอุปกรณ์ให้เรียบร้อยเสียก่อนนั้นเอง
โดยสรุปแล้ว การทำจะเริ่ม Big Data Project นั้น ไม่ได้อยู่ที่ปริมาณ หรือการมีข้อมูล แต่อยู่ที่ว่าองค์กรนั้น มีเป้าหมาย หรือมีความเข้าใจในการทำ Big Data Project อย่างไรเสียมากกว่า จะเริ่มได้เมื่อไร ก็คือ เริ่มได้ เมื่อ “พร้อม” โดยที่คำว่า “พร้อม” นี้ก็อาจหมายถึงต้องมีทีมงานที่พร้อม และมีสภาพแวดล้อมที่พร้อมรับการเปลี่ยนแปลงด้วย
เพราะ Big Data Project มันใหญ่สมชื่อ ทั้งในมุมกว้าง และมุมลึก ดังนั้นการจะทำ Big Data Project ให้สำเร็จ จึงต้องมีการวางแผนให้ดี และมีความชัดเจนในทุกขั้นตอนการทำงาน ที่สำคัญ คือ “รอไม่ได้” เพราะทุกนาทีที่เสียไป คือ “ค่าเสียโอกาส” สำหรับองค์กร
We turn your DATA into your KEY of SUCCESS.
Email: inquiry@coraline.co.th
Tel: 099-425-5398