top of page

Output หรือ ผลลัพธ์ของ Data Science คืออะไร?


What is the output or result of Data Science?

Data Science เป็นศาสตร์ใหม่ ที่ถูกพูดถึงกันมาก จนหลายคนบอกว่า Data Science เป็น Buzzword หรือเป็นคำฮิตที่ได้ยินบ่อยจนชินไปเสียแล้ว

แต่.... มีน้อยคนนัก ที่สามารถอธิบายได้ว่า Data Science คือ อะไร?

Data Science หรือ วิทยาศาสตร์ข้อมูล คือ กระบวนการในการทำความเข้าใจ วิเคราะห์ สังเคราะห์ และสร้างผลลัพธ์ใหม่ๆ ได้จากการมี “ข้อมูล” ตั้งต้นเดิม ซึ่งแตกต่างกับ Analytics ที่เราคุ้นเคยกันตรงที่ว่า Data Science จะเป็นการคิดค้นวิธีการใหม่ๆ เช่น การสร้าง Machine Learning Model การเขียน Decision Chart ใหม่จากชุดข้อมูลใหม่ เป็นต้น ในขณะที่ Analytics จะใช้วิธีการเดิมๆ เช่น การหาค่าเฉลี่ย การทำนายโดยใช้ Moving Average Model เป็นต้น

ศาสตร์ Data Science คือ การผสมรวมกันระหว่าง คณิตศาสตร์ (เช่น แคลคูลัส สถิติ ความน่าจะเป็น) และ คอมพิวเตอร์ ซึ่งด้านหนึ่งจะเป็นกลไกการออกแบบแนวทางการแก้ปัญหา ในขณะอีกด้านหนึ่ง (คอมพิวเตอร์) จะเป็นเสมือนเครื่องมือที่ต้องเขียนขึ้นมาเพื่อพิสูจน์แนวทางนั้นๆ และเพื่อนำกลไกการออกแบบนั้นไปใช้งานจริงในระบบต่อไป

การใช้ Data Science จะต้องอธิบายกลไกขั้นตอนในการตัดสินใจแต่ละส่วนได้ด้วยตัวเลข มิใช่แค่ทฤษฎีเปล่าๆ เช่น เมื่อพูดถึงคำว่า Deadstock เราทราบกันดีว่าเป็นการพูดถึงสินค้าคงคลังที่เหลือค้างในระบบ ... แต่... เมื่อไหร่ถึงเรียกว่า Deadstock จะไม่มีใครตอบได้อย่างชัดเจน เพราะไม่มีสมการหาค่า Deadstock ที่ตายตัว

สิ่งที่ Data Scientist ต้องทำ คือ การสร้าง Model ในการบ่งบอกว่า Deadstock ของแต่ละสินค้า เกิดขึ้นเมื่อใด ได้อย่างไร เป็นตัวเลข หรือ สถานะ ที่มีความชัดเจน ไม่ใช่แค่การประเมินสถานการณ์ ซึ่งสินค้าแต่ละประเภท ก็จะมี Criteria หรือ คุณสมบัติการคงค้างที่ต่างกัน

วิธีการคิด คือ การสร้าง Forecasting Model และ ใช้หลักการสถิติ และความน่าจะเป็น มาสร้างเป็น Model เพื่อหา “จุดสมดุล” เพื่อแจ้งให้ผู้ปฏิบัติงานทราบ (ซึ่งแต่ละสินค้า จะมี หรือไม่มี สถานะคงค้าง หรือ Deadstock ก็ได้ ถ้า Forecasting Model นั้นมีความแม่นยำ ก็จะสามารถสั่งสินค้านั้นได้แม่นยำด้วยเช่นกัน)

 

อีกตัวอย่างหนึ่ง คือ การคิด Fraud Detection Model หรือ การตรวจจับการโกง ซึ่งวิธีการทำ คือ การสร้าง Model เพื่อประเมินพฤติกรรม “ปกติ” ของแต่ละคน และมีการสร้างจุดแจ้งเตือน เมื่อเกิดเหตุการณ์ “ไม่ปกติ” เกิดขึ้นในแต่ละบุคคล ทำให้สามารถทราบสถานะได้ (เกือบ) ทันที เป็นการป้องกันการโกง หรือ การโจรกรรมได้อย่างทันทีทันใด

ถ้าไม่มี Fraud Detection Model สิ่งที่ต้องทำ อาจเป็นการสุ่มตรวจ การส่งเรื่องร้องเรียน หรือ เกิดการโกงไปแล้วโดยที่องค์กรไม่สามารถตรวจสอบได้ สร้างความเสียหายให้องค์กร และลูกค้าขององค์กรอย่างไม่สามารถประเมินค่าได้

ทั้ง 2 ตัวอย่าง แสดงให้เห็นชัดเจนว่า “Model” คือ สิ่งที่ Data Scientist ต้องสร้าง และนี่คือ “ผลลัพธ์” จากการทำ “Data Science”

Model มาจากอะไร? มาจากการนำ “ข้อมูล” ที่อาจจะต้องมีขนาดใหญ่ระดับหนึ่ง ผ่านการทำความสะอาด สร้างโครงสร้างให้ชัดเจน และต้องมี “ตัวแปร” ที่สำคัญ เพื่อใช้กลไกทางคอมพิวเตอร์ในการสร้าง Model ในการทำงานจริง ขั้นตอนการสร้าง Model ใช้เวลาไม่นาน แต่ที่นาน และยากกว่า ก็คือ การทำความเข้าใจในตัวข้อมูล รวมไปถึงการทำความสะอาดข้อมูลนั้นด้วย

มี Model แล้ว จะนำไปใช้ต่อได้อย่างไร มีผลลัพธ์อย่างไร? ผลลัพธ์ที่ได้จาก Model ออกมาเป็น “ข้อมูล” ซึ่งอาจจะมีทั้งเป็นตัวเลข หรือตัวอักษรก็ได้ เมื่อต้องการนำไปใช้ต่อ มีได้ 2 กรณีหลักๆ ได้แก่

  1. ออกเป็นรายงาน เช่น นำข้อมูลนั้นไปแสดงผลใน Dashboard หรือ โปรแกรม BI เป็นต้น

  2. ออกเป็นข้อมูลที่ส่งผ่านไปยังโปรแกรมอื่น เพื่อให้เกิดการกระทำ เช่น ส่งข้อความอัตโนมัติให้ผู้ใช้งาน ส่งข้อความไปที่ระบบเพื่อให้เครื่องมือดำเนินการตามกลไกต่างๆ เช่น ระบบรถขับเคลื่อนไร้มนุษย์ เป็นต้น

การจะนำผลลัพธ์ไปใช้ต่อ ต้อง สร้างระบบ ซึ่ง Data Scientist อาจไม่ใช่ผู้ทำหน้าที่ตรงนี้ (ขึ้นอยู่กับแต่ละกรณี) หน้าที่นี้อาจจะเป็นของ Data Engineer หรือ Software Developer ก็ได้

 

ในฐานะที่เป็นผู้บริหาร หรือผู้เกี่ยวข้องที่ต้องทำงานกับ Data Scientist นั้น จำเป็นที่จะต้องตรวจสอบงานของ Data Scientist เพราะการสร้าง Model เกิดจากการลองผิดลองถูก และ Model ที่เหมาะสมที่สุด ต้องได้รับการประเมิน และทดสอบจากหน้างาน โดยมีผู้เกี่ยวข้องช่วยกันตรวจสอบ มิควรให้ Data Scientist เสนอเองไปเสียหมด เพราะอย่างไรเสีย หน้าที่หลักของ Data Scientist คือ การสร้าง Model ในขณะที่หน้าที่ Business เป็นการตั้งโจทย์ และวางนโยบายเพื่อพัฒนาศักยภาพขององค์กร

อย่าให้ “Data Science” เป็นแค่ Buzzword สำหรับองค์กร เพราะหากองค์กรไหนสามารถสร้างทีมงาน Data Science ได้จริงๆ องค์กรนั้นจะสามารถสร้าง Model ใหม่ๆ ได้อย่างรวดเร็ว จนสามารถเกิดเป็นระบบการทำงานแบบ Data Driven Business ได้ไม่ยากอย่างแน่นอน


 

แท็ก:

< Previous
Next >
bottom of page