เป็นเทรนด์ที่แรงไม่ตก กับอาชีพใหม่ Data Scientist ซึ่งตำแหน่งนี้ที่อยู่ในตลาดแรงงานก็มี Job Description ที่หากหลาย แต่หากใครที่มีความสามารถในการเป็น Data Scientist อย่างชัดเจน เขาจะแยกออกได้ทันทีว่า นี้คือตำแหน่งที่เขาต้องการจริงๆ หรือไม่
อย่างไรก็ตาม จะเห็นได้ว่าบางองค์กร จ้าง Data Scientist เอาไว้เพียง 1 คน บางองค์กรต้องการสร้างทีม Data Scientist หลายๆ คน จึงเป็นคำถามที่ว่า แล้วจะรู้ได้อย่างไร ว่าจะต้องมี Data Scientist ในทีมทั้งหมดกี่คน
ก่อนจะไปที่จำนวนคน องค์กรควรมีเหตุผลในการมี Data Scientist โดยตอบคำถาม 2 ข้อนี้ให้ได้ก่อน
1. Role ของ Data Scientist คืออะไร?
ซึ่งโดยเนื้อแท้แล้ว Role ในการทำงานของ Data Scientist แบ่งออกเป็น 2 Role ใหญ่ๆ คือ นักวิเคราะห์ และ นักสร้างโมเดลหรือเขียนโปรแกรม ถึงแม้ว่าจะมีชื่อตำแหน่งเป็น Data Scientist เหมือนกัน แต่ความถนัด และแนวทางในการทำงานของทั้ง 2 Role นั้นต่างกันมาก เพราะสุดท้ายแล้ว Career Path ของเขาต่างกัน
นักวิเคราะห์ จะถนัดการแก้ปัญหา มีความสามารถในการระบุตัวแปรต่างๆ ที่ช่วยแก้ปัญหาได้ แต่ไม่ค่อยถนัดการขึ้น Data Product นักสร้างโมเดลลหรือเขียนโปรแกรม มีความเชี่ยวชาญในการเขียนโปรแกรม สร้าง Machine Learning และต่อยอดข้อมูลทั้งหมดเป็น Pipeline เดียวกันได้ แต่จะไม่ค่อยถนัดการออกหน้างาน หรือระบุตัวแปรปัญหาของธุรกิจ
สำหรับตำแหน่ง Senior Data Scientist จะเป็นบุคคลที่สามารเป็นทั้ง 2 Role นั้นได้ ทั้งสามารถระบุตัวแปรปัญหา เขียนโปรแกรม ออกแบบ Flow และยังต้องมี Skill ในการเป็น Project Manager ได้อีกด้วย
ทั้งนี้ ต้องไม่ลืมว่า Data Engineer, Data Scientist, Data Analyst ไม่ใช่คนเดียวกัน ในงาน Scale เล็ก อาจจะจ้างแค่คนเดียว ทำรวม 3 ตำแหน่งได้ แต่ในความเป็นจริง บุคคลนั้นจะกลายเป็นมีไม่ความเชี่ยวชาญด้านใดด้านหนึ่ง โดยเฉพาะในยุคที่เทคโนโลยี และความรู้ต่างๆ มีการอัพเดรตอยู่ตลอดเวลาเช่นนี้
2. Data Scientist จะขึ้นกับแผนกไหน?
ในการจ้าง Data Scientist จะแบ่งออกเป็น 2 แบบ คือ มีแผนกที่มีแต่ Data Expert Team ไปเลยเป็นทีมกลาง หรือ มี Data Scientist กระจายอยู่ตามแผนกต่างๆ
ในแบบแรก เรียกว่า Centralized ซึ่งอาจจะมีแค่ Data Scientist ก็ได้ หรือจะรวมเอา Data Engineer และ Data Analyst เข้าอยู่ด้วยกันไปเลยก็ได้ ทำงานเป็นกลุ่มกลางที่แผนกอื่นๆ สามารถเข้ามาขอความช่วยเหลือได้ มีข้อดีมี ได้ทำงานหลากหลาย และมีปริมาณงานให้ทำได้อย่างต่อเนื่อง
แบบที่สองคือ Decentralized มีข้อดี คือ Data Scientist คนนั้นจะมีความใกล้ชิดกับงาน และปัญหาจริงๆ เพราะขึ้นตรงอยู่กับแผนกใดแผนกหนึ่ง แต่มีข้อเสียเช่นกัน คือ - ความเสี่ยงเมื่อเขาลาออก - ไม่มี Team ช่วยกันคิด และตรวจสอบโมเดล - อาจมีปริมาณงานน้อยเกินไป - ไม่มีโอกาสได้ฝึก Model หลายๆ รูปแบบ ทำให้เสียโอกาสในการฝึก Skill เป็นต้น
เมื่อแน่ใจแล้วว่าจะจ้าง Data Scientist และมีคำตอบสำหรับ 2 ข้อข้างต้นเป็นที่เรียบร้อยแล้ว คราวนี้มาเข้าใจปริมาณงาน และเวลาในการทำงานแต่ละขั้นตอนของ Data Scientist เพื่อเป็นบรรทัดฐานในการระบุจำนวนคน
หน้าที่หลักของ Data Scientist คือ การแก้ปัญหาโดยใช้ตัวเลข เริ่มต้นจากการระบุตัวแปร ระบุปัญหา และเป้าหมายการทำงาน ตามมาด้วย Clean Data และการเขียนโปรแกรมเพื่อสร้าง Solution รวมไปถึงตรวจสอบความถูกต้องของ Model จนขั้นตอนสุดท้ายคือการ Implement Model นั้น เพื่อให้ Model ได้ถูกใช้งานจริงๆ
อย่าลืมว่า Data Scientist ไม่ใช่ผู้วิเศษ ดังนั้นต้องมีการตรวจสอบ Model ให้แน่ใจ และมี Team Support คอยช่วยกันแก้ไขงาน เพราะ Data ที่กำลังพูดถึงอยู่นี้ คือ Big Data ที่มิใช่ใหญ่แค่ขนาด แต่ยังมี Impact ที่ใหญ่โตอีกด้วย หากมองเฉพาะงานที่แท้จริงของ Data Scientist แล้วนั้น การ Structure and Clean Data เป็นขั้นตอนที่ใช้เวลานานที่สุด เรียกได้ว่ากว่า 70% - 80% ของเวลาทั้งหมดกันเลยทีเดียว ในขณะที่การ Modeling หรือสิ่งที่เป็น Value ที่สุดกลับใช้เวลาไม่นาน นั้นเพราะเป็นการใช้ความถนัดที่แท้จริงของเขา
ดังนั้นหากต้องการให้งานเกิดเร็ว วิธีที่ตรงตามตำราที่สุดก็คือต้องทำให้ข้อมูล Clean ให้ได้มากที่สุด แต่ในความเป็นจริงเกิดขึ้นได้ยากมาก เพราะคำว่า Clean ในมุมของ Data Engineer กับ Data Scientist นั้นต่างกัน ทำให้ Data Scientist ส่วนใหญ่ต้องการ Clean ด้วยตัวเองเสียมากกว่า
ในการทำงานจริง สิ่งที่ทำให้ Project Delay มากที่สุด มิใช่ Data Process แต่เป็นเรื่องการสื่อสาร หรือ Communication ซึ่งองค์กรที่ยังไม่มีการปรับตัวให้เป็นลักษณะ Agile ยิ่งต้องมีการ Authorize หลายขั้นตอน ทำให้กว่าจะถึง Decision Maker จริงๆ Model อาจจะไม่เหมือนเดิมเสียแล้ว
กลับมาที่คำถามหลักคือ ต้องมี Data Scientist กี่คน จึงตอบได้ว่า อยู่ที่มุมมองการใช้งานตำแหน่ง Data Scientist ของแต่ละองค์กร ว่าต้องการแค่การวิเคราะห์ หรือสร้าง Algorithm หรือ Data Product ออกมาใช้งานจริงๆ รวมถึงอยู่ที่ Skill ของ Data Scientist ในทีม หากใช้ Junior ก็อาจจะต้องมีหลายคน โดยที่ยังไงก็ต้องมี Senior คอยคุมอีกที และที่สำคัญขึ้นอยู่ที่แนวทางการทำงานขององค์กร ที่ต้องการ Lean แค่ไหน รีบเร่งแค่ไหน มีงานให้ทีมทำอย่างต่อเนื่องจริงๆ ใช่หรือไม่ และมีเป้าหมายให้ธุรกิจเดินหน้าไปในทิศทางใด
ขอยกตัวอย่างบริษัท Tech Start Up ยักษ์ใหญ่ 2 เจ้า คือ Airbnb (ก่อตั้ง 2008) และ Grab (ก่อตั้ง 2012) ทั้งสองบริษัทนี้มีความชัดเจนในการใช้ Data Product เป็นอย่างมาก จากการเข้าไปพูดคุย และดูงานกับ Data Expert Team ของเขา เขาบอกว่า “เขาไม่สนใจว่าคู่แข่งจะทำอะไร แต่ทีมของเขาต้องสามารถสร้างผลิตภัณฑ์ใหม่ๆ ออกมาให้ได้ให้ดีที่สุด ซึ่ง Product พวกนี้ ต้องทำให้เกิด Impact ได้จริงเท่านั้น มิใช่เป็นเพียงแค่การวิจัยในกระดาษขึ้นสไลด์แล้วผ่านไป” ปัจจุบัน Airbnb มี Data Scientist อยู่ประมาณ 150 คน และ Grab มี Data Scientist อยู่ในทีมประมาณ 36 คน อาจมองดูว่าเขามีหลายคน แต่ถ้าลองเทียบกับความยิ่งใหญ่ขององค์กรแล้ว จะพบว่า จำนวนที่เขามีนั้น “น้อยมาก” ค่ะ
อย่างไรก็ตาม ไม่ใช่ทุกองค์กรที่ต้องมี Data Expert Team แต่หากองค์กรนั้นมีความตั้งใจจะมี Team นี้แล้วนั้น องค์กรต้องมีเป้าหมายในการใช้งาน Team นี้อย่างชัดเจน เมื่อปรับตัวเป็น Data Driven Business แล้ว สิ่งที่ต้องให้คุณค่ามากที่สุด คือ "เวลา" เพราะหากช้ากว่าแค่เพียงนิดเดียว อาจโดนคู่แข่ง Disrupt ได้ในที่สุด
“อย่าให้ Data Scientist เป็นเพียงตำแหน่ง แต่จงให้เขาได้แสดงความสามารถของเขาให้ถูกทาง เพื่อให้องค์กรสามารถเดินหน้าเข้าสู่ยุค Digital Transformation ได้อย่างสวยงาม”
We turn your DATA into your KEY of success.
ให้คำปรึกษาการทำโครงการ Big Data, Data Model, Artificial Intelligence และ Digital Transformation เพื่อเพิ่มศักยภาพของธุรกิจ