1.Data Science คือ อะไร
ให้ลองจินตนาการดูว่า เวลาเราคิดถึงวิทยาศาสตร์ เราคิดถึงอะไร? ก็คงเป็นรูปหลอดทดลองที่มีสารเคมี แล้วมีนักวิทยาศาตร์ใส่เสื้อกราวน์ยืนผสมสารในหลอดทดลอง
เปลี่ยนใหม่ว่า หากเป็น Data Science เจ้าสารเคมีนั้นก็คือข้อมูล หรือ ตัวเลขขนาดใหญ่
ตามทฤษฎีแล้ว Data Science คือ Process ในการหา Pattern หรือความสัมพันธ์ของข้อมูล ที่ต้องใช้หลักวิทยาศาสตร์ นั้นก็คือ คณิตศาสตร์ นั้นเอง
2.ต้องเรียนอะไร?
เมื่อเข้าใจแล้วว่า มันคือ คณิตศาสตร์ประยุกต์อย่างหนึ่ง ดังนั้น ก็ต้องเรียนคณิตศาสตร์มาเป็นพื้นฐาน ไม่ว่าจะเป็น Linear Algebra, Probability, Statistics, Calculus, Differential Equation และอื่นๆ อีกมากมาย เสริมว่า ในการทำงานจริง Coraline พบว่าแม้แต่วิชา Drawing หรือ การเขียน Decision analysis flowchart ก็มีประโยชน์ เพราะช่วยให้เกิดการวาด Data Flow ที่ชัดเจน
สาขาที่เหมาะที่สุดสำหรับการเป็น Data Scientist คือ Computer Science, Math, Operations Research นอกจากนี้ก็จะเป็นวิศวกรรมศาสตร์แขนงต่างๆ และวิทยาศาสตร์แขนงต่างๆ ที่เรียนวิชาดังกล่าวข้างต้นมาเป็นพื้นฐาน
3.ต้องเขียนโปรแกรมเป็นมั้ย?
คำตอบ คือ “ต้องเขียนเป็น” เพราะความ Sexy ของ Data Scientist คือ สามารถออกแบบ Code ในการแก้ปัญหาข้อมูลเองได้ แต่การเขียนโปรแกรม เป็นเพียงการใช้เครื่องมือ ซึ่งหากไม่มีพื้นฐาน หรือ Logic ทางคณิตศาสตร์ ก็ไม่สามารถใช้เครื่องมือได้อยู่ดี อีกทั้งเครื่องมือต่างๆ ก็มีการ Update อยู่ตลอดเวลา ทำให้ Data Scientist จำเป็นต้องฝึก Coding อยู่ตลอด เพื่อฝึก Skill ให้แข็งแกร่ง
4.ถ้าไม่ Coding แล้วใช้โปรแกรมสำเร็จรูปได้มั้ย
ต้องบอกว่า โปรแกรมสำเร็จรูปก็เหมือนเราไปซื้ออาหารแช่แข็ง ซึ่งอาจจะดีในบางกรณี แต่มันไม่ได้ถูกออกแบบโดยตรงเพื่อปัญหานั้นๆ อย่างไรก็ตาม หน้าที่ของ Data Scientist คือ การใช้หลักคณิตศาสตร์ มาแก้ปัญหาเกี่ยวกับข้อมูลขนาดใหญ่ โดยใช้การเขียนโปรแกรมขึ้นมา หรือสร้าง Machine Learning ดังนั้น หากเป็นการใช้โปรแกรมสำเร็จรูป ก็คงไม่จำเป็นต้องจ้าง Data Scientist แต่อย่างใด
5.ไม่ได้จบสายวิทย์มา หรือไม่ได้เขียน Math มา จะเป็น Data Scientist ได้หรือไม่
ทางเราไม่ขอฟันธงว่าจะเป็นได้หรือไม่ เพียงแต่ขอเสนอมุมมองในการทำงานจริง ว่าการเป็น Data Scientist ไม่ได้สวยหรู นอกจากจะต้องจ้องหน้าคอมตลอดเวลาแล้ว ในมือต้องมีปากกา และกระดาษใหญ่ๆ เพื่อเขียน Logic ของการคำนวณ และเขียน Decision Flow ในการออกแบบตัวแปรของข้อมูลอีกด้วย เวลา Run Model แต่ละครั้ง ใช้เวลานานกว่าจะได้ผลลัพธ์ที่ต้องการ ซึ่งอาจจะดีหรือไม่ดีก็ได้ ต้องทำการทดลองซ้ำไป ซ้ำมาหลายครั้ง ไม่มีเฉลย ไม่มีใครบอกได้ว่าจะ Set Up ตัวแปรต่างๆ อย่างไร แม้แค่การเขียน Code ก็ต้องเขียนด้วยตัวเอง เริ่มตั้งแต่ If-Else ยันการขึ้นกราฟ หรือแสดงผล
ดังนั้น หากคุณคิดว่า การที่คุณไม่มีพื้นฐาน Math หรือ เขียนโปรแกรมไม่เป็น และอยากจะเป็น Data Scientist ให้คุณลองนึกภาพดูว่า คุณจะรับตัวเองได้หรือไม่ ในสถานะการดังกล่าว
6.Data Scientist คือ พวกเด็กเนิร์ด ที่ฉลาดๆ มากๆ ใช่มั้ย
ทุกคนมีความฉลาดเป็นของตัวเอง เพียงแต่คุณต้องหาให้เจอว่าคุณถนัดด้านไหน และคุณรักในสิ่งที่คุณเป็นหรือไม่
7.Data Scientist กำลังขาดแคลน และเป็นอาชีพที่มาแรงใช่มั้ย
คำตอบ คือ ใช่ แต่เพราะมันเพิ่งบูม อย่างไรก็ตาม เมื่อวันที่ Demand meets supply แล้ว มันอาจจะไม่บูมเหมือนตอนนี้ก็เป็นได้ ไม่สามารถตอบได้ แต่สิ่งที่ชัดเจน คือ งานของ Data Scientist เป็นงาน Project Based เมื่องานจบ ส่งมอบงาน แล้วก็ปิบจ๊อบกันไป นั้นหมายความว่า ไม่ใช่ทุกองค์กร ที่จำเป็นต้องมี Data Scientist ในขณะที่งานของ Data Analyst เป็นงาน Day-to-day Operation ที่ต้องมีอยู่ทุกองค์กร และทำได้แถบทุกแผนก ดังนั้นการเป็น Data Scientist ที่จะอยู่รอด และ Sexy ในแบบที่เขาพูดถึงกัน คุณจำเป็นต้องมีพื้นฐานที่มั่นคง ชัดเจน มี Skill การ Coding ที่รวดเร็ว และที่สำคัญ ต้องเก็บประสบการณ์ ผ่าน Project ต่างๆ เพื่อเรียนรู้ข้อผิดพลาด และควรต้องฝึก Implement จริงๆ เพื่อให้เข้าใจว่าการขึ้น Production นั้นเป็นอย่างไร
เราไม่มีทางรู้ว่าเราชอบอะไร ตราบใดก็ตามที่เราไม่ได้ลองเรียนรู้ และลงทำมันเสียก่อน แต่อย่างไรก็ตาม อยากให้คุณชอบที่จะเป็นจริงๆ มิใช่เพราะกระแส หรือคิดว่าเป็นอาชีพที่ร่ำรวย เพราะสุดท้ายแล้วกระแส ก็จะเปลี่ยนแปลงไปตามกาลเวลา และที่สำคัญ ทุกอาชีพ มีรวย มีจน อยู่ที่ว่าคุณจะสามารถสร้าง Skill ของตัวเองได้แข็งแรงเพียงใด
Coraline หวังว่า คำตอบของเรา จะสร้างความชัดเจนได้ระดับหนึ่ง ซึ่งนี้ก็เป็นเพียงความเห็นที่เกิดจากประสบการณ์การทำงาน มีโอกาสได้ Implement Data Product และได้ลองสัมผัสกับปัญหาที่เกิดขึ้น พร้อมๆ กับการหาทางออกด้วยความสามารถด้าน Data Science จริงๆ