เมทาดาตา หรือ Metadata เป็นชุดข้อมูลที่ใช้อธิบายข้อมูลทั้งกระบวนการเชิงธุรกิจ และเชิงเทคโนโลยีสารสนเทศ เช่น ประเภทข้อมูล (Data Type) ชื่อชุดข้อมูล (Titles) คำสำคัญ (Tag) วัตถุประสงค์ (Objective) รูปแบบการเก็บข้อมูล (Data Format) เป็นต้น
Metadata แตกต่างจากพจนานุกรมข้อมูล หรือ Data Dictionary ตรงที่วัตถุประสงค์ของการมี Metadata เพื่ออธิบายให้ผู้ใช้งานเข้าใจตัวชุดข้อมูล ในขณะที่วัตถุประสงค์ของ Data Dictionary เพื่ออธิบายทีมฝั่ง IT เพื่อให้เข้าใจโครงสร้างของข้อมูล โดย Data Dictionary จะมีการเก็บข้อมูล ชนิดของข้อมูล (Data Type) จำนวนความยาวของข้อมูลที่มีได้มากสุด (Data Length) ค่าเริ่มต้น (Default Value) ความหมายของ Column นั้น ๆ ตัวอย่างข้อมูล เป็นต้น กล่าวคือ ผู้ใช้งานข้อมูลเข้ามาค้นหาชุดข้อมูลโดยสามารถศึกษารายละเอียดจาก Metadata ได้ ในขณะที่ IT เมื่อต้องการเชื่อมโยงข้อมูล หรือค้นหาฟิลด์ (Field) หรือ คอลัมน์ (Column) โดยอ้างอิงจากเอกสาร Data Dictionary นอกจากนี้ ข้อมูลใน Metadata ค่อนข้างจะเปลี่ยนแปลงไม่บ่อยเมื่อเทียบกับข้อมูลใน Data Dictionary เป็นเพราะข้อมูลใน Data Dictionary เป็นข้อมูลเชิง Database ที่เปลี่ยนแปลงตลอดเวลา
ความสำคัญของ Metadata มีดังนี้
ช่วยจัดระเบียบข้อมูล → เมทาดาตาช่วยในการระบุและจัดหมวดหมู่ข้อมูล ทำให้ผู้ใช้งานสามารถค้นหาและเข้าถึงข้อมูลที่ต้องการได้ง่าย
ช่วยในการค้นหาข้อมูล → โดยใช้คำค้นหา (keywords) หรือแท็ก (tags) ทำให้การค้นหาข้อมูลเป็นไปอย่างรวดเร็วและตรงจุด
ช่วยสร้างความเข้าใจในชุดข้อมูล → เมทาดาตาให้ข้อมูลเพิ่มเติมเกี่ยวกับชุดข้อมูล เช่น ที่มาของข้อมูล (source) วันที่สร้าง (creation date) ความถี่ในการ update และข้อมูลเชิงลึกอื่น ๆ ทำให้ผู้ใช้สามารถเข้าใจข้อมูลหลักได้ดีขึ้น
ช่วยรักษาความปลอดภัย → เมทาดาตาช่วยในการระบุและควบคุมการเข้าถึงข้อมูล โดยระบุชั้นความลับข้อมูล ซึ่งนำมาสู่การระบุสิทธิ์ในการเข้าถึงข้อมูลได้
สนับสนุนการทำงานร่วมกัน → เมทาดาตาช่วยในการแบ่งปันข้อมูลระหว่างผู้ใช้และหน่วยงานต่าง ๆ โดยให้ข้อมูลเพิ่มเติมที่ช่วยให้เกิดการใช้งานข้อมูลร่วมกันภายใต้ความเข้าใจในทิศทางเดียวกัน
ผู้ที่มีหน้าที่รับผิดชอบในการจัดทำ Metadata คือ บริกรข้อมูล หรือ Data Steward ซึ่งกระบวนการในการจัดทำไม่ยาก แต่สิ่งที่ยาก คือ การไม่มีนโยบายในการจัดทำ ดังนั้น ถ้าผู้บริหารไม่ให้ความสำคัญกับโครงการ Data Governance ก็จะไม่มีจุดเริ่มต้นเพื่อดำเนินโครงการ
สุดท้ายปัญหาเรื้อรังก็คือ คนในองค์กรไม่สามารถค้นหาข้อมูลมาใช้งานต่อได้ องค์กรก็จะไม่สามารถปรับตัวเข้าสู่องค์กรที่ขับเคลื่อนด้วยข้อมูลได้ในที่สุด
Comentarios