top of page

การทำความเข้าใจโครงสร้างข้อมูล (Data Schema) ใน Power BI

Power BI เป็นโปรแกรม BI หรือ แพลตฟอร์มการวิเคราะห์ข้อมูลที่พัฒนาโดย Microsoft ที่ให้คุณสร้างกระดานแสดงผลและรายงานแบบโต้ตอบได้ง่าย ๆ ซึ่ง Dashboard ในโปรแกรม BI จะเป็น Interactive Dashboard ทำให้เมื่อมีการเปลี่ยนแปลงของข้อมูล ข้อมูลในรายงานจะเปลี่ยนแปลงได้ทันที ทำให้ไม่ต้องสร้างตารางหรือ Graph หลายหน้าเหมือนโปรแกรม Excel


ประโยชน์ของ Power BI

1. Power BI สามารถเชื่อมต่อกับแหล่งข้อมูลหลากหลายประเภท เช่น ฐานข้อมูล, ไฟล์ Excel, บริการออนไลน์, และแอปพลิเคชันทางธุรกิจอื่น ๆ ทำให้สามารถรวบรวมข้อมูลจากแหล่งต่าง ๆ เพื่อสร้างรายงานที่ครอบคลุมได้

2.  Power BI สามารถสร้าง Dashboard แบบโต้ตอบที่สามารถเจาะลึกเข้าไปในรายละเอียดเพื่อค้นพบข้อมูลเชิงลึกได้ง่าย

3. สามารถปรับแต่งรายงานและ Dashboard ให้ตรงกับความต้องการของธุรกิจได้ และยังสามารถเพิ่มความสามารถโดยการใช้เครื่องมือภายนอกหรือเขียนโค้ด Python และ R

4. Power BI สามารถเผยแพร่รายงานและ Dashboard ออนไลน์ได้อย่างง่าย ทำให้ทีมหรือคนในองค์กรเข้าถึงข้อมูลได้ทุกที่ทุกเวลา


โครงสร้างข้อมูลคืออะไร

โครงสร้างข้อมูล (Data Schema) คือวิธีการจัดการและจัดรูปแบบข้อมูลในฐานข้อมูลหรือระบบข้อมูลอื่น ๆ โครงสร้างข้อมูลจะระบุถึงประเภทของข้อมูล ความสัมพันธ์ระหว่างข้อมูล และวิธีการจัดเก็บข้อมูลอย่างมีประสิทธิภาพ โครงสร้างข้อมูลที่ดีช่วยให้การเรียกดูและวิเคราะห์ข้อมูลง่ายและรวดเร็วขึ้น ซึ่งเป็นสิ่งสำคัญในการออกแบบฐานข้อมูลและระบบวิเคราะห์ข้อมูล


ทำไมโครงสร้างข้อมูลจึงสำคัญ

โครงสร้างข้อมูลที่เหมาะสมช่วยให้การเรียกดูและวิเคราะห์ข้อมูลเป็นไปอย่างมีประสิทธิภาพ การออกแบบโครงสร้างข้อมูลใน Power BI เป็นสิ่งสำคัญที่ควรพิจารณา เนื่องจากส่งผลต่อสิ่งต่อไปนี้


1. ประสิทธิภาพการเรียกดูข้อมูล 

โครงสร้างข้อมูลที่ถูกออกแบบอย่างดีจะช่วยลดจำนวนการ join และการเรียกข้อมูลที่ไม่จำเป็น ทำให้การเรียกดูข้อมูลเร็วขึ้น


2. ความง่ายในการบำรุงรักษา 

โครงสร้างข้อมูลที่มีการจัดการอย่างถูกต้องจะทำให้ง่ายต่อการบำรุงรักษา ปรับเปลี่ยน และขยายในอนาคต


3. การลดความซับซ้อนของรายงาน 

การออกแบบโครงสร้างข้อมูลที่ดีทำให้รายงานและ Dashboard ง่ายต่อการเข้าใจและปรับแต่ง ส่งผลให้การตัดสินใจทำได้รวดเร็วขึ้น


4. การใช้ทรัพยากรที่มีประสิทธิภาพ 

การใช้โครงสร้างข้อมูลที่ถูกต้องจะช่วยลดภาระการประมวลผล ทำให้สามารถใช้ทรัพยากรอย่างเต็มประสิทธิภาพ


การเปรียบเทียบโครงสร้างข้อมูลแบบ Star, Snowflake และ Wide-Table

ในการวิเคราะห์และจัดเก็บข้อมูล โครงสร้างของฐานข้อมูลมีความสำคัญในการจัดระเบียบข้อมูล จัดเก็บข้อมูล และเรียกดูข้อมูล สำหรับผู้ใช้ Power BI การเข้าใจโครงสร้างข้อมูลแบบต่าง ๆ เช่น Star, Snowflake และ Wide-Table จะช่วยเพิ่มประสิทธิภาพและความสามารถในการใช้งานของรายงานและ Dashboard  


ประเภทและข้อดีข้อเสียของโครงสร้างข้อมูลแต่ละแบบใน Power BI 


โครงสร้างข้อมูลแบบ Star


โครงสร้างข้อมูลแบบ Star เป็นโครงสร้างที่ง่ายและใช้กันอย่างแพร่หลายในการจัดเก็บข้อมูล มักประกอบด้วยตาราง fact ที่อยู่ตรงกลางและมีตาราง dimension ล้อมรอบ ตาราง fact จะเก็บข้อมูลเชิงปริมาณ ในขณะที่ตาราง dimension จะเก็บข้อมูล descriptive เกี่ยวกับ fact เหล่านั้น

 

ข้อดี

1. โครงสร้างข้อมูลที่ตรงไปตรงมาทำให้ผู้วิเคราะห์เข้าใจความสัมพันธ์ของข้อมูลได้ง่ายขึ้น

2. การเรียกดูข้อมูลที่มีประสิทธิภาพ สามารถเรียกดูข้อมูลเร็วขึ้นเนื่องจากการ join ที่น้อยกว่า

ข้อเสีย

1. ข้อมูลซ้ำซ้อน เนื่องจากตาราง dimension ไม่ได้รับการทำ normalization จึงอาจมีข้อมูลซ้ำซ้อนได้


โครงสร้างข้อมูลแบบ Snowflake

โครงสร้างข้อมูลแบบ Snowflake เป็นโครงสร้างที่ได้รับการทำ normalization มากกว่าโครงสร้างข้อมูลแบบ Star โดยตาราง dimension จะถูกแบ่งเป็น sub-dimensions เพื่อลดความซ้ำซ้อนและเพิ่มประสิทธิภาพการจัดเก็บ



ข้อดี

1. การทำ normalization ช่วยลดการซ้ำซ้อนในข้อมูล dimension

2. รองรับข้อมูลลำดับชั้น โดยตาราง sub-dimension มีประโยชน์สำหรับการจัดเก็บความสัมพันธ์แบบลำดับชั้น

ข้อเสีย

1. ต้องการการออกแบบที่ระมัดระวังเนื่องจากเป็นโครงสร้างที่ซับซ้อน เพื่อให้แน่ใจว่าความสัมพันธ์ของข้อมูลชัดเจน

2. การ join ที่มากขึ้นทำให้การเรียกดูข้อมูลช้าลง โดยเฉพาะกับข้อมูลขนาดใหญ่


โครงสร้างข้อมูลแบบ Wide-Table

โครงสร้างข้อมูลแบบ Wide-Table ข้อมูล fact และ dimension จะถูกรวมเข้าด้วยกันเป็นตารางเดียว โดยมักจะถูก denormalize จากโครงสร้างอื่นๆ

ข้อดี

1. การที่ข้อมูลอยู่ในตารางเดียวทำให้การเรียกดูง่ายขึ้นและสามารถเพิ่มประสิทธิภาพสำหรับฐานข้อมูลแบบคอลัมน์

2. การวิเคราะห์บางประเภทสามารถได้รับประโยชน์จากโครงสร้างที่ถูก denormalize ยกตัวอย่างเช่น การวิเคราะห์การขายและการตลาด หรือ การวิเคราะห์ข้อมูลเชิงทำนาย (Predictive Analysis)

ข้อเสีย

1. ความซ้ำซ้อนของข้อมูลสามารถเพิ่มขนาดในการจัดเก็บและการใช้หน่วยความจำ

2. การปรับปรุง Wide-Table นั้นอาจจะยุ่งยาก


การเลือกโครงสร้างข้อมูลที่เหมาะสมสำหรับ Power BI

โครงสร้างข้อมูลแบบ Star มักเป็นตัวเลือกเริ่มต้นที่ดีที่สุดเนื่องจากความสมดุลของความเรียบง่ายและประสิทธิภาพ เหมาะสำหรับความต้องการเชิงวิเคราะห์ส่วนใหญ่และให้ข้อมูลเชิงลึกได้รวดเร็ว


โครงสร้างข้อมูลแบบ Snowflake จะถูกนำมาใช้เมื่อมีข้อจำกัดในเรื่องของการจัดเก็บข้อมูลและจำเป็นต้องใช้ dimension ที่ได้รับการทำ normalization อย่างไรก็ตามการใช้โครงสร้างข้อมูลแบบ Snowflake ให้

พิจารณาประสิทธิภาพที่ลดลงด้วย


โครงสร้างข้อมูลแบบ Wide-Table มีประโยชน์สำหรับการเรียกดูข้อมูลที่รวดเร็วกับฐานข้อมูลแบบคอลัมน์แบบสมัยใหม่ แต่อาจไม่เหมาะกับทุกกรณีเนื่องจากปัญหาการซ้ำซ้อนของข้อมูลและการบำรุงรักษา


ดังนั้น การเลือกโครงสร้างข้อมูลที่เหมาะสมเป็นสิ่งสำคัญสำหรับการสร้างแบบจำลองข้อมูลที่มีประสิทธิภาพใน Power BI แม้ว่าการเริ่มต้นด้วยโครงสร้างข้อมูลแบบ Star มักจะเป็นตัวเลือกที่ดีที่สุด การเข้าใจถึงจุดแข็งและจุดอ่อนของโครงสร้างข้อมูลแบบ Snowflake และ Wide-Table จะช่วยให้เราสามารถปรับแต่งแบบจำลองข้อมูลให้ตรงกับประสิทธิภาพและความต้องการในการวิเคราะห์ได้






 

Comments


bottom of page