تخزين البيانات هو نظام مصمم لتخزين البيانات وتنظيمها في المستودعات المركزية بما في ذلك البيانات من مصادر أخرى. إنه مفهوم أساسي لذكاء الأعمال في نماذج قواعد البيانات العلائقية التي تستخدم تقنيات تحليلية لدمج بيانات الأعمال في قاعدة بيانات مركزية.

هناك نموذجان معماريان شائعان يستخدمان في تخزين البيانات:

  • مخطط النجوم
  • مخطط ندفة الثلج

كلاهما نموذجان مشتركان لقواعد البيانات متعددة الأبعاد يستخدمان لتلبية احتياجات قواعد البيانات الكبيرة للأغراض التحليلية في مستودعات البيانات الحقيقية.

نقدم مقارنة غير متحيزة بين الاثنين لفهم أفضل من الآخر.

ما هو مخطط النجوم؟

إنه النموذج المعماري الأكثر شيوعًا والمقبول على نطاق واسع المستخدم لتطوير مستودعات البيانات وخزانات البيانات التي يتم فيها تنظيم البيانات في حقائق وأبعاد. إنه أبسط نموذج معماري يستخدم فيه جدول حقائق واحد للإشارة إلى جداول أبعاد متعددة ، لتقليد نمط نجمي.

كما يوحي الاسم ، فإن الرسم التخطيطي يشبه نجمة مع جدول الحقائق في المركز وجداول أبعاد متعددة تشع منه ، مما يخلق نمطًا يشبه النجمة.

يُعرف أيضًا باسم Star Join Schema وهو يخزن جميع سمات البعد في جدول حقائق واحد غير منسق للتنقل بسرعة عبر مجموعات البيانات الكبيرة متعددة الأبعاد التي تمثل أوقات استجابة الاستعلام السريعة.

Difference between Star and Snowflake Schema

ما هو مخطط ندفة الثلج؟

إنه امتداد للمخطط النجمي مع وظائف إضافية. على عكس مخطط النجوم ، يتم تسوية جداول الأبعاد في مخطط ندفة الثلج في جداول متعددة ذات صلة.

يمثل النموذج المعماري ترتيبًا منطقيًا للجداول في تسلسل هرمي لعلاقات متعدد إلى واحد حيث يتم تسوية جداول الأبعاد المتعددة في جداول ذات أبعاد فرعية ، تشبه نمط ندفة الثلج ، ومن هنا جاء الاسم.

إنه إصدار أكثر تعقيدًا من مخطط النجوم مع المزيد من الصلات بين جداول الأبعاد التي تؤدي إلى بطء وقت المعالجة لجلب البيانات مما يعني بطء أوقات استجابة الاستعلام. يقلل من تكرار البيانات مما يؤدي بدوره إلى تحسين أداء الاستعلام.

Difference between Star and Snowflake Schema

الفرق بين مخطط نجمة وندفة الثلج

عمارة مخطط النجوم والثلج

في قواعد البيانات العلائقية ، يعد المخطط النجمي أبسط نموذج معماري يستخدم لتطوير مستودعات البيانات ومجمعات البيانات متعددة الأبعاد. كما يوحي الاسم ، يشبه النموذج نجمة ذات نقاط تشع من المركز مما يعني أن جدول الحقائق هو المركز والنقاط هي جداول الأبعاد. مثل نماذج الأبعاد الأخرى ، فهي تتكون من بيانات في شكل حقائق وأبعاد. مخطط ندفة الثلج ، من ناحية أخرى ، هو النموذج المعماري الأكثر تعقيدًا والذي يشير إلى قاعدة بيانات متعددة الأبعاد ذات ترتيب منطقي للجداول في شكل ندفة الثلج.

جدول الأبعاد

مخطط ندفة الثلج مشابه تمامًا للمخطط النجمي باستثناء أنه يمكن أن يحتوي على أكثر من جداول أبعاد واحدة والتي يتم تسويتها بشكل أكبر في جداول متعددة ذات صلة يشار إليها باسم جداول الأبعاد الفرعية. إنه يمثل مستويات متعددة من العلاقات التي تتفرع إلى نمط ندفة الثلج. ومع ذلك ، يخزن المخطط النجمي جميع السمات ذات الصلة للبعد في جدول أبعاد واحد غير منسق مما يجعل من السهل فهم الاستعلامات الأبسط والتعامل معها.

نموذج العمل لمخطط النجوم والثلج

لا يمكن لجدول الأبعاد أن يحتوي على صفوف مكررة في نماذج قواعد البيانات العلائقية لحقيقة بسيطة أنه يمكن أن يخلق غموضًا في الاسترداد. يجب أن يحتوي كل جدول على عمود أو مجموعة من الأعمدة تسمى المفتاح الأساسي الذي يعرّف بشكل فريد جميع سجلات الجدول. المفتاح الخارجي هو عمود أو مجموعة من الأعمدة التي توفر ارتباطًا بين جدولين. في مخطط النجوم ، يحتوي كل جدول أبعاد على مفتاح أساسي مرتبط بمفتاح خارجي في جدول الحقائق. يتم تمثيل التدرج الهرمي للأعمال في مخطط ندفة الثلج بعلاقة مفتاح أساسي / مفتاح خارجي بين جداول الأبعاد.

تكامل البيانات في مخطط Star و Snowflake

الفرق الرئيسي بين نموذجي قاعدة البيانات العلائقية هو التطبيع. لا يتم تسوية جداول الأبعاد في مخطط النجوم مما يعني أن نموذج العمل سيستخدم مساحة أكبر نسبيًا لتخزين جداول الأبعاد والمزيد من المساحة يعني المزيد من السجلات الزائدة عن الحاجة والتي قد تؤدي في النهاية إلى عدم الاتساق. من ناحية أخرى ، يقلل مخطط Snowflake من تكرار البيانات لأن جداول الأبعاد يتم تسويتها والتي تمثل سجلات أقل تكرارًا. يتم الحفاظ على التسلسل الهرمي للأعمال وأبعاده من خلال التكامل المرجعي مما يعني أنه يمكن تحديث العلاقات بشكل مستقل في مستودعات البيانات.

أداء الاستعلام

يحتوي المخطط النجمي على عدد أقل من الصلات بين جدول الأبعاد وجدول الحقائق مقارنةً بمخطط ندفة الثلج الذي يحتوي على صلات متعددة تمثل تعقيدًا أقل للاستعلام. نظرًا لأن الأبعاد في مخطط النجوم مرتبطة من خلال جدول حقائق مركزي ، فإنه يحتوي على مسارات ربط واضحة مما يعني أوقات استجابة سريعة للاستعلام ووقت استجابة سريع يعني أداءً أفضل. يحتوي مخطط Snowflake على عدد أكبر من الصلات بحيث تكون أوقات استجابة الاستعلام أطول مما يؤدي إلى استعلامات أكثر تعقيدًا مما يضر بالأداء في النهاية.

مخطط النجوم مقابل مخطط ندفة الثلج: مخطط المقارنة

Star Schema VERSUS Snowflake Schema


ملخص مخطط آيات نجمة الثلج

كلاهما من النماذج المعمارية الأكثر شيوعًا والمستخدمة على نطاق واسع لتطوير مستودعات قواعد البيانات ومحلات البيانات. ومع ذلك ، فإن كل نموذج عمل له نصيبه العادل من الإيجابيات والسلبيات. في حين أن مخطط النجوم هو أبسط نموذج متعدد الأبعاد يتم استخدامه لتنظيم البيانات في حقائق وأبعاد ، فهو مثالي لتطوير مجموعات البيانات التي تتضمن علاقات أقل تعقيدًا. مخطط Snowflake هو تمثيل منطقي للجداول في قاعدة بيانات متعددة الأبعاد حيث يتم تخزين الأبعاد في جداول الأبعاد الفرعية. الفرق الرئيسي بين الاثنين هو التطبيع. يتم تسوية جداول الأبعاد في مخطط ندفة الثلج تمامًا في جداول بحث متعددة ، بينما في مخطط النجوم ، يتم إلغاء تنسيق جداول الأبعاد في جدول حقائق مركزي واحد.

المصدر

المادة السابقةالفرق بين العنوان المنطقي والعنوان الفعلي
المقالة القادمةالفرق بين Stack و Queue

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا