يعمل التطبيع على منع هدر مساحة القرص عن طريق تقليل التكرار أو القضاء عليه.
رسم بياني للمقارنة
أساس للمقارنة | تطبيع | Denormalization |
---|---|---|
الأساسية | التطبيع هو عملية إنشاء مخطط مجموعة لتخزين بيانات غير متكررة وغير متكررة. | عملية عدم التجانس هي عملية دمج البيانات بحيث يمكن الاستعلام عنها بسرعة. |
غرض | لتقليل تكرار البيانات وعدم تناسقها. | لتحقيق تنفيذ أسرع من الاستفسارات من خلال إدخال التكرار. |
مستعمل في | نظام OLTP ، حيث يتم التأكيد على جعل إدراج وحذف وتحديث الشذوذات بشكل أسرع وتخزين بيانات الجودة. | نظام OLAP ، حيث يتم التركيز على إجراء البحث والتحليل بشكل أسرع. |
تكامل البيانات | حافظ | لا يجوز الاحتفاظ بها |
وفرة | اقصاء | وأضاف |
عدد الجداول | يزيد | يقلل |
مساحة القرص | الاستخدام الأمثل | خسارة |
تعريف التطبيع
التطبيع هو طريقة ترتيب البيانات في قاعدة البيانات بكفاءة. وهو ينطوي على بناء الجداول وإقامة العلاقات بين هذه الجداول وفقا لبعض قواعد معينة. يمكن إزالة التكرار والتبعية غير المتسقة باستخدام هذه القواعد لجعلها أكثر مرونة.
تهدر البيانات المتكررة مساحة القرص ، وتزيد من عدم تناسق البيانات وتبطئ استعلامات DML. إذا كانت نفس البيانات موجودة في أكثر من مكان واحد وأي تحديث يتم الالتزام بهذه البيانات ، فيجب أن ينعكس التغيير في جميع المواقع. قد تجعل البيانات غير المتسقة عملية البحث عن البيانات والوصول إليها أكثر صعوبة من خلال فقد المسار إليها.
هناك العديد من الأسباب وراء إجراء التطبيع ، مثل تجنب التكرار ، وتحديث الحالات الشاذة ، والتشفير غير الضروري ، والاحتفاظ بالبيانات في النموذج الذي يمكن أن يستوعب التغيير بسهولة ودقة أكبر ، وإنفاذ قيود البيانات.
تتضمن عملية التطبيع تحليل التبعيات الوظيفية بين السمات. تتحلل العلاقات (الجداول) مع الشذوذات لتوليد العلاقات مع البنية. يساعد في تحديد السمات التي ينبغي تجميعها في علاقة.
يعتمد التطبيع أساسًا على مفاهيم الأشكال العادية . يقال إن جدول العلاقة يكون في شكل طبيعي إذا كان يفي بمجموعة معينة من القيود. هناك 6 أشكال طبيعية محددة: 1NF ، 2NF ، 3NF ، BCNF ، 4NF و 5NF. يجب أن يلغي التطبيع التكرار ولكن ليس على حساب النزاهة.
تعريف التشويه
عملية عدم التجانس هي عملية معكوسة للتطبيع ، حيث يتم تحويل المخطط المطوَّر إلى مخطط يحتوي على معلومات مكررة. تم تحسين الأداء باستخدام التكرار وإبقاء البيانات المتكررة متناسقة. سبب تنفيذ عملية عدم التسوية هو النفقات العامة التي يتم إنتاجها في معالج الاستعلام من خلال بنية فوق طبيعية.
يمكن تعريف الانحراف أيضًا على أنه طريقة تخزين الارتباط في العلاقات النموذجية العليا الرفيعة كعلاقة أساسية ، والتي تكون في شكل طبيعي أقل. يقلل من عدد الجداول وربط جدول معقد لأن عددًا أكبر من الصلات يمكن أن يؤدي إلى إبطاء العملية. هناك العديد من تقنيات عدم التسوية مثل: تخزين القيم القابلة للاشتقاق ، الجداول الموضوعة مسبقًا ، القيم المشفرة والاحتفاظ بالتفاصيل مع البيانات الرئيسية ، إلخ.
هنا نهج عدم التشديد ، يؤكد على المفهوم القائل بأن وضع جميع البيانات في مكان واحد ، يمكن القضاء على الحاجة إلى البحث عن تلك الملفات المتعددة لجمع هذه البيانات. يتم اتباع الاستراتيجية الأساسية في نزع السمية ، حيث يتم اختيار معظم الإجراءات الحاكمة لدراسة تلك التعديلات التي من شأنها تحسين الأداء في نهاية المطاف. والتغيير الأساسي هو إضافة سمات متعددة إلى الجدول الموجود لتقليل عدد الصلات.
الاختلافات الرئيسية بين التطبيع وإزالة الخلل
- التطبيع هو تقنية تقسيم البيانات إلى جداول متعددة لتقليل تكرار البيانات وعدم تناسقها وتحقيق تكامل البيانات. من ناحية أخرى ، فإن عدم التجانس هو تقنية دمج البيانات في جدول واحد لجعل استرجاع البيانات أسرع.
- يتم استخدام التطبيع في نظام OLTP ، والذي يؤكد على جعل إدراج وحذف وتحديث الشذوذ أسرع. في مقابل ذلك ، يتم استخدام Denormalization في نظام OLAP ، مما يؤكد على إجراء البحث والتحليل بشكل أسرع.
- يتم الحفاظ على سلامة البيانات في عملية التطبيع في حين أن النزاهة في البيانات تجعل من الصعب الاحتفاظ بها.
- يتم التخلص من البيانات المتكررة عند إجراء التطبيع في حين أن عدم التجانس يؤدي إلى زيادة البيانات المتكررة.
- تزيد عملية التطبيع من عدد الجداول والانضمام. في المقابل ، يقلل عدم التسوية من عدد الجداول والانضمام.
- يتم إهدار مساحة القرص في عدم التجانس لأنه يتم تخزين البيانات نفسها في أماكن مختلفة. على العكس ، يتم تحسين مساحة القرص في جدول normalized.
استنتاج
التطبيع و عدم التطابق مفيدان حسب الوضع. يتم استخدام التطبيع عند الحاجة إلى الإدراج السريع ، والحذف والتحديثات غير العادية ، واتساق البيانات. من ناحية أخرى ، يتم استخدام Denormalization عندما يكون البحث أسرع أكثر أهمية ولتحسين أداء القراءة. كما أنه يقلل من النفقات العامة التي أنشأتها البيانات overinized أو صلات الجدول معقدة.