موصى به, 2020

اختيار المحرر

الفرق بين التصنيف والانحدار

التصنيف والتراجع هما مشكلتان رئيسيتان للتنبؤ يتم معالجتهما عادة في مجال استخراج البيانات. النمذجة التنبؤية هي تقنية تطوير نموذج أو وظيفة باستخدام البيانات التاريخية للتنبؤ بالبيانات الجديدة. الاختلاف الكبير بين التصنيف والانحدار هو أن التصنيف يقوم بتعيين كائن بيانات الإدخال إلى بعض العلامات المنفصلة. من ناحية أخرى ، يقوم الانحدار بتعيين كائن بيانات الإدخال إلى القيم الحقيقية المستمرة.

رسم بياني للمقارنة

أساس للمقارنةتصنيفانحسار
الأساسية
اكتشاف نموذج أو وظائف يتم فيها تخطيط الكائنات في فئات محددة مسبقًا.نموذج مبتكر يتم فيه وضع خرائط الكائنات في قيم.
ينطوي على التنبؤالقيم المنفصلةقيم مستمرة
خوارزمياتشجرة القرار ، الانحدار اللوجستي ، إلخ.شجرة الانحدار (غابة عشوائية) ، الانحدار الخطي ، إلخ.
طبيعة البيانات المتوقعةغير مرتبةأمر
طريقة الحسابقياس الدقةقياس الخطأ الجذري لمتوسط ​​الجذر

تعريف التصنيف

التصنيف هو عملية إيجاد أو اكتشاف نموذج (وظيفة) مما يساعد على فصل البيانات إلى فئات فئوية متعددة. في التصنيف ، يتم تحديد عضوية المجموعة في المشكلة ، مما يعني أن البيانات يتم تصنيفها تحت تصنيفات مختلفة وفقًا لبعض المعايير ومن ثم يتم التنبؤ بالبيانات للبيانات.

يمكن إثبات النماذج المشتقة في شكل قواعد "IF-THEN"، والأشجار القرار أو الشبكات العصبية، وما إلى ذلك شجرة القرارات هي في الأساس-الرسم البياني الذي يشبه هيكل شجرة حيث كل عقدة الداخلية يصور الاختبار على سمة، وفروعها تظهر نتيجة الاختبار. تتعامل عملية التصنيف مع المشكلات التي يمكن فيها تقسيم البيانات إلى علامتين منفصلتين أو أكثر ، أي بعبارة أخرى مجموعتين أو أكثر من المجموعات المنفصلة.

لنأخذ مثالاً ، لنفترض أننا نريد أن نتوقع إمكانية هطول المطر في بعض المناطق على أساس بعض المعايير. ثم سيكون هناك اثنين من العلامات المطر والأمطار التي لا يمكن تحتها المناطق المختلفة التي يمكن تصنيفها.

تعريف الانحدار

الانحدار هو عملية إيجاد نموذج أو وظيفة لتمييز البيانات إلى قيم حقيقية مستمرة بدلاً من استخدام الفئات. رياضيا ، مع مشكلة الانحدار ، واحد يحاول العثور على تقريب الدالة مع الانحراف الأدنى للخطأ. في الانحدار ، من المتوقع أن تميزها التبعية الرقمية للبيانات.

تحليل الانحدار هو النموذج الإحصائي المستخدم للتنبؤ بالبيانات الرقمية بدلاً من الملصقات. ويمكنه أيضًا تحديد حركة التوزيع اعتمادًا على البيانات المتوفرة أو البيانات التاريخية.

لنأخذ المثال المماثل في التراجع أيضًا ، حيث نجد إمكانية حدوث المطر في بعض المناطق المحددة بمساعدة بعض المعلمات. في هذه الحالة ، هناك احتمال يرتبط بالمطر. هنا لا نقوم بتصنيف المناطق الواقعة تحت المطر ولا توجد علامات للمطر بدلاً من ذلك ، فنحن نقوم بتصنيفها مع الاحتمالية المرتبطة بها.

الاختلافات الرئيسية بين التصنيف والانحدار

  1. تقوم عملية التصنيف بعمل وظيفة يتم من خلالها التنبؤ بالبيانات في تصنيفات طبقية منفصلة. من ناحية أخرى ، يعتبر الانحدار هو عملية إنشاء نموذج يتنبأ بالكمية المستمرة.
  2. تشتمل خوارزميات التصنيف على شجرة القرار ، الانحدار اللوجستي ، إلخ. وعلى النقيض من ذلك ، فإن شجرة الانحدار (مثل الغابات العشوائية) والانحدار الخطي هي أمثلة لخوارزميات الانحدار.
  3. ويتنبأ التصنيف بالبيانات غير المرتبة في حين يتنبأ الانحدار بالبيانات المطلوبة.
  4. يمكن تقييم الانحدار باستخدام خطأ متوسط ​​في الجذر. على العكس ، يتم تقييم التصنيف من خلال قياس الدقة.

استنتاج

توفر تقنية التصنيف النموذج أو الوظيفة التنبؤية التي تتنبأ بالبيانات الجديدة في فئات أو تصنيفات منفصلة بمساعدة البيانات التاريخية. وعلى العكس من ذلك ، فإن أسلوب الانحدار يعمل على وظائف ذات قيمة مستمرة مما يعني أنه يتوقع البيانات في بيانات رقمية مستمرة.

Top