الفرق بين المجموعات الهرمية والجزئية

الفرق بين المجموعات الهرمية والجزئية
الفرق بين المجموعات الهرمية والجزئية

فيديو: الفرق بين المجموعات الهرمية والجزئية

فيديو: الفرق بين المجموعات الهرمية والجزئية
فيديو: الفرق بين الجنيه الذهب والسبيكه الأونصه في المدفوع عند الشراء والمسترد عند البيع وصافي تكلفة الجرام 2024, يوليو
Anonim

المجموعات الهرمية مقابل المجموعات الجزئية

التجميع هو أسلوب تعلم آلي لتحليل البيانات وتقسيمها إلى مجموعات من البيانات المتشابهة. تُعرف هذه المجموعات أو مجموعات البيانات المتشابهة باسم الكتل. يبحث تحليل الكتلة في خوارزميات التجميع التي يمكنها تحديد المجموعات تلقائيًا. الهرمية والتجزئة نوعان من هذه الفئات من خوارزميات التجميع. تقوم خوارزميات التجميع الهرمي بتفكيك البيانات في تسلسل هرمي من المجموعات. تقسم الخوارزميات الشرطية مجموعة البيانات إلى أقسام منفصلة بشكل متبادل.

ما هو التجميع الهرمي؟

تكرر خوارزميات التجميع الهرمي دورة إما دمج مجموعات أصغر في مجموعات أكبر أو تقسيم مجموعات أكبر إلى مجموعات أصغر.في كلتا الحالتين ، فإنه ينتج تسلسلاً هرميًا للعناقيد يسمى مخطط الأسنان. تستخدم إستراتيجية التجميع التكتلي النهج التصاعدي لدمج المجموعات في المجموعات الأكبر ، بينما تستخدم استراتيجية التجميع الانقسام نهجًا من أعلى إلى أسفل يتمثل في التقسيم إلى مجموعات أصغر. عادةً ما يتم استخدام النهج الجشع في تحديد المجموعات الأكبر / الأصغر المستخدمة للدمج / القسمة. تعد المسافة الإقليدية ومسافة مانهاتن وتشابه جيب التمام من أكثر مقاييس التشابه شيوعًا في البيانات الرقمية. بالنسبة للبيانات غير الرقمية ، يتم استخدام مقاييس مثل مسافة هامينج. من المهم ملاحظة أن الملاحظات الفعلية (الأمثلة) ليست ضرورية للتجميع الهرمي ، لأن مصفوفة المسافات فقط كافية. Dendogram هو تمثيل مرئي للمجموعات ، والذي يعرض التسلسل الهرمي بوضوح شديد. يمكن للمستخدم الحصول على مجموعات مختلفة اعتمادًا على المستوى الذي يتم عنده قطع مخطط الأسنان.

ما هو التجميع الجزئي؟

تقوم خوارزميات التجميع الجزئي بإنشاء أقسام مختلفة ثم تقييمها باستخدام بعض المعايير.يشار إليها أيضًا على أنها غير هرمية حيث يتم وضع كل مثيل في واحدة بالضبط من مجموعات k المتنافية. نظرًا لأن مجموعة واحدة فقط من المجموعات هي ناتج خوارزمية تجميع جزئية نموذجية ، يتعين على المستخدم إدخال العدد المطلوب من المجموعات (عادةً ما يسمى k). واحدة من أكثر خوارزميات التجميع الجزئي شيوعًا هي خوارزمية التجميع k-mean. يُطلب من المستخدم توفير عدد المجموعات (k) قبل البدء وتقوم الخوارزمية أولاً ببدء المراكز (أو النقط الوسطى) لأقسام k. باختصار ، تقوم خوارزمية التجميع k-mean بعد ذلك بتعيين الأعضاء بناءً على المراكز الحالية ومراكز إعادة التقديرات بناءً على الأعضاء الحاليين. تتكرر هاتان الخطوتان حتى يتم تحسين وظيفة هدف معينة للتشابه داخل الكتلة ووظيفة هدف الاختلاف بين المجموعات. لذلك ، يعد التهيئة المعقولة للمراكز عاملاً مهمًا للغاية في الحصول على نتائج الجودة من خوارزميات التجميع الجزئي.

ما هو الفرق بين المجموعات الهرمية و الجزئية؟

المجموعات الهرمية والجزئية لها اختلافات رئيسية في وقت التشغيل والافتراضات ومعلمات الإدخال والمجموعات الناتجة. عادةً ما يكون التجميع الجزئي أسرع من التجميع الهرمي. يتطلب التجميع الهرمي مقياس تشابه فقط ، بينما يتطلب التجميع الجزئي افتراضات أقوى مثل عدد المجموعات والمراكز الأولية. لا يتطلب التجميع الهرمي أي معلمات إدخال ، بينما تتطلب خوارزميات التجميع الجزئي عدد المجموعات لبدء التشغيل. يُعيد التجميع الهرمي تقسيمًا ذا مغزى وذاتيًا أكثر بكثير للكتل ولكن ينتج عن التجميع الجزئي مجموعات k بالضبط. تعد خوارزميات التجميع الهرمي أكثر ملاءمة للبيانات الفئوية طالما يمكن تحديد مقياس التشابه وفقًا لذلك.

موصى به: