الفرق بين KDD واستخراج البيانات

الفرق بين KDD واستخراج البيانات
الفرق بين KDD واستخراج البيانات

فيديو: الفرق بين KDD واستخراج البيانات

فيديو: الفرق بين KDD واستخراج البيانات
فيديو: هيكل رأس المال 2024, شهر نوفمبر
Anonim

KDD مقابل استخراج البيانات

KDD (اكتشاف المعرفة في قواعد البيانات) هو مجال علوم الكمبيوتر ، والذي يتضمن الأدوات والنظريات لمساعدة البشر في استخراج المعلومات المفيدة وغير المعروفة سابقًا (أي المعرفة) من مجموعات كبيرة من البيانات الرقمية. يتكون KDD من عدة خطوات ، ومن بينها التنقيب في البيانات. التنقيب في البيانات هو تطبيق خوارزمية محددة لاستخراج الأنماط من البيانات. ومع ذلك ، يتم استخدام KDD و Data Mining بالتبادل.

ما هو كي دي دي؟

كما ذكرنا سابقًا ، يعد KDD أحد مجالات علوم الكمبيوتر ، والذي يتعامل مع استخراج معلومات غير معروفة ومثيرة للاهتمام سابقًا من البيانات الأولية. KDD هي العملية الكاملة لمحاولة فهم البيانات من خلال تطوير الأساليب أو التقنيات المناسبة. تتعامل هذه العملية مع تعيين البيانات منخفضة المستوى إلى أشكال أخرى تكون أكثر إحكاما وتجريدًا وإفادة. يتم تحقيق ذلك من خلال إنشاء تقارير قصيرة ، ونمذجة عملية توليد البيانات وتطوير النماذج التنبؤية التي يمكنها التنبؤ بالحالات المستقبلية. نظرًا للنمو الهائل للبيانات ، لا سيما في مجالات مثل الأعمال التجارية ، أصبحت KDD عملية مهمة للغاية لتحويل هذه الثروة الكبيرة من البيانات إلى ذكاء الأعمال ، حيث أصبح الاستخراج اليدوي للأنماط مستحيلًا على ما يبدو في العقود القليلة الماضية. على سبيل المثال ، يتم استخدامه حاليًا في العديد من التطبيقات مثل تحليل الشبكات الاجتماعية ، واكتشاف الاحتيال ، والعلوم ، والاستثمار ، والتصنيع ، والاتصالات ، وتنظيف البيانات ، والرياضة ، واسترجاع المعلومات ، وإلى حد كبير للتسويق. عادةً ما يتم استخدام KDD للإجابة على أسئلة مثل ما هي المنتجات الرئيسية التي قد تساعد في الحصول على ربح مرتفع العام المقبل في Wal-Mart ؟.هذه العملية لها عدة خطوات. يبدأ بتطوير فهم مجال التطبيق والهدف ثم إنشاء مجموعة بيانات مستهدفة. ويلي ذلك تنظيف البيانات ومعالجتها وتقليلها وإسقاطها. الخطوة التالية هي استخدام التنقيب في البيانات (الموضحة أدناه) لتحديد النمط. أخيرًا ، يتم دمج المعرفة المكتشفة من خلال التصور و / أو الترجمة.

ما هو التنقيب عن البيانات؟

كما هو مذكور أعلاه ، يعد استخراج البيانات مجرد خطوة ضمن عملية KDD الشاملة. هناك هدفان رئيسيان للتنقيب عن البيانات على النحو المحدد في هدف التطبيق ، وهما التحقق أو الاكتشاف. يتحقق التحقق من فرضية المستخدم حول البيانات ، بينما يبحث الاكتشاف تلقائيًا عن أنماط مثيرة للاهتمام. هناك أربع مهام رئيسية للتنقيب عن البيانات: التجميع والتصنيف والانحدار والارتباط (التلخيص). التجميع هو تحديد مجموعات مماثلة من البيانات غير المهيكلة. التصنيف هو قواعد تعلم يمكن تطبيقها على البيانات الجديدة.الانحدار هو العثور على وظائف بأقل قدر من الخطأ لنمذجة البيانات. والارتباط يبحث عن العلاقات بين المتغيرات. بعد ذلك ، يجب تحديد خوارزمية استخراج البيانات المحددة. اعتمادًا على الهدف ، يمكن تحديد خوارزميات مختلفة مثل الانحدار الخطي والانحدار اللوجستي وأشجار القرار و Naïve Bayes. ثم يتم البحث عن أنماط الاهتمام في واحد أو أكثر من أشكال التمثيل. أخيرًا ، يتم تقييم النماذج إما باستخدام الدقة التنبؤية أو القابلية للفهم.

ما هو الفرق بين كي دي دي واستخراج البيانات؟

على الرغم من استخدام المصطلحين KDD و Data Mining بشكل كبير بالتبادل ، إلا أنهما يشيران إلى مفهومين مرتبطين ولكن مختلفين قليلاً. KDD هي العملية الشاملة لاستخراج المعرفة من البيانات بينما يعد استخراج البيانات خطوة داخل عملية KDD ، والتي تتعامل مع تحديد الأنماط في البيانات. بمعنى آخر ، التنقيب في البيانات هو فقط تطبيق خوارزمية محددة بناءً على الهدف العام لعملية كي دي دي.

موصى به: