DBMS مقابل استخراج البيانات
A DBMS (نظام إدارة قواعد البيانات) هو نظام كامل يستخدم لإدارة قواعد البيانات الرقمية التي تسمح بتخزين محتوى قاعدة البيانات ، وإنشاء / صيانة البيانات ، والبحث والوظائف الأخرى. من ناحية أخرى ، يعد Data Mining مجالًا في علوم الكمبيوتر ، يتعامل مع استخراج معلومات غير معروفة سابقًا ومثيرة للاهتمام من البيانات الأولية. عادة ، يتم تخزين البيانات المستخدمة كمدخلات لعملية استخراج البيانات في قواعد البيانات. المستخدمون الذين يميلون إلى الإحصائيات يستخدمون التنقيب في البيانات. يستخدمون النماذج الإحصائية للبحث عن الأنماط المخفية في البيانات. يهتم عمال مناجم البيانات بإيجاد علاقات مفيدة بين عناصر البيانات المختلفة ، وهو أمر مربح في نهاية المطاف للشركات.
DBMS
DBMS ، الذي يطلق عليه أحيانًا مدير قاعدة البيانات ، عبارة عن مجموعة من برامج الكمبيوتر المخصصة لإدارة (مثل التنظيم والتخزين والاسترجاع) لجميع قواعد البيانات المثبتة في النظام (أي محرك الأقراص الثابتة أو الشبكة). هناك أنواع مختلفة من أنظمة إدارة قواعد البيانات الموجودة في العالم ، وبعضها مصمم للإدارة السليمة لقواعد البيانات التي تم تكوينها لأغراض محددة. أشهر أنظمة إدارة قواعد البيانات التجارية هي Oracle و DB2 و Microsoft Access. توفر كل هذه المنتجات وسائل لتخصيص مستويات مختلفة من الامتيازات لمستخدمين مختلفين ، مما يجعل من الممكن التحكم في نظام إدارة قواعد البيانات (DBMS) مركزيًا بواسطة مسؤول واحد أو تخصيصه لعدة أشخاص مختلفين. هناك أربعة عناصر مهمة في أي نظام إدارة قواعد بيانات. هم لغة النمذجة وهياكل البيانات ولغة الاستعلام وآلية المعاملات. تحدد لغة النمذجة لغة كل قاعدة بيانات مستضافة في نظام إدارة قواعد البيانات.يوجد حاليًا العديد من الأساليب الشائعة مثل التسلسل الهرمي والشبكة والعلائقية والكائن قيد الممارسة. تساعد هياكل البيانات في تنظيم البيانات مثل السجلات الفردية والملفات والحقول وتعريفاتها وكائنات مثل الوسائط المرئية. تحافظ لغة استعلام البيانات على أمان قاعدة البيانات من خلال مراقبة بيانات تسجيل الدخول وحقوق الوصول لمختلف المستخدمين والبروتوكولات لإضافة البيانات إلى النظام. SQL هي لغة استعلام شائعة يتم استخدامها في أنظمة إدارة قواعد البيانات العلائقية. أخيرًا ، تساعد الآلية التي تسمح بالمعاملات في التزامن والتعددية. ستعمل هذه الآلية على التأكد من أن نفس السجل لن يتم تعديله من قبل عدة مستخدمين في نفس الوقت ، وبالتالي الحفاظ على تكامل البيانات في اللباقة. بالإضافة إلى ذلك ، يوفر DBMS النسخ الاحتياطي والتسهيلات الأخرى أيضًا.
تعدين البيانات
يُعرف استخراج البيانات أيضًا باسم اكتشاف المعرفة في البيانات (KDD). كما ذكرنا سابقًا ، فهو من سائر علوم الكمبيوتر ، الذي يتعامل مع استخراج معلومات غير معروفة سابقًا ومثيرة للاهتمام من البيانات الخام.نظرًا للنمو الهائل للبيانات ، لا سيما في مجالات مثل الأعمال التجارية ، أصبح استخراج البيانات أداة مهمة للغاية لتحويل هذه الثروة الكبيرة من البيانات إلى ذكاء الأعمال ، حيث أصبح الاستخراج اليدوي للأنماط مستحيلًا على ما يبدو في العقود القليلة الماضية. على سبيل المثال ، يتم استخدامه حاليًا في العديد من التطبيقات مثل تحليل الشبكات الاجتماعية واكتشاف الاحتيال والتسويق. عادةً ما يتعامل التنقيب عن البيانات مع المهام الأربع التالية: التجميع والتصنيف والانحدار والارتباط. التجميع هو تحديد مجموعات مماثلة من البيانات غير المهيكلة. التصنيف هو قواعد التعلم التي يمكن تطبيقها على البيانات الجديدة وستتضمن عادةً الخطوات التالية: المعالجة المسبقة للبيانات ، وتصميم النمذجة ، واختيار التعلم / الميزة ، والتقييم / التحقق من الصحة. الانحدار هو العثور على وظائف بأقل قدر من الخطأ لنمذجة البيانات. والارتباط يبحث عن العلاقات بين المتغيرات. عادة ما يتم استخدام التنقيب عن البيانات للإجابة على أسئلة مثل ما هي المنتجات الرئيسية التي قد تساعد في تحقيق أرباح عالية العام المقبل في وول مارت؟
ما هو الفرق بين DBMS والتنقيب في البيانات؟
DBMS هو نظام متكامل لإسكان وإدارة مجموعة من قواعد البيانات الرقمية. ومع ذلك ، فإن تعدين البيانات هو تقنية أو مفهوم في علوم الكمبيوتر ، والذي يتعامل مع استخراج المعلومات المفيدة وغير المعروفة سابقًا من البيانات الأولية. في معظم الأحيان ، يتم تخزين هذه البيانات الأولية في قواعد بيانات كبيرة جدًا. لذلك يستخدم معدِّنو البيانات الوظائف الحالية لنظام إدارة قواعد البيانات للتعامل مع البيانات الخام وإدارتها وحتى معالجتها مسبقًا قبل وأثناء عملية التنقيب عن البيانات. ومع ذلك ، لا يمكن استخدام نظام DBMS وحده لتحليل البيانات. ولكن ، بعض نظم إدارة قواعد البيانات (DBMS) في الوقت الحالي لديها أدوات أو قدرات داخلية لتحليل البيانات.