الفرق بين التنقيب عن البيانات وتخزين البيانات

الفرق بين التنقيب عن البيانات وتخزين البيانات
الفرق بين التنقيب عن البيانات وتخزين البيانات

فيديو: الفرق بين التنقيب عن البيانات وتخزين البيانات

فيديو: الفرق بين التنقيب عن البيانات وتخزين البيانات
فيديو: HTC Gratia Review 2024, يوليو
Anonim

التنقيب عن البيانات مقابل تخزين البيانات

التنقيب عن البيانات وتخزين البيانات كلاهما تقنيات قوية جدًا وشائعة لتحليل البيانات. المستخدمون الذين يميلون إلى الإحصائيات يستخدمون التنقيب في البيانات. يستخدمون النماذج الإحصائية للبحث عن الأنماط المخفية في البيانات. يهتم عمال مناجم البيانات بإيجاد علاقات مفيدة بين عناصر البيانات المختلفة ، وهو أمر مربح في نهاية المطاف للشركات. ولكن من ناحية أخرى ، يميل خبراء البيانات الذين يمكنهم تحليل أبعاد العمل مباشرة إلى استخدام مستودعات البيانات.

يُعرف استخراج البيانات أيضًا باسم اكتشاف المعرفة في البيانات (KDD). كما ذكرنا أعلاه ، فهو مجال من مجالات علوم الكمبيوتر ، والذي يتعامل مع استخراج معلومات غير معروفة ومثيرة للاهتمام من البيانات الأولية.نظرًا للنمو الهائل للبيانات ، لا سيما في مجالات مثل الأعمال التجارية ، أصبح استخراج البيانات أداة مهمة للغاية لتحويل هذه الثروة الكبيرة من البيانات إلى ذكاء الأعمال ، حيث أصبح الاستخراج اليدوي للأنماط مستحيلًا على ما يبدو في العقود القليلة الماضية. على سبيل المثال ، يتم استخدامه حاليًا في العديد من التطبيقات مثل تحليل الشبكات الاجتماعية واكتشاف الاحتيال والتسويق. عادةً ما يتعامل التنقيب عن البيانات مع المهام الأربع التالية: التجميع والتصنيف والانحدار والارتباط. التجميع هو تحديد مجموعات مماثلة من البيانات غير المهيكلة. التصنيف هو قواعد التعلم التي يمكن تطبيقها على البيانات الجديدة وستتضمن عادةً الخطوات التالية: المعالجة المسبقة للبيانات ، وتصميم النمذجة ، واختيار التعلم / الميزة ، والتقييم / التحقق من الصحة. الانحدار هو العثور على وظائف بأقل قدر من الخطأ لنمذجة البيانات. والارتباط يبحث عن العلاقات بين المتغيرات. عادة ما يتم استخدام التنقيب عن البيانات للإجابة على أسئلة مثل ما هي المنتجات الرئيسية التي قد تساعد في تحقيق أرباح عالية العام المقبل في وول مارت؟

كما هو مذكور أعلاه ، يتم استخدام تخزين البيانات أيضًا لتحليل البيانات ، ولكن بواسطة مجموعات مختلفة من المستخدمين وهدف مختلف قليلاً في الاعتبار. على سبيل المثال ، عندما يتعلق الأمر بقطاع التجزئة ، يهتم مستخدمو تخزين البيانات بشكل أكبر بأنواع المشتريات الشائعة بين العملاء ، وبالتالي فإن نتائج التحليل يمكن أن تساعد العميل من خلال تحسين تجربة العميل. لكن معدني البيانات يخمنون أولاً فرضية مثل أي العملاء يشترون نوعًا معينًا من المنتجات ويحللون البيانات لاختبار الفرضية. يمكن أن يتم تخزين البيانات بواسطة بائع تجزئة كبير يخزن متاجره في البداية بنفس أحجام المنتجات ليكتشف لاحقًا أن متاجر نيويورك تبيع مخزونًا أصغر حجمًا بشكل أسرع من متاجر شيكاغو. لذلك ، من خلال النظر إلى هذه النتيجة ، يمكن لمتاجر التجزئة تخزين متجر نيويورك بأحجام أصغر مقارنة بمتاجر شيكاغو.

لذلك ، كما ترى بوضوح ، يبدو أن هذين النوعين من التحليل لهما نفس الطبيعة بالنسبة للعين المجردة.كلاهما قلق بشأن زيادة الأرباح بناءً على البيانات التاريخية. لكن بالطبع ، هناك اختلافات أساسية. بعبارات بسيطة ، يكرس التنقيب عن البيانات وتخزين البيانات لتقديم أنواع مختلفة من التحليلات ، ولكن بالتأكيد لأنواع مختلفة من المستخدمين. بعبارة أخرى ، يبحث استخراج البيانات عن الارتباطات والأنماط لدعم فرضية إحصائية. لكن ، تخزين البيانات يجيب على سؤال أوسع نسبيًا ويقوم بتقطيع البيانات من هناك فصاعدًا للتعرف على طرق التحسين في المستقبل.

موصى به: