الفرق بين تعلم الآلة وعلم البيانات والذكاء الاصطناعي والتعلم العميق والإحصاء
كتابة: شفاء سعد
سنوضح في هذا المقال الأدوار المختلفة لعالم البيانات وكيف أن علم البيانات يتداخل مع مجالات أخرى كتعلم الآلة والتعلم العميق والذكاء الاصطناعي والإحصاء، وإنترنت الأشياء والرياضيات التطبيقية، وبما أن علم البيانات يعتبر من التخصصات العلمية المتوسعة، سنبدأ بالحديث عن التصنيفات المختلفة لعلماء البيانات التي قد نصادفها في مجالات العمل، وقد تكتشف أنت أيضًا أنك عالم بيانات وأنت لا تعلم.
وكما هو الحال في أي تخصص علمي، فإن علماء البيانات قد يقتبسون أساليبًا من التخصصات العلمية ذات العلاقة، على الرغم من أنهم لديهم أساليبهم، وخاصة الأساليب والخوارزمات التي تعنى بالتعامل مع مجموعات البيانات الكبيرة (datasets) غير المنظمة بشكل مؤتمت وبدون تدخل بشري، لإجراء التعاملات لحظيًا أو للتنبؤ.
سنوضح في هذا المقال الأدوار المختلفة لعالم البيانات وكيف أن علم البيانات يتداخل مع مجالات أخرى كتعلم الآلة والتعلم العميق والذكاء الاصطناعي والإحصاء، وإنترنت الأشياء والرياضيات التطبيقية، وبما أن علم البيانات يعتبر من التخصصات العلمية المتوسعة، سنبدأ بالحديث عن التصنيفات المختلفة لعلماء البيانات التي قد نصادفها في مجالات العمل، وقد تكتشف أنت أيضًا أنك عالم بيانات وأنت لا تعلم.
وكما هو الحال في أي تخصص علمي، فإن علماء البيانات قد يقتبسون أساليبًا من التخصصات العلمية ذات العلاقة، على الرغم من أنهم لديهم أساليبهم، وخاصة الأساليب والخوارزمات التي تعنى بالتعامل مع مجموعات البيانات الكبيرة (datasets) غير المنظمة بشكل مؤتمت وبدون تدخل بشري، لإجراء التعاملات لحظيًا أو للتنبؤ.
قادة التحليل: علم البيانات وتقنية المعلومات والأعمال، المهارات والأدوار والمسؤوليات
1- التصنيفات المختلفة لعلماء البيانات:
يُعرف علماء البيانات في نوعين، Type A حيث A ترمز للتحليلات بالانجليزية (Analytics) وهم النوع الأول، وعلماء البيانات Type B حيث B ترمز للبناة بالانجليزية (Builders):
أنواع علماء البيانات، النوع الأول والنوع الثاني
النوع الأول Type A:
يمكن لعالم البيانات من النوع الأول أن يكتب أكوادًا برمجية بشكل جيدٍ كفاية بما يخدمه للعمل مع البيانات، ولكنه ليس بالضرورة خبيرًا برمجيًا، وقد يكون عالم البيانات من النوع الأول خبيرًا في التصميم التجريبي، والتنبؤ، والنمذجة، والاستدلال الاحصائي، وأشياء أخرى يتم تدريسها عادةً في أقسام الإحصاء. بشكل عام، وعلى الرغم من ذلك، فإن المنتج الذي يعمل عليه عالم البيانات هذا ليس القيمة الاحتمالية (p-value) ومجال الثقة (confidence intervals) كما هو الحال في بعض الأحيان للإحصائيين التقليديين العاملين في صناعة الأدوية على سبيل المثال. يعرف علماء البيانات من النوع هذا بعدة مسميات في شركة جوجل، مثل الاحصائي أو المحلل الكمي أو محلل هندسة دعم القرار أو عالم بيانات، وربما تسميات أكثر من ذلك.
النوع الثاني Type B:
عالم البيانات من النوع الثاني يشترك مع النوع الأول في بعض الخلفيات الاحصائية، لكنهم أيضًا مبرمجون خبراء وقد يكونون مهندسي برمجيات متمكنين، يهتم عالم البيانات من هذا النوع بشكل رئيسي باستخدام البيانات في المنتج النهائي، حيث يبنون نماذج تنبؤية تتفاعل مع المستخدمين وغالبًا ما تقدم توصيات لمنتجات أو أشخاص قد تعرفهم أو إعلانات أو أفلام أو نتائج بحثٍ وغيرها، المصدر: هنا
وفي الشركات الناشئة، تجد أن علماء البيانات يرتدون عدة قبعات أو يقومون بعدة أدوار، كأن يكون تنفيذيًا أو منقب بيانات أو مهندس بيانات أو معماري أو باحث أو إحصائي أو مصمم النماذج (كما في النماذج التنبؤية) أو مبرمج.
في حين يتم تصوير عالم البيانات بشكل عام على أنه مبرمج خبير في لغة R و Python و SQL و Hadoop والإحصاء ، فإن هذا هو مجرد غيض من فيض، تمامًا مثلما يمكن لفني المختبر أن يطلق على نفسه أنه عالمٌ فيزيائي، بينما الفيزيائي الحقيقي هو أكثر من ذلك بكثير، وتتنوع مجالات خبرته في علم الفلك، والفيزياء الرياضية، والفيزياء النووية وغيرها الكثير، ويمكن قول الشيء نفسه عن علماء البيانات، فالمجالات متنوعة مثل المعلوماتية الحيوية وتكنولوجيا المعلومات والمحاكاة ومراقبة الجودة والتمويل الحسابي وعلم الأوبئة والهندسة الصناعية وحتى نظرية الأعداد.
2- تعلم الآلة والتعلم العميق:
قبل التعمق في الرابط بين علوم البيانات وتعلم الآلة، سنناقش باختصار تعلم الآلة والتعلم العميق، تعلم الآلة هو مجموعة من الخوارزمات التي تتدرب على مجموعة بيانات لإجراء تنبؤات أو اتخاذ إجراءات لتحسين بعض الأنظمة. على سبيل المثال، بناءً على بيانات سابقة للعملاء، يتم استخدام خوارزمات التصنيف الموجهة لتصنيف العملاء المحتملين إلى تصنيف جيد أو سيئ لأغراض القروض. تتنوع التقنيات المستخدمة في مهمة معينة (مثل التجميع الموجّه): آلة المتجهات الداعمة (SVM)، وبايز البسيط (Naive Bayes)، والشبكات العصبية (Neural Nets)، والتجميعات (Ensembles)، وقواعد الارتباط (Association Rules)، وأشجار القرار (Decision Trees)، والانحدار اللوجستي (Logistic Regression)، أو مزيج من عدة تقنيات.
كل هذا هو مجموعة فرعية من علوم البيانات، يطلق عليه الذكاء الاصطناعي وبشكل أكثر تحديدًا التعلم العميق، عندما تكون هذه الخوارزمات مؤتمتة، كما هو الحال في قيادة الطائرات الآلية أو السيارات ذاتية القيادة. اضغط هنا لمقال آخر يقارن بين تعلم الآلة والتعلم العميق، ويطلق عليه تعلم الآلة أو التعلم العميق المبني على إنترنت الأشياء إذا كانت البيانات التي تم جمعها تأتي من أجهزة استشعار وتم نقلها عبر الإنترنت.
العلاقة بين الذكاء الاصطناعي وتعلم الآلة والتعلم العميق
بعض الناس لديهم تعريف مختلف للتعلم العميق، يعتبرون التعلم العميق بمثابة شبكات عصبية (أحد تقنيات تعلم الآلة) مع طبقة أعمق. تم طرح السؤال في موقع Quora مؤخرًا، وفيما يلي شرح أكثر تفصيلاً:
- AI (الذكاء الاصطناعي) هو مجال فرعي في علوم الحاسب، تم تأسيسه في الستينيات، وكان يركز على حل المهام التي تعتبر سهلة بالنسبة للإنسان ولكنها صعبة على أجهزة الكمبيوتر، أي نظامًا يمكنه القيام بأي شيء يمكن للإنسان (ربما باستثناء الأمور المادية البحتة)، هذا بشكل عام. ويتضمن جميع أنواع المهام، مثل التخطيط، والتنقل في جميع أنحاء العالم والتعرف على الأشياء والأصوات، والتحدث، والترجمة، وإجراء المعاملات الاجتماعية أو التجارية، والعمل الإبداعي (صناعة الفن أو الشعر)، إلخ.
- NLP (معالجة اللغات الطبيعية) هو ببساطة الجزء الذي يعنى باللغة (المكتوبة غالبًا) في الذكاء الاصطناعي.
- يعنى تعلم الآلة بالنظر إلى بعض المسائل مثل تحديد ما هو الإجراء الصحيح من بين مجموعة معينة من الإجراءات، مع إعطاء الكثير من المعلومات حول العالم المحيط ، وعادة ما تكون هناك حاجة إلى بعض العمليات الخارجية للحكم على ما إذا كان الإجراء صحيحًا أم لا. من الناحية الرياضية، يمكننا القول أنها دالة، تستقبل بعض المدخلات، وتعمل على حساب المخرجات الصحيحة، لذا فإن المشكلة الفعلية هي ببساطة بناء نموذج لهذه الدالة الرياضية بطريقة مؤتمتة.
- لتمييز تعلم الآلة عن الذكاء الاصطناعي، يمكننا القول بأنه إذا كان بإمكاني كتابة برنامج ذكي للغاية وله سلوك شبيه بالإنسان، فيمكن أن يكون ذكاءً اصطناعيًا، ولكن إن لم يتمكن هذا البرنامج من تعلم وإيجاد مدخلاته تلقائيًا من البيانات، فعندها لا يمكننا القول أنه برنامج تعلم الآلة.
- التعلم العميق هو أحد أنواع تعلم الآلة الذي يحظى بشعبية كبيرة الآن، يتضمن نوعًا معينًا من النماذج الرياضية الذي يمكن اعتباره تركيب مكون من عدة أجزاء (دالة مركبة)، وحيث يمكن تعديل بعض هذه الأجزاء للتنبؤ بالنتيجة النهائية بشكل أفضل.
3- علم البيانات وتعلم الآلة:
يعد تعلم الآلة والإحصاء جزءًا من علم البيانات، تعني كلمة "تعلم" في تعلم الآلة أن الخوارزمات تعتمد على بعض البيانات المستخدمة كمجموعة تدريب لضبط بعض مدخلات النموذج أو الخوارزمية. يشمل هذا العديد من التقنيات مثل الانحدار أو بايز البسيط أو التجميع الموجّه، ولكن ليست كل التقنيات تناسب هذه الفئة، على سبيل المثال، يهدف التجميع غير الموجّه -أسلوب في علم الإحصاء والبيانات- إلى الكشف عن التجميعات وهياكل التجميع دون أي معرفة مسبقة أو حتى وجود مجموعة تدريب لمساعدة خوارزمية التصنيف، ونحتاج في هذا لأن يقوم الانسان بإضافة التصنيف للتجميعات الموجودة، وبعض الأساليب تعتبر هجينة، مثل التصنيف شبه الموجّه، مثل بعض أساليب الكشف عن الأنماط أو تقدير الكثافة.
العلاقة بين علم البيانات وبين الذكاء الاصطناعي، وتعلم الآلة، والتعلم العميق
علم البيانات هو أكبر وأعمق بكثير من تعلم الآلة، فالبيانات في علم البيانات قد تجمع عن طريق الآلة أو بشكل مؤتمت، وقد لا يكون ذلك (تجمع عن طريق المسح اليدوي مثل التجارب السريرية)، وقد لا يكون لها علاقة بالتعلم كما ناقشنا للتو، لكن الاختلاف الرئيسي هو حقيقة أن علم البيانات يغطي كامل طيف معالجة البيانات، وليس فقط الخوارزمات أو الجوانب الإحصائية، وعلى وجه الخصوص يغطي علم البيانات أيضًا:
- تكامل البيانات
- العمارة الحاسوبية الموزعة
- تعلم الآلة المؤتمت.
- تمثيل البيانات.
- لوحات البيانات وذكاء الأعمال.
- هندسة البيانات.
- الإطلاق للأنظمة في وضع الإنتاج (production mode).
- القرارات المؤتمتة المبنية على البيانات.
تعليقات
إرسال تعليق