المهارات الرقمية11 فصل ثاني

الحادي عشر خطة جديدة

icon

تعلم الآلة

ظهر مصطلح تعلم الآلة  اول مرة من خلال شخص امريكي يدعى آرثر صموئيل  كان يعمل في شركة IBMعام  1959.

ويمكن تعريف مفهوم تعلم الآلة على انه احد فروع الذكاء الاصطناعي الذي يهتم بتصميم وتطوير الخوازميات والتقنيات المختلفة تلك التي تسمح لجهاز الكمبيوتر بالقيام بعملية التعلم.

ويعتمد تعلم الآلة على على توافر كم هائل من البيانات ،و هذه البيانات تتوفر الآن بشكل كبير نتيجة تولدها بسب الانتشار الكبير للاجهزة الرقمية والتطبيقات الالكترونية.

وعملية التعلم هذه لا تكون محددة بمهمات معينة،وانما من خلال تعرض النظام لعدد كبير من الحالات والامثلة التي تعمل على تحسين الاداء عند اتخاذ القرار.

ومن الأمثلة على برامج تعلم الآلة البرنامج الذي يقوم بتصنيف الإيميلات الإلكترونية،حيث يتم تصنيفها في مجلدات خاصة : مجلد الايميلات المرغوبة (Regular Emails) ومجلد الايميلات غير المرغوبة (Spam Emails) .

 

متطلبات بناء نموذج التعلم الآلي:

حتى نستطيع تطوير نموذج التعلم الآلي ونضمن فعاليته،يجب توفر كل مما يلي:

البيانات الضخمة (Big Data)

حتى يستطيع نموذج التعلم الآلي القيام بما هو مطلوب منه،لا بدّ من توافر كميات ضخمة من البيانات مرتبطة بالمشكلة المراد حلها،ومن الصفات الواجب توفرها في هذه البيانات:

  • أن تكون ذات معلومات دقيقة
  • أن تكون خالية من الاخطاء
  • أن تكون متنوعة ومرتبطة بالمشكلة
  • ان يتم تنظيفها وتقسيمها بشكل صحيح 

 

الخصائص (Features)

يشير مصطلح خصائص البيانات الى السمات التي تحدد مجموعة بيانات والتي تساعد في تحديد طبيعة وسلوك هذه البيانات.وتعتبر خاصية مهمة لأانها توفر المعلومات اللازمة لفهم البيانات ومعالجتها بشكل فعال. ويطلق عليها أحيانا مصطلح المتغيرات.

على سبيل المثال: في جدول معلومات العملاء،تمثل الصفوف سجلات كل سجل يعبر عن بيانات عميل، ومن السمات المرتبطة في هذا العميل: الإسم ،العمر،الجنس، سجل الشراء،...

وكل خاصية من هذه الخصائص ممكن ان يكون لها أثر على نتائج تعلم الآلة حسب المشكلة المراد حلها.

 

خوارزميات تعلم الآلة (Algorithms)

بما انه توافر لدينا الكم الهائل من البيانات الصحيحة  وقمنا بتحديد الخصائص المراد التعامل معها، لا بدّ من توافر خوارزمية تقوم  بدراسة هذه البيانات وتحليلها واستخلاص الأنماط والتنبؤات منها لغايات اتخاذ القرار المناسب لحل المشكلة. وتذكر دوماً يجب اختيار الخوارزمية الانسب لحل المشكلة بشكل فعال.
 

اجهزة فائقة السرعة والذاكرة
إن كل ما سبق من توافر البيانات وتنظيمها ومعالجتها  وتحليلها من خلال الخوارزميات المحددة لا يستطيع العمل بكفاءة عالية واعطاء النتائج المطلوبة ما لم يتوفرأجهزة حاسوب ومصادر تقنية تمتلك قدرات عالية في معالجة البيانات من ناحية السرعة وحجم الذاكرة لديها.

 

 

وفيما يلي رسم توضيحي يمثل ما تم شرحه سابقا من متطلبات لبناء نموذج التعلم الآلي، والذي لا بد من :

  • تقييمه بشكل مستمر
  • مراقبة أداؤه والعمل على تحسين هذا الاداء
  • القيام بنشره في البيئة الحقيقية
  • مراقبة فعالية الاداء لديه في بيئة الانتاج

اجهزة فائقة السرعة

أنواع خوارزميات التعلّم الآلي

 

سبق وتعلمنا في الصفوف السابقة عن مفهوم الخوارزمية ، وتم تعريف خوارزمية التعلم الآلي على انها  مجموعة من القواعد أو العمليات التي يستخدمها نظام الذكاء الاصطناعي لتنفيذ المهام لغايات إكتشاف رؤى وأنماط جديدة للبيانات، أو للتنبؤ بقيم المخرجات من مجموعة معينة من متغيرات الإدخال.

وتم تصنيف هذه الخوارزميات الى عدة فئات حسب طبيعة التعلم التي تقوم بها وآلية عمل الخوارزمية كما يلي:


التعلم الالي

 
وسوف نقوم بتوضيح كل نوع من هذه الخوارزميات على حدا:

1.التعلّم الخاضع للإشراف (Supervised Learning)

المقصود بخوارزميات التعلم الخاضع للإشراف هي الخوارزميات التي تتعلم من بيانات التدريب المصنفة لغايات القيام بالتنبؤ بنتائج البيانات غير المتوقعة.

إذ تحتوي مجموعات البيانات على مدخلات ومخرجات صحيحة تساعد النموذج على التعلم بشكل أسرع.

لناخذ مثالاً:

على فرض نريد تدريب الآلة للمساعدة على التنبؤ بالوقت الذي تحتاجه  لغايات الذهاب من المنزل الى المدرسة، هنا، عليك أن تبدأ بجمع مجموعة من البيانات المصنفة والتي تتضمن:

  • احوال الطقس
  • وقت خروجك من المنزل
  • أيام العطل والاجازات
  • ساعات الإزدحام
  • المسافة من البيت الى المدرسة

كل مما سبق يعتبر  مدخلات في مثال التعلم الخاضع للإشراف والمخرج لدينا  هو مقدار الوقت الذي الذي تحتاجه في الذهاب من المنزل الى المدرسة في اليوم المحدد.

يمكن تصنيف نماذج التعلم الخاضع للإشراف الى فئتين حسب طبيعة المعلومات الموجودة بالوسم (الهدف) هما: نماذج التصنيف ونماذج الإنحدار.

وحتى نستطيع فهم كل صنف، دعنا اولاً ننظر الى المثال في الصورة التالية:


رسم بياني التعلم الالي

كما نرى،يوجد مجموعة من البيانات الخاضعة للأشراف تم تقسيمها في صفوف وأعمدة،حيث

الأعمدة تمثل سمات وخصائص مختلفة

الصفوف تمثل الملاحظات أو العينات

والوسم عبارة عن متغير ممكن أن يكون رقماً او فئة (الهدف)

 

أولاً:نماذج التصنيف

في حال نماذج التصنيف ،يأخذ الوسم قيما محددة (Discrete Values) مثل مريض أو غير مريض، أيميل مرغوب،إيميل غير مرغوب.

ويرتبط نوع التصنيف بعدد الاوسمة :

1.التصنيف الثنائي: يكون عدد الاوسمة فيه اثنان فقط (مثال تشخيص الحيوانات الى واحد من نوعين:قط أم كلب)

2.التصنيف متعدد الفئات (تصنيف الحيوانات الى أنواع متعددة)

ومن الامثلة على نماذج التعلم الخاضع للإشراف من نوع نماذج التصنيف:

اشجار القرار

 

 

ثانياً.نماذج الإنحدار

وفي حال نماذج الإنحدار ياخذ الوسم قيماً مستمرة (Continuous Values) والتي تتغير فيها القيمة اعتماداً على عوامل أخرى. مثل تحديد سعر منزل،السعر يتغير حسب الفترة الزمنية للبيع، حسب سعر قطعة الأرض في المكان، حسب درجة حرارة المكان.

ومن الامثلة على نماذج التعلم الخاضع للإشراف من نوع نماذج الإنحدار:

الانحدار الخطي

الانحدار اللوجيستي

 

 

2. التعلّم غير الخاضع للإشراف (Unsupervised Learning)

 هو أسلوب للتعلم الآلي، حيث لا تحتاج إلى الإشراف على النموذج. بدلاً من ذلك، تحتاج إلى السماح للنموذج بالعمل من تلقاء نفسه لاكتشاف المعلومات. وهو يتعامل بشكل رئيسي مع البيانات غير المسماة (دون وسم).

 وهو يهدف الى فهم العلاقات الداخلية للبيانات و الاستفادة من هذه البيانات غير المهيكلة أو غير الموسومة والتي تحتاج عملية هيكلتها ووسمها الى جهد بشري كبير جداً.

والشكل التالي يوضح مثالا لعملية تعلم آلي غير خاضع للإشراف:

تعلم غير خاضع لاشراف

حيث تظهر المدخلات على شكل بيانات خام (Raw Data) لم يتم تصنيفها أو وسمها باسم معين ولا يُعرف عنها معلومات مسبقة.

يقوم التعلم الآلي غير الخاضع للأشراف بإجراء

  • دراسة للأنماط وعمليات تفسير واستنتاجات
  • يتم اخضاع هذه البيانات الى خوارزمية محددة  واجراء عمليات المعالجة المطلوبة 
  • الحصول على نموذج مدرب يستطيع حل المشكلة واخراج النتائج.

 

وهناك ثلاث انواع من خوارزميات التعلم غير الخاضع للإشراف هم:

  • التجميع والتي تعمل على تجميع البيانات بناءً على التشابه فيما بينها، حيث يتم تقسبم البيانات الى مجموعات متشابه كل مجموعة تسمى (Clusters).

ومن فوائد هذا النوع من الخوارزميات:

  • المساعدة في تحليل البيانات
  • المساعدة في تصميم أنظمة التوصية (إعطاء نصيحة وتوصية حول الامر)
  • تساعد في عمل محركات البحث
  • تسهل عمليات وسم كميات كبيرة من المعلومات

والصورة التالية توضح المفهوم  

التجميع

  • تقليل الأبعاد: ويعمل هذا النوع من الخوارزميات على تبسيط ما لدينا من بيانات من خلال التقليل من أعداد المتغيرات  العشوائية مع  المحافظة على أكبر قدر ممكن من المعلومات. والمقصود بالمتغيرات الخصائص التي تمثل البيانات،حيث يتم استخلاص الخصائص الأكثر فائدة لغايات تسهيل فهمها والتعامل معها.

         

تقليل الابعاد

  حسب الشكل في الصورة :قامت الخوارزمية بتقسيم البيانات من الفضاء عالي الأبعاد (حيث توجد كل البيانات) الى أكثر من فضاء فرعي ،معتمدة في كل مرة على اختيار مجموعة ذات لون واحد داخل عنقود وبقية البيانات في الطرف الاخر.

 

  • إكتشاف القيم المتطرفة أو الشاذة

تهدف هذه الخوارزمية الى معرفة القيم المتطرفة (البعيدة عن معدل باقي القيم)،أي انها نوحي بانها ليست من ضمن المجموعة، مثل العينات التي يكون فيها عيوب .

ثم تقوم على تنقية البيانات من هذه القيم المتطرفة لأنها ممكن أن تؤدي الى نتائج غير حقيقية أو تؤثر على جودة المنتج.

وهذا النوع من الخوارزميات يساعد في كشف عمليات الاحتيال خاصة عند ملاحظة تصرفات غير معتادة .

 اكتشاف القيم

 

3. التعلّم المعزّز (Reinforcement Learning)

في هذا الأسلوب للتعلم الآلي ،يتم اتخاذ القرارات اعتماداً على التجربة من خلال (المحاولة والخطأ).

اذا لا يتم تزويد النموذج بكمية من البيانات الثابتة ليتعلمها،وإنما يسمح له بالتفاعل مع البيئة.

حيث ان هذه الخوارزميات في هذا النموذج تستخدم نموذج (الثواب والعقاب) في معالجة البيانات. بحيث يمكن تحسين سلوك العميل اعتمادا على ما يتم منحه من مكافآت (الثواب) أو ايقاع العقوبات عليه (العقاب).

حيث يراقب العميل البيئة عن طريق مجموعة من المستشعرات مثل الكاميرات وأجهزة الاستشعار ، وتتمثل أفعاله في إرسال إشارات لتفعيل المحركات. وقد يُبرمجُ ليحصل على مكافآت إيجابية كلما اقترب من الوجهة المستهدفة، ومكافآت سلبية كلما أضاع الوقت أو اتجه في الاتجاه الخطأ. وتعمل على التعلم من تلقاء نفسها حول أفضل مسار تتخذه.

 

 

خطوات بناء نموذج تعلّم الآلة

هناك خطوات قياسية علينا اتباعها عند البدء في بناء نموذج التعلم الآلي تتمثل في الرسم التالي:

 

وفيما يلي شرح حول كل خطوة من الخطوات الواردة في الشكل بالاعلى:

1.تحديد المشكلة

عادة يبدأ البحث عن الحلول عند وجود مشكلة معينة،لذا،لا بد من تحديد المشكلة وفهمها لغايات معرفة كيفية التوجه باختيار الحل المقترح والتقنيات المراد استعمالها لغايات حل المشكلة. وهناك عدد من الأسئلة يجب طرحها:

  •  ما نوع المشكلة التي نحاول حلها؟
  • ما هي مصادر البيانات الموجودة بالفعل؟
  • ما هي مخاوف الخصوصية الموجودة؟
  • هل البيانات عامة؟
  • أين يجب أن نخزن الملفات؟

 

2.جمع البيانات

فعلياً،تعتبر هذه الخطوة الخطوة الأولية من خطوات بناء نموذج تعلم الآلة. ويعود السبب في ذلك لأن حجم البيانات ونوعيتها هي التي تحدد كفاءة النموذج وفاعليته.

ولنتذكر دوماً: بأن طبيعة البيانات تختلف باختلاف المشكلة المراد حلها.

مثال(1): المشكلة هي توقع سعر سيارة

البيانات المطلوبة: نوع السيارة، طراز السيارة،حجمها،لونها،تاريخ الصنع،وغيره من الخصائص المرتبطة بالسيارات.

مثال(2): المشكلة:توقع سعر منزل في الأردن

البيانات المطلوبة:منطقة المنزل،مساحة الأرض،مساحة البناء،عدد الطوابق،نوعية الحجر المستخدم،عمر البناء، وغيرها من الخصائص المرتبطة بالمنزل.

3.استكشاف البيانات

يعد استكشاف البيانات مرحلة حاسمة في تحليل البيانات، حيث تعتبر هذه الخطوة  ضرورية لفهم البنية الأساسية للبيانات، واكتشاف الأنماط والاتجاهات والشذوذ والتي يمكن أن تؤثر بشكل كبير على اتجاه التحليلات اللاحقة . وتشمل عملية استكشاف البيانات:

4.تجهيز البيانات

هو عملية إعداد البيانات حتى تصبح البيانات جاهزة للاستخدام من قبل خوارزميات التعلم الآلي وعملية تجهيز البيانات تضمن ما يلي:

تنظيف البيانات: وهي هي عملية تصحح الأخطاء وإزالة القيم المفقودة وتحديد القيم المتطرفة وإزالتها وتعديلها.

تحويل البيانات: تحويل البيانات الى الشكل الذي يمكن للنموذج التعامل معه من خلال عمليات الترميز والتمثيل الرقمي.

تقسيم البيانات: ويقصد بها توزيع البيانات الى مجموعات لغايات تقييم اداء النموذج بالشكل الصحيح،وتشمل هذه المجموعات :

ويجب مراعاة نسب تقسيم البيانات (والذي يعتمد على الحجم الإجمالي للبيانات)  على النحو التالي:

80% مجموعات تدريب مقابل 20% مجموعات تقييم

أو

70% مجموعات تدريب مقابل 30% مجموعات تقييم

 

5.اختيار النموذج

و المقصود بها عملية اختيار خوارزمية مناسبة أو بنية نموذجية لمهمة معينة. يعتمد الاختيار على طبيعة المشكلة والبيانات المتاحة والنتيجة المرجو تحقيقها.

فمثلاً هناك خوارزميات تستخدم في حال كانت البينات المتوفرة على شكل صور، وهناك خوارزميات للنصوص،وأخرى للأصوات وغيرها للبيانات الرقمية.

وعادة يتم تجريب أكثر من خوارزمية ومن ثم اختيار الخوارزمية التي تعطي أفضل النتائج.

 

6.التدريب

وتمثل هذه الخطوة المرحلة  التي يتم فيها تدريب النموذج المحدد على مجموعة البيانات المعدة. بحيث يتعلم النموذج الأنماط والعلاقات في البيانات أثناء التدريب، ويقوم بتمثيلها بنموذج رياضي.

ولنتذكر دوماً : إذا كانت بيانات التدريب تشبه إلى حد كبير مشاكل العالم الحقيقي التي سيُكلف بها النموذج بحلها، فإن تعلم أنماطها وارتباطاتها سيمكّن النموذج المدرب من إجراء تنبؤات دقيقة على البيانات الجديدة .

 

7.تقييم النموذج

وهي العملية التي من خلالها يتم حساب مجموعة من مقاييس تقييم الأداء والتي تُبرهن على وصول النموذج المُتعلم إلى درجة جيدة من التعلم  بحيث  أصبح يُمكن الاعتماد عليه واستخدامه في حل  مسألة أو مشكلة ما.

وتتم هذه العملية من خلال الخطوات التالية:

 

8.تطبيق النموذج

وهي عملية استخدام النموذج الذي تم تدريبه سابقا  (من خلال بيانات مجموعة التدريب) على  بيانات مجموعة الاختبار

9.حساب المقاييس

ويقصد بها عملية مقارنة النتائج المتوقعة مع النتائج الفعلية وذلك من خلال تجريب النموذج على المجموعة الثالثة من البيانات وهي (مجموعة التحقق) وذلك لغايات التأكد من دقة اداء النموذج وقابيلته للاستخدام في العالم الواقعي.

 

10.تحسين النموذج

نحتاج الى هذه الخطوة لغايات العمل على تحسين أداء النموذج بقدر الإمكان، وذلك من خلال إعادة ضبط المعاملات التي تدرب عليها النموذج سابقاً. وكلما تم تغير أحد المعاملات سوف تتغير دقة النتائج، وهكذا حتى نحصل على الشكل الذي نرضاه.

 

11.نشر النموذج

وهنا تاتي الخطوة الآخيرة بعد الانتهاء من جميع الخطوات السابقة، حيث يصبح النموذج متاحاً للإستعمال بعد عملية تثبيته على الخوادم (servers) ونشره للعالم  من خلال تطبيق معين أو موقع إالكتروني.

ولنتذكر دوماً : حتة بعد عملية النشر، يتم مراقبة اداء النموذج باستمرار للتأكد من أدائه السليم والعمل على إجراء الصيانة اللازمة للخوادم الخاصة به.

ومع مرور الوقت،ممكن إعادة تدريب النموذج من خلال خوارزميات أحدث وبيانات جديدة لغايات الحصول على نتائج أفضل.

 

أدوات بناء نموذج التعلّم الآلي

مع تزايد اعتماد تعلم الآلة، ظهرت أدوات برمجية متخصصة لدعم جوانب مختلفة من دورة حياة التعلم الآلي. حيث هناك العديد من الاداوات التي ممكن توظيفها في بناء نماذج التعلم الآلي. وتنقسم هذه الاداوات الى قسمين هما:

 

Jo Academy Logo