العودة إلى المدونة
Machine Learning 29 يونيو 2026 12 min للقراءة

تحسين نموذج CNN-BiLSTM بالخوارزمية الجينية للتنبؤ بالناتج المحلي الإجمالي المغربي

نهج هجين يجمع بين شبكات CNN و BiLSTM، مُحسَّن بواسطة الخوارزمية الجينية، للتنبؤ بالناتج المحلي الإجمالي الحقيقي الفصلي للمغرب.

المؤلفون: سناء الحمياني، يوسف غانو، حميد خليفي، عزيز بوجدين

مقدمة وتحدي التنبؤ الاقتصادي

يعد التنبؤ الدقيق بنمو الناتج المحلي الإجمالي الحقيقي (GDP) ركيزة أساسية للنمذجة القياسية ورسم السياسات الاقتصادية والمالية. فهو يوفر لصناع القرار والمصارف المركزية والفاعلين في السوق رؤية واضحة حول اتجاه النمو الاقتصادي. ومع ذلك، تتسم السلاسل الزمنية الكلية بالتعقيد والديناميكية وعدم الخطية، فضلاً عن تأثرها الشديد بالصدمات الهيكلية الكبرى (مثل الأزمة المالية العالمية لعام 2008 وجائحة كوفيد-19).

تاريخياً، اعتمد التنبؤ الاقتصادي على النماذج الإحصائية الخطية التقليدية:

  • نموذج ARIMA (المتوسطات المتحركة التنازلية المتكاملة ذاتياً)
  • نموذج VAR (الانحدار الذاتي المتجه)

وعلى الرغم من بساطة هذه النماذج وقابليتها للتفسير، إلا أنها تفترض خطية واستقرار السلاسل الزمنية، مما يجعلها عاجزة عن التقاط العلاقات التفاعلية غير الخطية والمعقدة بين المؤشرات الاقتصادية الحديثة. ورغم أن خوارزميات تعلم الآلة (مثل الغابة العشوائية، وXGBoost) توفر مرونة أكبر، إلا أنها تواجه صعوبات في نمذجة الاعتماديات الزمنية طويلة المدى في البيانات التتابعية.

تقدم هذه الدراسة نموذجاً هجيناً يجمع بين الشبكات العصبية الالتفافية (CNN)  والشبكات العصبية ذات الذاكرة الطويلة قصيرة المدى ثنائية الاتجاه (BiLSTM)، ومحسناً بواسطة الخوارزمية الجينية (GA) للتنبؤ بالناتج المحلي الإجمالي الحقيقي الربع سنوي للمغرب.


منهجية العمل المقترحة

مخطط بياني: مخطط انسيابي لمنهجية عمل GA-CNN-BiLSTM المقترحة

GA-CNN-BiLSTM Flowchart

تتكون منهجية العمل في هذا البحث (GA-CNN-BiLSTM) من أربع مراحل رئيسية:

  1. اختيار الميزات: تحديد المتغيرات القطاعية الأكثر ملاءمة باستخدام معامل ارتباط سبيرمان والمعلومات المتبادلة (MI)، ثم ترتيب الأهمية باستخدام خوارزمية XGBoost وتفسيرها عبر قيم SHAP.
  2. الشبكة العصبية الهجينة: تستخرج طبقة CNN الأنماط المحلية والتقلبات الدورية قصيرة المدى، بينما تقوم طبقة BiLSTM بنمذجة الاعتماديات الزمنية طويلة المدى في الاتجاهين الأمامي والخلفي.
  3. الخوارزمية الجينية: تحسين متزامن لتسع معلمات فائقة، بما في ذلك نافذة الإزاحة الزمنية (Lag window)، ومرشحات الالتفاف، ووحدات الخلايا العصبية، ومعدلات الإسقاط (Dropout)، ومعدل التعلم، وحجم الدفعة.
  4. قياس عدم اليقين: استخدام طريقة Monte Carlo Dropout لإنشاء فترات تنبؤ قوية بدقة 95%.

اختيار المؤشرات والتفسير الاقتصادي باستخدام SHAP

لتجنب مشكلات التكرار والأبعاد العالية، قمنا بتطبيق عملية اختيار ميزات قوية على مرحلتين تشمل 15 مؤشراً اقتصادياً كلياً صادراً عن المندوبية السامية للتخطيط بالمغرب (من الربع الأول لعام 1980 إلى الربع الثالث لعام 2025):

  1. المرحلة الأولى (التصفية الأولية): استخدام ارتباط سبيرمان لتصفية الاتجاهات الخطية، والمعلومات المتبادلة (MI) لالتقاط العلاقات غير الخطية.
  2. المرحلة الثانية (XGBoost & SHAP): ترتيب أهمية الميزات باستخدام XGBoost وتفسير تأثيرها اقتصادياً باستخدام قيم SHAP.

الأهمية العالمية للميزات حسب تحليل SHAP

توضح نتائج تحليل SHAP ترتيب ومساهمة المؤشرات السبعة التي تم الاحتفاظ بها للتنبؤ بالناتج المحلي الإجمالي:

المؤشر الاقتصاديمتوسط قيمة SHAP المطلقةنسبة المساهمةالتفسير وال rationale الاقتصادي في السياق المغربي
الإدارة العامة والدفاع؛ الضمان الاجتماعي40,951.7353.29%الدور المهيمن للنفقات الحكومية، أجور الوظيفة العمومية، وشبكات الحماية الاجتماعية.
التعليم، الصحة وأنشطة العمل الاجتماعي13,494.7917.56%انعكاس مباشر للقيمة المضافة للخدمات غير التسويقية ودعم رأس المال البشري.
الضرائب الصافية من الإعانات7,263.549.45%المكون المالي المباشر في طريقة الإنتاج لاحتساب الناتج المحلي الإجمالي بأسعار السوق.
العقارات والخدمات المقدمة للشركات6,530.588.50%قطاعات ديناميكية رئيسية تدفع الخدمات التسويقية وتكوين رأس المال.
إنتاج وتوزيع الكهرباء والغاز والماء3,932.185.12%بنية تحتية حيوية تدعم الأنشطة الصناعية والاستهلاك المنزلي.
الصناعات التحويلية2,698.183.51%النواة الصناعية الوطنية، وتتأثر بشكل مباشر بالطلب المحلي والخارجي.
الفلاحة والغابات والصيد البحري1,975.882.57%قطاع متقلب تاريخياً بسبب الصدمات المناخية، ولكنه يظل هيكلياً للنمو.

معمارية النموذج الهجين GA-CNN-BiLSTM

تكمن قوة النموذج الهجين في التكامل بين آليتين مختلفتين:

  • طبقة الشبكة الالتفافية (CNN): لالتقاط الميزات المكانية والزمنية المحلية، وتقلبات الدورة الاقتصادية قصيرة المدى.
  • طبقة الشبكة ثنائية الاتجاه (BiLSTM): لمعالجة السلاسل الزمنية في الاتجاهين الأمامي والخلفي لالتقاط العلاقات طويلة المدى والتأثيرات المتأخرة للمؤشرات القطاعية.

تحسين المعلمات الفائقة بالخوارزمية الجينية

تتأثر نماذج التعلم العميق بشدة باختيار المعلمات الفائقة. لحل هذه المشكلة، تم استخدام الخوارزمية الجينية (GA) لتحسين 9 معلمات بشكل متزامن. وقبل بدء التحسين، تم إجراء بحث شبكي أولي لتحديد أفضل إعدادات للتحكم بالخوارزمية الجينية نفسها:

  • احتمال العبور ($cxpb = 0.7$)
  • احتمال الطفرة ($mutpb = 0.2$)
  • حجم التنافس ($tournsize = 3$)
  • عدد الأفراد = 20، عدد الأجيال = 30

وجاءت التهيئة المثلى التي توصلت إليها الخوارزمية الجينية كالتالي:

المعلمة الفائقةنطاق البحثالقيمة المثلى (GA)
نافذة الإزاحة الزمنية (Lags)[4, 6, 8, 10, 12, 14, 16]12 فصول ربع سنوية
عدد مرشحات CNN[10 - 150]83
حجم نواة CNN[3 - 7]5
حجم طبقة التجميع الأقصى[1 - 3]1
معدل إسقاط CNN[0.0 - 0.6]0.15
خلايا BiLSTM المستترة[10 - 150]137
معدل إسقاط BiLSTM[0.0 - 0.6]0.15
خلايا الطبقة الكثيفة[10 - 150]34
معدل التعلم[1e-5 - 1e-2]0.0068 (Adamax)

نتائج التجارب وأداء المقارنة

تم اختبار النموذج النهائي باستخدام استراتيجية النافذة المتوسعة (من الربع الرابع لعام 2018 إلى الربع الثالث لعام 2025). وسجل نموذج GA-CNN-BiLSTM تفوقاً كبيراً على نماذج تعلم الآلة والنماذج الإحصائية الأخرى:

مقاييس الأداء العامة للنماذج

النموذجمعامل التحديد $R^2$متوسط مربع الخطأ MSEمتوسط الخطأ المطلق MAEنسبة الخطأ المطلق المئوي MAPE
GA-CNN-BiLSTM0.98510.01490.00880.89%
BiLSTM0.97450.02550.00840.84%
CNN0.97300.02700.01191.25%
AdaBoost0.91810.08190.02162.18%
Lasso0.80620.19380.03153.09%
XGBoost0.72080.27920.04013.99%
VAR0.70550.29450.02912.92%
GRU0.70020.29980.02412.50%
Random Forest0.57800.42200.05245.20%

اختبار المتانة والصمود أثناء الصدمات الاقتصادية

لقياس مدى مرونة النموذج وصموده في أوقات الأزمات الكبرى، قمنا بمقارنة أداء GA-CNN-BiLSTM مع نموذج الانحدار الذاتي المتجه (VAR) الخطي في الفترات العادية وأثناء فترة صدمة كورونا:

الفترة الزمنيةالنموذج المستخدمنسبة الخطأ المئوية MAPEمتوسط الخطأ MAEمتوسط مربع الخطأ MSE
فترة الصدمةGA-CNN-BiLSTM1.63%0.03140.0040
VAR4.93%0.15220.0422
الفترة العاديةGA-CNN-BiLSTM0.68%0.01240.0002
VAR2.61%0.09280.0126

بالإضافة إلى ذلك، تم قياس عدم اليقين في التوقعات باستخدام طريقة Monte Carlo Dropout (إجراء 50 تكراراً عشوائياً عند الاستدلال)، مما وفر فترات تنبؤ بدقة 95%:

  • احتمالية تغطية فترة التنبؤ (PICP): 98.59%
  • متوسط عرض فترة التنبؤ (MPIW): 34,794.27
  • العرض المتوسط المنظم لفترة التنبؤ (PINAW): 0.2488

الاستنتاجات والتطلعات المستقبلية

تثبت هذه الدراسة أن دمج خصائص الالتفاف من شبكات CNN (لالتقاط ديناميكيات القطاعات المحلية) مع تتابعات شبكات BiLSTM (لالتقاط الاتجاهات طويلة المدى)، والمحسنة بالكامل بالخوارزمية الجينية، يقدم نموذجاً متطوراً وموثوقاً للتنبؤ بالناتج المحلي الإجمالي المغربي.

ويسهم دمج تحليل SHAP في ربط المخرجات المعقدة بالواقع الاقتصادي الفعلي للمندوبية السامية للتخطيط، مما يعزز الثقة والشفافية لدعم القرارات التنموية. ويمكن أن تشمل التطويرات المستقبلية مؤشرات عالية التردد (مثل استهلاك الكهرباء القطاعي وحركة السياحة الوافدة) لبناء نظام تنبؤ آني (Nowcasting) بالوقت الفعلي.

Deep LearningGenetic AlgorithmGDP ForecastingCNN-BiLSTMSHAP
Z

Zakaria Kassemi

مهندس ذكاء اصطناعي وأنظمة ML — المغرب