Thursday 28th of March 2024 Sahafi.jo | Ammanxchange.com

المواضيع الأكثر قراءة

 
  • آخر تحديث
    11-Mar-2020

جرار يدعو إلى حوسبة المزيد من المعرفة باللغة العربية

 بترا

نبه أستاذ الذكاء الاصطناعي وحوسبة اللغة في جامعة بيرزيت الدكتور مصطفى جرار، إلى أن المادة العربية في قواعد البيانات والقواعد الحاسوبية على شبكة الانترنت ما زالت ضعيفة عالميا.
 
وفي محاضرة القاها بعنوان «تجربة بناء أضخم قاعدة بيانات لغوية في تاريخ اللغة العربية»، مساء أول من أمس في منتدى عبد الحميد شومان الثقافي بعمان، دعا جرار إلى ضخ المزيد من نتاجاتنا المعرفية والعقلية والفكرية والعلمية المتعقلة باللغة العربية في الحاسوب؛ لتوفير فضاء معرفي حقيقي متاح للجميع، معتبرا ان هذا الامر يعد واجبا قوميا ومعرفيا لتطور اللغة ومواكبتها للعصر وتعزيزا لحضورها في المشهد المعرفي العالمي.
 
واستعرض في المحاضرة التي أدارها أمين عام مجمع اللغة العربية الدكتور محمد السعودي، الجهود المبذولة في جامعة بيرزيت من أجل حوسبة اللغة العربية، وإثراء المحتوى الرقمي باللغة العربية عبر شبكة الانترنت.
 
وأشار جرار إلى إن الجامعة تستخدم محركات «البحث المعجمي»، و"الانطولوجيا العربية»، و"كراس اللهجة العامية الفلسطينية»، وهي متاحة جميعها لاستخدام الباحثين والجمهور مجاناً عبر موقع الجامعة الإلكتروني، مبينا أن «محرك البحث المعجمي» لجامعة بيرزيت الأول من نوعه في العالم ليس فقط على مستوى اللغة العربية، بل على مستوى جميع اللغات المستخدمة عبر شبكة الانترنت.
 
واوضح ان قاعدة بيانات المحرك تتضمن حوسبة (150) معجما عربيا مختلفا، سواء المعاجم اللغوية العامّة التراثية والحديثة، أو المعاجم العلمية المتخصصة في مختلف مجالات العلوم التطبيقية والإنسانية.
 
ويوفر المحرك، بحسب جرار، ترجمة دقيقة بالعربية للمصطلحات والألفاظ الأجنبية، وبما يتجاوز الأخطاء والمغالطات الكثيرة التي تعتري ترجمات محركات البحث شائعة الاستخدام مثل محرّك (جوجل ترانزليت)، حيث تعتمد المحركات على غرار (جوجل) ما يسمى «الترجمة الإحصائية» لمعاني المفردات والكلمات، وليس الترجمة «المعجمية» المنضبطة، كما في محرك جامعة بيرزيت.
 
وسلط جرار، الفائز بجائزة عبد الحميد شومان للباحثين العرب لدورة العام 2019- حقل العلوم التكنولوجية والزراعية (حوسبة اللغة العربية)، الضوء على منهجيات جديدة لتوصيف اللغة العربية من أجل النهوض بها لمواكبة عصر المعرفة والذكاء الاصطناعي.
 
واستعرض أضخم قاعدة بيانات لغوية في تاريخ اللغة العربية؛ وهي شبكة لغوية شاملة تحتوي على جميع المستويات التصريفية، والاشتقاقية، والدلالية، والأنطولوجيا، والعامية، بشكل مترابط، إضافةً لربطها بشبكات لغوية أجنبية.
 
ولفت جرار إلى أن زيادة الاهتمام بالمصادر اللغوية كـ(معاجم، مكانز، مسارد، أنطولوجيات..)، يأتي بهدف بناء تطبيقات حاسوبية، مثل: الترجمة الآلية، استرجاع البيانات بأكثر من لغة، فهم وتحليل النصوص المكتوبة والمنطوقة، التحدث مع الآلة، عازيا عدم دعم التطبيقات الحديثة للغة العربية، إلى شح المصادر اللغوية العربية المحوسبة، إذ لا يوجد قائمة بجميع المدخلات العربية، كما لا يوجد مصادر لغوية حديثة.
 
وقال المحاضر،إن جامعة بيرزيت ساهمت في جمع ورقمنة وتنقيح ودمج وتوحيد المصادر اللغوية، وإتاحتها للجمهور العربي والباحثين ومتعلمي اللغة العربية، ومطوري التطبيقات عبر واجهات برمجية (APIs).
 
وبشأن محرك «الانطولوجيا العربية»، بين جرار أنه يهدف إلى ضبط فوضى التعريفات والدلالات والمفاهيم في اللغة العربية، والتي تعتري حتى النقاشات العلمية والأكاديمية المتخصصة، فيما يستعير المحرك ذاته مفهوم «الانطولوجيا» من الفلسفة، والذي يعني «علم الوجود»، أو علم «ماهية الأشياء»، كما تشير إليه المصادر التراثية العربية.
 
لكن محرك «كراس»، يأتي، وفقا لجرار، استجابة لحقيقة واقعية مفادها أن نسبة كبيرة من المحتوى العربي عبر شبكة الانترنت مكتوب باللهجات العامية، ولعدم قدرة محركات البحث وأجهزة الحاسوب على التعرّف على هذه اللهجات. وكان الدكتور السعودي أكد في معرض تقديمه للمحاضر أهمية حوسبة اللغة العربية من خلال مشروعات ضخمة تعيد لها مكانتها من جديد، وإيجاد مرجعية متخصصة لمأسسة ومراقبة آليات عمل مراكز تعليم اللغة العربية لغير الناطقين بها.