الثورة اللغوية في مجال البحث العلمي:
يواجه التقدم العلمي عقبة رئيسية تتمثل في فائض المعلومات. أدى النمو المتفجر للمواد والبيانات العلمية إلى صعوبة متزايدة في اكتشاف رؤى مفيدة وسط كمية هائلة من المعلومات. يتم الوصول إلى المعرفة العلمية اليوم من خلال محركات البحث، لكنها غير قادرة على تنظيم المعرفة العلمية بمفردها.
في هذه المقالة، نتطرق إلى Galactica: نموذج لغوي كبير قادر على تخزين المعرفة العلمية ودمجها واستنتاجها. Galactica يتم تدريبه على مجموعة علمية ضخمة من الأوراق والمراجع وقواعد المعرفة والعديد من المصادر الأخرى.
يتفوق Galactica على النماذج الحالية في مجموعة من المهام العلمية. على سبيل المثال، في اختبارات المعرفة التقنية مثل معادلات لاتيكس، يتفوق Galactica على أحدث إصدار من GPT-3 بنسبة 68.2٪ مقابل 49.0٪. كما يقدم Galactica أداءً جيدًا في الاستنتاج، حيث يتفوق على Chinchilla في اختبار MMLU الرياضي بنسبة 41.3٪ مقابل 35.7٪، و PaLM 540B في اختبار MATH بدرجة 20.4٪ مقابل 8.8٪. كما أنه يحقق أفضل نتيجة حتى الآن على المهام الفرعية مثل PubMedQA و MedMCQA dev بنسبة 77.6٪ و 52.9٪ على التوالي. وعلى الرغم من عدم تدريبه على مجموعة عامة، يتفوق Galactica على BLOOM و OPT-175B في اختبار BIG-bench.
نعتقد أن هذه النتائج توضح إمكانات النماذج اللغوية كواجهة جديدة للعلوم. لذلك قمنا بإتاحة النموذج مفتوح المصدر لصالح المجتمع العلمي.
لكن إلى جانب هذه المزايا، هناك تحديات تواجه Galactica. فقد أزالت الشركة المطورة له العرض التوضيحي للجمهور بسبب ميل النماذج اللغوية الكبيرة مثل Galactica إلى توليد مخرجات غير دقيقة وغير موثوقة، حتى مع تدريبها على بيانات علمية وأكاديمية عالية الجودة. إن فهم الجمهور للقوة والضعف لهذه النماذج اللغوية أمر ضروري من أجل تطويرها بطريقة أفضل.
مع ذلك، يمثل Galactica خطوة مهمة في مجال البحث العلمي، ونحن على أعتاب ثورة لغوية ستساعد العلماء على استكشاف واستنتاج المعرفة بطرق لم تكن ممكنة من قبل.
لا توجد اي تعلقات بعد.