DeepSeek تنافس نماذج OpenAI o1 بإطلاق نماذج R1
شركة DeepSeek تنافس نماذج OpenAI o1، بأطلاق نموذجين جديدين للذكاء الاصطناعي، هما R1 وR1-Zero، مدعيةً تفوقهما في الأداء على نماذج التفكير المنطقي o1 من OpenAI، كما كشفت عن 6 نماذج مفتوحة المصدر أصغر حجمًا، بعضها ينافس أداء نموذج OpenAI-o1-min.
ويتميز R1-Zero بتقنية تعلم معزز مبتكرة، حيث طور مهاراته في الاستدلال دون الاعتماد على بيانات بشرية، باستخدام نظام مكافآت مبسط وقواعد صارمة لفحص دقة الإجابات، مثل التحقق من الحلول الرياضية والبرمجية، كما طورت DeepSeek خوارزمية جديدة تقيّم مجموعات من الإجابات بدلًا من تقييم كل إجابة على حدة، مما عزز كفاءة الأداء.
لكن النموذج واجه تحديات مثل صعوبة قراءة الإجابات وخلط اللغات، ولحل هذه المشكلات، أطلقت الشركة نموذج R1، الذي يمر بمراحل تدريب مكثفة مع تعلم معزز متعدد الجولات لتحسين الأداء، وأظهرت الاختبارات أن R1 حقق أداءً قريبًا من OpenAI-o1-1217 في معايير استدلالية متنوعة.
كما قدمت DeepSeek 6 نماذج صغيرة تتراوح بين 1.5 و70 مليار معلمة، باستخدام 800 ألف مثال تدريبي ولّدها R1، وأثبتت هذه النماذج، مثل R1-Distill-Llama-70B وR1-Distill-Qwen-32B، تفوقًا في القدرات الاستدلالية على نماذج أكبر حجمًا.
وتتيح DeepSeek نماذجها برخصة MIT، مما يسمح باستخدامها وتعديلها بحرية، ويمكن الوصول إليها عبر منصتي GitHub وHuggingFace، أو عبر واجهة برمجية (API) بأسعار تنافسية مقارنة بنماذج OpenAI.
يأتي هذا الإطلاق بعد نجاح الشركة في تقديم DeepSeek-V3، الذي يُعد من أقوى النماذج المفتوحة المصدر عالميًا، وقادرًا على منافسة نماذج مثل GPT-4o.