أطلقت شركة DeepSeek الصينية الناشئة نموذج اللغة الضخم DeepSeek-V3.1 في أغسطس 2025. يُعد هذا الإصدار نقلة نوعية نحو مفهوم “النموذج الوكيل” (Agent)، حيث يدمج قدرات نموذج V3 الأساسي مع نموذج R1 المخصص للاستدلال في نموذج هجين واحد. يتميّز DeepSeek V3.1 بأنه نموذج مفتوح المصدر وضخم جدًا (671 مليار معامل إجمالًا، منها 37 مليار فقط فعّالة أثناء كل استدلال، وفق بنية Mixture-of-Experts). كما تم توسيع نافذة السياق فيه إلى 128 ألف رمز، مما يسمح للنموذج باستيعاب وفهم مستندات أو محادثات طويلة جدًا خلال التفاعل. جميع تحسينات V3.1 تأتي تحت رخصة MIT المفتوحة، مما يعني أنه يمكن للمطورين تنزيل النموذج وتشغيله بحرية أو حتى إعادة تدريبه باستخدام مخرجاته.

القدرات والميزات التقنية في الإصدار V3.1
DeepSeek V3.1 يقدم تحسينات تقنية جوهرية على سابقيه. أبرز ميزة هي دعمه لوضعين من الاستدلال في نموذج واحد:
وضع غير مفكّر (Non-Thinking) للإجابات المباشرة والسريعة.
وضع التفكير العميق (Thinking) الذي ينتج سلسلة تفكير داخلية قبل الإجابة.
يمكن التبديل بين الوضعين بسهولة عبر تغيير قالب المحادثة أو عبر زر مخصص باسم “DeepThink”. في الوضع غير المفكّر،

استخدام الأدوات والوكلاء
شملت تحسينات V3.1 تدريبات على استخدام الأدوات وتنفيذ المهام متعددة الخطوات. أصبح النموذج أكثر ذكاءً في استدعاء الأدوات الخارجية والعمل كوكيل لحل المهمات.

نموذج DeepSeek R1 ومصيره الحالي
أُطلق DeepSeek R1 في يناير 2025 كنموذج متخصص بالاستدلال المنطقي. اعتمد على تعلم تعزيز واسع النطاق (RL) بعد التدريب ليكتسب مهارات التفكير المنطقي، وكان يولد سلسلة تفكير صريحة قبل الإجابة النهائية. تميز R1 بقدرته على حل مسائل الرياضيات والبرمجة وألغاز المنطق بدقة عالية، وحقق أداءً منافسًا للنماذج المغلقة الرائدة.

روابط هامة:
https://www.deepseek.com
https://platform.deepseek.com/api_keys
https://api-docs.deepseek.com
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
https://huggingface.co/deepseek-ai

#deepseek
#technology
#infotech4you