أطلقت Anthropic يوم الثلاثاء 30 يونيو 2026 نموذجاً جديداً باسم كلود سونيت 5 (Claude Sonnet 5)، ووصفته بأنه «أكثر نماذج سونيت قدرةً على العمل كوكيلٍ مستقلّ حتى الآن».
الفئة المتوسّطة (mid-tier) في تسمية Anthropic هي فئة «سونيت»: أرخص من فئة «Opus» الأعلى وأغلى من الفئات الأصغر، وموجّهةٌ لمن يريد قدرةً عالية بتكلفةٍ يحتملها التشغيل الكثيف.
والجديد أنّ هذا النموذج المتوسّط بات يفعل ما كان حكراً على النماذج الأكبر والأغلى: يضع خطّةً لمهمّة، ويشغّل أدواتٍ مثل المتصفّح والطرفية (terminal)، ويعمل تلقائياً لفتراتٍ أطول دون أن يتوقّف في منتصف الطريق.
ويكتسب توقيت الإطلاق أهمّيةً موازية للنموذج نفسه؛ ففي اليوم نفسه، أعلنت Anthropic أنّ وزارة التجارة الأمريكية رفعت قيود التصدير التي كانت قد فرضتها على نموذجَيها الأقوى، Fable 5 و Mythos 5، بعد ثمانية عشر يوماً من التعطيل القسريّ.

ما الذي أطلقته Anthropic بالضبط
سونيت 5 نموذج لغويّ كبير (LLM) من عائلة كلود، متاحٌ فور إطلاقه في كل مكان تقريباً، وهو النموذج الافتراضيّ لخطّتَي Free و Pro، ومتاحٌ لمستخدمي Max و Team و Enterprise، وداخل أداة البرمجة Claude Code، وعبر واجهة برمجة التطبيقات (API) بمُعرّف النموذج claude-sonnet-5.
ويحمل نافذة سياق (context window) سعتها مليون رمز (1M tokens)، أي أنه يستطيع أن يُبقي في «ذاكرته» أثناء الجلسة الواحدة كمّاً ضخماً من النصّ أو الكود — ما يكفي لقراءة قاعدة كودٍ كاملة أو مستنداتٍ طويلة والعمل عليها دفعةً واحدة دون أن ينسى بدايتها.
جوهر الترقية هو ما يسمّى السلوك الوكيليّ (agentic behavior). والمقصود بالوكيل هنا نموذجٌ لا يكتفي بالردّ على سؤالٍ واحد، بل يقدر على تنفيذ سلسلة خطواتٍ نحو هدفٍ بنفسه: يخطّط، ثم يستدعي أداةً خارجية (يفتح صفحة ويب، يشغّل أمراً في الطرفية، يحرّر ملفاً)، ثم يقرأ النتيجة ويقرّر خطوته التالية، ويكرّر ذلك حتى ينجز المهمّة.
القيمة العملية أنّ النموذج «يكمل مهامّ معقّدة كانت الإصدارات السابقة تتوقّف عندها في منتصف الطريق» — بحسب المختبِرين الذين جرّبوه — وهذا بالضبط ما يجعله مناسباً لتشغيل الوكلاء التلقائيين وحلقات البرمجة الطويلة.
الأزمة التي سبقت الإطلاق: توقّف Fable 5 و Mythos 5
قبل أسبوعين ونصف من إطلاق سونيت 5، كانت Anthropic في مواجهةٍ مع الحكومة الأمريكية. ففي 12 يونيو 2026، وتحديداً في الساعة 5:21 مساءً بتوقيت شرق الولايات المتحدة، تلقّت الشركة أمراً بضوابط التصدير (export control directive) من الحكومة يقضي بتعليق كلّ وصولٍ إلى نموذجَيها الأحدث والأقوى، Fable 5 و Mythos 5، من قِبل أيّ أجنبيّ (foreign national) داخل الولايات المتحدة أو خارجها — بمن فيهم موظّفو Anthropic الأجانب أنفسهم.
ولضمان الامتثال، اضطُرّت الشركة إلى تعطيل النموذجين عملياً للجميع، فحدث ما يشبه إطفاءً عالمياً لهما بعد أيامٍ قليلة من طرحهما.
سبب التدخّل الحكوميّ كان أمناً قومياً، ومحوره ثغرةٌ في حواجز الأمان.
فقد أفادت Anthropic بأنّ الحكومة رأت أنها اطّلعت على طريقةٍ لتجاوز حواجز الأمان في Fable 5 — أي «كسر الحماية» (jailbreak). والطريقة المعروضة، كما وصفتها الشركة، كانت أن يُطلَب من النموذج قراءة قاعدة كودٍ معيّنة وإصلاح أيّ ثغراتٍ برمجية فيها.
المشكلة أنّ هذه القدرة نفسها — العثور على ثغرات الكود وإصلاحها — هي وجهٌ من قدرةٍ سيبرانية أعمق كامنةٍ في النموذج، فما يصلح للإصلاح يصلح مبدئياً للاستغلال.
واعترضت Anthropic على القرار، معتبرةً أنّ الثغرة «ضيّقة» و«غير شاملة» (non-universal)، وأنّ قدراتٍ مماثلة متاحةٌ على نطاقٍ واسع في نماذج أخرى منشورة للعموم، فلا يستقيم أن يُسحَب نموذجٌ تجاريٌّ يخدم مئات الملايين لأجل ثغرةٍ محدودة.
انتهى الجمود بعد ثمانية عشر يوماً. ففي 30 يونيو، رفعت وزارة التجارة القيود، وبدأت Anthropic باستعادة الوصول إلى Fable 5 و Mythos 5 في اليوم التالي.
ولم يكن الرفع مجّانياً: التزمت الشركة مقابله بأن ترصد المخاطر الأمنية وتعالجها استباقياً، وأن تساعد في وضع معايير للنماذج المستقبلية، وأن تُبلّغ الحكومة عن أيّ نشاطٍ خبيث.
وفي اليوم نفسه الذي عادت فيه النماذج الأقوى، أُطلق سونيت 5.
لماذا وُلد سونيت 5 «ضعيفاً» سيبرانياً — عن قصد
تجلّى أثر هذه الأزمة في تصميم سونيت 5 مباشرةً. ولأنّ القدرة السيبرانية الخطرة هي ما أوقع Fable 5 و Mythos 5 في المشكلة، جاء موقف Anthropic من سونيت 5 على النقيض من المتوقّع؛ فالشركة تنصّ صراحةً في بطاقة النظام (system card) المرافقة للنموذج: «لم ندرّب سونيت 5 عمداً على مهامّ الأمن السيبرانيّ».
والنتيجة أنّ أداءه في هذا المجال جاء أدنى بكثير من نماذج مثل Opus 4.8 و Mythos 5، وهو ضعفٌ مقصودٌ بالتصميم لا نقصٌ عارض.
يُلتبَس أحياناً على القارئ أنّ سونيت 5 «أسوأ» سيبرانياً من سلفه سونيت 4.6، والصورة أدقّ من ذلك.
ففي اختبارٍ محدّد أُجري بالتعاون مع Mozilla لتطوير ثغرةٍ مستغِلّة (exploit) في متصفّح Firefox 147، لم ينجح سونيت 5 في إنتاج ثغرةٍ عاملة أبداً، فسجّل صفراً بالمئة (0.0%) — وهو النتيجة نفسها التي سجّلها سونيت 4.6 تماماً.
الفارق الوحيد أنّ سونيت 5 أظهر معدّل «نجاحٍ جزئيّ» أعلى قليلاً في خطوات الطريق، دون أن يبلغ ثغرةً كاملة. فليس الأمر تراجعاً في القدرة، بل هو نموذجٌ لم يُبنَ ليكون أداةً سيبرانية أصلاً.
ويخالف هذا الموقف الممارسات المألوفة في إصدار النماذج؛ فالاتّهام الشائع لكثيرٍ من الإصدارات هو «تضخيم المقاييس» (benchmaxxing) — أي تحسينُ النموذج خصّيصاً ليتصدّر اختبارات الأداء المعروفة دون أن ينعكس ذلك على نفعٍ حقيقيّ. أمّا في حالة سونيت 5، فالحاصل عكسُ ذلك في المجال السيبرانيّ: خفضٌ متعمَّدٌ للقدرة، كأثرٍ مباشر للتشابك الذي علقت فيه الشركة مع Fable و Mythos.
ومع ذلك، ولأنّ سونيت 5 أقوى قليلاً من سلفه على هذه المهامّ، أُطلق وحواجز الأمان السيبرانيّ (cyber safeguards) مفعّلةٌ فيه افتراضياً — وهي الحواجز نفسها المستخدَمة في Opus 4.7 و 4.8، تعمل على رصد النشاط السيبرانيّ الخطر وحجبه لحظياً.
ومن يحتاج قدرةً سيبرانية أعلى بحواجز أقلّ تقيّداً — لبحثٍ أمنيّ مشروع مثلاً — توجّهه Anthropic إلى Opus 4.8، أو إلى برنامج التحقّق السيبرانيّ (Cyber Verification Program) الذي يتيح حواجز مخفّفة للأغراض المشروعة.
القدرات بالأرقام: أين يقف من Opus 4.8 وسونيت 4.6
الترقية على أرض الواقع ملموسةٌ في القياسات، خصوصاً في البرمجة والعمل الوكيليّ.
في SWE-bench Pro — وهو اختبارٌ يقيس حلّ مسائل برمجية حقيقية مأخوذة من مستودعاتٍ فعلية — سجّل سونيت 5 نسبة 63.2%، متقدّماً على سونيت 4.6 (58.1%)، وإن بقي دون Opus 4.8 (69.2%).
وفي Terminal-Bench 2.1، الذي يقيس قدرة النموذج على إنجاز مهامّ عبر سطر الأوامر، قفز من 67.0% لدى سونيت 4.6 إلى 80.4% — وهي أوضح قفزات هذا الإصدار.
وفي استخدام الحاسوب (OSWorld-Verified)، حيث يشغّل النموذج واجهةً رسومية كما يفعل الإنسان، تقدّم إلى 81.2% مقابل 78.5% لسلفه.
ويبرز تقدّم النموذج بوضوحٍ أكبر في مهامّ العمل المعرفيّ (knowledge work) — كالتحليل والصياغة والاستدلال المهنيّ. فعلى مقياس GDPval-AA v2، تجاوز سونيت 5 المتوسّطُ نموذجَ Opus 4.8 الأعلى فعلاً مسجّلاً 1618 نقطة مقابل 1615.
غير أنّ فارق الثلاث نقاط يُعدّ تعادلاً إحصائياً عملياً؛ وهو ما يثبت ملامسة الفئة المتوسّطة لأداء الفئة الأعلى في هذا النوع من العمل دون التفوق القاطع عليها.
وفي الاستدلال المعقّد (Humanity's Last Exam بالأدوات) سجّل 57.4%، متقدّماً بوضوح على سونيت 4.6 (46.8%) وملامساً Opus 4.8 (57.9%).
فالنموذج يضيّق المسافة إلى Opus 4.8 في معظم المهامّ العملية دون أن يمحوها، ومن هنا جاء وصفه بأنه «قريبٌ من ذكاء Opus» بسعرٍ أدنى.
السعر: خصمٌ حادّ، ومفاجأةٌ في التكلفة الفعلية
يُطلَق سونيت 5 بسعرٍ تمهيديّ (introductory) قدره 2 دولار لكل مليون رمز إدخال (input) و10 دولارات لكل مليون رمز إخراج (output)، وذلك حتى 31 أغسطس 2026.
بعد ذلك التاريخ يرتفع إلى 3 دولارات إدخالاً و15 دولاراً إخراجاً. وللمقارنة، كان سونيت 4.6 بسعر 3/15، بينما Opus 4.8 أغلى بكثير عند 5/25. فالنموذج الجديد يقدّم قدرةً تقترب من Opus بأقلّ من نصف سعره على قائمة الأسعار — وهذا ما يجعله مغرياً لتشغيل الوكلاء بكثافة، إذ تتراكم الرموز وتصير التكلفة عاملاً حاسماً.
لكنّ التكلفة الفعلية تخالف سعر القائمة في بعض المهام.
فسونيت 5 أكثر «إسهاباً» (verbose) من سلفه، إذ يستهلك في المتوسّط نحو 69 ألف رمز إخراج للمهمّة الواحدة، أي أكثر بنحو 40% من سونيت 4.6. والسبب أنّ سلوكه الوكيليّ الأكثر استقلالية يدفعه إلى خطواتٍ ودوراتٍ أكثر لإنجاز المهمّة.
والنتيجة أنّ التكلفة الفعلية للمهمّة قد تنقلب على المتوقّع: في قياسٍ على مؤشّر الذكاء لمنصّة Artificial Analysis، بلغت كلفة المهمّة الواحدة نحو 2.29 دولار — أي ضِعف سونيت 4.6 تقريباً، وأعلى بنحو 15% من Opus 4.8 نفسه، رغم أنّ سعر رمزه الواحد أرخص.
بعبارةٍ عملية: الرمز الأرخص لا يعني بالضرورة المهمّة الأرخص إن احتاج النموذج رموزاً أكثر لإنجازها.
كيف استقبله المطوّرون
كان الاستقبال منقسماً، وأقربَ إلى الفتور منه إلى الحماس.
على منصّات النقاش التقنية، تكرّر شعورٌ بأنّ اسم «سونيت 5» وعَدَ بأكثر ممّا سلّم.
فقفزة الإصدار الكامل (من 4.6 إلى 5) توحي بنقلةٍ جيليّة، بينما رأى كثيرون أنّ ما وصل أقربُ إلى «سونيت 4.8 أو 4.9» — تحسينٌ تدريجيّ لا تحوّلٌ جذريّ.
وزاد الشعورَ بالخيبة أنّ كثيرين كانوا ينتظرون عودة النموذج الأقوى Fable 5، فجاء سونيت 5 في نظرهم كأنه «جائزة ترضية» بينما ظلّت الأنظار معلّقةً بالنموذج المتقدّم الذي غاب أسابيع.
وتركز الانتقاد الأكثر تحديداً حول ارتفاع التكلفة الفعلية؛ فرغم رخص سعر الرمز، يرفع إسهاب النموذج فاتورة المهمّة فوق تكلفة Opus في بعض القياسات.
أمّا على الجانب الآخر، فقد حظي النموذج بتقييمٍ إيجابيّ من مبني الأنظمة الذين يشغّلون وكلاء طويلي الأمد وحلقات برمجة، إذ وجدوا فيه نموذجاً موثوقاً في استخدام الأدوات وإتمام المهامّ حتى وإن لم يتصدّر كل اختبارٍ ثابت.
فمنصّة Cursor للبرمجة، مثلاً، أفادت بأنّ سونيت 5 سجّل 57% على مقياسها الداخليّ مقابل 49% لسونيت 4.6 — تحسّنٌ ملموس في سياق الاستخدام الحقيقيّ.
كما لاحظ بعضهم مقاومةً أفضل لمحاولات «حقن التعليمات» (prompt injection) التي تحاول اختطاف الوكيل أثناء تشغيله المستقلّ للطرفية أو المتصفّح — وهي ميزةٌ أمنية تهمّ من يشغّل النموذج بلا إشرافٍ مباشر. ويُلخّص هذا التباين في أنّ النموذج يفيد بيئات الإنتاج الفعلية، بينما يفتقر إلى عامل الانبهار الشخصيّ.
ما الذي يعنيه هذا فعلاً
لا يمثّل سونيت 5 قفزةً في الذكاء، بل إعادةَ تموضعٍ في السعر والاعتمادية لخدمة الوكلاء. فشركة Anthropic تدفع بقدرةٍ تقترب من فئتها العليا إلى فئةٍ أرخص، في سوقٍ صار فيه تشغيل الوكلاء بتكلفةٍ محتملة هو التحدّي الأبرز، لا مجرّد تصدّر اختبارات الذكاء.
لكنّ الأثر الأعمق يظهر في ملفّ الأمن السيبرانيّ: نموذجٌ خُفِّضت قدرتُه في مجالٍ بعينه عن عمد كأثرٍ مباشر لأزمةٍ تنظيمية لا لقرارٍ هندسيّ صرف.
ويشير هذا التخفيض المتعمّد للقدرات إلى دخول النماذج الحدودية طوراً جديداً تتشابك فيه القدرةُ التقنية بالرقابة الحكومية، مما سيؤثّر بالضرورة على مسار الإصدارات القادمة.
لتجربة سونيت 5 مباشرةً أو الاطّلاع على تفاصيله الرسمية:
جرّب سونيت 5 الإعلان الرسمي توثيق النماذج
