مع تزايد استخدام أدوات الذكاء الاصطناعي، أصبح من الصعب على المستخدمين غير المتخصصين التمييز بين الأنظمة المختلفة، خاصة بين ChatGPT من OpenAI وGemini من Google، حيث تؤثر التحديثات السريعة على توازن القوة بينهما، وهو ما تجلى مؤخرًا عند إصدار ChatGPT الإصدار 5.2 الذي أعاده إلى صدارة الأداء.
بدلاً من الاعتماد على التجارب الفردية، يلجأ الخبراء إلى الاختبارات المعيارية التي تقيس قدرات الذكاء الاصطناعي في مجالات مثل التفكير المنطقي وحل المشكلات والاستدلال المجرد، وقد أظهرت مجموعة من هذه الاختبارات تفوق ChatGPT على Gemini في ثلاث مجالات رئيسية.
1- الإجابة عن الأسئلة العلمية المعقدة “غير القابلة للبحث”
يعتبر اختبار GPQA Diamond من أبرز الاختبارات المصممة لقياس قدرات التفكير على مستوى الدكتوراه في مجالات الفيزياء والكيمياء والأحياء، حيث تُعرف الأسئلة بأنها “مضادة لمحركات البحث” لأنها تتطلب ربط مفاهيم علمية متعددة بدلاً من الاعتماد على استنتاجات سطحية، وقد سجل ChatGPT-5.2 نسبة 92.4% متفوقًا بفارق طفيف على Gemini 3 Pro الذي حقق 91.9%، وللمقارنة، فإن متوسط نتائج خريجي الدكتوراه يبلغ نحو 65% بينما لا يتجاوز غير المتخصصين 34%.
2- حل مشكلات البرمجة الواقعية
في مجال البرمجة، يُعتبر اختبار SWE-Bench Pro من أصعب المعايير، حيث يعتمد على مشكلات حقيقية مأخوذة من منصة GitHub، وتتطلب فهم شيفرات معقدة وتقارير أعطال واقعية، وقد أظهرت النتائج أن ChatGPT-5.2 تمكن من حل نحو 24% من هذه المشكلات، بينما حقق Gemini 18% فقط، ورغم أن هذه النسب قد تبدو منخفضة، فإن صعوبة الاختبار تفسر ذلك، حيث لا يزال الإنسان يتفوق بحل 100% من هذه الحالات.
3- حل الألغاز البصرية والتفكير المجرد
في اختبار ARC-AGI-2، الذي يقيس القدرة على استنتاج الأنماط المجردة من أمثلة محدودة، حقق ChatGPT-5.2 Pro نتيجة 54.2%، بينما سجل Gemini 3 Pro 31.1%، في حين حققت النسخ الأعلى تكلفة من Gemini نتائج أقرب لكنها لم تتفوق، ويُعتبر هذا المجال من أصعب التحديات أمام الذكاء الاصطناعي، لكنه يُظهر تفوق ChatGPT ليس فقط على Gemini بل على معظم المنافسين.
كيف تم الوصول إلى هذه النتائج؟
اعتمد التحليل على أحدث الإصدارات المدفوعة من النظامين مع التركيز على الاختبارات المعيارية بدلاً من المقارنات الشخصية، ورغم وجود اختبارات أخرى يتفوق فيها Gemini، فإن هذه المعايير الثلاثة تمثل مزيجًا مهمًا من التفكير العلمي وحل المشكلات والذكاء المجرد.
تستمر المنافسة في التطور، لكن الأرقام الحالية تشير إلى أن ChatGPT يحتفظ بتقدم ملحوظ في مجالات تتطلب عمقًا في التفكير وليس مجرد إجابات سريعة.

