كشف تقرير بحثي جديد عن نتائج مثيرة للاهتمام لاختبار قياسي عالمي يُعرف باسم “Apex-Agents”، والذي يهدف إلى تقييم قدرة وكلاء الذكاء الاصطناعي على أداء مهام وظائف “الياقات البيضاء” في مجالات مثل البنوك والاستشارات والقانون، وأظهرت النتائج أن أفضل الموديلات الحالية، بما في ذلك “Gemini 3 Flash” من جوجل، لم تحقق نسبة نجاح تتجاوز 24% في تنفيذ المهام المطلوبة، مما يثير تساؤلات حول وعود الأتمتة الشاملة في بيئات العمل المختلفة.
أسباب ضعف الوكلاء
تشير التقارير إلى أن المشكلة الرئيسية تكمن في عدم قدرة الوكلاء الأذكياء على التعامل مع المعلومات المشتتة عبر أدوات متعددة مثل “Slack” و”Google Drive” كما يفعل البشر، حيث يعاني هؤلاء الوكلاء من “فقدان السياق” عند الانتقال بين المنصات المختلفة، مما يؤدي إلى أخطاء في اتخاذ القرارات أو تنفيذ الأوامر الإدارية، وهذا يعني أن تحقيق بيئة عمل آلية لا يزال بعيد المنال، كما أن التحول نحو “القوة العاملة السيليكونية” قد يستغرق وقتاً أطول مما توقعته شركات التكنولوجيا الكبرى.
ووفقاً للتقارير، يعتبر 52% من قادة الشركات أن المخاوف الأمنية والامتثال هي العائق الأكبر أمام نشر هؤلاء الوكلاء، حيث تشترط الأغلبية وجود رقابة بشرية كاملة على كل قرار يتخذه الذكاء الاصطناعي لضمان سلامة العمليات التجارية والمالية من الأخطاء العشوائية.
تحديات الموثوقية في بيئات العمل المعقدة
أثبتت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة كبيرة في التنسيق بين المهام المتعددة التي تتطلب “فهماً دلالياً” متغيراً، مما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية مغامرة تقنية غير محسوبة النتائج في الوقت الراهن.
أولوية الحوكمة على القدرات الخام
يتفق خبراء الأمان على أن الموثوقية والحوكمة تظلان أهم من القدرات الحسابية الخام، حيث يتطلب بناء وكلاء ناجحين إعادة تصميم العمليات التشغيلية للمؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة لضمان أعلى مستويات الدقة والأمان الرقمي.

