نجحت شركة ناشئة هندية تُعرف باسم Sarvam AI في تحقيق إنجازات ملحوظة في مجال الذكاء الاصطناعي، حيث أثارت أدواتها الجديدة اهتمامًا كبيرًا داخل الهند وخارجها بعد أن أظهرت أداءً متفوقًا مقارنة بنماذج عالمية مثل ChatGPT وGoogle Gemini وClaude في مهام تتعلق بالسياق الهندي، خاصة في معالجة الوثائق والنصوص متعددة اللغات، مما يطرح تساؤلات حول قدرة النماذج المحلية المتخصصة على المنافسة في الأسواق العالمية.

أدوات Sarvam AI التي أشعلت الجدل: Vision وBulbul

أطلقت Sarvam AI أداتين جديدتين هما Sarvam Vision وBulbul V3، وهما تستهدفان مهام محددة بدقة عالية، مما مكن الشركة من التفوق في اختبارات ومعايير عالمية متخصصة، ولكن هذا التفوق لا يعني بالضرورة أنها بديل شامل لنماذج الذكاء الاصطناعي العامة مثل ChatGPT أو Gemini.

تفوق واضح في مهام محددة: OCR والنص إلى صوت

يعتبر Sarvam Vision رائدًا في اختبارات التعرف الضوئي على النصوص، حيث أعلن براتيوش كومار، الشريك المؤسس لشركة Sarvam AI، في 5 فبراير عن تحقيق نموذج Sarvam Vision نتائج غير مسبوقة في اختبار olmOCR-Bench، وهو معيار عالمي يقيس قدرات نماذج الذكاء الاصطناعي في التعرف الضوئي على الحروف.

هذا النوع من الاختبارات يقيس قدرة النموذج على قراءة النصوص من الصور والمستندات الممسوحة ضوئيًا وفهم الخطوط المعقدة والتعرف على الكتابة اليدوية، بالإضافة إلى تحليل الجداول والصيغ الرياضية والتنسيقات التقنية، وفي هذا الإطار، سجل نموذج Sarvam Vision دقة بلغت 84.3%، متفوقًا على ChatGPT من OpenAI وGemini 3 Pro من Google وDeepSeek OCR v2 الصيني، كما حقق 93.28% في اختبار OmniDocBench v1.5، خاصة في التعامل مع التخطيطات المعقدة والجداول التقنية والمعادلات والصيغ الرياضية.

السر الحقيقي: التفوق في اللغات والنصوص الهندية

أحد الأسباب الرئيسية لتفوق Sarvam Vision هو تركيزه العميق على اللغات والنصوص الهندية، حيث تم تدريب النموذج خصيصًا على أنماط الكتابة المحلية والخطوط الهندية المعقدة واللغات الإقليمية المختلفة، ورغم أن نماذج مثل ChatGPT وGemini تمتلك قدرات قوية في التعرف على النصوص، فإنها ليست مُحسّنة بنفس الدرجة للتعامل مع النصوص الهندية، مما منح Sarvam Vision أفضلية واضحة في هذا السياق، ويجعل هذا التفوق Sarvam AI خيارًا مناسبًا للشركات والمؤسسات الهندية التي تتعامل مع مستندات رسمية ممسوحة ضوئيًا ونماذج حكومية ومحتوى متعدد اللغات ووثائق مكتوبة بخط اليد.

Bulbul V3: تفوق في تحويل النص إلى صوت هندي

الأداة الثانية التي أثارت الانتباه هي Bulbul V3، وهو نموذج لتحويل النص إلى صوت، ووفقًا للاختبارات والمعايير المتخصصة، تفوقت Bulbul V3 على ElevenLabs، أحد أشهر وأقوى نماذج تحويل النص إلى صوت عالميًا، لكن في السياق الهندي تحديدًا، ويعود السبب إلى العامل نفسه الذي منح Sarvam Vision تفوقه، حيث تم تدريب النموذج على اللهجات الهندية وفهم نطق اللغات المحلية ومحاكاة الإيقاع الطبيعي للكلام في الهند، مما جعله ينتج أصواتًا تبدو أكثر طبيعية وواقعية للمستخدم الهندي.

لماذا لا تُعد Sarvam AI بديلًا لـ ChatGPT وGemini؟

رغم التفوق اللافت الذي حققته Sarvam AI في مهام متخصصة، فإنها لا تُعد نموذج ذكاء اصطناعي عامًا مثل ChatGPT أو Gemini، إذ إن نماذجها مصممة لأداء وظائف محددة بدقة عالية، ولا تدعم المحادثات الطويلة أو إنتاج محتوى إبداعي متنوع، كما أنها غير قادرة على معالجة مسائل معقدة تمتد عبر مجالات متعددة.

فعلى سبيل المثال، يستطيع Gemini إعداد اختبار تجريبي لامتحان JEE ومرافقة المستخدم خطوة بخطوة أثناء الحل، بينما يمكن لـ ChatGPT تحليل صور الأشعة الطبية وتقديم تصور مبدئي لما يظهر فيها، وهي استخدامات لا تزال خارج نطاق قدرات Sarvam AI في الوقت الحالي.

الفرق في الحجم: نماذج صغيرة مقابل عمالقة الذكاء الاصطناعي

أحد الفروق الجوهرية بين نماذج Sarvam AI وChatGPT أو Gemini يكمن في حجم النماذج نفسها، حيث يضم نموذج Sarvam Vision نحو 3 مليارات باراميتر فقط، في حين يُشاع أن Google Gemini 3 يحتوي على ما يقرب من 2 تريليون باراميتر، وبشكل عام، كلما زاد عدد الباراميترات زادت قدرات النموذج ومرونته في التعامل مع مهام متعددة ومعقدة، إلا أن تدريب وتشغيل نماذج بهذا الحجم الهائل يتطلب مئات الآلاف من وحدات GPU وبنية تحتية ضخمة ومراكز بيانات عملاقة، وهي موارد لا تتوفر حاليًا بهذا النطاق داخل الهند.

إنجاز هندي يستحق الاحتفاء

رغم القيود، فإن ما حققته Sarvam AI يُعد إنجازًا كبيرًا بكل المقاييس، هذه النماذج لا تدّعي أنها بديل شامل للذكاء الاصطناعي العام، لكنها تثبت أن الشركات الهندية قادرة على تطوير أدوات عالمية المستوى، وتؤكد أن التحدي الحقيقي أمام الهند في مجال الذكاء الاصطناعي ليس الكفاءة البشرية، بل البنية التحتية والقدرات الحاسوبية.

كما يمكن اعتبار Vision وBulbul بمثابة إثبات مفهوم يوضح أن التفوق على النماذج العالمية ممكن عندما يكون التركيز ذكيًا ومحددًا، ولهذا السبب، فإن تفوق Sarvam AI-even في مهام محددة هو سبب حقيقي للاحتفال.