يعيش العالم اليوم تحولاً تكنولوجياً ملحوظاً بفضل التطور السريع في أنظمة الذكاء الاصطناعي التوليدي، حيث تجاوزت هذه الأنظمة مجرد قراءة النصوص وكتابتها لتكتسب القدرة على “الرؤية” وفهم المحتوى المرئي بشكل متقدم.
الرؤية الحاسوبية
تُعرف التقنية التي تسمح للآلات بفهم المحتوى المرئي باسم “الرؤية الحاسوبية” (Computer Vision)، وهي فرع من الذكاء الاصطناعي يهدف إلى تمكين الآلات من تحليل الصور ومقاطع الفيديو بطريقة مشابهة لكيفية معالجة العقل البشري للمشاهد المرئية، وهذا التطور يفتح آفاقاً واسعة لتطبيقات جديدة كانت غير متوقعة قبل سنوات قليلة، حيث أصبحت الآلات قادرة على تمييز الأشياء وقراءة النصوص من الصور وفهم السياق العاطفي أو المنطقي للمشاهد.
ووفقاً لتقارير منشورة في مدونة أوبن إيه آى الرسمية (OpenAI Blog)، فإن النماذج اللغوية الكبيرة الحديثة تم تزويدها بقدرات متعددة الوسائط (Multimodal)، مما يمكنها من معالجة النصوص والصور معاً، مما يتيح للمستخدم تحميل صورة لمخطط بياني معقد حيث يقوم النظام الذكي بتحليل البيانات المرئية واستخراج الأرقام ثم تقديم ملخص نصي دقيق لما تعنيه هذه الأرقام، وتعتمد هذه التقنية على تدريب النماذج باستخدام مليارات الصور المرفقة بنصوص وصفية، مما يخلق رابطاً ذكياً بين الشكل المرئي والكلمة التي تعبر عنه.
آلية عمل تقنية الرؤية الحاسوبية
تعمل الرؤية الحاسوبية من خلال تقسيم الصورة إلى آلاف أو ملايين النقاط الصغيرة المعروفة باسم “البكسلات” (Pixels)، حيث تقوم الشبكات العصبية الاصطناعية (Neural Networks) بفحص هذه البكسلات لاكتشاف الأنماط الأساسية مثل الحواف والألوان والظلال، وتقوم طبقات أعمق داخل هذه الشبكات بتجميع الأنماط البسيطة لتشكيل أشكال أكثر تعقيداً، مما يمكنها في النهاية من التعرف على وجه إنسان أو سيارة أو نوع معين من النباتات، والجدير بالذكر أن النماذج الحديثة لا تتعرف على الأشياء فحسب، بل تفهم العلاقات بينها، فعلى سبيل المثال، إذا عرضت عليها صورة شخص يحمل مظلة تحت غيوم داكنة، ستستنتج الآلة أن السماء تمطر وأن الشخص يحمي نفسه من البلل، مما يعكس مستوى متقدماً من الفهم السياقي.
أمثلة للاستفادة من هذه التقنية في حياتك اليومية
للاستفادة من مميزات الرؤية الحاسوبية في النماذج المدعومة بالذكاء الاصطناعي، يمكنك اتباع الخطوات العملية التالية:
1. التقط صورة للمكونات الغذائية المتوفرة في ثلاجتك ورفعها لبرنامج الذكاء الاصطناعي واطلب منه اقتراح وصفات طبخ مناسبة بناءً على ما يراه
2. تصوير المستندات أو الملاحظات المكتوبة بخط اليد المعقد، والطلب من النظام تحويلها إلى نص رقمي قابل للتعديل والبحث
3. المساعدة في التعليم وحل المشكلات من خلال التقاط صورة لمسألة رياضية أو جهاز إلكتروني معطل، حيث يقوم الذكاء الاصطناعي بشرح خطوات الحل أو تقديم إرشادات الصيانة خطوة بخطوة

