كيف تُحدث IEEE ثورة في استرجاع الوجوه بالذكاء الاصطناعي دون استخدام الرسومات؟

6 دقيقة واحدة

طور الباحثون إطار عمل مبتكر للذكاء الاصطناعي يهدف إلى تحسين أنظمة استرجاع الصور الوجهية، حتى عندما يقدم المستخدمون رسومات تقريبية أو غير مكتملة. يعالج هذا النهج المبتكر القصور الكبير في أنظمة الاسترجاع الوجهية المدعومة بالذكاء الاصطناعي، والمتمثل في التباين في أساليب الرسم البشري. تعتمد الأنظمة التقليدية غالبًا على رسومات عالية الجودة لمطابقة الصور ضمن قواعد بيانات ضخمة. ومع ذلك، في السيناريوهات الواقعية، غالبًا ما ينتج المستخدمون رسومات غير مكتملة أو ذات أنماط متنوعة، مما يعقد عملية الاسترجاع بدقة. النظام الجديد، المعروف باسم FDSRM، يغير التركيز من المظهر الدقيق للرسم إلى ميزات الوجه الدلالية الأعمق المشتركة عبر أساليب الرسم المختلفة. في جوهره، توجد وحدة مراقبة الميزات، التي تستخدم “خبراء” متخصصين متعددين لتحديد الهياكل والأنماط الوجهية الرئيسية. يتيح ذلك للذكاء الاصطناعي العمل بشكل مستقل عن الأساليب الفنية الفردية مع التعرف على الخصائص الوجهية الأساسية. بالإضافة إلى ذلك، تم تقديم نظام موائم للدمج التكيفي لإدارة العشوائية أثناء عملية الرسم. مع إضافة المستخدمين لخطوط الرسم، يقوم الذكاء الاصطناعي بضبط نفسه ديناميكيًا، حيث يجمع بين معلومات الرسم والبيانات النصية والدلالية للحفاظ على دقة الاسترجاع. تم تدريب النموذج مسبقًا على مجموعة بيانات كبيرة النطاق لمحاذاة الصور الوجهية والنصوص، مما يجعله يتعمم بفعالية على سيناريوهات متنوعة في العالم الواقعي. تشير النتائج التجريبية إلى تحسينات كبيرة في دقة الاسترجاع وعمومية النظام مقارنة بالطرق الحالية. الأداء القوي للنموذج، حتى بدون معلومات مساعدة، يشير إلى تطبيقات محتملة في إنفاذ القانون، والطب الشرعي الرقمي، والبحث عن الأشخاص المفقودين، والأمن. يعكس هذا التطور اتجاهًا أوسع في أبحاث الذكاء الاصطناعي، نحو أنظمة متعددة الوسائط مرنة تفسر المعلومات البشرية غير المكتملة. ومع تقدم نماذج الذكاء الاصطناعي في الفهم الدلالي، قد تمهد أنظمة مثل FDSRM الطريق نحو تقنيات استرجاع أكثر تكيفًا وتوافقًا مع البشر.

الوسوم

يوسف حداد

6 دقيقة واحدة