مطالعهای با هوش مصنوعی، دلایل برتری «اَبَرشناساها» در تشخیص چهره را آشکار میکند

پژوهشی جدید با استفاده از دادههای ردیابی چشم، به بررسی توانایی خارقالعاده برخی افراد در تشخیص چهره پرداخته است.
از توانایی این افراد در جستجوی عاملان مسمومیت نوویچوک در سالزبری، یافتن مظنونان به قتل و حتی شناسایی مجرمان جنسی استفاده شده است. اکنون، پژوهشی جدید دیدگاههای تازهای را درباره علت مهارت بالای اَبَرشناساها در تشخیص چهره آشکار کرده است.
تحقیقات پیشین نشان داده بود افرادی که توانایی خارقالعادهای در تشخیص چهره دارند، نسبت به افراد عادی به نواحی بیشتری از صورت نگاه میکنند.
اکنون پژوهشگران با استفاده از نوعی هوش مصنوعی، نشان دادهاند که این رویکرد چگونه به تقویت مهارت آنها کمک میکند.
دکتر جیمز دان، نویسنده اصلی این پژوهش از دانشگاه نیو ساوت ولز سیدنی، میگوید: «موضوع فقط نگاه کردن به همهجا نیست، بلکه هوشمندانه نگاه کردن است.»
دان و همکارانش در مقالهای که در نشریه Proceedings of the Royal Society B: Biological Sciences منتشر شده، گزارش دادهاند که چگونه از دادههای ردیابی چشم یکی از مطالعات پیشین خود بهره بردهاند. در آن مطالعه، ۳۷ اَبَرشناسا و ۶۸ فرد با توانایی تشخیص عادی شرکت داشتند.
در آن پژوهش، به شرکتکنندگان تصاویری از چهرههای کامل و همچنین تصاویری که در آن تنها ناحیهای از چهره که به آن نگاه میکردند نیمهمرئی بود، نشان داده شد.
در مطالعه جدید، این تیم از این دادهها برای بازسازی اطلاعات بصری واقعی که چشمان شرکتکنندگان دیده بودند، استفاده کرد.
این «اطلاعات شبکیهای» سپس به شبکههای عصبی عمیق (DNNs) – نوعی سیستم هوش مصنوعی – که برای تشخیص چهره آموزش دیده بودند، داده شد. آنها همچنین به این سیستم هوش مصنوعی یک تصویر کامل از همان چهرهای که شرکتکننده دیده بود یا چهرهای متفاوت را ارائه کردند.
در هر مورد، سیستم هوش مصنوعی امتیازی را برای میزان شباهت اطلاعات شبکیهای با تصویر کامل چهرهای که به آن داده شده بود، تولید کرد.
این تیم نتایج شرکتکنندگان عادی و اَبَرشناساها را با یکدیگر و همچنین با دادههای مبتنی بر نواحی انتخابشده تصادفی از تصویر اولیه چهره مقایسه کرد.
نتایج نشان میدهد که در همه موارد، با مرئیتر شدن بخشهایی از چهره که به آن نگاه میشد، عملکرد سیستم هوش مصنوعی افزایش مییافت.
همچنین، در تمام سطوح وضوح تصویر، عملکرد سیستم هوش مصنوعی زمانی که بر اساس اطلاعات شبکیهای اَبَرشناساها بود، در بالاترین حد خود قرار داشت.
دان میگوید: «این نشان میدهد که تفاوت در توانایی تشخیص چهره، نه تنها به پردازشهای بعدی در مغز، بلکه تا حدی به نحوه جستجو و نمونهبرداری فعالانه ما از اطلاعات بصری نیز بستگی دارد.»
سپس تیم تحقیق کرد که آیا این نتایج صرفاً به این دلیل است که اَبَرشناساها به نواحی بیشتری از چهره نگاه میکنند و در نتیجه اطلاعات بیشتری دریافت میکنند.
با این حال، آنها دریافتند که حتی زمانی که مقدار اطلاعات چهره در دادههای شبکیهای یکسان بود، سیستم هوش مصنوعی با دادههای دریافتی از اَبَرشناساها عملکرد بهتری داشت.
دان میگوید: «این یعنی برتری آنها فقط کمی نیست، بلکه کیفی است. آنها مناطقی را انتخاب میکنند که سرنخهای هویتی بیشتری دارند، بنابراین هر “پیکسلی” که انتخاب میکنند برای تشخیص چهره ارزشمندتر است.»
دکتر ریچل بنتس، متخصص پردازش چهره در دانشگاه برونل لندن که در این پژوهش نقشی نداشته، از این مطالعه استقبال کرد.
او گفت: «به نظر من، سهم اصلی این پژوهش در درک ما از اَبَرشناسایی این نتیجهگیری است که تشخیص برتر چهره فقط به نگاه کردن به یک ناحیه خاص، یا نگاه طولانیتر یا به نقاط بیشتر در چهره مربوط نمیشود. اَبَرشناساها چهره را به طور گستردهتری بررسی میکنند، اما در عین حال اطلاعات مفیدتری را نیز نمونهبرداری میکنند.»
دکتر آلخاندرو استودیلو از دانشگاه بورنموث گفت این مطالعه بر اساس نمایش تصاویر ثابت به افراد در شرایط بسیار کنترلشده انجام شده است.
او افزود: «مهم است که آزمایش شود آیا همین الگو در سناریوهای طبیعیتر و پویاتر نیز صادق است یا خیر.»
اگرچه این مطالعه نشان میدهد راهکارهایی برای کمک به تشخیص چهره وجود دارد، اما بعید به نظر میرسد که همه بتوانند به یک اَبَرشناسا تبدیل شوند.
بنتس میگوید: «در حال حاضر نمیدانیم که آیا این الگوهای حرکت چشم را میتوان به طور مؤثر آموزش داد یا خیر.»
دان گفت مطالعات نشان دادهاند که اَبَرشناسایی ریشه در ژنتیک دارد و ارثی است.
او میگوید: «به نظر میرسد اَبَرشناساها به طور طبیعی مفیدترین ویژگیها را تشخیص میدهند و آموزش این مهارت دشوار است، زیرا از چهرهای به چهره دیگر متفاوت است.»
این پژوهشگران یک آزمون رایگان برای کمک به شناسایی اَبَرشناساها طراحی کردهاند که در UNSW Face Test در دسترس است.