سال انتشار: ۱۳۹۳

محل انتشار: نخستین سمپوزیوم ملی رباتیک و هوش مصنوعی

تعداد صفحات: ۶

نویسنده(ها):

زینب سادات تهجدی – دانشجوی دکتری، دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود
حسین مروی – عضو هیئت علمی، دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود

چکیده:

سیستم تعیین هویت گوینده از بین تعدادی از گویندگان، گوینده ای که بیشترین تطابق را با گوینده ی ورودی داشته باشد پیدا می کند. در طراحی چنین سیستمی چالش های بسیاری مطرح است که از آن جمله می توان به اثر نویز محیطی، کانال انتقال و تغییر حالات احساسی گوینده اشاره کرد. در این مقاله، مسئله ی تعیین هویت گوینده در شرایط احساسی مورد توجه قرار گرفته است. برای ساخت مدل از پایگاه داده ی برلین و ویژگی های MFCC و مشتقات مرتبه ی اول آن استفاده شده است. هدف ارزیابی کارایی مدل های ساخته شده با استفاده از الگوریتم هایی است که همگی بر پایه درخته تصمیم عمل می کنند. نتایج نشان می دهد از بین مدل های ساخته شده با استفاده از گفتار طبیعی و بدون احساس، روش درخت تصمیم پایه، بیزین و تابعی نسبت به سایر مدل ها در ارزیابی با دادگان احساسی نتایج بهتری داشته اند و سیستم پایدارتری ایجادکرده اند. همچنین احساس شادی و خشم سیستم را بیشتر تحت تأثیر قرار داده اند ولی احساس خستگی و غم نرخ بازشناسی بهتری داشته و سیستم نسبت به این احساس ها پایدارتر است.