سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

مجید نم نبات – کارشناس ارشد هوش مصنوعی، تیم بخش پردازش سیگنال سیستم تبدیل متن به گفت
عباس کوچاری – کارشناس ارشد هوش مصنوعی، تیم بخش پردازش سیگنال سیستم تبدیل متن به گفت

چکیده:

منحنی گام یکی از پارامترهای اصلی و بسیار مهمِ در نوای گفتار می باشد که در پروسه تبدیل متن به گفتار لازم اسـت ت خمـین زده شود . در این مقاله ما با استفاده از تئوری تیلت برای توصیف منحنی گام و همچنین درختهای کلاس بندی و رگرسـیون بـرای مـدل نمودن پارامترها، منحنی گام را برای یک سیستم تبدیل متن به گفتار تخمین می زنیم . بدین منظور ما یک دادگان آماده و با استفاده
از این دادگان در حدود ۰۰۱ ویژگی ورودی استخراج می نماییم . همچنین برای یافتن مدلهای بهینه بررسی های مختلفی انجام شـده است که از آن جمله می توان به افزودن پارامترهای تیلت بعنوان پارامترهای ورودی بصورت افزایشی هنگام آموزش و تست مدلها و نیز در نظر گرفتن هجاهای استرس دار بعنو ان رویداد تکیه اشاره نمود . علاوه بر این نتایج حاصل از استفاده از کوانتیزاسیون برداری و ساخت کتاب کد از پارامترهای تیلت نیز برای تخمین گام مورد ارزیابی قرار گرفته است . در انتهـا بـا اسـتفاده از مـدلهای بهینـه حاصل، برای معیارهای ضریب همبستگی و میان منحنی گام تخمین زده شده و منحنی گـام واقعـی بـرای مجموعـه تـست مقادیر ۱ / ۱۶ % و ۶۸۳ / ۵۲ هرتز بدست می آید