سال انتشار: ۱۳۸۱

محل انتشار: هشتمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

محمدعلی مرادمند کارگر – دانشجوی کارشناسی ارشد مهندسی پزشکی دانشگاه صنعتی امیرکبیر
فرشاد الماس گنج – استادیار دانشکدۀ مهندسی پزشکی دانشگاه صنعتی امیرکبیر

چکیده:

با توجه به اهمیت روزافزون پردازش سیگنال های شنیداری 1 ، ضرورت طبقه بندی این سیگنالها در مراحل اولیه و قبل از انجام پردازشهای پیشرفته تر ضروری می باشد . با مشخص شدن نوع سیگنال شنیداری و اینکه آیا سیگنال گفتاری ، مو سیقی و یا … است می توان نسبت به نوع پردازش های بعدی که باید روی آن انجام بگیرد تصمیم گیری نمود . در این مقاله یک روش طبقه
بندی سیگنالهای شنیداری به سیگنال های گفتاری و غیر گفتاری با استفاده ازضرایب زیرباندهای تبدیل ویولت 2 ارائه می گردد که در آن از خاصیت مولتی رزولوشن زمان – فرکانس تبدیل ویولت استفاده می شود . ابتدا سیگنال شنیداری با استفاده از تبدیل ویولت deb4 به پنج زیر باند تجزیه می شود . سپس برای هر زیر باند حاصل شده ، ویژگیهای آماری سیگنال مثل متوسط ، انحراف معیار و نرخ عبور از صفر استخراج می گردند . در ادامه بر اساس ویژگیهای استخراج شده برای هر زیر باند و با استفاده از قوانین نزدیکترین همسایگی طبقه بندی بر روی دادگان تعلیم انجام می شود . دادگان تعلیم و تست حاوی سیگنال های مختلف گفتاری و موسیقی می باشند . با آزمایش سیستم بر روی دادگان تست ، دقت طبقه بندی در حدود 87 درصد برای دو طبقۀ گفتار و موسیقی بدست آمد .