سال انتشار: ۱۳۹۰

محل انتشار: اولین کنفرانس ملی دانش پژوهان کامپیوتر و فناوری اطلاعات

تعداد صفحات: ۷

نویسنده(ها):

حمیدرضا طهماسبی – دانشگاه آزاد اسلامی واحد کاشمر – گروه مهندسی کامپیوتر
ملیحه آموزگار – دانشگاه آزاد اسلامی واحد کاشمر – گروه مهندسی کامپیوتر

چکیده:

یکی از معروفترین کلاسه بندی های مبتنی بر فاصله ، کلاسه بند نزدیکترین k همسایه است که دقت آن ب انتخاب مقدار مناسب k و معیار اندازه گیری فاصله بین نمونه ها بستگی دارد. این کلاسه بند متداولترین روش کلاسه بندی در تشخیص بیماریها در داده کاوی پزشکی می باشد. مساله انتخاب معیار سنجش فاصله بین نمونه ها ، یکی از مهمترین چالشها در بکارگیری این کلاسه بد محسوب میشود. در این مقاله دقت این کلاسه بند با ازمایش توایع فاصله ی اقلیدسی ، منهتن (شهری) ، چبیشف ، بری کورتیس ، و کانبرا برای تشخیص بیماری بر روی مجموعه داده های پزشکی سرطان سینه ، دیابت ، هپاتیت پف تیروئید ، تومور اولیهه ، و امراض پوستی به ازای مقادیر مختلف k مورد ارزیابی قرار می گیرد و بهترین معیار معرفی می گردد. همچنین مقدار مناسب k برای هر مجموعه داده نیز مشخص می گردد. قبل از بکارگیری هر معیار ، پیش پردازش و تبدیل داده ها به یک مقیاس جدید و قابل پذیرش توسط هر معیار انجام می گیرد.