سال انتشار: ۱۳۸۹

محل انتشار: سومین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات

تعداد صفحات: ۸

نویسنده(ها):

مریم بخشی – دانشکده فنی دانشگاه آزاد اسلامی واحد زنجان
محمدرضا فیضی درخشی – گروه کامپیوتر دانشگاه تبریز

چکیده:

مسئله تشخیص رکوردهای تکراری یکی از مسائل چالش برانگیز در حوزه پایگاه داده ها می باشد در نتیجه یافتن الگوریتم های مناسبدراین زمینه کمک قابل توجهی در ساماندهی اطلاعات و استخراج پاسخ صحیح در پرس و جوهای مختلف از پایگاه داده را انجام میدهد یکی از مراحل تشخیص تکرار خوشه بندی می باشد خوشه بندی عبارتست از فرایند طبقه بندی مجموعه داده های موجود به خوشه های مختلف بطوریکه شباهت بین داده های درون هر خوشه حداکثر و شباهت بین داده های درون خوشه های متفاوت حداقل می باشد هدف ازاین مقاله یافتن الگوریتمهای خوشه بندی مناسب برای مجموعه داده موجود می باشد برای ارزیابی کارایی الگوریتمهای مطالعه شده نیاز به شاخص های اعتبار سنجی وجود دارد که شاخصهای مناسب جهت سنجش میزان صحت نتایج خوشه بندی اورده شده است.