سال انتشار: ۱۳۸۹

محل انتشار: سومین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات

تعداد صفحات: ۵

نویسنده(ها):

امیر ملکی انور – دانشکده کامپیوتر دانشگاه بوعلی سینا همدان
امیرعلی مددی –
مریم امیری –
عبدالحمید پیله ور –

چکیده:

نشانه گذاری یکی از ولین گامهای مهم برای انجام هرگونه پردازش برروی هر زبان طبیعی است وظیفه نشانه گذار جداکردن کلمات و تعیین مرز بین آنها می باشد دراین مقاله براساس ویژگیهای نوشتاری، ساختاری و معنایی زبان فارسی ماشین نشانه گذار زبان فارسی طراحی شدها ست که در دو مرحله مرز بین واژگان را تشخیص می دهد نشانه گذار سطح اول تنها براساس علایم جداکننده اصلی مانند فاصله، ویرگول و نقطه واژگان را از هم جدا میکند و نشانه گذار سطح دوم براساس ویژگی های معنایی زبان فارسی عمل می کند دراین ماشین ساختار های موجود در زبان فارسی از جمله اعداد، تاریخ و نشانه های جمع مورد بررسی قرار میگیرند. هرچند بررسی نتایج به دست امده برروی ماشینهای نشانه گذار وابسته به نوع متن و نحوه نوشتار آن است در مجموع با توجه به ساختار دو سطحی ماشین ارائه شده و بررسی اولیه صورت گرفته در سطح اول آن نتایج به دست امده در مقایسه با ماشین نشانه گذار ساده که براساس علایم جداکننده اصلی به تفکیک نشانه های زبان فارسی می پردازد همواره عملکرد بهتری دارد.