کسره اضافه

کسره اضافه یکی از ویژگی‌های خاص زبان فارسی محسوب می‌‏گردد. به کمک کسره اضافه عباراتی تولید می‌شوند که بسیار با معنی‌تر از کلمات به تنهایی است. کلماتی که توسط کسره اضافه به‌یکدیگر متصل می‌شوند بایستی پیوسته و در کنار هم خوانده شوند تا معنای درست به ذهن خواننده متبادر گردد. نمونه‌هایی از آن عبارتند از: (جمهوریِ اسلامیِ ایران، دیوارِ چین، نوشابه‌یِ گازدار).

شناسایی اتوماتیک کسره‌ اضافه یکی از اهداف پردازش زبان فارسی شناخته می‌شود که در این ابزار به آن پرداخته شده است. ابزار پیش‌رو با استفاده از الگوریتم میدان‌های مغناطیسی شرطی یا‌‌ همان Conditional Random Fields (CRF) یکی از بهترین نتایج را در این زمینه به دست آورده است. نتایج ما دقت بالغ بر ۹۸% را با سرعتی بالغ بر ۱۰۰ هزار کلمه بر ثانیه نشان می‌‏دهد که در نوع خود منحصر به فرد است.

کاربردهای متنوعی را برای این ابزار می‌توان متصور بود که برخی از آن‌ها عبارتند از: استفاده در ابزارهای تبدیل متن به گفتار، استفاده در سیستم‌های استخراج کلیدواژه ماشینی، ترجمه ماشینی، تشخیص موجودیت‌های اسمی و بسیار کاربردهای دیگر.