کسره اضافه یکی از ویژگیهای خاص زبان فارسی محسوب میگردد. به کمک کسره اضافه عباراتی تولید میشوند که بسیار با معنیتر از کلمات به تنهایی است. کلماتی که توسط کسره اضافه بهیکدیگر متصل میشوند بایستی پیوسته و در کنار هم خوانده شوند تا معنای درست به ذهن خواننده متبادر گردد. نمونههایی از آن عبارتند از: (جمهوریِ اسلامیِ ایران، دیوارِ چین، نوشابهیِ گازدار).
شناسایی اتوماتیک کسره اضافه یکی از اهداف پردازش زبان فارسی شناخته میشود که در این ابزار به آن پرداخته شده است. ابزار پیشرو با استفاده از الگوریتم میدانهای مغناطیسی شرطی یا همان Conditional Random Fields (CRF) یکی از بهترین نتایج را در این زمینه به دست آورده است. نتایج ما دقت بالغ بر ۹۸% را با سرعتی بالغ بر ۱۰۰ هزار کلمه بر ثانیه نشان میدهد که در نوع خود منحصر به فرد است.
کاربردهای متنوعی را برای این ابزار میتوان متصور بود که برخی از آنها عبارتند از: استفاده در ابزارهای تبدیل متن به گفتار، استفاده در سیستمهای استخراج کلیدواژه ماشینی، ترجمه ماشینی، تشخیص موجودیتهای اسمی و بسیار کاربردهای دیگر.