آنالیز احساسات به معنای تشخیص احساسی بودن یا نبودن متن و همچنین نوع آن احساس است به طوری که هر متن میتواند دارای سه نوع احساس منفی، خنثی و مثبت باشد. تشخیص احساسات کمک شایانی به به درک نظرات جامعه نسبت به مسائل مختلف میکند. از این رو در سالهای اخیر تحقیقات بسیاری در این زمینه صورت گرفته است.
تحلیل احساسات
تگماینر
تگماینر به شما کمک می کند دادههای برخط شبکههای اجتماعی را جمعآوری، تحلیل و گزارش کنید. این دانش به تولیدکنندگان محتوا ، بازاریابان ،محققان ،صاحبان کسب و کار خبرنگاران و….. کمک میکند که تحلیلی دقیق و جامع از جامعه هدف بدست آورده و استراتژی های خود را سنجیده و بهبود دهند و مهمتر از آن تاثیر فعالیت های خود را رصد و گزارش کنند.
تحلیل هیجان
تحلیل هیجان (Emotion Analysis) محصول دیگری از شرکت دادهکاوی سحاب پرداز است.این محصول برای تشخیص هیجان در متون فارسی طراحی شده که در نوع خود اولین محسوب میشود. در تحقیقات گذشته انواع متعددی از هیجان اسم برده شده است که معروفترین آنها عبارتند از شادی، غمگینی، ترس، نفرت، خشم، تعجب، اعتماد و انتظار.
کسره اضافه
کسره اضافه یکی از ویژگیهای خاص زبان فارسی محسوب میگردد. به کمک کسره اضافه عباراتی تولید میشوند که بسیار با معنیتر از کلمات به تنهایی است. کلماتی که توسط کسره اضافه بهیکدیگر متصل میشوند بایستی پیوسته و در کنار هم خوانده شوند تا معنای درست به ذهن خواننده متبادر گردد. نمونههایی از آن عبارتند از: (جمهوریِ اسلامیِ ایران، دیوارِ چین، نوشابهیِ گازدار).
فاصلهگذاری متن
فاصلهی مجازی که به آن نیمفاصله هم گفته شده، نویسهای در استاندارد یونیکد است که برای حروفچینی کامپیوتری بعضی خطها از قبیل خط فارسی و خطهای هندیک بهکار میرود.در فارسی این نویسه در مواردی که دو حرف به هم نمیچسبند ولی «فاصلهی مرئی» ندارند استفاده میشود. مثلاً در کلمههای «خانهها»، «میشود» و «بهرهوری».
موجودیتهای اسمی
شناسایی و برچسب گذاریاسامی درون متن در علم پردازش زبان طبیعی نقش کلیدی و مهمی را ایفا می کند. تحقیقات انجام شده نشان میدهد مهمترین مطالب یک متن غالبا حول اسامی درون آن متن قرار دارد. از این رو شناسایی اسامی درون متن کمک شایانی در درک منظور و محتوای متن دارد.
کلیدواژه ماشینی
شناسایی خودکار کلیدواژگان متون یکی از پرکاربردترین شاخههای علم پردازش زبان طبیعی میباشد. کلمات کلیدی یک متن دربرگیرنده موضوعات اصلی آن میباشد و از این لحاظ برای محققین و دانشمندان ارزش بسیار بالایی دارد. ما در این ابزار یک روش جامع و کامل را به کار بردهایم که ترکیبی از روشهای مبتنی بر ناظر و بدون ناظر است.
برچسبگذاری ادات سخن
شناسایی برچسب صرفی یک کلمه یا همان برچسب ادات سخن، یکی از پایهایترین نیازهای پردازش هوشمند متون محسوب میگردد. طی این فرایند نوع کلمات از لحاظ اسم، فعل و حرف بودن شناسایی شده و جزئیات بیشتری نیز از آن در قالب برچسب ارائه میگردد. ابزار پیش رو یکی از قویترین برچسبگذارهای حال حاضر زبان فارسی محسوب میگردد که توانایی شناسایی 14 برچسب مهم صرفی را داراست.
تگ ماینردانش بنیان
درباره شرکت
در دوران معاصر، رشد سریع فنآوری اطلاعات و توسعه شبکههای ارتباطی مانند اینترنت از یک طرف و رشد سریع تکنولوژی و گسترش ابزارهای ارتباطی مانند تلفنهای هوشمند از طرف دیگر باعث بهوجود آمدن رسانههای نوین و آمادهسازی بستری جهت ارتباطات بیشتر و به اشتراک گذاری محتوا شدهاست، این رشد سریع منجر به تغییر مفاهیم تولید محتوا و گردش اطلاعات شده است. شرکت دادهکاوی سحابپرداز، با هدف استفاده از فنآوریهای هوش مصنوعی در شناخت، تحلیل و خودکارسازی فرآیندهای موجود در رسانههای نوین و کسب دانش از این حجم عظیم اطلاعات، راهاندازی شده است. این مجموعه متشکل از کارشناسانی متخصص و نخبه در حوزهی یادگیری ماشینی و پردازش زبان طبیعی، در سال 1394 آغاز بهکار نموده است. در ابتدای کار، با توجه به پیچیدگی نوشتار زبان فارسی و نیاز به غنیسازی متون فارسی ما را بر آن داشت تا در زمینه متنکاوی متون فارسی فعالیتهایی را شروع کنیم که در نهایت این روند باعث تولید محصولاتی کاملا بیهمتا گردید. امیدواریم مجموعه فعالیتهای دادهکاوی سحاب پرداز منجر به پیشرفت علم و بهبود کسب و کار در ایران عزیزمان شود.
مهارت ها
پردازش زبانهای طبیعی
(Natural language Processing)
تحلیل شبکه های اجتماعی
(Social Network Analysis)
یادگیری ماشینی
(Machine Learning)
داده کاوی
(Data Mining)
بازیابی اطلاعات متنی
(Text Information Retreival)
متن کاوی
(Text Mining)