تصویر عنوان
تحلیل احساسات

تحلیل احساسات

آنالیز احساسات به معنای تشخیص احساسی بودن یا نبودن متن و همچنین نوع آن احساس است به طوری که هر متن می‌تواند دارای سه نوع احساس منفی، خنثی و مثبت باشد. تشخیص احساسات کمک شایانی به به درک نظرات جامعه نسبت به مسائل مختلف می‌کند. از این رو در سال‌های اخیر تحقیقات بسیاری در این زمینه صورت گرفته است.

تگ‌ماینر

تگ‌ماینر به شما کمک می کند داده‌های برخط شبکه‌های اجتماعی را جمع‌آوری، تحلیل و گزارش کنید. این دانش به تولیدکنندگان محتوا ، بازاریابان ،محققان ،صاحبان کسب و کار خبرنگاران و….. کمک میکند که تحلیلی دقیق و جامع از جامعه هدف بدست آورده و استراتژی های خود را سنجیده و بهبود دهند و مهمتر از آن تاثیر فعالیت های خود را رصد و گزارش کنند.

تحلیل هیجان

تحلیل هیجان

تحلیل هیجان (Emotion Analysis) محصول دیگری از شرکت داده‌کاوی سحاب پرداز است.این محصول برای تشخیص هیجان در متون فارسی طراحی شده که در نوع خود اولین محسوب می‌شود. در تحقیقات گذشته انواع متعددی از هیجان اسم برده شده است که معروف‌ترین آنها عبارتند از شادی، غمگینی، ترس، نفرت، خشم، تعجب، اعتماد و انتظار.

کسره اضافه

کسره اضافه

کسره اضافه یکی از ویژگی‌های خاص زبان فارسی محسوب می‌‏گردد. به کمک کسره اضافه عباراتی تولید می‌شوند که بسیار با معنی‌تر از کلمات به تنهایی است. کلماتی که توسط کسره اضافه به‌یکدیگر متصل می‌شوند بایستی پیوسته و در کنار هم خوانده شوند تا معنای درست به ذهن خواننده متبادر گردد. نمونه‌هایی از آن عبارتند از: (جمهوریِ اسلامیِ ایران، دیوارِ چین، نوشابه‌یِ گازدار).

اصلاح فاصله‌گذاری متن فارسی

فاصله‌گذاری متن

فاصله‌ی مجازی که به آن نیم‌فاصله هم گفته شده، نویسه‌ای در استاندارد یونی‌کد است که برای حروف‌چینی کامپیوتری بعضی خط‌ها از قبیل خط فارسی و خط‌های هندیک به‌کار می‌رود.در فارسی این نویسه در مواردی که دو حرف به هم نمی‌چسبند ولی «فاصله‌ی مرئی» ندارند استفاده می‌شود. مثلاً در کلمه‌های «خانه‌ها»، «می‌شود» و «بهره‌وری».

شناسایی موجودیت‌های اسمی

موجودیت‌های اسمی

شناسایی و برچسب‏ گذاری‌اسامی درون متن در علم پردازش زبان طبیعی نقش کلیدی و مهمی را ایفا می‌‏ کند. تحقیقات انجام شده نشان می‌دهد مهم‌ترین مطالب یک متن غالبا حول اسامی درون آن متن قرار دارد. از این رو شناسایی اسامی درون متن کمک شایانی در درک منظور و محتوای متن دارد.

کلیدواژه ماشینی

شناسایی خودکار کلیدواژگان متون یکی از پرکاربردترین شاخه‌های علم پردازش زبان طبیعی می‌باشد. کلمات کلیدی یک متن دربرگیرنده موضوعات اصلی آن می‌باشد و از این لحاظ برای محققین و دانشمندان ارزش بسیار بالایی دارد. ما در این ابزار یک روش جامع و کامل را به کار برده‌ایم که ترکیبی از روش‌های مبتنی بر ناظر و بدون ناظر است.

برچسب‌گذاری ادات سخن

شناسایی برچسب صرفی یک کلمه یا همان برچسب ادات سخن، یکی از پایه‌ای‌ترین نیازهای پردازش هوشمند متون محسوب می‌گردد. طی این فرایند نوع کلمات از لحاظ اسم، فعل و حرف بودن شناسایی شده و جزئیات بیشتری نیز از آن در قالب برچسب ارائه می‌گردد. ابزار پیش رو یکی از قویترین برچسب‌گذارهای حال حاضر زبان فارسی محسوب می‌گردد که توانایی شناسایی 14 برچسب مهم صرفی را داراست.

تگ ماینردانش بنیان

شرکت داده‌کاوی سحاب پرداز یکسال و اندی پس از تاسیس و در سال 1396 دانش‌بنیان شد و تاکنون با افتخار جزئی از خانواده شرکت‌های مبتنی بر علم و دانش بوده است. در حال حاضر شرکت در رده تولیدی نوع 2 دسته‌بندی شده است. قابل ذکر است این شرکت در آذرماه 1396 توانست رتبه دوم برترین استارت‌آپ‌های حوزه فناوری اطلاعات را بدست آورد.

درباره شرکت

در دوران معاصر، رشد سریع فن‌آوری اطلاعات و توسعه شبکه‌های ارتباطی مانند اینترنت از یک طرف و رشد سریع تکنولوژی و گسترش ابزارهای ارتباطی مانند تلفن‌های هوشمند از طرف دیگر باعث به‌وجود آمدن رسانه‌های نوین و آماده‌سازی بستری جهت ارتباطات بیشتر و به اشتراک گذاری محتوا شده‌است، این رشد سریع منجر به تغییر مفاهیم تولید محتوا و گردش اطلاعات شده است. شرکت داده‌کاوی سحاب‌پرداز، با هدف استفاده از فن‌آوری‌های هوش مصنوعی در شناخت، تحلیل و خودکارسازی فرآیندهای موجود در رسانه‌های نوین و کسب دانش از این حجم عظیم اطلاعات، راه‌اندازی شده است. این مجموعه متشکل از کارشناسانی متخصص و نخبه در حوزه‌ی یادگیری ماشینی و پردازش زبان طبیعی، در سال 1394 آغاز به‌کار نموده است. در ابتدای کار، با توجه به پیچیدگی نوشتار زبان فارسی و نیاز به غنی‌سازی متون فارسی ما را بر آن داشت تا در زمینه متن‌کاوی متون فارسی فعالیت‌هایی را شروع کنیم که در نهایت این روند باعث تولید محصولاتی کاملا بی‌همتا گردید. امیدواریم مجموعه فعالیت‌های داده‌کاوی سحاب ‌پرداز منجر به پیشرفت علم و بهبود کسب و کار در ایران عزیزمان شود.

  • سازمان بسیج مستضعفین
  • وزارت امورخارجه
  • مهراز
  • وزرات ارتباطات
  • آستان قدس رضوی
  • وزارت فرهنگ و ارشاد اسلامی

مهارت ها

پردازش زبان‌های طبیعی

(Natural language Processing)

تحلیل شبکه های اجتماعی

(Social Network Analysis)

یادگیری ماشینی

(Machine Learning)

داده کاوی

(Data Mining)

بازیابی اطلاعات متنی

(Text Information Retreival)

متن کاوی

(Text Mining)