فایل word آشکارسازي خودکار طعنه در متون برخط فارسي با کمک الگوريتم هاي رده بندي

    —         —    

ارتباط با ما     —     لیست پایان‌نامه‌ها

... دانلود ...

بخشی از متن فایل word آشکارسازي خودکار طعنه در متون برخط فارسي با کمک الگوريتم هاي رده بندي :


سال انتشار : 1396

نام کنفرانس یا همایش : چهارمين کنفرانس ملي فناوري اطلاعات، کامپيوتر و مخابرات

تعداد صفحات :17

چکیده مقاله:

استفاده گسترده از وب برای ابراز نظر و عقیده افراد باعث ایجاد حوزه مطالعاتی به نام نظرکاوی شده است؛هدف اصلی این حوزه آشکارسازی نظرات مثبت و منفی نهفته در متن است یکی از زیرمجموعههای نظرکاوی، طعنه کاوی است. در طعنه کاوی نیز نظرات مثبت و منفی به شکل معکوس ابراز میشوند. هدفاین مقاله ارایه یک مدل با الگوریتمهای ردهبندی برای آشکارسازی طعنه است؛ که متن را به عنوان طعنه آمیز یا غیر طعنهآمیز ردهبندی میکند. تاکنون مطالعات مختلفی غالبا برای زبان انگلیسی بر روی مسیله ردهبندیمتن طعنهآمیز یا غیر طعنهآمیز انجام شده است؛ اما تاکنون تحقیقی روی زبان فارسی در این حوزه گزارش نشده است. در این مقاله، مدلی مبتنی بر یادگیری ماشین برای ردهبندی متن طعنهدار و بدون طعنه ارایهمیشود و برای یافتن بهترین الگوریتمهای ردهبندی، روش نایوبیز، ماشین بردار پشتیبان، درخت تصمیم، رگرسیون لجستیک در مدل پیشنهادی آزمایش میشود. برای این کار یک مجموعه داده شامل 1320 توییتفارسی از سایت توییتر جمعآوریشده است. طبق نتایج آزمایشات، بهترین الگوریتم ردهبندی با بالاترین درستی برای مدل پیشنهادی، الگوریتم ردهبندی نایوبیز بدست آمد. این الگوریتم و روش انتخاب ویژگی تکرار واژه بر روی این مجموعه داده، درستی91/06 درصد را به دست آورد.

لینک کمکی