توسعه‌ و بهره‌برداری از سکوی پردازش زبان فارسی عامیانه در سامانه‌ی ذکاوت

شماره :
41972
آخرین به روزرسانی :
سه شنبه 1402/06/28 ساعت 16:39
دسته بندی

توسعه‌ و بهره‌برداری از سکوی پردازش زبان فارسی عامیانه در سامانه‌ی ذکاوت

به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، همگام با طراحی و توسعه سامانه ذکاوت(ذائقه‌سنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت.

گفتنی است از آن‌جایی که متن‌های منتشرشده در پیام‌رسان/ شبکه‌های اجتماعی به صورت عامیانه می‌باشند و پردازش زبان فارسی یکی از ارکان پایه‌ای تحلیل محتوای متنی است، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاوره‌ای) نیز توسط پروژه‌ "طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی" توسعه داده شده و در سامانه ذکاوت، طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است.

به گفته مهندس لیلا ربیعی مجری پروژه های مذکور و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT، این سکو شامل ابزارهای تشخیص موجودیت‌های نامدار (NER)، نرمال‌ساز فارسی(Normalizer)، برچسب‌زن ادات سخن(POSTagger) و چانکر(chunker) می‌باشد، که به صورت API قابلیت ارائه خدمات را خواهد داشت. لازم به توضیح است که پیکره‌ای شامل 500 هزار توکن فارسی از متون عامیانه شبکه‌های اجتماعی جهت توسعه‌ی ابزارهای برچسب‌زن ادات سخن و چانکر، توسط تیم زبان‌شناسی برچسب‌گذاری شده است.

لازم به ذکر است پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاه‌های مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی می‌نماید.

X