مدل‌های زبان فارسی همراه اول در الکامپ 1403 رونمایی شدند

در جریان نمایشگاه سالانه الکامپ 1403، مدل‌های زبان فارسی همراه اول که با هوش مصنوعی تجهیز شدند با حضور وزیر ارتباطات و فناوری اطلاعات رونمایی شدند.

اداره کل ارتباطات شرکت ارتباطات سیار همراه اول، اعلام کرد که در نخستین روز از آغاز نمایشگاه الکامپ 1403، گروه MCINext از مدل‌های زبان فارسی توسعه یافته همراه اول با حضور عیسی زارع‌پور در سالن اختصاصی این اپراتور (سالن 35) رونمایی کرد. این مدل‌ها شامل سیلک (با 1.3 میلیارد پارامتر)، آهوران (با 8 میلیارد پارامتر) و آوا (با 13 میلیارد پارامتر) بوده است.

مدل‌های زبانی بزرگ (LLM) ابزارهای هوش مصنوعی هستند که با تجزیه و تحلیل اطلاعات و داده‌های ورودی خروجی‌های مانند عکس و متن، پاسخ به سوالات و دیگر وظایف مختلف زبانی را انجام می‌دهند. شرکت ارتباطات سیار درحال توسعه این فناوری است و قرار است در آینده نه چندان دور گروه MCINext زمینه استفاده عمومی از این ابزار را فراهم کند. اما در زیر هرکدام از مدل‌های یادشده را به اختصار توضیح می‌دهیم:

مدل زبانی سیلک: مدل سیلک پارامترهای نسبتا کمی را دراختیار دارد اما با مجموعه دادگان فارسی آموزش دیده و با توجه به شمار داده‌ها قابلیت زبانی خوبی را ارائه می‌دهد. توانایی این مدل که از پایه (from scratch) آموزش دیده در آینده بیشتر خواهد شد.
مدل زبانی آهوران: مدل پایه برای آموزش آهوران مدل چندزبانه LIama3 متعلق به شرکت متا به‌صورت آموزش ادامه‌دار بر روی یک مجموعه دادگان فارسی توسعه داده شده است. مدل پایه برای این فناوری دارای قابلیت‌های فراوانی است و می‌تواند باعث گسترش زیادی در زمینه تولید متن توسط مدل آهوران به زبان فارسی شود. اما باید بگوییم که این مدل کاربرد تجاری فراوانی دارد. از جمله کاربرد‌های این مدل می‌توان به تولید متن خودکار، ایجاد ابزارهای موردنیاز برای کمک به نویسندگان، تحلیل احساسات کاربران شبکه‌های اجتماعی و پشتیبانی از طریق چت‌بات اشاره کرد. علاوه براین مدل آهوران باعث افزایش بهره‌وری، کاهش هزینه‌های شرکت‌ها می‌شود.
مدل زبانی آوا: مدل پایه برای آموزش آوا مدل aya از شرکت cohere بوده و هدف آن پاسخگویی از داخل متن (context) است. تفاوت مدل آوا با مدل‌های دیگر این است که برای پاسخگویی نیازمند دریافت اطلاعات اولیه است و تا آنجا که امکان دارد از ارائه پاسخ‌هایی که در زمان آموزش دریافت کرده خودداری می‌کند.

اما نکته پایانی اینکه شرکت همراه اول تلاش کرده است تا با کمک روش‌های همترازسازی (RLHF و DPO) مانع از تولید محتواهای آسیب‌رسان شود.