در جریان نمایشگاه سالانه الکامپ 1403، مدلهای زبان فارسی همراه اول که با هوش مصنوعی تجهیز شدند با حضور وزیر ارتباطات و فناوری اطلاعات رونمایی شدند.
اداره کل ارتباطات شرکت ارتباطات سیار همراه اول، اعلام کرد که در نخستین روز از آغاز نمایشگاه الکامپ 1403، گروه MCINext از مدلهای زبان فارسی توسعه یافته همراه اول با حضور عیسی زارعپور در سالن اختصاصی این اپراتور (سالن 35) رونمایی کرد. این مدلها شامل سیلک (با 1.3 میلیارد پارامتر)، آهوران (با 8 میلیارد پارامتر) و آوا (با 13 میلیارد پارامتر) بوده است.
مدلهای زبانی بزرگ (LLM) ابزارهای هوش مصنوعی هستند که با تجزیه و تحلیل اطلاعات و دادههای ورودی خروجیهای مانند عکس و متن، پاسخ به سوالات و دیگر وظایف مختلف زبانی را انجام میدهند. شرکت ارتباطات سیار درحال توسعه این فناوری است و قرار است در آینده نه چندان دور گروه MCINext زمینه استفاده عمومی از این ابزار را فراهم کند. اما در زیر هرکدام از مدلهای یادشده را به اختصار توضیح میدهیم:
- مدل زبانی سیلک: مدل سیلک پارامترهای نسبتا کمی را دراختیار دارد اما با مجموعه دادگان فارسی آموزش دیده و با توجه به شمار دادهها قابلیت زبانی خوبی را ارائه میدهد. توانایی این مدل که از پایه (from scratch) آموزش دیده در آینده بیشتر خواهد شد.
- مدل زبانی آهوران: مدل پایه برای آموزش آهوران مدل چندزبانه LIama3 متعلق به شرکت متا بهصورت آموزش ادامهدار بر روی یک مجموعه دادگان فارسی توسعه داده شده است. مدل پایه برای این فناوری دارای قابلیتهای فراوانی است و میتواند باعث گسترش زیادی در زمینه تولید متن توسط مدل آهوران به زبان فارسی شود. اما باید بگوییم که این مدل کاربرد تجاری فراوانی دارد. از جمله کاربردهای این مدل میتوان به تولید متن خودکار، ایجاد ابزارهای موردنیاز برای کمک به نویسندگان، تحلیل احساسات کاربران شبکههای اجتماعی و پشتیبانی از طریق چتبات اشاره کرد. علاوه براین مدل آهوران باعث افزایش بهرهوری، کاهش هزینههای شرکتها میشود.
- مدل زبانی آوا: مدل پایه برای آموزش آوا مدل aya از شرکت cohere بوده و هدف آن پاسخگویی از داخل متن (context) است. تفاوت مدل آوا با مدلهای دیگر این است که برای پاسخگویی نیازمند دریافت اطلاعات اولیه است و تا آنجا که امکان دارد از ارائه پاسخهایی که در زمان آموزش دریافت کرده خودداری میکند.
اما نکته پایانی اینکه شرکت همراه اول تلاش کرده است تا با کمک روشهای همترازسازی (RLHF و DPO) مانع از تولید محتواهای آسیبرسان شود.