در قالب فراخوان پژوهش‌های عمیق شرکت‌های دانش‌بنیان اعلام شد؛

فراخوان طراحی و پیاده‌سازی زیرساخت تعاملی مدل‌های زبانی

بنیاد ملی علم ایران در راستای مأموریت‌گرا‌شدن پژوهش‌ها و حمایت از طرح‌های پژوهشی که به فناوری روز دنیا می‌پردازد و می‌تواند باری از دوش صنعتگران کشور بردارد، فراخوان‌هایی را با عنوان برنامه حمایت از پژوهش عمیق شرکت‌های دانش‌بنیان منتشر می‌کند.«طراحی و پیاده‌سازی زیرساخت تعاملی مدل‌های زبانی» به عنوان یکی دیگر از فراخوان‌های این برنامه، منتشر می‌شود و متقاضیان تا ۱۵ بهمن برای ثبت نام مهلت دارند.
فراخوان طراحی و پیاده‌سازی زیرساخت تعاملی مدل‌های زبانی

به گزارش روابط‌عمومی بنیاد ملی علم ایران (INSF) ، براساس برنامه‌ریزی‌های صورت گرفته، بنیاد ملی علم ایران در راستای مأموریت‌گرا‌شدن پژوهش‌ها و حمایت از طرح‌های پژوهشی که به فناوری روز دنیا می‌پردازد و می‌تواند باری از دوش صنعتگران کشور بردارد، فراخوان‌هایی را با عنوان برنامه حمایت از پژوهش عمیق شرکت‌های دانش‌بنیان منتشر می‌کند. در این برنامه، نیاز‌های پژوهشی پرریسک شرکت‌های دانش‌بنیان، از طریق سامانه کایپر بنیاد ملی علم ایران به این نهاد اعلام می‌شود و پس از بررسی و داوری‌های لازم، فراخوان پژوهش‌های عمیق و پرریسک شرکت‌های دانش‌بنیان به پژوهشگران و محققان اعلام می‌شود.

فراخوان فراخوان طراحی و پیاده‌سازی زیرساخت تعاملی مدل‌های زبانی به عنوان یکی دیگر از فراخوان‌های این برنامه، منتشر می‌شود.

توضیحات فراخوان

پیشینه مسئله تحقیقاتی:

با توجه به قابلیت مدل‌های زبانی مولد در گفت وگو با عامل‌های انسانی و ارائه پاسخ‌های منطبق با معیارهای زبانی، استفاده از این مدل‌ها‌‌‌‌‌‌‌ برای اتوماسیون بخش ارتباط با مشتری از اولین کاربردهایی است که برای این مدل‌ها در صنعت دنبال می‌شود.

این شرکت دانش بنیان، در حال حاضر در یکی از واحدهای کسب‌وکاری خود، خدمات پشتیبانی از مشتریان را در قالب اپراتورهای انسانی ارائه می‌‌دهد. این مدل کسب و کار از نظر مقیاس‌‌پذیری دارای چالش‌های جدی است و به همین دلیل، خودکارسازی و هوشمندسازی پشتیبانی و ارتباط با مشتریان، باعث افزایش سرعت پشتیبانی، افزایش توان مقیاس پذیری پشتیبانی و رضایت مشتریان می‌گردد. با توجه به پیشرفت‌های اخیر در حوزه پردازش زبان‌های طبیعی، به ویژه مدل‌های مولد و مدل‌های زبانی بزرگ و متوسط، این شرکت در صدد است تا در نتیجه انجام این پروژه تحقیقاتی، پلتفرمی تولید گردد که امکان خودکارسازی ارتباط و گفتگو با مشتریان را ضمن حفظ کیفیت در سطح مطلوب ایجاد کند.

برای اینکه بتوان از این مدل‌های زبانی با هزینه معقول و کیفیت مطلوب در حوزه پشتیبانی و ارتباط با مشتریان استفاده کرد، نیاز به ایجاد قابلیت‌هایی جدید در این مدل‌های زبانی است که هدف این پروژه تحقیقاتی است.

شرح مسئله تحقیقاتی:

مدل‌های زبانی، علی‌رغم قابلیت‌های بسیار، دارای کمبودهایی مانند عدم دسترسی به داده‌های بیرونی و برخط، عدم توانایی در اتصال به API های سیستم‌های دیگر و عملکرد ضعیف‌تر در زبان فارسی هستند. در این پروژه، هدف رفع این کمبودها است. شرح هرکدام از موارد مسئله تحقیقاتی به صورت زیر است:

  1. ایجاد ربات پشتیبانی با قابلیت استفاده از محتواهای متنی: در سیستم‌های پشتیبانی، معمولاً مجموعه‌ای از مستندات در اختیار اپراتور قرار داده می‌شود که اپراتور باید بر این مطالب مسلط شود و پاسخ کاربر را مبتنی بر این مستندات بدهد. بنابراین، در صورتی که یک مدل زبانی بخواهد به عنوان پشتیبان مشتری عمل کند، باید بتواند پاسخ کاربران را در صورت لزوم بر اساس یک محتوای متنی ازپیش‌‌تهیه‌‌شده بدهد و در صورتی که جواب یک سوال در مجموعه داده دراختیارقرارداده شده وجود ندارد، پاسخ کاربر را با اطلاعات نامرتبط ندهد. با توجه به زمان‌بر بودن آموزش مدل‌های زبانی، به روشی که برای این کار وجود دارد، تولید محتوای مبتنی بر استخراج گفته می‌شود. برای این منظور، نیاز است که امبدینگ مناسبی از کلمات فارسی وجود داشته باشد که بر مبنای آن بتوان اطلاعات مرتبط با پرسش کاربر را بازیابی کرد و در قالب مکالمه به او پاسخ داد.
  2. قابلیت اتصال به API جهت دریافت اطلاعات لحظه‌ای: در بسیاری از موارد اپراتور پشتیبانی، برای پاسخ به یک کاربر، نیازمند چک کردن پنل‌های مختلف و دریافت اطلاعات لحظه‌ای در مورد وضعیت سفارشات کاربر یا تغییر وضعیت سفارش یا موارد دیگر در آن پنل به درخواست کاربر است. برای اینکه یک مدل زبانی بتواند به طور کامل جایگزین اپراتور پشتیبانی شود، این مدل‌ها باید قابلیت استنتاج اینکه برای انجام هر کاری باید چه API ی را فراخوانی کنند را داشته باشد.
  3. قابلیت استفاده ربات از محتواهای چت های پیشین اپراتورها و کاربران: در بسیاری از کسب‌‌وکارها، مهم‌ترین بخش اطلاعاتی که برای پاسخ‌گویی به مشتریان وجود دارد، گفت‌وگوهای پیشین بین اپراتورهای انسانی و مشتریان است. استفاده از این اطلاعات برخلاف مستندات مکتوب کسب وکارها با پیچیدگی بیشتری روبه‌رو ا ست. از این جهت که برای استفاده از پاسخی که به یک پرسش داده شده است، باید بتوان زمینه‌ای را که این پاسخ در آن صحیح بوده است استخراج کرد و تنها در همان زمینه از آن استفاده کرد.
  4. طراحی خط لوله تولید ربات‌های پشتیبانی: چنان‌چه گفته شد، برای پاسخ گویی مؤثر به مشتریان یک کسب‌‌وکار به صورت خودکار، نیاز به مدلی است که بتواند با درنظرگرفتن مستندات و تاریخچه آن کسب‌‌وکار و هم چنین فراخوانی API های آن، به داده‌های لازم برای پاسخ گویی به کاربر دست یابد. اما هدف ما در این طرح، ایجاد پلتفرم است که بتوان برای مشتریان مختلف این کار را با صرف هزینه و زمان کم به نتیجه رساند. از این رو، یکی از چالش‌های این طرح، ایجاد یک خط لوله توسعه چنین مدل‌‌هایی است که بتوان با در اختیار قرار دادن مستندات کسب‌وکار و API های آن و هم‌‌چنین چت‌های پیشین بین مشتریان و اپراتورها، به مدلی دست یافت که این نیازمندی‌‌ها را برای آن کسب‌‌وکار مرتفع نماید.
  5. ایجاد فرآیند ارزیابی خودکار مدل‌های پاسخ‌گویی مبتنی بر بازیابی: یکی از چالش‌های اصلی ایجاد مدل‌های خودکار پاسخ‌‌گویی به مشتری، ارزیابی این مدل‌‌ها است؛ به گونه‌ای که بتوان بعد از تهیه این مدل‌‌ها و قبل از اینکه در دسترس کاربران قرار بگیرد، از صحت عملکرد آن‌ها اطمینان حاصل کرد. ایجاد چنین فرآیند و سیستمی که خروجی‌های خط لوله تولید ربات‌های پاسخ‌‌گویی را بتواند ارزیابی کند، یکی از پیچیدگی‌های اصلی تولید چنین پلتفرمی است.

چالش‌های نیاز فناورانه:

  1. نتیجه حاصل از این پژوهش، زیرساختی خواهد بود که امکان تعامل مدل‌های زبانی را با سیستم‌های آنلاین دیگر، فرآیندها و وظایف فراهم خواهد نمود. این زیرساخت باید بتواند با قرار گرفتن مدل زبانی در یک زمینه مشخص و استفاده از تاریخچه پیشین گفتگو، در هر لحظه تصمیم بگیرد که مدل زبانی باید با چه سیستم، API یا عاملی باید ارتباط برقرار کرده و چه نتایجی را باید از ارتباط استخراج نماید.
  2. چالش و پیچیدگی اصلی این پژوهش در ایجاد توانایی مناسب استنتاج برای فهم زمینه مکالمه، خواسته دقیق عامل انسانی و تناظر آن با API مربوطه است به‌طوری که تشخیص سرویسی که مدل با آن ارتباط برقرار کند دقیق و دارای حداقل خطا باشد. برای مثال؛ یک چت‌بات را فرض کنید که امکان اتصال به API ده (۱۰) سیستم متفاوت را دارد. فرض کنید که یکی از این API ها امکان اتصال به تقویم آنلاین کاربر و دیگری امکان اتصال به یک سیستم رزرو بلیط سینما را دارد. کاربری را فرض کنید که از چت‌بات به زبانی انسانی می‌خواهد تا در یکی از زمان‌های خالی او یک بلیط سینما رزرو کند. در پاسخ به این سوال، چت‌بات باید بتواند استنتاج کند که برای انجام کار این کاربر باید به دو API تقویم و سیستم رزرو متصل گردد، ابتدا از تقویم، زمان‌های خالی کاربر را چک کند و سپس براساس آن، یک بلیط برای او رزرو نماید. طراحی و پیاده‌سازی زیرساختی که این موضوع را دقیق متوجه شود و بدون خطا به API های درست متصل گردد، مثالی از چالش و پیچیدگی این پژوهش است.

گام‌های تحقیقاتی و الزامات طرح:

  1. تحقیق و تحلیل و طراحی معماری سامانه تولید محتوای مبتنی بر محتوا و فراخوانی API ها؛
  2. پاک‌سازی داده‌ها و توسعه و آموزش و دقیق‌سازی مدل‌ها بر روی مجموعه داده یک کسب‌وکار؛
  3. طراحی و توسعه خط لوله آموزش و خدمت‌رسانی مدل‌ها به‌گونه‌ای که با تغییر داده‌ها بتوان مدل متناسب را در زمان کمی به‌دست‌آورد؛
  4. طراحی و پیاده‌سازی سامانه آزمون مدل‌های آموزش‌داده‌شده و سنجش میزان دقت آن‌ها.

خروجی نهایی تحقیق:

  1. کدهای نرم‌افزاری پروژه: شامل تمامی برنامه‌های نوشته شده به زبان‌های برنامه‌نویسی مختلف، تنظیمات برنامه‌نویسی، تمامی مخازن پروژه‌های برنامه‌نویسی و پکیج‌های آن‌ها؛
  2. طراحی معماری: شامل شرح و طراحی معماری کلی سیستم نهایی و مؤلفه‌های مختلف آن و نحوه و پروتکل ارتباطی آن‌ها؛
  3. مستندات اتصال و یکپارچه‌سازی: شامل مستندات لازم برای یکپارچه‌سازی سیستم با سایر سیستم‌ها مانند API Reference
  4. مستندات استقرار: مستندات راهنمای استقرار سیستم اعم از منابع سخت‌افزاری و شبکه‌ای مورد نیاز، برنامه‌های سیستمی لازم برای راه‌اندازی پروژه و سیستم‌عامل لازم برای استقرار؛
  5. پژوهش‌های علمی در راستای مدل‌های زبانی: تمامی پژوهش‌هایی که در راستای شناخت بهتر ظرفیت‌های مدل‌های زبانی و مدل‌های زبانی مولد برای اجرای این پروژه صورت‌گرفته، اعم از مطالعات تطبیقی یا توسعه‌دانش جدید در این حوزه‌.

راهکارهای غیرجذاب:

  1. استفاده از مدل‌های زبانی غیر متن‌باز مانند ChatGPT و Bard و Claude ؛
  2. استفاده از مدل‌های زبانی بسیار بزرگ که اجرای آن‌هابه‌صورت محلی دارای هزینه سخت‌افزاری بسیار زیاد باشد.

تسهیم مالکیت فکری:

  1. مالکیت معنوی: مجری در مالکیت معنوی ناشی از اجرای تحقیق سهیم خواهد بود و انتشار مقاله مشترک توسط مجری و متقاضی در ژورنال‌های داخلی و خارجی، ارائه مقاله در کنفرانس‌ها و سمینارها با موافقت و اشاره به نام همه دست‌اندرکاران مجاز خواهد بود.
  2. مالکیت منافع مادی: با توجه به مدل کسب‌وکار شرکت متقاضی، منافع مالی ناشی از توسعه این فناوری متعلق به شرکت متقاضی است.

نحوه پذیرش:

رقابتی است و از بین پروپوزال‌های دریافتی، موردی که شرایط زیر را داشته باشد، در اولویت خواهد بود.

  1. ترکیب متخصصین تیم پیشنهادی مرتبط باشد.
  2. افراد پیشنهاد شده، دارای سابقه پژوهشی و فنی در آن موضوع باشند.
  3. زمان‌بندی، هزینه و شرح خدمات، متناسب و مرتبط با پژوهش مورد تقاضا باشد. (در این بخش، مجری می‌تواند برآورد اولیه خود را اعلام کند اما بدیهی است جزئیات اجرایی در ابتدای امر مشخص نیست و مجری و کارفرما با علم به این موضوع وارد این توافق خواهند شد)
  4. تیم پیشنهاددهنده، زیرساخت انجام پژوهش اعم از آزمایشگاه و کارگاه را داشته باشند.
  5. پروپوزال طبق فرمت پیشنهادی بنیاد، تهیه و ارسال شده باشد.

هزینه‌های قابل قبول:

  1. حق‌التحقیق نیروی انسانی؛
  2. تست‌ها و آنالیزها؛
  3. خدمات.

حوزه‌های اولویت‌دار

مهندسی / کامپیوتر / هوش مصنوعی

واجدین شرایط

پژوهشگر اصلی تیم لازم است عضو هیئت علمی یکی از دانشگاه‌ها و مؤسسات آموزش عالی کشور باشد.

از پروپوزال‌هایی که در قالب رساله دکتری و طرح پسادکتری تعریف شوند، حمایت فوق‌العاده می‌شود.

پس از دریافت پروپوزال از طریق سامانه کایپر، ارزیابی انجام گرفته و در صورت کسب امتیاز بالا، تیم برگزیده جهت مذاکره با بنیاد و شرک ت متق اضی دعوت خواهد شد.

فایل پیوست

فرم خام پروپوزال

تاریخ فراخوان

کلیه افراد واجد شرایط تا ۱۵ بهمن فرصت دارند که پروپوزال خود را از طریق سامانه کایپر / بخش پژوهشگر و متقاضی / فراخوان پژوهش عمیق شرکت‌های دانش‌بنیان برای بنیاد ملی علم ایران ارسال نمایند.

مبلغ حمایت

پژوهش پیشنهاد شده تا سقف ۸۰ درصد، حداکثر ۲ میلیارد تومان، توسط بنیاد ملی علم ایران حمایت خواهد شد. بدیهی است که مابقی هزینه‌ها باید توسط شرکت متقاضی پژوهش تأمین شود.

کارگروه مسئول

در صورت هرگونه سوال می‌توانید با کارگروه دانش‌بنیان با ایمیل: amini.m@insf.org و شماره تلفن ۰۲۱۸۲۱۶۱۱۲۱ تماس بگیرید.

جهت بارگذاری پروپوزال کلیک کنید.

 

‌‌‌‌‌‌‌علاقمندان می‌توانند اخبار و رویدادهای بنیاد ملی علم ایران را در شبکه‌های اجتماعی زیر دنبال کنند: