در قالب فراخوان پژوهشهای عمیق شرکتهای دانشبنیان اعلام شد؛
فراخوان طراحی و پیادهسازی زیرساخت تعاملی مدلهای زبانی
به گزارش روابطعمومی بنیاد ملی علم ایران (INSF) ، براساس برنامهریزیهای صورت گرفته، بنیاد ملی علم ایران در راستای مأموریتگراشدن پژوهشها و حمایت از طرحهای پژوهشی که به فناوری روز دنیا میپردازد و میتواند باری از دوش صنعتگران کشور بردارد، فراخوانهایی را با عنوان برنامه حمایت از پژوهش عمیق شرکتهای دانشبنیان منتشر میکند. در این برنامه، نیازهای پژوهشی پرریسک شرکتهای دانشبنیان، از طریق سامانه کایپر بنیاد ملی علم ایران به این نهاد اعلام میشود و پس از بررسی و داوریهای لازم، فراخوان پژوهشهای عمیق و پرریسک شرکتهای دانشبنیان به پژوهشگران و محققان اعلام میشود.
فراخوان فراخوان طراحی و پیادهسازی زیرساخت تعاملی مدلهای زبانی به عنوان یکی دیگر از فراخوانهای این برنامه، منتشر میشود.
توضیحات فراخوان
پیشینه مسئله تحقیقاتی:
با توجه به قابلیت مدلهای زبانی مولد در گفت وگو با عاملهای انسانی و ارائه پاسخهای منطبق با معیارهای زبانی، استفاده از این مدلها برای اتوماسیون بخش ارتباط با مشتری از اولین کاربردهایی است که برای این مدلها در صنعت دنبال میشود.
این شرکت دانش بنیان، در حال حاضر در یکی از واحدهای کسبوکاری خود، خدمات پشتیبانی از مشتریان را در قالب اپراتورهای انسانی ارائه میدهد. این مدل کسب و کار از نظر مقیاسپذیری دارای چالشهای جدی است و به همین دلیل، خودکارسازی و هوشمندسازی پشتیبانی و ارتباط با مشتریان، باعث افزایش سرعت پشتیبانی، افزایش توان مقیاس پذیری پشتیبانی و رضایت مشتریان میگردد. با توجه به پیشرفتهای اخیر در حوزه پردازش زبانهای طبیعی، به ویژه مدلهای مولد و مدلهای زبانی بزرگ و متوسط، این شرکت در صدد است تا در نتیجه انجام این پروژه تحقیقاتی، پلتفرمی تولید گردد که امکان خودکارسازی ارتباط و گفتگو با مشتریان را ضمن حفظ کیفیت در سطح مطلوب ایجاد کند.
برای اینکه بتوان از این مدلهای زبانی با هزینه معقول و کیفیت مطلوب در حوزه پشتیبانی و ارتباط با مشتریان استفاده کرد، نیاز به ایجاد قابلیتهایی جدید در این مدلهای زبانی است که هدف این پروژه تحقیقاتی است.
شرح مسئله تحقیقاتی:
مدلهای زبانی، علیرغم قابلیتهای بسیار، دارای کمبودهایی مانند عدم دسترسی به دادههای بیرونی و برخط، عدم توانایی در اتصال به API های سیستمهای دیگر و عملکرد ضعیفتر در زبان فارسی هستند. در این پروژه، هدف رفع این کمبودها است. شرح هرکدام از موارد مسئله تحقیقاتی به صورت زیر است:
- ایجاد ربات پشتیبانی با قابلیت استفاده از محتواهای متنی: در سیستمهای پشتیبانی، معمولاً مجموعهای از مستندات در اختیار اپراتور قرار داده میشود که اپراتور باید بر این مطالب مسلط شود و پاسخ کاربر را مبتنی بر این مستندات بدهد. بنابراین، در صورتی که یک مدل زبانی بخواهد به عنوان پشتیبان مشتری عمل کند، باید بتواند پاسخ کاربران را در صورت لزوم بر اساس یک محتوای متنی ازپیشتهیهشده بدهد و در صورتی که جواب یک سوال در مجموعه داده دراختیارقرارداده شده وجود ندارد، پاسخ کاربر را با اطلاعات نامرتبط ندهد. با توجه به زمانبر بودن آموزش مدلهای زبانی، به روشی که برای این کار وجود دارد، تولید محتوای مبتنی بر استخراج گفته میشود. برای این منظور، نیاز است که امبدینگ مناسبی از کلمات فارسی وجود داشته باشد که بر مبنای آن بتوان اطلاعات مرتبط با پرسش کاربر را بازیابی کرد و در قالب مکالمه به او پاسخ داد.
- قابلیت اتصال به API جهت دریافت اطلاعات لحظهای: در بسیاری از موارد اپراتور پشتیبانی، برای پاسخ به یک کاربر، نیازمند چک کردن پنلهای مختلف و دریافت اطلاعات لحظهای در مورد وضعیت سفارشات کاربر یا تغییر وضعیت سفارش یا موارد دیگر در آن پنل به درخواست کاربر است. برای اینکه یک مدل زبانی بتواند به طور کامل جایگزین اپراتور پشتیبانی شود، این مدلها باید قابلیت استنتاج اینکه برای انجام هر کاری باید چه API ی را فراخوانی کنند را داشته باشد.
- قابلیت استفاده ربات از محتواهای چت های پیشین اپراتورها و کاربران: در بسیاری از کسبوکارها، مهمترین بخش اطلاعاتی که برای پاسخگویی به مشتریان وجود دارد، گفتوگوهای پیشین بین اپراتورهای انسانی و مشتریان است. استفاده از این اطلاعات برخلاف مستندات مکتوب کسب وکارها با پیچیدگی بیشتری روبهرو ا ست. از این جهت که برای استفاده از پاسخی که به یک پرسش داده شده است، باید بتوان زمینهای را که این پاسخ در آن صحیح بوده است استخراج کرد و تنها در همان زمینه از آن استفاده کرد.
- طراحی خط لوله تولید رباتهای پشتیبانی: چنانچه گفته شد، برای پاسخ گویی مؤثر به مشتریان یک کسبوکار به صورت خودکار، نیاز به مدلی است که بتواند با درنظرگرفتن مستندات و تاریخچه آن کسبوکار و هم چنین فراخوانی API های آن، به دادههای لازم برای پاسخ گویی به کاربر دست یابد. اما هدف ما در این طرح، ایجاد پلتفرم است که بتوان برای مشتریان مختلف این کار را با صرف هزینه و زمان کم به نتیجه رساند. از این رو، یکی از چالشهای این طرح، ایجاد یک خط لوله توسعه چنین مدلهایی است که بتوان با در اختیار قرار دادن مستندات کسبوکار و API های آن و همچنین چتهای پیشین بین مشتریان و اپراتورها، به مدلی دست یافت که این نیازمندیها را برای آن کسبوکار مرتفع نماید.
- ایجاد فرآیند ارزیابی خودکار مدلهای پاسخگویی مبتنی بر بازیابی: یکی از چالشهای اصلی ایجاد مدلهای خودکار پاسخگویی به مشتری، ارزیابی این مدلها است؛ به گونهای که بتوان بعد از تهیه این مدلها و قبل از اینکه در دسترس کاربران قرار بگیرد، از صحت عملکرد آنها اطمینان حاصل کرد. ایجاد چنین فرآیند و سیستمی که خروجیهای خط لوله تولید رباتهای پاسخگویی را بتواند ارزیابی کند، یکی از پیچیدگیهای اصلی تولید چنین پلتفرمی است.
چالشهای نیاز فناورانه:
- نتیجه حاصل از این پژوهش، زیرساختی خواهد بود که امکان تعامل مدلهای زبانی را با سیستمهای آنلاین دیگر، فرآیندها و وظایف فراهم خواهد نمود. این زیرساخت باید بتواند با قرار گرفتن مدل زبانی در یک زمینه مشخص و استفاده از تاریخچه پیشین گفتگو، در هر لحظه تصمیم بگیرد که مدل زبانی باید با چه سیستم، API یا عاملی باید ارتباط برقرار کرده و چه نتایجی را باید از ارتباط استخراج نماید.
- چالش و پیچیدگی اصلی این پژوهش در ایجاد توانایی مناسب استنتاج برای فهم زمینه مکالمه، خواسته دقیق عامل انسانی و تناظر آن با API مربوطه است بهطوری که تشخیص سرویسی که مدل با آن ارتباط برقرار کند دقیق و دارای حداقل خطا باشد. برای مثال؛ یک چتبات را فرض کنید که امکان اتصال به API ده (۱۰) سیستم متفاوت را دارد. فرض کنید که یکی از این API ها امکان اتصال به تقویم آنلاین کاربر و دیگری امکان اتصال به یک سیستم رزرو بلیط سینما را دارد. کاربری را فرض کنید که از چتبات به زبانی انسانی میخواهد تا در یکی از زمانهای خالی او یک بلیط سینما رزرو کند. در پاسخ به این سوال، چتبات باید بتواند استنتاج کند که برای انجام کار این کاربر باید به دو API تقویم و سیستم رزرو متصل گردد، ابتدا از تقویم، زمانهای خالی کاربر را چک کند و سپس براساس آن، یک بلیط برای او رزرو نماید. طراحی و پیادهسازی زیرساختی که این موضوع را دقیق متوجه شود و بدون خطا به API های درست متصل گردد، مثالی از چالش و پیچیدگی این پژوهش است.
گامهای تحقیقاتی و الزامات طرح:
- تحقیق و تحلیل و طراحی معماری سامانه تولید محتوای مبتنی بر محتوا و فراخوانی API ها؛
- پاکسازی دادهها و توسعه و آموزش و دقیقسازی مدلها بر روی مجموعه داده یک کسبوکار؛
- طراحی و توسعه خط لوله آموزش و خدمترسانی مدلها بهگونهای که با تغییر دادهها بتوان مدل متناسب را در زمان کمی بهدستآورد؛
- طراحی و پیادهسازی سامانه آزمون مدلهای آموزشدادهشده و سنجش میزان دقت آنها.
خروجی نهایی تحقیق:
- کدهای نرمافزاری پروژه: شامل تمامی برنامههای نوشته شده به زبانهای برنامهنویسی مختلف، تنظیمات برنامهنویسی، تمامی مخازن پروژههای برنامهنویسی و پکیجهای آنها؛
- طراحی معماری: شامل شرح و طراحی معماری کلی سیستم نهایی و مؤلفههای مختلف آن و نحوه و پروتکل ارتباطی آنها؛
- مستندات اتصال و یکپارچهسازی: شامل مستندات لازم برای یکپارچهسازی سیستم با سایر سیستمها مانند API Reference
- مستندات استقرار: مستندات راهنمای استقرار سیستم اعم از منابع سختافزاری و شبکهای مورد نیاز، برنامههای سیستمی لازم برای راهاندازی پروژه و سیستمعامل لازم برای استقرار؛
- پژوهشهای علمی در راستای مدلهای زبانی: تمامی پژوهشهایی که در راستای شناخت بهتر ظرفیتهای مدلهای زبانی و مدلهای زبانی مولد برای اجرای این پروژه صورتگرفته، اعم از مطالعات تطبیقی یا توسعهدانش جدید در این حوزه.
راهکارهای غیرجذاب:
- استفاده از مدلهای زبانی غیر متنباز مانند ChatGPT و Bard و Claude ؛
- استفاده از مدلهای زبانی بسیار بزرگ که اجرای آنهابهصورت محلی دارای هزینه سختافزاری بسیار زیاد باشد.
تسهیم مالکیت فکری:
- مالکیت معنوی: مجری در مالکیت معنوی ناشی از اجرای تحقیق سهیم خواهد بود و انتشار مقاله مشترک توسط مجری و متقاضی در ژورنالهای داخلی و خارجی، ارائه مقاله در کنفرانسها و سمینارها با موافقت و اشاره به نام همه دستاندرکاران مجاز خواهد بود.
- مالکیت منافع مادی: با توجه به مدل کسبوکار شرکت متقاضی، منافع مالی ناشی از توسعه این فناوری متعلق به شرکت متقاضی است.
نحوه پذیرش:
رقابتی است و از بین پروپوزالهای دریافتی، موردی که شرایط زیر را داشته باشد، در اولویت خواهد بود.
- ترکیب متخصصین تیم پیشنهادی مرتبط باشد.
- افراد پیشنهاد شده، دارای سابقه پژوهشی و فنی در آن موضوع باشند.
- زمانبندی، هزینه و شرح خدمات، متناسب و مرتبط با پژوهش مورد تقاضا باشد. (در این بخش، مجری میتواند برآورد اولیه خود را اعلام کند اما بدیهی است جزئیات اجرایی در ابتدای امر مشخص نیست و مجری و کارفرما با علم به این موضوع وارد این توافق خواهند شد)
- تیم پیشنهاددهنده، زیرساخت انجام پژوهش اعم از آزمایشگاه و کارگاه را داشته باشند.
- پروپوزال طبق فرمت پیشنهادی بنیاد، تهیه و ارسال شده باشد.
هزینههای قابل قبول:
- حقالتحقیق نیروی انسانی؛
- تستها و آنالیزها؛
- خدمات.
حوزههای اولویتدار
مهندسی / کامپیوتر / هوش مصنوعی
واجدین شرایط
پژوهشگر اصلی تیم لازم است عضو هیئت علمی یکی از دانشگاهها و مؤسسات آموزش عالی کشور باشد.
از پروپوزالهایی که در قالب رساله دکتری و طرح پسادکتری تعریف شوند، حمایت فوقالعاده میشود.
پس از دریافت پروپوزال از طریق سامانه کایپر، ارزیابی انجام گرفته و در صورت کسب امتیاز بالا، تیم برگزیده جهت مذاکره با بنیاد و شرک ت متق اضی دعوت خواهد شد.
فایل پیوست
تاریخ فراخوان
کلیه افراد واجد شرایط تا ۱۵ بهمن فرصت دارند که پروپوزال خود را از طریق سامانه کایپر / بخش پژوهشگر و متقاضی / فراخوان پژوهش عمیق شرکتهای دانشبنیان برای بنیاد ملی علم ایران ارسال نمایند.
مبلغ حمایت
پژوهش پیشنهاد شده تا سقف ۸۰ درصد، حداکثر ۲ میلیارد تومان، توسط بنیاد ملی علم ایران حمایت خواهد شد. بدیهی است که مابقی هزینهها باید توسط شرکت متقاضی پژوهش تأمین شود.
کارگروه مسئول
در صورت هرگونه سوال میتوانید با کارگروه دانشبنیان با ایمیل: amini.m@insf.org و شماره تلفن ۰۲۱۸۲۱۶۱۱۲۱ تماس بگیرید.
جهت بارگذاری پروپوزال کلیک کنید.
علاقمندان میتوانند اخبار و رویدادهای بنیاد ملی علم ایران را در شبکههای اجتماعی زیر دنبال کنند: