پژوهشگران «دانشگاه کارنگی ملون» و «متا»، روش جدیدی را ابداع کردهاند که ربات به واسطه آن میتواند مهارتها را مانند یک کودک سه ساله یاد بگیرد.
به گزارش استادی فایندز، نوزادان و کودکان نوپا با کاوش در محیط اطراف خود یاد میگیرند و اکنون رباتها نیز میتوانند از همین روش برای یادگیری استفاده کنند. در یک همکاری پیشگامانه بین «دانشگاه کارنگی ملون»(CMU) و «متا»(Meta)، دانشمندان از روشی که نوزادان به واسطه آن یاد میگیرند، برای ایجاد یک رویکرد نوآورانه به منظور آموزش دادن رباتها الهام گرفتهاند. نتیجه این کار، یک عامل هوش مصنوعی به نام «روبوایجنت»(RoboAgent) بود که برای تقلید از فرآیند یادگیری کودک نوپا و کسب مهارتها به اندازه یک کودک سه ساله طراحی شده است.
«ویکاش کومار»(Vikash Kumar) پژوهشگر مؤسسه رباتیک در دانشکده علوم رایانه دانشگاه کارنگی ملون گفت: هدف ما ایجاد یک عامل هوش مصنوعی است که بتواند طیف گستردهای از مهارتها را در موقعیتهای جدید ایجاد کند و مشابه نحوه یادگیری نوزادان انسان باشد. روبوایجنت از مشاهدات و بازیهای محدود استفاده میکند. این روش درست مانند روش نوزادانی است که برای یادگیری، بسیار تماشا میکنند، تقلید میکنند و به تکرار کردن آن میپردازند.
روبوایجنت در سناریوهای متنوع، توانایی خود را در ۱۲ مهارت نشان داد و یک پلتفرم یادگیری پویا را به نمایش گذاشت که با محیطهای متغیر سازگار است. برخلاف پژوهشهای پیشین که در حوزه شبیهسازی انجام شدهاند، این پروژه با موفقیت در محیطهای دنیای واقعی و با استفاده از دادههای بسیار کمتر عمل کرد.
«آبیناو گوپتا»(Abhinav Gupta) دانشیار موسسه رباتیک، در یک نشست دانشگاهی گفت: روبوایجنت، پیچیدگی بیشتری از مهارتها را نسبت به تلاشهای پیشین نشان میدهد و مجموعه مهارتهای متنوعی را به نمایش میگذارد که از دستاوردهای هر عامل رباتیک در دنیای واقعی پیشی میگیرد. روبوایجنت کارآیی، مقیاسپذیری و سازگاری با موقعیتهای دیدهنشده را ترکیب میکند.
ساختار منحصربهفرد یادگیری روبوایجنت، هسته اصلی اثربخشی و کارآیی آن است. این ساختار خط مشی نوآورانه، استدلال را حتی با تجربیات محدود سهولت میبخشد و عامل را قادر میسازد تا طبق اهداف مشخصشده عمل کند.
فرآیند یادگیری روبوایجنت از روشی الهام میگیرد که کودکان به واسطه آن دانش را جمعآوری میکنند. درست همان طور که والدین فرزندان خود را راهنمایی میکنند، پژوهشگران نیز تجربیات ارزشمند خود را به این ربات ارائه دادند. با وجود این، دامنه یادگیری روبوایجنت فراتر از محیط آن است.
«موهیت شارما»(Mohit Sharma) دانشجوی مقطع دکتری رشته رباتیک گفت: برای غلبه بر محدودیتها، روبوایجنت از ویدیوهای اینترنتی یاد میگیرد. این کار به همان روشی صورت میگیرد که نوزادان با مشاهده محیط اطراف خود، رفتارهایی را میآموزند. این ویدیوها به روبوایجنت کمک میکنند تا نحوه تعامل انسانها با اجسام را بیاموزد و از مهارتها برای تکمیل کردن وظایف استفاده کند. روبوایجنت، درسهای ارزشمندی را از سناریوهای گوناگون میآموزد و آنها را در چالشهای جدید به کار میگیرد.
هدف پروژه بلندپروازانه این گروه، افزایش سازگاری رباتها با تنظیمات گوناگون است. «شوبهام تولسانی»(Shubham Tulsiani) دانشیار موسسه رباتیک گفت: یادگیری روبوایجنت میتواند ما را به سوی ساخت یک ربات جهانی نزدیکتر کند که قادر به انجام دادن طیف گستردهای از وظایف در محیطهای گوناگون باشد. این پلتفرم میتواند رباتها را برای کار کردن در فضاهای بدون ساختار مانند خانهها، بیمارستانها و مناطق عمومی سودمندتر کند.
تاثیر این پروژه با رویکرد منبع باز آن بیشتر میشود. این گروه پژوهشی در حال انتشار مدلهای آموزشدیده، پایگاه کد، درایورهای سختافزاری و مجموعه دادههای گسترده موسوم به «روبوست»(RoboSet) است که بزرگترین مجموعه داده رباتیک در دسترس عموم بر مبنای سختافزار استاندارد به شمار میرود. هدف از این کار، تقویت همکاری و توسعه در جامعه رباتیک است و راه را برای ارائه یک عامل رباتیک عمومی همهکاره و اساسی در آینده هموار میکند.
منبع: ایسنا