МӘСКЕУ, 29 қараша. Орыс ғалымдары жылдам контекстік күшейту бойынша оқытудың алғашқы ашық ортасын жасады (контексте RL). Бұл туралы T-Bank AI Research жасанды интеллект зерттеу зертханасында хабарлады.
«T-Bank AI Research және AIRI институтының жасанды интеллект ғылыми-зерттеу зертханасының ғалымдары MIPT, Skoltech және Innopolis студенттерінің қатысуымен контекстік білім беру саласындағы зерттеулер үшін алғашқы ашық ортаны құрды және алгоритмдерді әзірледі – Xland – MiniGrid », — делінген хабарламада.
Зертханада түсіндірілгендей, XLand-MiniGrid – бұл бүкіл әлем бойынша зерттеушілерге арналған қоғамдық доменде жарияланған виртуалды орта, онда жасанды интеллект (AI) ұзақ оқуды қажет ететін, бірақ өзара әрекеттесуді қажет ететін «нөлден» емес, шешім қабылдауға және жаңа әрекеттерді орындауға үйретеді. сигналдар мен контекст арқылы қоршаған ортамен.
XLand-MiniGrid жүйесіндегі сынақтарды Google DeepMind, Берклидегі Калифорния университеті және Оксфорд университетінің зерттеушілері орындады. Қоршаған ортаны құруды сипаттайтын ғылыми мақала 10-15 желтоқсан аралығында Ванкуверде (Канада) өтетін жасанды интеллект саласындағы ең ірі халықаралық NeurIPS 2024 конференциясына қабылданды, деп хабарлайды T-Bank AI Research.
«Біз мәтінмәндік күшейтуді оқыту саласына ол әлі бастапқы кезеңінде кірдік, сондықтан жаңа идеяларды бағалау үшін қолайлы құрал таппадық. Шамасы, бұл көптеген кәсіпқойлар үшін мәселе, яғни ол сол құралдардың бірі болуы керек. Вячеслав Сини, AI Alignment ғылыми тобының зерттеушісі (T-Bank AI Research бөлігі) бірінші жұмыс шешілгенін айтты. Осылайша, Xland-MiniGrid пайда болды. .
AIRI институтының адаптивті агент ғылыми тобының жетекшісі Владислав Куренков XLand-MiniGrid жаңа алгоритмдерді құруды тездететінін айтты. «Мәтінмәндік күшейтуді оқыту AI саласындағы ең перспективалы ғылыми бағыттардың бірі болып табылады, өйткені ол сыртқы кері байланыс негізінде жаңа жағдайларға тез бейімделетін агенттерді алуға мүмкіндік береді. Біз әзірлеген құрылым салыстыру процесін айтарлықтай жылдамдатады. және осы салада жаңа алгоритмдер құру», — деді Куренков, оның сөздері хабарламада келтірілген.
Қолданба
Контексттегі RL әсіресе жаңа жағдайларға лезде бейімделуді қажет ететін жекелендірілген ұсыныстар, роботтарды басқару және автономды көліктер сияқты салаларда пайдалы екенін атап өткен жөн.
Сонымен қатар, ірі компаниялардың контекстіндегі RL сыртқы пайдаланушылар үшін қол жетімді емес, және жалпыға қолжетімді құралдар негізінен ұқсас тапсырмаларды қамтамасыз етеді және үйренуге оңай, бұл күрделі алгоритмдерді әзірлеуді және сынауды қиындатады.
Басқа қолданыстағы орталардан айырмашылығы, XLand-MiniGrid ашық қолжетімділік болып табылады және оқу шарттарын тікелей процесте өзгертуге мүмкіндік береді. Бұл әртүрлі күрделіліктегі тапсырмаларды модельдеуді жеңілдетеді, бейімделгіш және сенімді жасанды интеллект үлгілерін жасауға көмектеседі, делінген хабарламада.
Орта JAX – өнімділігі жоғары бағдарламаларды әзірлеу технологиясы негізінде жасалған. Баяу аналогтардан айырмашылығы, XLand-MiniGrid секундына миллиардтаған операцияларды орындайды, деп хабарлайды T-Bank AI Research.
«XLand-MiniGrid 30 мың тапсырмадағы AI әрекеттерінің 100 миллиард мысалын қамтиды. Бұл нөлден бастаудың орнына оқыту үшін бар деректер жиынын пайдалануға мүмкіндік береді. Осының барлығы саладағы жаңа жаңалықтарға септігін тигізеді. RL контекстінде шығындарды азайтады және зерттеу үшін ресурстарды үнемдейді», — делінген хабарламада.