RoboCat本質(zhì)上是由AI賦能的軟件程序,可以作為機(jī)器人的“大腦”,由其加持的機(jī)器人與傳統(tǒng)機(jī)器人不同之處在于,RoboCat機(jī)器人更具“通用性”,并可實(shí)現(xiàn)自我改進(jìn)、自我提升。
(資料圖片僅供參考)
DeepMind稱,RoboCat是全球第一個可以解決和適應(yīng)多種任務(wù)的機(jī)器人AI智能體,并且它可以在各類真實(shí)的機(jī)器人產(chǎn)品上完成這些任務(wù)。
據(jù)DeepMind的介紹,只需要通過100次左右的演示,RoboCat就可以學(xué)會操控機(jī)械臂來完成各式各樣的任務(wù),然后通過自生成的數(shù)據(jù)來進(jìn)行迭代改進(jìn)。
要知道,構(gòu)建通用機(jī)器人之所以進(jìn)展緩慢,一個重要原因就是收集真實(shí)世界的訓(xùn)練數(shù)據(jù)需要時間,而RoboCat的快速學(xué)習(xí)能力減少了對人類監(jiān)督訓(xùn)練的需求,可以說是朝著創(chuàng)建通用機(jī)器人邁出了重要一步。
從發(fā)布的視頻中可以看到,RoboCat已經(jīng)可以通過自主學(xué)習(xí)操控機(jī)械臂,完成“套圈”“搭積木”“抓水果”等任務(wù),這些任務(wù)看似簡單,但考驗了機(jī)械臂操作的精準(zhǔn)度、理解力以及對于形狀匹配難題的解決能力。
最重要的是,不論是它操控的機(jī)械臂還是要完成的任務(wù),RoboCat之前從來沒見過,如今,RoboCat完成一項新任務(wù)的成功率已經(jīng)從初期的36%提升至74%。
RoboCat 用到的關(guān)鍵技術(shù)之一,是一種多模態(tài)模型Gato,而Gato在西班牙語里意為“貓”(cat),這也是“RoboCat”這一命名的由來之一。
Gato模型可以在模擬環(huán)境和物理環(huán)境中處理語言、圖像和動作,研究人員將Gato的架構(gòu)與一個大型訓(xùn)練數(shù)據(jù)集進(jìn)行了結(jié)合,這個數(shù)據(jù)集包含100-1000個各種機(jī)械臂完成任務(wù)的演示。
基于原始數(shù)據(jù)集和新訓(xùn)練產(chǎn)生的數(shù)據(jù),RoboCat的數(shù)據(jù)集將包含數(shù)百萬次的訓(xùn)練軌跡數(shù)據(jù),它學(xué)習(xí)的新任務(wù)越多,它就能更好地學(xué)習(xí)和解決額外的新任務(wù)。
此前研究人員已經(jīng)在機(jī)器人大規(guī)模學(xué)習(xí)多種任務(wù)方面進(jìn)行了探索,并將對語言模型的理解與現(xiàn)實(shí)世界的機(jī)器人能力相結(jié)合,而RoboCat的進(jìn)步性在于,它是第一個可以解決和適應(yīng)多種任務(wù)的機(jī)器人 AI 智能體。
DeepMind的論文顯示,執(zhí)行任務(wù)成功率的大幅提升,是由于RoboCat的經(jīng)驗越來越豐富,就像人們在特定領(lǐng)域加深學(xué)習(xí)時發(fā)展出更多樣化的技能一樣,并且RoboCat完成現(xiàn)實(shí)世界訓(xùn)練任務(wù)的成功率要遠(yuǎn)高于傳統(tǒng)基于視覺的模型方案,這也是 DeepMind 研究的重要價值所在。
RoboCat這種“通用性學(xué)習(xí)能力”對于加快機(jī)器人領(lǐng)域的研究有重要意義,DeepMind認(rèn)為,RoboCat獨(dú)立學(xué)習(xí)技能、快速自我提升的能力,以及對于不同硬件設(shè)備的快速適應(yīng)能力,將對新一代通用機(jī)器人AI智能體的發(fā)展起到重要推動作用。
關(guān)鍵詞:
質(zhì)檢
推薦