記者|雷風雨
春節假期的天津大學深度強化學習實驗室內傳出一則好消息,由具身團隊自主研發的具身基座模型R1.5版,搭載于多種型號的機器人上正式亮相。
走進實驗室,記者看到這里布置成了“春節居家現場”。“把客廳收拾一下,再給客人做杯奶茶。”話音剛落,一臺機器人便動了起來。它先是“看”到地上的紙團,機械臂隨即抓起掃帚,沿著規劃好的路線將垃圾清掃干凈;接著轉身來到操作臺,輕輕捏起一個紙杯,加茶、加奶、攪拌,一杯冒著熱氣的奶茶穩穩端到“客人”面前。整個過程一氣呵成,無需人為干預。
這臺機器人如此“通人性”,原因在于它剛剛被植入的“大腦”——由該團隊自主研發的具身基座模型R1.5版。
“看著簡單,背后可費了大功夫。”實驗室青年骨干湯宏垚副研究員向記者解釋,為了讓機器人像人一樣靈活應對復雜環境,團隊給它設計了一套“大腦+小腦”的分工架構。
他打了個比方:大腦是多模態大模型,負責理解指令、拆解任務、規劃路徑;小腦則是基于強化學習的決策控制模塊,負責具體動作的精準執行——用多大力氣拿杯子才不會捏碎、移動中如何保持平衡,這些都是小腦在實時計算。
“大腦做決策,小腦做控制,兩者配合好了,機器人才能把活兒干好。”馬億副教授說,這段時間團隊就在攻關這個協同問題。如今,搭載了新模型的機器人,不僅能掃地、做奶茶,還能擦花瓶、給手機充電、為客人沖咖啡、打包禮盒。哪怕面對從未見過的場景,它也能“零樣本適應”。
技術突破的同時,團隊也在思考如何讓成果走出實驗室。記者看到,這里不光有理工科的“程序員”,還有新媒體專業的視頻拍攝人員,這是實驗室的獨特之處——“文工交叉”。
“酒香也怕巷子深。”實驗室骨干鄭巖副教授說。為了讓科研成果被看見、被理解,團隊邀請新媒體學院張守信老師團隊協助,加班加點,將枯燥的代碼和算法,通過場景化視頻生動呈現。在他們的最新演示視頻中,機器人整理凌亂的房間、遞上溫熱的奶茶、打包送給朋友的禮盒……這些忙前忙后的身影,漸漸描畫出未來智能生活最溫柔的想象。
“這個春節不回家,為的就是把一年的算法成果集成在機器人身上,呈現出達到國內外領先水平的智能能力。”鄭巖說。就在不久前,該實驗室憑借“基于強化學習的智能決策關鍵技術及應用”項目,榮獲2025年度中國圖象圖形學學會科技進步獎一等獎。
這群年輕人正用自己的方式,讓人工智能從實驗室走向千家萬戶。
【未經授權,嚴禁轉載!聯系電話028-86968276】
