突破大語(yǔ)言模型局限 大曉機(jī)器人助推具身智能從“模仿”走向“推理”
18日,大曉機(jī)器人正式發(fā)布首個(gè)開(kāi)源且商業(yè)應(yīng)用的開(kāi)悟世界模型3.0(Kairos 3.0),以及讓具身本體擁有自主空間智能的具身超級(jí)大腦模組A1,并創(chuàng)新提出了“環(huán)境式數(shù)據(jù)采集”路徑,有望大大降低行業(yè)數(shù)據(jù)采集成本。
?新華財(cái)經(jīng)上海12月19日電(記者 杜康)18日,大曉機(jī)器人正式發(fā)布首個(gè)開(kāi)源且商業(yè)應(yīng)用的開(kāi)悟世界模型3.0(Kairos 3.0),以及讓具身本體擁有自主空間智能的具身超級(jí)大腦模組A1,并創(chuàng)新提出了“環(huán)境式數(shù)據(jù)采集”路徑,有望大大降低行業(yè)數(shù)據(jù)采集成本。
大曉機(jī)器人由商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事王曉剛擔(dān)任董事長(zhǎng);首席科學(xué)家陶大程曾出任京東探索研究院創(chuàng)始院長(zhǎng)、優(yōu)必選人工智能首席科學(xué)家。兩位業(yè)界頗有影響力的科學(xué)家坐鎮(zhèn),讓這家新創(chuàng)立企業(yè)自誕生便被予以更多關(guān)注。
王曉剛介紹,一直以來(lái),具身智能領(lǐng)域面臨訓(xùn)練數(shù)據(jù)的極度缺乏?!皵?shù)據(jù)始終是 AI 進(jìn)化的核心支撐。此前行業(yè)通過(guò)采集員真機(jī)遙操,海量收集各類(lèi)機(jī)器人的本體數(shù)據(jù),但這一路徑導(dǎo)致數(shù)據(jù)采集成本高昂、效率低下,且產(chǎn)出的技能模型嚴(yán)重綁定于特定硬件。此后,特斯拉、Figure AI紛紛放棄此前依賴(lài)的真機(jī)遙操路徑,轉(zhuǎn)而探索純視覺(jué)學(xué)習(xí)方案,希望讓機(jī)器人通過(guò)觀(guān)看海量視頻,直接習(xí)得人類(lèi)的動(dòng)作與智慧。但這種學(xué)習(xí)方式缺乏對(duì)三維物理世界的力學(xué)規(guī)律、物理屬性和動(dòng)作意圖理解?!?/p>
此次大曉機(jī)器人提出的“環(huán)境式數(shù)據(jù)采集”路徑,采用“以人為中心”的數(shù)據(jù)采集體系,通過(guò)跨視角多模態(tài)設(shè)備,融合視覺(jué)、觸覺(jué)、語(yǔ)音、力學(xué)規(guī)律等多維度數(shù)據(jù),構(gòu)建基于物理基礎(chǔ)的3D資產(chǎn)庫(kù),全面覆蓋具身模型訓(xùn)練所需的各類(lèi)交互信息。
據(jù)悉,環(huán)境式數(shù)據(jù)采集可實(shí)現(xiàn)一年千萬(wàn)小時(shí)的數(shù)據(jù)收集,讓數(shù)據(jù)采集成本大大降低。在即時(shí)零售倉(cāng)儲(chǔ)場(chǎng)景中,該方案已實(shí)現(xiàn)多視角數(shù)據(jù)采集,覆蓋數(shù)萬(wàn)種 SKU,完成倉(cāng)儲(chǔ)分揀與打包全流程,涵蓋五大階段13個(gè)“原子動(dòng)作”;在居家、零售等多元場(chǎng)景中,也已實(shí)現(xiàn)對(duì)人體自然行為、物品交互軌跡的精準(zhǔn)捕捉,甚至能復(fù)現(xiàn)遙操作范式下難以實(shí)現(xiàn)的生鮮抓取、精細(xì)化放置等任務(wù)。
基于環(huán)境式采集數(shù)據(jù),大曉機(jī)器人同時(shí)發(fā)布了首個(gè)開(kāi)源且商業(yè)化應(yīng)用的世界模型——開(kāi)悟世界模型3.0。
從“模仿”走向“推理”,被行業(yè)認(rèn)為是具身智能的進(jìn)化方向之一。“世界模型”則是其中一個(gè)重要的技術(shù)進(jìn)化路徑,有望突破大語(yǔ)言模型局限,擁有對(duì)物理世界的三維空間建模能力與動(dòng)態(tài)因果推理能力,讓機(jī)器人大腦更聰明,泛化性更好。
據(jù)悉,開(kāi)悟世界模型3.0通過(guò)視覺(jué)、3D 軌跡、觸覺(jué)、摩擦力等多維度信息輸入,可以深度理解真實(shí)世界的物理規(guī)律與人類(lèi)行為的底層邏輯。模型可具備跨本體一鍵生成、多本體泛化等特性,為具身智能提供高保真、可泛化的虛擬訓(xùn)練環(huán)境。
目前,開(kāi)悟具身智能世界模型產(chǎn)品平臺(tái)內(nèi)置支持11大類(lèi)、54個(gè)細(xì)類(lèi),累計(jì)328個(gè)標(biāo)簽,覆蓋115個(gè)垂類(lèi)具身場(chǎng)景,開(kāi)發(fā)者只需輸入簡(jiǎn)單指令,就能快速生成可視化的任務(wù)模擬內(nèi)容。大曉機(jī)器人已經(jīng)向全行業(yè)開(kāi)放API,推動(dòng)各類(lèi)輕量化、定制化具身智能產(chǎn)品快速涌現(xiàn),促進(jìn)應(yīng)用生態(tài)發(fā)展。
?
編輯:葛佳明
?
聲明:新華財(cái)經(jīng)(中國(guó)金融信息網(wǎng))為新華社承建的國(guó)家金融信息平臺(tái)。任何情況下,本平臺(tái)所發(fā)布的信息均不構(gòu)成投資建議。如有問(wèn)題,請(qǐng)聯(lián)系客服:400-6123115










