2025-09-17
在人工智能、具身智能與人形機器人等前沿科技加速演進的當下,技術突破與產業(yè)落地的協同銜接已成為行業(yè)發(fā)展的核心命題。9月17日,“2025具身智能全球硬科技發(fā)展大會”在天津盛大啟幕。全球頂尖專家、學者與企業(yè)代表齊聚于此,圍繞 “技術攻堅突破” 與 “場景落地實踐” 兩大核心議題展開深度交流,共繪具身智能生態(tài)化發(fā)展新藍圖。天娛數科受邀參會,集團首席數據官吳邦毅發(fā)表《Behavision:通用具身智能與物理世界的交互基座》主題演講。演講從產業(yè)演進規(guī)律切入,深入拆解行業(yè)核心瓶頸,系統闡述解決方案,全面解碼天娛數科的技術布局與實踐思考,為行業(yè)發(fā)展提供了兼具理論深度與落地價值的經驗借鑒。
“當前人形機器人產業(yè)正深陷‘四缺’困境:缺乏算法通用開發(fā)平臺,導致企業(yè)重復投入研發(fā)資源;缺乏通用3D數據平臺,直接制約具身智能的高效訓練;缺乏標準認證平臺,造成產品兼容性差、生態(tài)協同受阻;缺乏場景測試與人才培養(yǎng)平臺,則進一步阻礙技術從實驗室走向產業(yè)實踐?!眳前钜阍谘葜v中直指行業(yè)痛點。
為破解行業(yè)困局,天娛數科打造了Behavision空間智能MaaS平臺,其核心邏輯為“世界感知—時空推理—泛化執(zhí)行”。作為整合數據與算法能力的核心載體,平臺的關鍵突破在于構建了融合“傳感”(感知識別)、“大腦”(認知決策)與 “小腦”(運動執(zhí)行)的通用支撐體系,推動人形機器人“腦體協同”這一行業(yè)瓶頸的攻克與發(fā)展。
破解人形機器人產業(yè)困局,數據是根基。吳邦毅表示:“天娛數科已構建起全國領先的高質量3D與多模態(tài)數據體系,公司自建專業(yè)級3D動捕與多模態(tài)數據采集基地,累計沉淀150萬條3D數據、65萬條多模態(tài)數據,其中包含20萬條機器人任務訓練專業(yè)數據,從基礎的‘抓取、放置’到復雜的空間理解和大小腦協同,覆蓋生活服務、高端制造、智慧醫(yī)療等關鍵場景?!?/span>
吳邦毅認為:“物理AI的落地,始于對物理世界的深刻理解。機器要‘會做事’,必先‘懂物理’——既要明晰物體的幾何結構、材質硬度、重心分布,也要掌握門如何轉動、抽屜如何滑動、零件如何拼接的運動規(guī)律與交互邏輯?!碧鞀蕯悼普且?/span>3D鉸接數據為核心,遵循“物理真實性、語義可理解性、場景泛化性”三大核心標準:通過毫米級光學動捕設備與三維掃描技術,精準還原物體的幾何結構、表面紋理及動態(tài)交互規(guī)則,為數據賦予可信賴的“物理骨架”;依托3D鉸接數據,對門、抽屜、機械臂等可交互物體的運動關節(jié)、自由度、受力反饋等屬性進行細粒度標注,賦予數據理解交互邏輯的“語義靈魂”。如同給AI植入了“物理直覺”,讓機器不再將“門”僅視作一組三維坐標,而是理解其“可繞合頁旋轉、需施加推力開啟”的功能本質,為后續(xù)的精準操作奠定認知基礎。
目前,3D鉸接數據已成功入選《北京市行業(yè)高質量數據集典型案例》。此外,公司“人形機器人空間6D動捕長程數據”等核心數據集已在全國多地數據交易平臺上架,推動高質量數據的市場化流通與產業(yè)共享。
有了高質量數據,算法則是激活價值的“引擎”。算法支撐層面,天娛數科以自研備案大模型矩陣為核心驅動力,天星基座大模型、3D智能領域“智者千問”行業(yè)大模型及智慧廣告大模型形成協同效應,結合Embodied Chain-of-Thought Reasoning (ECoT) for VLA算法,讓人形機器人可快速學習復雜動作序列與操作邏輯。
通用大模型與垂類大模型的融合,破解了傳統算法“通用則不精準、精準則難泛化”的矛盾。大模型保障人形機器人對任務目標、場景環(huán)境的通用理解與決策,VLA算法則聚焦操作細節(jié)的精準控制,使人形機器人既能“看懂”復雜場景需求,又能“做好”精細操作動作。
數據與算法的價值落地,最終要靠平臺規(guī)?;瘜崿F。天娛數科Behavision 空間智能MaaS 平臺作為數據與算法的整合核心,通過建立“傳感”(感知識別)、“大腦”(認知決策)與 “小腦”(運動執(zhí)行)一體化的通用支撐體系,打通人形機器人的“腦體協同”堵點。
平臺創(chuàng)新性搭建原子技能庫,針對輪式、腿足式、多足式人形機器人及單/多軸機械臂等不同形態(tài)設備,梳理出“移動、抓取、旋轉、協同”等多種原子技能,形成可快速復用的動作“模板庫”。當面臨新任務時,由傳感模塊獲取環(huán)境與目標信息并完成空間感知與語義理解,“大腦”結合大模型算法生成決策方案,“小腦”則從原子技能庫中調用適配模塊,實現多場景任務的快速調度與高效執(zhí)行。這種“感知-決策-執(zhí)行”閉環(huán),推動人形機器人從1.0的“程序演示”階段躍遷至3.0的“精準感知+自主決策+高效執(zhí)行”智能新階段。
更關鍵的是,Behavision平臺通過3D鉸接數據的深度應用,成功跨越物理AI的“數據鴻溝”。吳邦毅表示“該數據覆蓋外觀(幾何紋理)、結構(關節(jié)連接)、物理屬性(質量、摩擦系數)、語義(功能用途)四大維度,完整標注物體的‘是什么、怎么動、有什么用’,有效填補了傳統數據缺少物理屬性、缺功能語義的空白?!边@意味著AI不再是“看得到卻不懂”的“門外漢”,而是能理解“椅子可坐、門可推開、開關可按”的參與者。
從數據筑基到算法突破,從平臺落地到產業(yè)賦能,天娛數科通過Behavision體系的構建,形成了“數據-算法-平臺-場景”的完整產業(yè)閉環(huán)。在具身智能生態(tài)化發(fā)展的浪潮中,這種以高質量數據為核心、以協同平臺為紐帶的發(fā)展路徑,不僅為企業(yè)自身構建了技術與生態(tài)雙重優(yōu)勢,更將為“人工智能+”戰(zhàn)略的落地提供堅實支撐,加速具身智能從實驗室走向千行百業(yè)的進程。