機(jī)器人應(yīng)該是什么樣的?在科幻文學(xué)影視作品長(zhǎng)年的熏陶影響下,社會(huì)大眾往往對(duì)人形機(jī)器人寄予了諸多幻想與預(yù)期,而當(dāng)我們把這一問(wèn)題拋給人形機(jī)器人領(lǐng)域的從業(yè)者時(shí),得到的幾乎不約而同的答案卻是:人形機(jī)器人仍處在起步階段。
有目共睹,全球范圍內(nèi)的人形機(jī)器人熱潮仍在持續(xù)。8月8日,中國(guó)的機(jī)器人公司逐際動(dòng)力宣布,其CL-1機(jī)器人繼習(xí)得上樓梯和跑步技能后,已能在模擬倉(cāng)庫(kù)中完成一系列搬運(yùn)任務(wù)。8月6日晚,美國(guó)初創(chuàng)企業(yè)Figure發(fā)布了新一代產(chǎn)品Figure02。而在一周之前,德國(guó)機(jī)器人公司Neura Robotics也更新旗下人形機(jī)器人4NE-1在多場(chǎng)景下的工作視頻。
世界上的人形機(jī)器人發(fā)展到何種程度了?機(jī)器人廠商都在做哪些技術(shù)研發(fā)與商業(yè)化探索?《中國(guó)經(jīng)營(yíng)報(bào)》記者采訪了多名來(lái)自相關(guān)企業(yè)的人士,希望給社會(huì)公眾提供一個(gè)初步的解答與參考。
性能爭(zhēng)鋒
Figure02是Figure公司最新推出的第二代人形機(jī)器人產(chǎn)品,F(xiàn)igure公司創(chuàng)立于2022年,至今已完成5輪、總金額為8.54億美元的融資,估值達(dá)到26億美元,因投資方為微軟、OpenAI、英偉達(dá)、英特爾、亞馬遜創(chuàng)始人杰夫·貝索斯等而廣受業(yè)界的關(guān)注。該公司創(chuàng)始人兼CEO布雷特·艾德考克(Brett Adcock)宣稱,F(xiàn)igure02是目前“世界上最先進(jìn)的AI硬件”,甚至其在社交媒體X上向特斯拉CEO埃隆·馬斯克“嗆聲”,稱“現(xiàn)在我們是老大了!”根據(jù)Figure官方公布的參數(shù),相比前一代,F(xiàn)igure02從外觀設(shè)計(jì)、軟硬件性能,到內(nèi)置AI模型都進(jìn)行了明顯的升級(jí)。在OpenAI多模態(tài)大模型支持下,F(xiàn)igure02支持自然語(yǔ)言交互。
值得一提的是,特斯拉于2022年10月正式入局人形機(jī)器人賽道,推出了人形機(jī)器人Optimus(擎天柱),并在2023年12月推出了第二代Optimus Gen-2機(jī)器人。
記者梳理了包括Figure、特斯拉、波士頓動(dòng)力、Neura Robotics、宇樹科技、逐際動(dòng)力、優(yōu)必選、銀河通用等多家國(guó)內(nèi)外機(jī)器人產(chǎn)品及相關(guān)公開(kāi)的性能參數(shù),綜合對(duì)比后發(fā)現(xiàn),各家在外觀形態(tài)、重量、負(fù)荷能力、電池續(xù)航、步行速度、主要應(yīng)用場(chǎng)景、成本定價(jià)等各方面都不盡相同,在技術(shù)研發(fā)與主要性能方面也各不相同。不過(guò)總體來(lái)看,人們大致可以從靈巧性、空間感知交互能力、平衡穩(wěn)定性等幾個(gè)方面進(jìn)行技術(shù)的積累與測(cè)試對(duì)比。這里需要說(shuō)明的是,觀察大都基于各個(gè)機(jī)器人廠商官方公布的演示視頻,而演示視頻是否能夠與實(shí)際效果一致,暫時(shí)還無(wú)法一一甄別核實(shí)。
在平衡穩(wěn)定方面,在宇樹科技今年5月發(fā)布的人形機(jī)器人G1演示視頻中可以看到一名工程師從后方“猛踹”機(jī)器人的畫面。宇樹科技相關(guān)人士告訴記者,此項(xiàng)測(cè)試的目的在于利用強(qiáng)化學(xué)習(xí)的方式優(yōu)化機(jī)器人的運(yùn)動(dòng)控制程序,讓它在復(fù)雜環(huán)境或者有外力干擾的情況下保持平衡。與此同時(shí),宇樹科技目前在技術(shù)研發(fā)方面的重點(diǎn)在于提升機(jī)器人的整體運(yùn)動(dòng)性能和智能化能力。
而靈巧性在一定程度上決定了機(jī)器人抓取任務(wù)的完成能力。銀河通用機(jī)器人創(chuàng)始人王鶴表示,該公司已合成了10億規(guī)模的靈巧手抓取數(shù)據(jù),能夠?qū)崿F(xiàn)對(duì)各種形態(tài)透明、高光材質(zhì)以及各種隨機(jī)堆疊物品的高穩(wěn)定抓取。最新面市的Figure02采用第四代靈巧手,擁有16個(gè)自由度;而特斯拉Optimus的這一數(shù)據(jù)為11個(gè)自由度,據(jù)馬斯克透露,今年新的Optimus將有22個(gè)自由度。
關(guān)于空間感知能力,比如機(jī)器人通過(guò)視覺(jué)感知系統(tǒng)獲取環(huán)境信息,滿足定位、跟蹤、分揀裝配等需求。在逐際動(dòng)力的最新演示視頻中,CL-1能夠基于實(shí)時(shí)感知,在模擬倉(cāng)庫(kù)中自主找到指定貨物,協(xié)同全身運(yùn)動(dòng),實(shí)現(xiàn)負(fù)重深蹲、負(fù)重舉起等在內(nèi)的多種運(yùn)動(dòng)姿態(tài)下的搬運(yùn)操作。
知名對(duì)沖基金Coatue在近日發(fā)布的《通往通用機(jī)器人之路》報(bào)告中指出,數(shù)據(jù)是機(jī)器人發(fā)展的核心瓶頸,圍繞快速積累機(jī)器人訓(xùn)練數(shù)據(jù),近年來(lái)陸續(xù)形成了四種路徑:一是遠(yuǎn)程操作,即由實(shí)驗(yàn)人員操作機(jī)械手柄,遠(yuǎn)程控制機(jī)器人做出相同動(dòng)作;二是研究人員通過(guò)增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)讓人機(jī)交互過(guò)程具備更強(qiáng)的解釋性;三是通過(guò)海量算力進(jìn)行模擬運(yùn)算,計(jì)算得出海量訓(xùn)練數(shù)據(jù)集; 四是通過(guò)多模態(tài)大模型,直接讓機(jī)器人通過(guò)視頻學(xué)習(xí)人類動(dòng)作,從而積累數(shù)據(jù)。記者從業(yè)內(nèi)了解到,這四種路徑各有優(yōu)劣利弊,不同企業(yè)也選擇了不同路線在探索實(shí)踐,甚至也存在融合交叉,目前還并沒(méi)有所謂的勝敗之分。
場(chǎng)景探索
“競(jìng)賽已經(jīng)開(kāi)始,包括Figure、特斯拉等數(shù)十種新型人形機(jī)器人正在開(kāi)發(fā)中,以突破機(jī)器人的通用性。”《通往通用機(jī)器人之路》報(bào)告稱,單一用途的機(jī)器人已經(jīng)存在50多年,然而工業(yè)和消費(fèi)機(jī)器人歷來(lái)以線性速度增長(zhǎng),尚未實(shí)現(xiàn)指數(shù)級(jí)普及。盡管有炫目的演示,但機(jī)器人項(xiàng)目在不同環(huán)境和成本方面仍面臨挑戰(zhàn)。與數(shù)字世界中的其他模式不同,機(jī)器人技術(shù)嚴(yán)重受限于高質(zhì)量的訓(xùn)練數(shù)據(jù),這是實(shí)現(xiàn)通用智能的主要限制因素。幸運(yùn)的是,過(guò)去幾年的開(kāi)放研究加速了生成大量可擴(kuò)展訓(xùn)練數(shù)據(jù)的進(jìn)程。與此同時(shí),隨著硬件變得更加實(shí)惠,投入成本持續(xù)下降。
值得一提的是,早在2013年就涉足人形機(jī)器人領(lǐng)域的老牌廠商波士頓動(dòng)力,在2024年4月17日宣布停產(chǎn)液壓動(dòng)力的Atlas,全面轉(zhuǎn)向全電動(dòng)路線。顯然,“老將”“新秀”將共同在人形機(jī)器人賽道上角逐。
從演示視頻來(lái)看,人形機(jī)器人測(cè)試的場(chǎng)景已覆蓋制造工廠、商業(yè)零售、農(nóng)業(yè)、家庭、科研等多個(gè)領(lǐng)域。其中,F(xiàn)igure02、Optimus-Gen2、優(yōu)必選Walker S Lite等紛紛進(jìn)入汽車制造工廠中。早在今年1月,F(xiàn)igure就與寶馬簽署商業(yè)協(xié)議,F(xiàn)igure機(jī)器人在寶馬工廠中“自動(dòng)執(zhí)行困難、不安全且乏味的任務(wù)”。今年5月,特斯拉官方的視頻顯示,Optimus Gen-2已進(jìn)入自家的汽車工廠“打工”,在特斯拉電池工廠學(xué)會(huì)了分裝電池。優(yōu)必選Walker S Lite自7月初進(jìn)入吉利控股集團(tuán)旗下極氪5G智慧工廠“實(shí)訓(xùn)”,在CTU入庫(kù)上料工位協(xié)同員工執(zhí)行搬運(yùn)任務(wù)。今年7月,Neura Robotics則在演示視頻中展示了燙衣服、切蔬菜水果、擺盤、整理物品、鈑金焊接、工具箱搬運(yùn)等任務(wù)。銀河通用相關(guān)負(fù)責(zé)人向記者透露,近期計(jì)劃聯(lián)合美團(tuán)在無(wú)人藥店、商超等場(chǎng)景中部署機(jī)器人,“盡快地在線下幫助人類干活兒”。
值得注意的是,據(jù)記者不完全統(tǒng)計(jì)及采訪,已經(jīng)有幾家機(jī)器人企業(yè)公開(kāi)提出了人形機(jī)器人產(chǎn)品的量產(chǎn)時(shí)間表。布雷特·艾德考克公開(kāi)表示,F(xiàn)igure公司將推動(dòng)人形機(jī)器人的低成本、高效率制造,2025年開(kāi)始批量生產(chǎn)。波士頓動(dòng)力方面則透露,全電動(dòng)的Atlas機(jī)器人將于明年年初在現(xiàn)代汽車內(nèi)部進(jìn)行測(cè)試,并在未來(lái)幾年內(nèi)全面投產(chǎn)。2023年2月創(chuàng)立的智元機(jī)器人方面也提出,其人形機(jī)器人“遠(yuǎn)征”在今年內(nèi)實(shí)現(xiàn)商業(yè)化。銀河通用機(jī)器人將批量生產(chǎn)的時(shí)間計(jì)劃定于2026年。由清華大學(xué)交叉信息研究院孵化的星動(dòng)紀(jì)元在今年將面向科研教育市場(chǎng)的“小星”第6代產(chǎn)品實(shí)現(xiàn)批量出貨。而宇樹科技人形機(jī)器人產(chǎn)品已在國(guó)內(nèi)外科研機(jī)構(gòu)、高等院校等獲得采購(gòu)訂單,其G1憑借9.9萬(wàn)元人民幣(海外市場(chǎng)1.6萬(wàn)美元)的價(jià)格優(yōu)勢(shì)已贏得了業(yè)界的高度關(guān)注。
數(shù)位業(yè)內(nèi)人士在接受記者采訪時(shí),對(duì)人形機(jī)器人的觀點(diǎn)不盡相同,但大多看好未來(lái)的技術(shù)突破與市場(chǎng)潛力。不過(guò)他們認(rèn)為短期內(nèi)不應(yīng)當(dāng)對(duì)人形機(jī)器人抱有過(guò)分的樂(lè)觀期望,因?yàn)槠湔w仍在起步階段,各家都在努力投入與加速研發(fā)中。與此同時(shí),得益于大模型技術(shù)突破、資本助力支持,人形機(jī)器人的發(fā)展正在駛?cè)肟燔嚨,從長(zhǎng)遠(yuǎn)來(lái)看也不應(yīng)當(dāng)持過(guò)度的悲觀看法。
按照Coatue報(bào)告的調(diào)研分析,機(jī)器人的普及會(huì)經(jīng)歷由淺入深的三個(gè)階段,走出一條獨(dú)特的發(fā)展路徑。第一階段是,人們通過(guò)電影、小說(shuō)等媒介對(duì)機(jī)器人形成初步模糊的了解;第二階段,指消費(fèi)者直接享受機(jī)器人提供的服務(wù),而非自己擁有機(jī)器人,類似B2B2C的模式,比如消費(fèi)者在咖啡廳享用一杯機(jī)器人拉花的咖啡,就屬于這個(gè)階段;第三階段則是每個(gè)用戶自己擁有一臺(tái)或多臺(tái)機(jī)器人。
本報(bào)記者 曲忠芳 北京報(bào)道