2024年12月18日,在第二屆具身智能產業發展論壇上,寧波均普人工智能與人形機器人研究院(下文稱“均普機器人研究院”)CTO沈天曜指出,具身智能機器人的工程化落地仍面臨不少挑戰,包括成本、大規模產品庫存、軟件算法等,大模型訓練、數據采集和處理仍需突破。當前人形機器人的產品形態尚不成熟,需要根據具體需求進行優化,明確的需求是推動產品發展的關鍵。
得益于多年的技術及行業知識沉淀,均普機器人研究院致力于從制造業的真實需求出發,為合作伙伴界定產品特性,并提供巨量、多元的場景為企業的產品做落地驗證,助力人形機器人在工業場景實現工程化落地。

沈天曜 | 均普人工智能與人形機器人研究院CTO
以下為演講內容整理:
針對未來的發展趨勢,社會各界普遍達成共識,即人形機器人或同類機器人產品在未來必將廣泛融入我們的生產與日常生活之中。我們有理由相信,在未來,人形機器人在日常生活中的普及程度或將媲美汽車,成為每個家庭的標配。而在工業領域,它們則相當于工業機器人,成為生產線上的必備元素。
然而,我們距離這一目標的實現尚有較大差距,在實際的工程化應用過程中存在著諸多挑戰與問題。對于這些問題的解決,關鍵在于需要有主體去積極行動,推動問題的解決。均勝集團希望能夠參與到這一歷史進程之中,貢獻力量。從技術層面而言,功能更為泛化、更貼近日常生活需求的人形機器人在技術上實現難度更大。
無論從大模型的構建這樣的軟件角度,還是從機器人的靈活性、穩定性這樣的硬件角度看,人形機器人均面臨著較多挑戰。特別是在短期內,大多數專注于人形機器人本體研發的企業都面臨著突破的焦慮。在投入數百億資金后,投資者期望能夠迅速看到成果。然而,這種期望顯然是不切實際的。目前來看,我們認為工業應用場景是一個非常好的商業化渠道。
均普智能擅長在工廠環境中開展業務,在工業生產以及產線管理領域都具備豐富經驗。我們特別關注人形機器人這一領域,并為此成立了專門的研究院。另外,均勝集團本身就是一個全球化布局的企業,在全球多地擁有研發中心和生產基地。集團在汽車行業深耕多年,我們相信,在汽車行業積累的knowhow經驗能夠復制并被融合到人形機器人的研發中。

圖源:演講嘉賓素材
人形機器人與具身智能在工廠中的定位不是工業機器人的替代者,而是替代部分簡單、重復、機械的人類勞動。人形機器人的使用符合現代工廠的智能化演進趨勢,鑒于此,我們堅信,依托均勝集團的全球化布局,我們的機器人產品有大量的落地場景,多樣化場景帶來的明確需求也將推動工程化落地。
我們并非直接生產產品,而是致力于為工廠提供穩定、高效、柔性化智能制造裝備和產線,實現快節拍、數字化、可追溯等生產功能。例如,當客戶需要構建一條自動化產線時,我們會綜合考慮產線的節拍、日出貨量以及場地條件等因素,為其設計并交付一條完整的定制化產線。在這個背景下,我們希望將這種高關節自由度、高柔性的人性機器人與定制化產線整合,為海外客戶提供的不僅僅是產線級、車間級的生產裝備,而是工廠級智能制造解決方案。
汽車產業具有產業鏈長、高度集成化的特點,是歷次科技革命和產業革命的先導產業,正在向智能制造轉型升級。傳統產線雖然能夠滿足一定的生產需求,但在柔性方面存在局限。相比之下,通過引入人形機器人或具身體機器人,我們能夠實現超高柔性與自動化的生產線調整。這不僅順應汽車制造業的全球趨勢與未來方向,也十分契合客戶們對于安全穩定、高效節能、智能升級的戰略準備。
為了使產品快速與應用場景融合,我們需要對應用場景進行細分。以垂直場景為基準來收集所需要的數據,從而大幅度降低數據采集的樣本量。比如實現游戲機器人的全面能力可能需要收集百億級的數據。在特定的垂直場景中,可能僅需一千萬個數據樣本即可滿足需求。那么,這一千萬個數據樣本又該如何獲取呢?
比如安排50名工作人員,每人每天工作12小時,每月工作28天,以此計算,50人一個月可采集約100萬條數據。我們將這些采集到的數據進行整合和處理,構建出一個經過充分訓練的大模型。該模型能夠應對10至15種不同的工況,并具備一定的自主學習和遷移能力,從而實現快速部署。一旦實現這一目標,我們就能夠真正將具身智能融入到我們的產線之中,顯著提高生產效率和靈活性。
當前社會對具身智能的期望與產業實際發展水平之間存在顯著的差距。如果人形機器人無法滿足全社會對機器人概念的普遍期待,那么這一領域將難以形成具有廣泛影響力的產業。我們認為,人形機器人最大的挑戰并不在于其硬件方面,而在于大模型的構建、垂類大模型的應用以及數據采集等方面。
為此,我們致力于基于多樣化的產品形態,在汽車電子、工業自動化等領域,為人形機器人的主機廠及高校機構提供一系列應用平臺,以支持數據采集、場景構建與需求明確。我們與眾多供應商建立了緊密的合作關系,并攜手高校與研究機構,將他們的先進技術在我們的工程環境中進行實際驗證。通過這一系列的合作與驗證,我們不僅能夠高效、高質量地采集和處理數據,還能夠構建高精度、高適應性的AI模型,確保機器人在復雜環境中能夠高效工作。
此外,我們針對特定垂直領域(如汽車電子、工業自動化等),進行深度優化,提高機器人在具體應用場景中的性能表現水平。通過多輪驗證與優化,我們將進一步推動技術的功能化與產品化,確保相關技術符合行業規范,并最終實現市場推廣。我們相信這一系列的努力,將有助于提高人形機器人的實際應用能力,助力整個產業快速發展。
目前,人形機器人還有很多技術難點尚未完全攻克,存在諸如軟件端無法適應復雜的應用場景、交互能力差等問題。因此,在感知系統的開發上,我們會更加明確其性能需求、適用場景、集成芯片設計等,使其更好同具身智能相結合。
在數據采集方面,我們認識到真實的工程場景數據對于提升機器人性能至關重要。盡管網絡數據量龐大,但其準確性難以保證;虛擬仿真數據雖然可以大量生成,但與實際場景相比,準確性仍有差距。在工程實踐中,我們發現許多在仿真環境中表現出色的技術,但在應用于實際場景時仍會遇到各種問題。因此,我們計劃在自己的廠區及合作伙伴的場所搭建專門的數據工廠,專注于數據采集和真實的工程實際數據檢測。通過這種方式,我們可以獲得更準確、更符合實際應用需求的數據,從而進一步優化人形機器人的性能,增加其靈活性和可靠性。
在開發與合作進程中,我們遇到了許多挑戰:具身機器人配備了大量的傳感設備,智能的實現離不開感知能力。然而,目前我們觀察到的一個現象是,許多專注于具身機器人整機開發的公司,其實際行為更接近于構建一個展示技術實力的平臺,而非開發一個實用的產品。他們傾向于將最強大、最優質、最昂貴的組件集成到系統中,例如追求極高的處理器性能,以及過度堆砌激光雷達等傳感器。
這種開發模式并不符合工程化產品的開發原則,它更像是一種技術展示。究其原因,主要在于需求的模糊性。如果我們面向的是C端市場,開發的是消費電子類產品,那么需求在一定程度上是可以被引導和創造的。例如30年前,人們從未設想手機需要具備拍照功能,但如今,拍照已成為手機的標配功能,這一需求是被創造出來的。但在工業界,需求的產生則遵循著截然不同的邏輯——先有需求,后有產品。當人力無法搬動沉重的工件時,機械臂應運而生;當人工操作速度無法滿足生產需求時,自動化產線成為解決方案。

圖源:演講嘉賓素材
在計算智能領域,由于應用場景的模糊性,當前計算機的連接方式與器件產品的開發并未嚴格遵循需求導向。我們致力于協助那些擁有強大技術實力的科技公司,清晰地界定他們所需的機器人產品類型。例如,在簡單的工作環境中,可能無需激光雷達,僅依靠雙目攝像頭便足以滿足需求。針對雙目攝像頭的應用,我們需要細致考慮其精度要求、采集頻率、物理形態、安裝位置以及快速拆裝機制等關鍵要素。這些問題均屬于零部件設計與優化的范疇,正是我們公司當前全力解決的核心問題之一。
這些細節和功能化的要求雖然瑣碎,但我們堅信這些問題的解決將有助于行業實現進一步發展。
此外,在關節部件的研發上,我們也進行了深入探索。最近,我們進行了一項實驗,為某款機器人的下肢配備了三箱可樂作為負載,并讓它在廠區內進行兩個半小時的持續奔跑測試,直至電池耗盡。在測試過程中,我們發現,機器人左側臀部的溫度僅為三十多度,而右側則高達六十多度。
若此類問題出現在一款工業產品上,是絕對無法被接受的,這樣的產品也無法推向市場。不過,在機器人領域,由于技術尚處于早期發展階段,這類問題在某種程度上是可以被容忍的。但從行業長遠發展角度來看,這些問題是要被解決的。
針對這些問題,我們進行了深入排查與研究,找出其根源。目前,我們也觀察到了大量人形機器人產品在結構設計上存在諸多不足。這反映出許多科技公司,尤其是那些缺乏機械工程和電路硬件背景的科技公司,在產品開發上所面臨的困境。
此外,在智能產品的信號傳輸方面,行業整體缺乏統一性和規范性,如一個主控電腦上可能同時通過USB、CAN總線、Wi-Fi、藍牙等多種不同的通信方式接入的設備。
設備管理層面也存在一些問題,如我們難以準確掌握設備的上線與下線狀態,有時缺乏設備狀態反饋,這些問題迫切需要我們構建一套有效的設備狀態呈現系統。為此,我們必須將產品集成到總線上,通過總線通信的方式實現設備間的互聯與數據交換,這才是符合工程化要求的解決方案。
此外,我們需要探索一種合適的硬件芯片集成方案,推動具身智能接口的標準化發展。我們的目標是使這些產品能夠像顯卡一樣,實現即插即用,從而助力科技公司或整機公司提高在算法領域的研發效率。
我們認為,工業化的垂直大模型是未來發展的重要方向。目前,我們已經著手開展多個具體場景的應用實踐,旨在構建工業化的產業大模型。我們相信,這些大模型將真正具備改變主觀性的潛力,極大提高生產力水平。