世界模型(World Model)是一種理解現實世界動態的生成式AI模型,其不僅能理解靜態的數據,還能模擬現實世界的動態過程。
多模態感知融合、真實物理世界構建、動態環境預測是世界模型核心能力。在構建方法上,目前世界模型主要有用擴散模型生成、用Transformer架構提取關鍵信息、用“雙自回歸技術”補“長時記憶”、用“神經-符號結合”補“邏輯推理”四種構建方法。
世界模型是實現空間智能的核心、物理推理的基礎,在自動駕駛、機器人、數字孿生、影視游戲、虛擬現實、元宇宙、醫療健康、具身智能等領域具有廣闊應用潛力。在自動駕駛領域,世界模型可以整合靜態結構、動態實體等多源信息,實時捕捉并更新環境狀態,進而為自動駕駛的感知、預測、決策、規劃等提供統一的環境表征。
根據新思界產業研究中心發布的
《2025-2029年世界模型行業市場深度調研及投資前景預測分析報告》顯示,目前世界模型正不斷從“前沿概念”進入“工程落地”拐點,預計自動駕駛、機器人等領域率先實現商業化應用,尤其是自動駕駛領域。
世界模型核心思想可以追溯到上世紀90年代初,但近年來才引起廣泛關注,目前世界模型仍處于早期發展階段。世界模型訓練需要處理海量、高維度的物理交互數據,對AI芯片的推理、訓練能力要求極高,目前世界模型商業化落地仍面臨算力成本過高、訓練數據太單一、長時間預測不準、場景適配性差等難題。
但作為實現空間智能的核心,世界模型已成為國內外廠商必爭之地,在國際市場上,世界模型布局企業包括World Labs、谷歌、英偉達、Meta、Tesla、Wayve等。Genie 3是谷歌首個支持實時交互的世界模型,也是目前最具代表性的世界模型之一。
我國在世界模型領域亦有布局,目前參與者已達十余家,包括商湯、理想、華為、騰訊、蔚來、小米等,其中商湯的絕影開悟世界模型在產品技術、應用能力、生態建設等方面優勢明顯,綜合實力位居國內第一。
新思界
行業分析人士表示,世界模型已成為國內外廠商必爭之地,我國企業已具備與國際廠商相競爭的實力。近年來,在相關企業積極布局下,新世界模型不斷涌現,同時世界模型在自動駕駛、機器人、具身智能等領域的探索也不斷推進。但由于算力成本高、數據單一等難題,目前世界模型仍處于發展早期階段,距離大規模落地仍有一定距離。
關鍵字: