2025年12月17日,在第七屆AI智能座艙與顯示技術大會上,理想汽車高級總監李娟深入闡述了智能空間的發展理念,其核心在於通過空間交互與智能交互兩大主線提升用戶體驗。空間交互方面,理想汽車提出了「三維五屏空間交互」概念,通過多模態交互體系,實現從二維到三維的升級,並引入分區空間交互,滿足不同區域乘員的獨立需求。同時,車內座椅的靈活佈局為空間交互提供了更多可能性,支持更豐富的場景體驗。
智能交互領域,理想汽車自主研發大模型,並將其應用於車輛中,通過任務型服務體系降低用戶認知負荷,實現一句話完成所有相關任務。同時,理想汽車打通了諸多生活場景服務,如快速取餐等,並推出調音大師、任務大師等功能,滿足用戶個性化需求,推動「用戶定義汽車」的新階段。李娟表示,未來理想汽車將繼續探索自然交互與意圖交互,提升用戶體驗。
李娟|理想汽車高級總監
以下為演講內容整理:
智能空間的核心在於通過特定空間內的服務實現用戶體驗。為有效支撐這一服務,我們將其規劃為兩條主線,這兩條主線是一個有機聯繫的整體。第一條主線是空間交互,旨在構建一個靈活有趣的空間,並提供極致的空間體驗。第二條主線是智能交互,目標是為用戶提供一個能夠持續成長的智能助手,並最終成為其有機的硅基夥伴。
01
空間交互
在智能座艙中,我們始終聚焦於服務車內人員,因此人機交互至關重要。相比之下,車輛的其他部分,如智能輔助駕駛與整車電子化,主要服務於車輛本身,旨在提升駕乘舒適性與自動化水平,從而為用戶節約精力。兩者服務的對象不同。
從交互維度來看,車內空間在交互對象和交互模態上與常見設備存在顯著區別。以手機或電腦為例,它們本質上是二維平面設備,服務對象單一,通常僅針對用戶個人,因此交互模態也相對簡單。例如,PC主要依靠鍵鼠操作,手機則以觸控為主。而車內環境則完全不同。首先,車輛不論用於商務或家庭,其設計需要服務於包括駕駛員在內的所有乘員。其次,車輛本身是一個完整的立體空間,交互行為需在三維空間內進行。此外,我們致力於打造多模態交互體系,不僅限於觸控,更融合視覺、語音等多種模態,共同構成完整的空間交互體驗。
空間交互層面,我們提出了「三維五屏空間交互」概念,將人機交互劃分為感知、理解與表達三個環節。在車內環境中,感知層面的聽覺與視覺,以及表達環節,均實現了從二維到三維的升級,從而構建出真正的空間交互能力。
然而,隨着技術發展,我們發現單一的統一空間交互模式已無法充分滿足用戶需求。例如,在家庭用車場景中,當後排兒童觀看電影時,前排駕駛員往往無法同時收聽音樂或享受音頻服務。
為解決這一問題,我們提出了分區空間交互的概念。通過將車內空間劃分為前後等不同區域,實現後排乘客觀看影音內容的同時,前排駕駛員仍可獨立享受音樂或其他音頻服務,從而提升長途出行等場景下的體驗,緩解行程中的枯燥感。
為實現分區交互,我們在技術架構上進行了重構。感知層面需具備分區感知能力,中央處理系統需實現分區理解,最終驅動聽覺與視覺表達系統進行分區呈現。因此,從感知、理解到表達的完整鏈條均需實現分區處理,這也使分區交互成為智能座艙發展的重要趨勢。
此外,空間交互的靈活性核心在於車內座椅的佈局與可調性。座椅的可移動與變換能力是拓展空間使用場景、豐富交互多樣性的關鍵基礎。正是基於這一能力,智能空間得以支持更豐富的場景,並為多元化的空間交互創造了可能。
許多人提及車輛時,往往忽略了一個方面,即我們可以在車內擁有一個寬敞的大客廳或大臥室,從而提供多樣化的體驗。這些豐富的體驗,涉及兩個維度,一是「有」,即是否具備相關功能或空間;二是「好」,即這些功能或空間的體驗是否足夠優質。
以客廳為例,它絕不能顯得狹窄侷促,而必須讓人感到舒適。為了實現真正的大客廳體驗,我們需要配備相應的設施和配件。比如,當我們在客廳裏一起玩耍或品茶時,就需要有合適的桌板等配件來支持這些活動。再比如家庭影院系統,它要求我們對光環境進行精準控制,提供全景聲的沉浸式體驗,以及設計大尺寸的螢幕,這些元素共同構成了一個有機的整體。只有這樣,用戶方能獲得更貼近實際物理世界的家庭影院體驗。因此,我們持續致力於通過空間打造、舒適性提升,以及各類環境因素的有機融合,來構建多樣化的空間交互體驗。
02
智能交互
在探討智能交互時,我們首先關注的是其能否為用戶提供更多有意義的功能,助力用戶完成更多有趣的事情。理想同學在2024年累計喚醒次數達到了13.8億次。而在五一期間,單日喚醒次數更是高達1200萬次。取得如此出色的數據表現,主要在於理想同學足夠智能,能夠切實幫助用戶處理事務,進而提升了用戶對它的信任感。
在打造理想同學的過程中,我們始終堅持自主研發大模型,自2023年起,便着手構建並率先將自研的GPT大模型應用於車輛中。隨後,我們逐步進行迭代升級,前期先開發了一些智能體,後續逐步具備了長思考和短思考的能力。到了2025年,我們開始運用agent的整體服務與生態,通過CUA能力和A2A能力,構建起連接數字世界與物理世界的服務。同時,我們還拓展了智能體的生態,從而贏得了衆多用戶的歡迎。
智能交互應用場景上。首先,我們會利用AI大模型的能力,設法降低用戶的認知負荷。我們致力於將功能型服務升級為任務型服務。功能型服務中,用戶通常通過發出具體指令來操作,例如「開啓導航」「開啓空調」「打開座椅加熱」「打開車門」等,這些均屬於單一功能。用戶需自行拆解這些功能,並調度AI來完成相應服務。然而,用戶實際上更期望能夠僅通過一句話,甚至無需言語,即可讓系統自動完成所有相關任務。為此,我們構建了一整套任務型服務體系。用戶只需提出一句話需求,後續所有任務功能的拆解以及連續、連貫的任務執行,均由AI負責完成。
我們將整個服務升級為任務型模式。這種模式不僅體現在交停車費這一場景中——交停車費本身能夠顯著降低用戶的認知負荷,讓支付過程更加優雅;同時,它也是實現智能輔助駕駛後必備的一項能力。
此外,我們還打通了諸多生活場景的服務。例如,我們與肯德基合作,實現了快速取餐服務。用戶只需一句話,系統便可自動為其點選喜愛的套餐,並指定取餐地點。除此之外,點咖啡、點外賣等各類生活服務能力也已上線,並通過OTA推送給了用戶。
智能交互還帶來了另一項變革。我們過去一直強調「軟件定義汽車」,而未來則應邁向「用戶定義汽車」。軟件定義汽車的能力指的是將整個移動互聯網的生態遷移至車內,涵蓋出行服務、音頻、視頻、遊戲以及生活類應用等,旨在讓用戶在車內能夠完成更多與生活相關的場景化服務。這是過去5到10年間,行業持續努力的方向。
然而,僅依靠軟件定義汽車仍顯不足。以理想汽車為例,目前我們已擁有160萬用戶,每位用戶都有其個性化的需求,對軟件功能和場景的定義也各不相同。如何滿足如此龐大且多樣化的用戶需求,成為我們面臨的重要課題。
為此,我們推出了大師系列。首個推出的功能是調音大師。之所以推出調音大師,是因為聲音是一個極具主觀性的元素,每個人對聲音的喜好和偏好都不盡相同。有些用戶偏好古典音樂,有些則鍾情於流行音樂,對於不同類型的音樂,所需的調音風格自然也不盡相同。官方或許只能提供一套我們認為最優的聲音配置,但用戶需求千差萬別,對聲音的要求也各不相同。為此,我們推出了調音大師功能。
在調音大師的底層,我們開放了196個參數供用戶調整,專業用戶可針對這196個參數進行精細調校。對於非專業用戶也無需擔心,我們提供了不同類型樂器的預設音效進行播放,用戶只需聆聽並選擇自己喜歡的樂器聲音呈現方式,即可以一種簡單直接的方式,定製出自己鍾愛的音效,實現千人千面的聽音體驗。
針對任務大師功能,我們也做了諸多創新。由於用戶需求和場景各異,通過任務大師,用戶可以告知理想同學需要播放什麼音樂或視頻。通過這些功能,用戶能夠營造出各種充滿儀式感的場景,同時也可設定安全提醒,甚至自主創作娛樂與交互內容。這些功能均由用戶根據自身需求自行構建。此外,用戶對桌面的訴求也各不相同。例如,有的用戶當前正在學習英語,希望桌面上能常駐每日五個英語單詞或五句英語句子,以便每日背誦;而有的用戶則偏好球類資訊,希望桌面上能展示當前最熱門、最火熱的球類信息。
針對每個人對桌面的需求各異,用戶只需一句話,即可生成符合自己喜好的桌面。如此一來,每個人的桌面都將獨一無二,且每日可隨心更換。如果今天不喜歡當前桌面,明天便可換成其他樣式,從而更貼合用戶當前的心情與狀態。
要實現千人千面的效果,其底層支撐無疑是AI大模型所賦予的各項能力。
第二個關鍵要點在於,我們需要將原子化的能力進行拆解。第三個要點則是,基於對用戶需求的深刻理解,構建起完善的記憶系統。此外,硬件方面需具備強大算力,最終推動我們進入用戶定義座艙的新階段。
關於交互發展,我們認為可分為三個階段。目前,我們已開始邁入自然交互階段。自然交互意味着用戶能夠通過多模態方式,如語言進行交互。例如,我們此前推出的指代功能便深受用戶喜愛。用戶只需說:「理想同學,幫我打開這個」,系統便能理解用戶所指的是天窗還是車窗,並直接完成操作。這種交互方式無需用戶特意記憶諸如左前窗、左窗、右窗、前窗,以及一排還是二排等複雜信息,更符合人類的交互習慣。
最終,交互將邁向意圖交互階段。它類似於人與人之間的交互,首先需要對交互對象有深入了解,不僅要掌握其歷史喜好,更要洞察其當前狀態與即時偏好。其次,雙方需建立起足夠的信任關係。如果AI能夠持續準確地為用戶提供幫助,用戶的信任便會逐步累積。隨着信任程度的提升,AI代理能夠為用戶處理的事務也將日益增多。此外,這一過程還需融合情感計算與行為建模等相關能力。唯有如此,方能真正進入意圖交互階段。
當前,我們正從自然交互向意圖交互方向進行探索,致力於讓用戶在智能空間或智能座艙中,獲得愈發便捷、好用的體驗,讓智能系統愈發聰慧,更能高效地協助用戶處理各類事務,同時涵蓋極致的空間體驗能力。
(以上內容來自理想汽車高級總監李娟於2025年12月17-18日在第七屆AI智能座艙與顯示技術大會發表的《智能交互與空間交互》主題演講。)
探索更多