9月21日,風險投資公司安德森·霍洛維茨公司(AndreessenHorowitz,簡稱a16z)發布了一期重磅訪談視頻。a16z普通合伙人馬丁·卡薩多(MartinCasado)與WorldLabs的兩位領軍人物——被譽為“AI教母”的李飛飛以及她曾經的學生賈斯汀·約翰遜(JustinJhonson)展開了一場精彩對話。
此次訪談重點討論了AI的歷史進程、當前挑戰以及未來突破,特別是“空間智能”這一領域的潛力和應用。
回顧AI發展:從“寒冬”到“大爆發”
李飛飛在訪談中首先回顧了人工智能的發展歷程。她表示,盡管許多人對那個時期的AI發展持悲觀態度,稱之為“AI的寒冬”,但她卻始終認為這是“春前的冬眠”。
李飛飛形象地描述道,人工智能正經歷著“大爆發”式的快速發展。她強調,當前的AI已經不僅限于文本處理,在音頻、視頻等多模態領域也正在迅速崛起,這為AI帶來了無數的可能性。
賈斯汀則通過自己的學術經歷,回顧了深度學習的興起,并強調算力的飛速提升對AI發展的關鍵作用:“算力的增長是驚人的,以前需要6天才能完成的任務,現在只需要不到5分鐘就能完成?!彼镁唧w的例子說明,隨著技術的發展,AI的能力在幾何級數上攀升。
空間智能:3D世界的AI革命
作為此次對話的核心話題之一,李飛飛和賈斯汀深刻剖析了“空間智能”的革命性潛力。李飛飛定義道:“空間智能是機器在3D空間和時間中感知、推理和行動的能力?!?/p>
李飛飛表示,視覺空間智能是她的“北極星”。她指出,空間智能與語言智能一樣重要,甚至在某些方面可能更古老、更基礎。她還提到,AI的發展不會局限于處理平面圖像或文本,而是會邁向對三維世界的理解,這是智能發展的自然延伸。
賈斯汀進一步解釋了空間智能與傳統基于語言的AI之間的差異:“語言模型的底層表示是一維的,但世界是三維的。我們認為,世界的三維特性應該在表示中占據核心地位。”他認為,空間智能不僅僅是對圖像或視頻的2D處理,而是通過3D模型來推動機器理解物理世界的本質。
李飛飛還從進化的角度闡述了空間智能的重要性:“智能的進化使動物,尤其是人類,能夠在世界中移動,與世界互動,甚至創造文明。這種能力不僅僅是感知二維世界,更是理解并應對三維的真實物理環境。”
“視覺智能是我的激情所在,因為我相信每一個智能生物,如人類、機器人或其他形式,都必須具備看待世界、推理世界和與世界互動的能力?!崩铒w飛進一步解釋,空間智能不僅是技術上的突破,更是構建未來AI生態的關鍵。
李飛飛強調,當前的計算能力更加成熟,數據理解比以往更深入,算法進展迅速,正是探索空間智能的關鍵時刻。
應用場景:虛擬與現實世界融合
當談及空間智能的潛在應用時,賈斯汀表示:“未來的AI不僅能生成圖像或視頻,還能創建一個充滿活力和交互性的3D世界?!彼O想,空間智能能夠應用在游戲、教育、虛擬攝影等多個領域,甚至開啟一種全新的媒體形式。這不僅降低了3D內容制作的成本,還可能會激發更多的沉浸式體驗。
李飛飛則補充了增強現實(AR)和虛擬現實(VR)的應用場景。她提到:“這種技術將成為AR/VR的‘操作系統’,幫助人類增強能力。”
她舉例說,未來,佩戴AR眼鏡的人可能不需要任何專業技能,就能修理汽車或完成復雜的操作。她認為,通過空間智能,虛擬世界與現實世界的融合將大大增強人類與機器的互動能力。
賈斯汀指出,隨著這項技術的成熟,未來我們可能不再需要使用手機、平板等不同尺寸的屏幕。他表示:“如果你能夠將虛擬內容與物理世界無縫融合,那么對所有這些屏幕的需求就會減少?!?/p>
李飛飛還提到了蘋果發布的VisionPro。她笑稱,“就在WorldLab成立的時候,蘋果發布了VisionPro。蘋果使用了‘空間計算’這個詞,幾乎是‘偷’了我們的名字,我們是‘空間智能’?!?/p>
邁向“北極星”的旅程
在對話的最后,馬丁·卡薩多問及如何衡量空間智能的成功。李飛飛表示:“當我們看到越來越多的企業和用戶開始使用我們的模型來解鎖他們的需求時,那將是我們到達一個重要里程碑的時刻?!钡仓赋觯分鸺夹g的“北極星”是一場永無止境的旅程,空間智能的未來充滿了無限可能。
賈斯汀則認為,空間智能的終極目標是理解宇宙的四維結構,技術的每一次突破都會開啟更多的未知領域:“我們永遠不會到達終點,但這正是技術魅力所在?!?/p>