計算機能像一個嬰兒一樣思考嗎?
1950 年,理論計算機科學家、人工智能之父艾倫 · 圖靈(Alan Turing)曾說道:" 與其嘗試制作一個模擬成人思維的程序,為何不嘗試制作一個模擬兒童思維的程序呢?"
按照圖靈的說法,如果從學些兒童的思維開始,并接受適當的經驗,計算機就可以像成年人一樣思考。
盡管當前人工智能(AI)行業已經取得了驚人的進步,完成了越來越多的、難以置信的任務,比如 Atari 電子游戲,國際象棋和圍棋等棋類游戲,以及蛋白質折疊和語言建模等科學問題。
但是,人工智能在這些細分領域內取得的成功,也清晰地表明,一些根本的東西依然缺失——人工智能系統在理解物理世界的常識性規律方面,表現得并不盡如人意。
特別是,即使是最先進的人工智能系統也仍然難以掌握 " 常識 " 知識。
然而,即使只有 5 個月大的嬰兒也懂得世界運作的常識性規則,當他們看到不符合物理規律的場景時,比如玩具突然不見了,也會感到驚訝。
對人類來說,這種知識似乎無處不在。只有人工智能系統具備如人類一般的推理能力,才能實現真正的智能。
如今,一項來自英國人工智能公司 DeepMind 的最新研究指出,受嬰兒視覺認知研究的啟發,他們的人工智能系統能夠以類似嬰兒的方式學習物理世界的基本常識性規則。
相關研究論文以 "Intuitive physics learning in a deep-learning model inspired by developmental psychology" 為題,已發表在科學期刊 Nature Human Behaviour 上。

( 來源:Nature Human Behaviour)
該人工智能系統名為 PLATO,是一個能學習直觀物理(Intuitive physics)的深度學習系統,遵循認為物體在我們周圍物理世界的表示和預測中扮演核心作用的理論。
直觀物理是一種常識性知識,用來理解物體的行為和相互作用。例如,如果你在半空中搖晃你的鑰匙,并宣布讓它掉落,每個人都知道,不受其他物體支撐的物體(也就是你的鑰匙)不會漂浮在半空中,兩個物體(鑰匙和桌子)不會相互穿過。因此,你會期望你的鑰匙會下落,直到它與桌子相遇。這種認知并不僅僅存在于成年人身上——即使是 3 個月大的嬰兒也有,如果人們遇到一個似乎違反預期的 " 神奇 ",就會做出 " 驚訝的 " 反應。
在此次工作中,研究團隊通過給 PLATO 觀看許多描繪簡單場景的視頻來訓練它,比如球落到地上,球滾到其他物體后面又再次出現,很多球之間彈來彈去等。

圖|來自 "freeform" 數據集的視頻,用于訓練模型。(來源:該論文)
據論文描述,PLATO 由感知模塊(左)和動態預測器(右)兩部分組成,感知模塊用于將視覺輸入轉換為一組目標代碼,動態預測器則使用這些目標代碼來預測未來的幀。

圖|PLATO 使用感知模型和動態模型對每個物體進行預測。(來源:該論文)
PLATO 將每一段視頻幀通過感知模塊分解為一組目標代碼,實現了從視覺輸入到個性化對象的映射;隨后,目標代碼在對象緩沖區中通過幀進行累積和跟蹤;最后,系統會動態地處理物體的表征,產生新的表征,這些表征會受到物體與其他物體之間的關系和互動的影響。
此外,他們也通過一系列實驗來驗證人工智能系統是否可以學習一系列不同的物理概念——特別是那些年幼的嬰兒可以理解的概念,比如固體性(兩個物體不會相互穿過)和連續性(物體不會瞬時性地存在)。
訓練之后,研究人員給 PLATO 觀看了有時包含不可能場景的視頻,以此作為測試。
和年幼的小孩一樣,PLATO 在看到沒有意義的場景(比如物體互相穿過卻沒有發生相互作用)時表現出了 " 驚訝 "。

圖|PLATO 展示了在沒有任何再訓練的情況下對未見過的物體和動力學具有魯棒性。(來源:該論文)
最重要的是,PLATO 只觀看了 28 小時的視頻就獲得了以上學習效果。
此外,此次研究還有兩個令人驚訝的發現。
其一,該模型能夠將期望概括為一組新的對象和事件,這些對象和事件與訓練集中呈現的不同;
第二,該模型能夠成功地演示學習,盡管已經在一個相對較小的視覺動畫集上訓練。
而這些發現,與科學家此前在嬰兒研究中看到的特征相似。
對此,美國西北大學教授 Susan Hespos 評價道," 與許多關鍵的研究發現一樣,該研究可以成為人工智能和發展科學之間的協同機會。他們的工作正在突破日常經驗可以和不可以解釋智能的界限。"" 這篇論文的結果表明,圖靈可能是對的。"
在她看來,該研究在關于嬰兒和成人看待世界的方式是否基本相似的先天 - 后天(nature – nurture)辯論中建立了一個有趣的中間立場。
在以往的研究中," 先天 " 的觀點被當代許多發展科學家所接受,但這并不是唯一的可能性,而其他學者支持從零開始學習的 " 后天 " 理論,并堅持認為發展真正智能的關鍵在于通過處理大量經驗或大量數據來發現輸入的模式。如果后者是正確的,那么大腦可以被視為一種通用設備,它能適應環境提供的任何結構和挑戰。
"Piloto 等人的結果表明,視覺動畫的經驗是學習過程的重要貢獻,但它不是全部。完整的故事需要一些內在的知識。"
基于以上研究,研究團隊表示,模仿嬰兒認知的深度學習系統 PLATO 勝過更傳統的 " 從零開始學習 " 系統。
PLATO 可以作為研究人類如何學習直觀物理的一個有力工具,同時也表明了物體表征對于我們理解周圍世界具有重要作用。