原文作者:Matthew Hutson
機器學習技術能提高計算效率,可能會有更深遠的應用。
倫敦 DeepMind 的研究人員證明,人工智能(AI)能為一類非常基本的數學計算找到捷徑。他們的做法是先把問題變成一個游戲,再使用機器學習技術—— DeepMind 的另一個 AI 曾用這種機器學習技術打敗了人類圍棋和象棋選手。

AlphaTensor 的設計目的是進行矩陣乘法,但同樣的方法也可以用來解決其他數學挑戰。來源:DeepMind
這個 AI 發現的算法在計算效率上打破了過去幾十年的紀錄,研究團隊的結果 10 月 5 日發表于《自然》 [ 1 ] ,或為某些領域打開了實現更快計算的新大門。
" 這也太厲害了," 林茨大學的計算機科學家 Martina Seidl 說,"這項研究證明了機器學習在破解數學難題上的潛力。"
用算法追算法
隨著機器學習的不斷進步,AI 已經可以生成語言,預測蛋白質形狀 [ 2 ] ,檢測黑客攻擊。而研究人員也在越來越多地利用這項技術反哺它自身——用機器學習來優化它自己的底層算法。
DeepMind 開發的這個 AI 名為 AlphaTensor,其設計初衷是執行被稱為矩陣乘法的運算。這種運算是指把網格化排列的數字——即矩陣——相乘。矩陣可以表示圖片的像素集、氣象模型中的空氣狀況,也可以表示人工神經網絡的內部機制。要把兩個矩陣相乘,數學家必須先把單個數字相乘,再通過特定方式把它們相加,產生一個新的矩陣。1969 年,數學家Volker Strassen 為兩個 2×2 矩陣的乘法找到了一種僅需 7 次乘法——而不是 8 次——的算法 [ 3 ] 。這激勵了其他研究者尋找更多類似技巧。
DeepMind 的做法是使用名為強化學習的機器學習方法。在強化學習中,一個 AI" 智能體 "(通常是一個神經網絡)會學習如何與環境交互,以達成一個多步目標,例如在桌面游戲中取勝。如果它做得好,該智能體就會得到強化——它的內部參數會更新,以提高未來的成功率。
AlphaTensor 還使用了一種博弈方法,名為樹搜索。在樹搜索中,AI 在計劃下一步行動時,會探索不同分支的可能性會產生什么結果。在樹搜索中,為了決定優先選擇哪條路徑,它會讓一個神經網絡預測每一步最有希望成功的行動。當智能體還在學習的時候,它會使用訓練游戲的結果作為反饋來強化神經網絡,而這會進一步優化樹搜索,取得更多成功,再從中學習。
每次博弈都是一個單人游戲,從一個三維張量(3D tensor)——數組——開始,其中的數字都填好了。AlphaTensor 需要用最少的步驟將所有數字變成 0,每一步都要從一組可行的行動中選擇。每一步都代表一次計算,該計算的逆轉相當于將前兩個矩陣中的數字結合起來產生輸出矩陣中的一個數字。游戲很難,因為這個智能體的每一步可能都要從幾萬億種行動中選擇。" 如何為算法發現構造盤面空間是非常精密的," 論文的作者之一、DeepMind 的計算機科學家 Hussein Fawzi 在一場新聞發布會上說,但 " 更難的是如何在這個空間中尋路 "。
為了給 AlphaTensor 的訓練助一把力,開發人員給它展示了一些成功的游戲案例,這樣它就不需要從零開始了。由于行動的順序無關緊要,當它找到一組成功的行動序列后,開發人員就會把行動序列重新打亂再交給它當作學習范例。
高效運算
開發團隊在最大 5×5 的矩陣上測試了該系統。在很多情況下,AlphaTensor 重新發現了 Strassen 等數學家已經找到的捷徑,但它也發現了一些 " 新大陸 "。例如,在將 4×5 和 5×5 的矩陣相乘時,過去最好的算法需要 80 次乘法,而 AlphaTensor 發現的算法只需要 76 次。
"它在玩這些游戲時有著驚人的直覺。"DeepMind 的計算機科學家 Pushmeet Kohli 在新聞發布會上說道。Fawzi 告訴《自然》,"AlphaTensor 并沒有人類關于矩陣乘法的直覺 ",所以 " 從某種意義上說,它需要從頭開始構建自己的知識體系 "。
在解更大的矩陣乘法時,開發團隊的方法是先做出將問題拆解成更小問題的元算法。在把 11×12 和 12×12 的矩陣相乘時,他們的算法能將乘法次數從 1022 次減少到 990 次。
AlphaTensor 還能根據特定硬件優化矩陣乘法。團隊在兩個不同的處理器上訓練了該智能體,不僅在它執行更少運算時予以強化,在它縮短執行時間時也會得到強化。很多時候,這個 AI 的矩陣乘法比之前的算法快了好幾個百分點。有些情況下,一個處理器上最快的算法在另一個處理器上就不是最快的了。
開發團隊表示,同樣的思路也可能應用在其他類型的數學運算中,例如將復雜的波或其他數學對象拆解成更簡單的組合。" 這一發現倘若能得到實際應用,就太令人激動了," 麻省理工大學的計算機科學家 Virginia Vassilevska Williams 說," 能強化性能就能優化很多應用。"
美國維克森林大學的計算機科學家 Grey Ballard 看到了未來人機合作的潛力。" 我們或許能用這種計算方式向前再邁一小步," 他說," 但我更期待看到理論學家開始分析他們找到的新算法,尋找線索,從而實現下一個突破。"
原文地址:http://www.myzaker.com/article/63576a2eb15ec045f94ada5c