【為什麼我們要挑選這篇文章】AI 機器人如何才能獲得人類的智力呢?
深度學習領大神 LeCun(楊立昆)在近期的演講中發表了他的看法,他認為應該讓典型的神經網路拋棄機率論框架,並賦予它「無限權值」,才能使機器人透過無監督學習來獲取人類的智力。(責任編輯:陳美羽)
深度學習領域的大師 Yann LeCun 表示,AI 的下一個發展方向可能是摒棄深度學習的所有機率技巧,轉而掌握多種變化的能量值。
FB 的 AI 主管,擁有想像不存在東西的能力
據說有一些工程師和科學家,可以在他們的腦海中想像出那些尚未變成現實的構思,Facebook 的 AI 主管 Yann LeCun 就是這種人。
他在《機器學習時刻》(When the Machine learning)一書中寫到:「我主要靠直覺工作。」這本新書既是一本傳記、科普書籍,同時也是一部 AI 史。這本書於 10 月 16 日出版了法文版,名為《Quand la machine apprend》。
LeCun 在書中寫道:「我在腦海中勾勒出了愛因斯坦稱之為『思維實驗』的臨界情況。」
這種在通常認為可行範圍內想像不存在東西的能力,是工程師和創新者的標誌。LeCun 在 AI 人群中是一個罕見的人物,他不僅精通算法設計,在電腦工程領域也有一定的建樹。
他使 CNN 變得實用,在機器學習中脫穎而出
LeCun 今年因為對電腦科學有貢獻而獲得了 ACM 圖靈獎,最出名的是他在 20 世紀 90 年代推進和完善了卷積神經網路(CNN,一種前饋神經網路,它的人工神經元可以回應一部分覆蓋範圍內的周圍單元,對於大型圖像處理有出色表現。),並使其實用化。
他沒有從零發明這個東西,但他使得 CNNs 變得實用可行,這奠定了機器學習革命的基礎。在過去的十年裡,LeCun 以及同為獲獎者的 Geoffrey Hinton(傑佛瑞.辛頓)和 Yoshua Bengio(約書亞.班吉歐),一同在機器學習領域中脫穎而出。
如何讓機器獲得人類智力?LeCun:無監督學習
10 月 16 日,在新澤西州普林斯頓高等研究院(Institute for Advanced Study),工程師 LeCun 在台上解釋了「什麼聽起來像是直覺,但卻是實實在在的直覺。」這是一個為期三天的深度學習研討會,具體來說,就是深度學習的理論探討。
該活動由研究所數學教授 Sanjeev Arora(桑吉夫.阿洛拉)舉辦,吸引了許多人工智慧領域的傑出人物,包括 NVIDIA 的人工智慧研究負責人 Anima Anandkumar,以及 LeCun 的同事 ── Facebook 學者 Leon Bottou(萊昂.伯托)。
LeCun 的簡報展示的是他最近在許多講座上所採用的主題:如何超越傳統深度學習的標記訓練範例。他對聽眾說:「我們不可能單純地透過監督或多任務學習讓機器獲得一般人類的智力,我們將不得不採取其他方法。」
LeCun 認為,另一種方法就是無監督學習。為了使無監督學習成為可能,整個領域需要更多地研究一種方法 ── 機器學習能量模型(energy-based learning)。
機器學習能量模型:提供電腦豐富的原始數據
能量函數在 AI 領域已經存在了數十年。生物學家 John Hopfield(約翰.霍普菲爾德)在 20 世紀 80 年代首次推廣了這種方法,當時人們稱之為「霍普菲爾德網路」(Hopfield Network)。這在當時是機器學習的一個突破,它還催生了其他類型的學習算法,這些算法處理的是需要優化的能量場概念,例如 Hinton 追求的「玻爾茲曼機」。
此外,LeCun 還反思了卷積網路的持久吸引力。
「關於機器學習能量模型的想法已經有一段時間了」,LeCun 說,「最近因為我需要減少監督學習算法的使用,所以又意識到了這一點。」
機器學習模型很容易學習案例中的細節,但是其基本思想是,不要創建大量帶有標籤的數據集(例如貓和狗的圖片),也不用花費數千小時玩 DeepMind 的 AlphaZero 這樣的國際象棋遊戲,而只是獲取一些豐富的原始數據,例如大量的 YouTube 影片剪輯,然後將其提供給電腦。
LeCun 說:「可以把這台機器做得非常大,讓它整天觀看 YouTube 或 Facebook 上的直播。」
機器可以被訓練來預測每一幀影片之後接下來會發生什麼。預測和現實之間的相容性就是所謂的能量水平。較低的能量更好、更相容,意味著更準確,所以神經網路試圖達到一個理想的低能量狀態。
LeCun:典型的神經網路必須有「無限權值」
LeCun 在舞台上充滿活力,尤其對主題的細微差別很感興趣。他向觀眾展示了其不確定性的一面,他直視著前方,開始前後擺動手臂,並說道:「你現在正看著我,你在拍我的影片,背景沒有變化,相機也沒有移動。」
「發生的唯一一件事情是,我可以朝一個方向或另一個方向移動我的頭,可以以不同的方式移動我的肌肉,而在這次演講中,我頭部所有圖片的流形現在都是一個低維流形,受到我頭部肌肉數量的限制。」
LeCun 的想法在機器學習方面相當激進。在 LeCun 的版本中,能量函數消除了機率預測。「我認為正確的做法是拋棄機率論框架,因為它是錯誤的,也是沒用的」他認為,典型的神經網路必須有「無限權值」。
LeCun 登法國時尚雜誌,談論 AI 前景和危險
顯然,在 LeCun 的設想中還有一些尚未實現,他嘗試把它表達出來,但是距離真正實現,仍需時日。LeCun 接著將登上飛往巴黎的飛機,與記者會面討論這本書。11 月他登上了在法國時尚雜誌《新觀察家》(l’Obs)的封面上,談論 AI 的前景和危險,這是每個人都為之興奮與害怕的東西。
幾十年來,LeCun 和其他人都可以看到它,但這些東西並沒有起作用。現在它似乎已經太管用了,倘若必須有人來充當監察人員,那正是 LeCun。
(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈機器學習能量模型:Facebook 的 AI 主管 LeCun 所想像的 AI 未來 〉。首圖來源: 大數據文摘 。)
延伸閱讀
▌Python 早就落伍了!AI 權威 LeCun 直言:深度學習需要更靈活的程式語言
▌ 在家從零自學沒問題!22 歲數據工程師大推 3 本必看的機器學習入門書
▌ 機器學習演算法的三大陷阱:人類看不到,但 AI 看得一清二楚的「隱藏變數」