首 頁  >   金融  >   網貸品牌  >   寶元貸  >   DNC可微分神經計算機的功能取決于它的核心

DNC可微分神經計算機的功能取決于它的核心

2016-11-25 16:04

現在科技的發展是迅速的,我們不得不驚嘆。最近“阿爾法狗之父”,DeepMind又創造了一臺結合“神經網絡”計算系統與常規計算機內存的學習機器。斯坦福大學心智、腦和計算中心主任盛贊該成果是“人工智能研究一個非常有意思的重要里程碑”。他們在《自然》雜志上發表了一份研究,介紹名為“可微分神經計算機”(differentiable neural computer, DNC)的深度強化學習神經網絡。他們在研究中展示了DNC如何學習使用其記憶,回答有關復雜結構數據的問題,比如人工生成的故事、家譜,甚至是倫敦地鐵線路圖。此外,DNC還能通過強化學習,解決方塊游戲難題。

柏拉圖曾把記憶力比作蠟板,上面一旦刻了字,就能永久保存。柏拉圖用一個比喻來解釋“可塑性”,即人們可以塑造或重塑自己的想法。但我們的記憶,除了存儲內容外,還能夠形成聯系,相互連接。

英國哲學家約翰?洛克相信,如果記憶是在臨近的時間段和空間里形成的,那么它們就可以相連。除了蠟板以外,最著名的比喻就是馬塞爾?普魯斯特的瑪德蓮蛋糕了(一個成年人只要嘗一口年幼時吃過的甜點,童年回憶就如洪水一樣涌現)。現在我們知道,片段式記憶(或稱事件記憶)依靠的是海馬體。時至今日,人類對記憶的比喻變得更為精煉。記憶對我們來說不再是蠟板,而是一種可塑的過程。在這個過程中,特定的片段組成你的經歷,而這些記憶的片段可以重組。

另外,行為與記憶之間的關系是可變的,而非“刺激—反應”這樣么簡單。它怎么變,與事件的背景與處理事件的優先級別相關。舉個例子來說,如果記得倫敦地鐵圖,就能回答以下兩個有相同答案的問題:“怎么從Piccadilly Circus站去Moorgate站?”和“如果選一條和Northern Line線相鄰的線向北走,怎樣才能到Moorgate站?”可見,記憶的內容可以和記憶的使用被分開。

另一種觀點認為,記憶經過整理之后,可以用于計算。它更像是樂高玩具,人們可以根據問題重組記憶。

神經網絡在圖形認知方面表現出色,反應快速,決策及時,而我們才剛開始建立能緩慢思考的神經網絡,這種網絡能有目的,或理性地運用知識。比如,讓它儲存像交通運輸網這種信息,隨后有邏輯、合理地思考這些碎片化知識,并回答問題。我們在最近發表的論文中闡述,如何結合神經網絡和記憶系統,造出這一種能快速儲存并靈活解讀知識的學習型機器。這些被我們成為DNC(differentiable neural computers)的機器,可以像神經網絡一樣學習,還可以像電腦一樣存儲復雜數據。

一臺普通電腦的處理器可以通過RAM讀寫信息。RAM給了處理器更多的空間來整理計算過程中的信息。儲存臨時信息的空間被稱為變量,被存在記憶卡上。對電腦來說,設置一個儲存數字的變量很簡單,建立數據結構也不難,因為變量之間都有關聯。

最簡單的數據結構之一是列表,列表中,變量按順序排列。一種更復雜的數據結構是樹狀結構,如家譜,順著孩子就能找到父母,以及他們和祖先之間的聯系。最復雜且綜合的數據結構是圖表,如倫敦地鐵圖。我們設計DNC的初衷,是讓機器獨自學習建立復雜數據結構,并解決相關問題。DNC的核心是一個叫“控制器(controller)”的神經網絡,它的功能與電腦處理器類似。控制器負責輸入、解讀、書寫記憶,并回答相關問題,它的“記憶”由一系列儲存臨時信息的空間構成。

控制器可以進行數個記憶操作。每時每刻,控制器都在決定是否寫入內存。選擇書寫的話,信息就被存儲到全新的地方,或一個控制器找的地方。這樣,控制器就能隨時隨地更新存儲空間的內容。如果所有的記憶空間都滿了,控制器也可以選擇清空,正如電腦可以換個地方放置無用的數據。

控制器寫入記憶,就是把一個矢量單位信息輸送到選定的記憶空間。一旦寫入信息,不同的記憶空間都會存在聯系,這種聯系就是存儲信息的順序。

控制器除了寫入信息外,還可以解讀儲存在不同區間的記憶,通過搜索,利用現有的聯系,順序或逆序回憶已寫入的信息。被解讀過的信息可以直接回答某個問題,或對某個問題作出反應,采取行動。總的來說,這些操作令DNC有能力分配記憶空間、存儲記憶信息,并快速搜索記憶。像人一樣使用記憶,DeepMind 造了個比阿爾法狗更厲害的“機器人”

       

神經網絡控制器接受外部信息。DNC儲存的是“已有關聯”,“已有關聯”能幫控制器搜索記憶非專業讀者看來,我們重復用“控制器能夠……”,“DNC決定做……”的措辭挺奇怪的,但這是因為,DNC是從0開始學習使用記憶、回答問題。 我們把DNC的回答拿去和正確答案作比較,于是,控制器不斷優化自己,給出與正確答案越來越接近的答案。在此過程中,控制器也學會了如何使用自己的記憶。

我們想問DNC和數據結構相關的問題,以此測試它的能力。 圖表數據是一個很好的測試手段,因為它常包含了一些可以被任意相連的數據,并形成路徑和周期。 我們的論文表明,DNC可以通過自主學習,解釋一張圖表,并回答與之相關的問題。

向DNC描述過倫敦地鐵圖后,我們問它,“搭乘Central Line線,從Bond Street站出發,坐一站,換乘Circle Line線坐四站,再搭Jubilee Line線坐兩站,最后你在哪里出站?”我們也會讓DNC計劃路線,問它“怎么從Moorgate站到Piccadilly Circus站?”像人一樣使用記憶,DeepMind 造了個比阿爾法狗更厲害的“機器人”   

DNC在接受訓練時使用的是隨意生成的圖表(左)。訓練以后,我們再測試DNC能否在倫敦地鐵圖中找到合適的路線(右)。我們用多組三個詞來描述地鐵圖,并用兩個任務來舉例:“橫向往返運動”,即DNC從站點開始,按一定順序的路線行走;“最短路線”,也就是DNC要找到兩個站點之間最短的線路。

利用一份家譜,我們展示了DNC可以回答需要做復雜運算的問題。比方說,即使我們僅提供了父母、孩子以及兄弟姐妹之間的信息,也可以問DNC“誰是Freya媽媽那邊的叔父?”現在我們可以看到controller讀取的是哪個記憶區間的信息,以此分析DNC如何使用其記憶。和DNC相比,之前傳統神經網絡要么沒法存儲信息,要么就是不會學習解讀數據,舉一反三。

像人一樣使用記憶,DeepMind 造了個比阿爾法狗更厲害的“機器人”        

我們還可以通過強化學習來訓練DNC。我們讓DNC對一個問題作出反應,但不會告訴它正確答案。一旦它的反應令人滿意,我們就會給它打高分。或是讓DNC面對一些彩色磚堆,給它指令:“把淺藍格子放到綠格子底下;橙色格子移到紅色格子的右邊;紫色的弄到橙色的下面;淺藍色的放深藍色右邊;綠色格子扔紅色格子底下;紫色格子放綠色格子的左邊。”

像人一樣使用記憶,DeepMind 造了個比阿爾法狗更厲害的“機器人”        

DNC解決移動方塊游戲的問題。

我們可以創建許多可實現的目標,再讓神經網絡來執行任務,達成目標。 在這種情況下,就像一臺電腦,DNC能夠記住好幾條線索,不同線索和某個特定目標相關,DNC可以執行這些任務。

人類記憶如何運作是一個古老的問題,我們對它的理解還不完全。我們希望DNC能夠為電腦科學提供新手段,也為認知科學、神經科學提供一個新的模型:這是一臺學習機械,無需提前編程,也可以整理信息,讓信息和事實相聯系,并且利用這些信息解答問題。

網友薦論

  • 相信西部世界已經不遠
  • 西部世界,有了記憶以后。。。
  • 一片丹心向陽開刪除→重啟→死機→滅亡……
  • 誰說PC機已走向衰落?誰說電腦產業沒有前途?如果電腦都具有記憶功能,將會有更大的應用領域,就會是一個新的藍海。企業家們,去開發像阿爾法狗一樣,具有深度學習和記憶功能的智能電腦(PC)吧,我想要!還會有更多的人也想要!
  • 科幻片中機器人最終實現意識自主,自我進化,脫離人類控制,導致人類和機器人之間的戰爭,在未來真有可能成為現實了
聲明:
1、除挖了看原創的內容之外(原創內容歡迎轉載,但必須備注來源:挖了看),挖了看發布的所有內容版權歸原作者所有;
2、為更廣泛地傳遞信息普及相關知識,挖了看上的部分文章為轉載,并不用于任何商業目的,如涉及作品內容、版權和其他問題,請在30日內與我們聯系(0515-88890809),我們將在第一時間刪除內容或協商稿費;
3、為了讓有版權及高質量內容得到更好傳播,可以永久免費在挖了看上投稿,有機會獲取更多宣傳資源,詳情請聯系我們微信號:qinhao0528;
4、挖了看發布的信息僅供參考之用,并不代表本網贊同其觀點,也不代表本網對其真實性負責。您若對該稿件內容有任何疑問或質疑,請盡快與挖了看聯系,本網將迅速給您回應并做相關處理。聯系我們微信號:qinhao0528;
5、挖了看律師顧問:江蘇莘莊律師事務所姜海生律師:微信13615156969。

© 2019 挖了看網 walekan.com 鹽城清法網絡科技有公司 蘇ICP備16013988號-1

違法和不良信息舉報電話:010-58733394 侵權投訴聯系我們微信號:qinhao0528

網站地圖 專題

极速时时大小