201711240812台中抽水肥推薦 尋找軍營抽肥廠商~各軍營單位抽肥就找一川

DeepMind官方解密新版 AlphaGo 棋藝制勝奇招:價值網絡把控通盤局面

本文首發於微信公眾號:新智元。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。


新智元報道編譯報道:文強劉小芹 零夏

【新智元導讀】4月10日,中國棋院與谷歌在北京宣佈,今年5月在“中國烏鎮·圍棋峰會”上AlphaGo升級版將與最頂尖的人類棋手進行對弈,世界冠軍柯潔將出戰。 隨後,DeepMind CEO Demis Hassabis 在官方博客上撰文介紹瞭這一比賽和全新版的 AlphaGo,並強調 AlphaGo 不僅會下棋,在節約能源、醫療、翻譯等方面也得到瞭應用。其團隊詳細也解讀瞭AlphaGo 在圍棋上的最新技術進步,包括策略和戰略上的創新。


今天,中國圍棋協會和浙江省體育局攜手Google共同宣佈,三方將聯合主辦“中國烏鎮·圍棋峰會”,屆時AlphaGo將再度與最頂尖的人類棋手進行對弈。這場為期5天,有關圍棋與人工智能的賽事將於5月23日至27日在中國最負盛名的水鄉古鎮、世界互聯網大會永久會址——浙江桐鄉烏鎮舉行。

在去年與圍棋世界冠軍李世石的對弈中,AlphaGo以出其不意的招法,給世人留下瞭深刻的印象,也給圍棋這項延續千年的智慧遊戲帶來瞭全新的想象力,同時也表明圍棋的奧妙仍有足夠的空間在等待我們去探索。

DeepMind CEO Demis Hassabis 在官方博客撰文文寫道:不像有些人擔心人工智能減弱瞭圍棋遊戲的樂趣那樣,相反,人工智能實際上使人類玩傢變得更強大,更多創新。圍棋作為可能是歷史上被研究和思考得最多的遊戲,不管是專業棋士還是業餘圍棋愛好者,在仔細研究 AlphaGo 創新的每一步棋時,實際上已經學到瞭新的知識和策略。

“AlphaGo 的下棋方式使我們感到自由,讓我們覺得沒有任何走棋是不可能的。現在人人都在嘗試從前沒有嘗試過的風格。” ——周瑞陽,九段棋士

顯然,最好的人類圍棋棋士和最具創新的圍棋 AI 對手之間的夥伴關系還有待更多認識。這就是為什麼我們很高興地宣佈 AlphaGo 下一步的計劃:在圍棋的發源地中國,參與為期五天的的圍棋峰會。

時隔一年,AlphaGo將與柯潔為代表的中國頂尖棋手一道,進一步追求圍棋的真諦。柯潔表示能和AlphaGo對戰是他的榮幸,面對大傢對最終輸贏的疑慮和關心,他表示自己一定要贏。整個活動柯潔多次表達自己拼勁全力求勝的決心,在微博也對AlphaGo說“來啊”,給自己打氣。


媒體會中也有觀點認為,這個賽事重要的意義不在於輸贏,更在於為人類更好地研究、開發和台中市抽水肥使用人工智能做出有益的嘗試。這個賽事是現代科技與中國傳統文化的美妙結合額,透過日新月異發展的人工智能,傳承瞭千年歷史的圍棋必將進一步閃耀出其智慧的光芒。


圖:憑借精湛的洞察力和毫不動搖的信心,柯潔以平穩的風格著稱,總是瞭解何時可大膽落子何時該謹慎行事。上圖中,Google 首席執行官 Sundar Pichai 訪問聶衛平在北京的圍棋道場時,柯潔(右一)與聶衛平(柯潔旁邊),樊麾(站著)和古力(左一)一起,憑借記憶復現 AlphaGo 與李世乭的一盤棋的開頭幾手,並向 Pichai 解釋這些落子之美。

根據大會安排,本次圍棋峰會內容豐富。其中AlphaGo與世界排名第一的柯潔的三番棋對弈無疑是眾人最關註的焦點。另外峰會還將舉辦配對賽和團隊賽兩場形式各異的交流比賽,配對賽中,兩位棋手將分別與AlphaGo組隊,挑戰棋手如何去理解AlphaGo的獨特風格並與之合作;在團隊賽中,將由五位中國頂尖棋手合作,建立棋手“神經網絡”,降低心理因素的影響,從而做出更加客觀的判斷。

Demis Hassabis 還介紹說,目前,已經有一些 AlphaGo 背後的機器學習方法被用於解決一些重要問題,例如減少能源使用。機器學習技術也已經被用於一系列令人興奮的醫學研究項目中。而且在 Google 的許多台中抽水肥產品中,機器學習突然使得許多不可能變為可能——讓 Google Photos 的用戶能夠立即地在如山的照片中找到一張雪地上的狗的照片,比過去十年的改進加在一起還要多地一次性提高瞭 Google Translate 的翻譯質量,等等。

我們很期待這次的圍棋對弈和討論將帶來哪些見解,以及這些見解將如何幫助我們解決共同的挑戰——無論是圍棋上的挑戰還是其他挑戰。

AlphaGo 的創新在職業圍棋界中顯示出巨大的影響潛力,我們希望在即將到來的“中國烏鎮·圍棋峰會”上達成更多的合作研究機會。我們非常期待 AlphaGo 和人類專業棋士共同探索圍棋的真正本質!

4月10日,在中國棋院舉行的發佈會上,Demis 以視頻的方式發表講話。 AlphaGo 棋藝革新:三三定式(3-3 invasion)和妖刀定式


另一篇博客《Innovation of AlphaGo》上,DeepMind的軟件工程師與圍棋專業棋手樊麾共同講解瞭自去年以來AlphaGo在圍棋策略和戰術上的進步。

Alphago 強大之處並不在於單獨的一手或一連幾手,而是它為每一局對弈帶來的獨一無二的新視角。雖然圍棋的風格很難以一言以蔽之,但 AlphaGo 的策略象征瞭一種靈活和開放的精神:沒有先入為主的觀念,因此可以找到最有效的對弈策略。

正如以下兩局對弈所顯示的,這種思想經常使 AlphaGo 得出有悖直覺但十分強大的行動。

盡管圍棋是“圍地吃子”的遊戲,但是大多數決策類的戰鬥都講究雙方的力量平衡。AlphaGo 在維持平衡方面可謂一絕。具體說,AlphaGo 在運用“勢”方面能力精湛,也就是利用已經下定的棋子影響周圍的形勢。雖然這種“勢”無法量化,但 AlphaGo 的價值網絡使其能夠一次考慮到通盤的局面,從而做出細微且精確的判斷。這些能力讓 AlphaGo 將局部的“勢”擴展為全局的優勢。


在這局棋裡(Dia.1),黑子(AlphaGo)安全領域(secure territory)很少,而白子占據瞭三個角。但是,黑子的“勢”輻射到整個盤面。尤其是標記出的落子,雖然鞏固瞭白棋,但同時也增強瞭黑棋的可能性。圍棋選手通常會避免這樣的出招,因為這樣必定會付出代價,而回報卻不一定。但 AlphaGo 結合它對風險和獎勵強勁的判斷,最終下出瞭這一步棋。


但是,這些“勢”的價值全部取決於具體的場景。當這些“勢”能夠有效轉移時,AlphaGo 都自由地消去這些“勢”。在 Dia.2 中,AlphaGo 下出瞭驚人的 6 子連線(三角標記)。圍棋選手評價稱,在第四行(圓圈標記)有“勢”,在第三行有地(territory),但在第二行隻有敗局。AlphaGo 的走法最初看起來是符合這些評價的,這些落子給瞭白棋力量和“勢”。大多數圍棋選手都不會下出這樣的6子連在一起的棋。但是,AlphaGo 判斷這樣有助於將白棋分散開來,在接下來的過招中,慢慢地侵蝕白棋的優勢,從上方和下方同時確保瞭領先的優勢。

新的招式,新的模式

AlphaGo 在最近的幾句對弈中,還下出瞭一些開局的新招式。最引人註目的是開局的3-3入侵和“Magic Sword”的新變種。每個都違反瞭常規理論,但在更深入的反思中,卻證明是符合道理的。

初盤的三三定式(3-3 invasion)


這樣落子立馬就確保瞭角落的安全。但是,像 Dia.4 顯示的教科書式的接下來的開盤佈局,很早就被拋棄瞭,因為“勢”太多(it gives too much influence)。


AlphaGo 的創新之處在於,它省略瞭標記出的過招,讓角落處在 Dia.5 顯示的不確定(unsettled)的狀態。

盡管不那麼安全,黑子仍然保有從左邊逃出,或者在右邊落子占據角落的選擇,這樣就在僅僅減弱些微 influence 的情況下,占據瞭更多的領地(territory)。這個策略在職業棋手之間激起瞭熱烈的討論,而且至少已經有一個人在實際對弈中應用瞭這一招。

The New Magic Sord

AlphaGo 最初是使用人類的數據進行訓練的,因此它知道當代落子占角的下法,也通常按照這樣的順序落子。但是,在“Magic Sword”,也即被稱為“村正妖刀”的圍棋定式中,AlphaGo 卻出現瞭偏離。


然而,AlphaGo 往往更喜歡放棄外圍,贏取領地上的優勢(Dia. 9所示)。

大多數圍棋選手都不會考慮下這種棋,因為這樣黑棋雖然有很強的城墻(wall),但白棋的後手跟進讓黑棋的“勢”並沒有看上去那麼大。如果黑棋不繼續鞏固這面城墻,還會遭到攻擊。韓國頂尖棋手金志錫(Kim Jiseok)最近在一場比賽中用瞭這一系列落子(Dia. 10所示),他最終贏得瞭那場比賽。

AlphaGo 和柯潔對弈比賽規則

圍棋在各地的規則並不完全相同,中國大陸圍棋規則是數子法,日本圍棋規則和韓國圍棋規則是數目法,另外還有計點制度。一盤棋用三種規則計算出來的結果一般是相同的。本次烏鎮比賽采用中國規則。本次比賽詳細介紹如下:

1. 柯潔對戰AlphaGo:三番棋,無論輸贏都要下完三番,每方3小時,5次1分鐘讀秒;如果柯潔獲勝,將獲得150萬美元獎金;

2. 配對賽:兩位棋手分別與AlphaGo組隊,每方1小時,1次1分鐘讀秒,將由連笑、古力將出戰;

3. 團隊賽:五位中國頂尖棋手合作,每方2小時30分,保留3次1分鐘讀秒,柯潔、周睿羊、時越、唐韋星、陳耀燁出戰

AlphaGo是第一個擊敗人類職業圍棋選手、第一個戰勝世界冠軍的程序,是圍棋史上最具實力的選手之一。2016年3月,在全世界超過一億觀眾的關註下,AlphaGo經過5局對弈,最終以4比1的總比分戰勝瞭圍棋世界冠軍李世石。此後,AlphaGo憑借其“充滿創意而又機智”的下法,躋身圍棋界最高職業稱號——職業九段行列,成為歷史上首個獲得這一榮譽的非人類棋手。

近期,AlphaGo的升級版本以“Master/Magister”的稱謂與世界頂級的圍棋選手進行瞭60場線上快棋賽,並取得59勝1和棋。

一直以為,圍棋就被認為是傳統遊戲中對人工智能而言最具挑戰性的項目。這不僅僅是因為圍棋包含瞭龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過瞭簡單的啟發式算法。

為瞭應對圍棋的巨大復雜性,AlphaGo結合瞭監督學習和強化學習的優勢。通過訓練形成瞭一個策略網絡,將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網絡對自我對弈進行預測,以-1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。AlphaGo將這兩種網絡整合進基於概率的蒙特卡羅樹搜索,實現瞭它的真正優勢。最後,新版的AlphaGo產生大量自我對弈棋局,為下一代版本提供瞭訓練數據,此過程循環往復。

在獲取棋局信息後,AlphaGo會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為AlphaGo的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力智商加入近似人類的直覺判斷。

文章來源:微信公台中抽水肥推薦眾號新智元

(責任編輯:宋政 HN002)


和訊網今天刊登瞭《DeepMind官方解密新版 AlphaGo 棋藝制勝奇招:...》一文,關於此事的更多報道,請在和訊財經客戶端上閱讀。

台灣電動床工廠 電動床
台灣電動床工廠 電動床
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
一川抽水肥清理行|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
X戰警多鏡頭行車記錄器專業網|多鏡頭行車記錄器|多鏡頭行車紀錄器比較|多鏡頭行車紀錄器推薦|多鏡頭行車紀錄器影片
台中抽水肥專業網|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
台灣靜電機批發工廠|靜電機|靜電機推薦|靜電油煙處理機|靜電油煙處理機推薦
優美環保科技工程-靜電機,靜電機推薦,靜電機保養,靜電機清洗,靜電油煙處理機


沒有上一則|日誌首頁|沒有下一則
回應
關鍵字
[此功能已終止服務]
    沒有新回應!





Powered by Xuite