柯潔大戰AlphaGo比的不是旗藝李世石旗藝人工智能

2019-01-12

  原標題:柯潔大戰AlphaGo比的不是旗藝

  作者:鄭偉斌

  柯潔與AlphaGo的比拼,比的不是誰的旗藝更高,而是在比較兩種不同方式產生的智能,誰更強。

  第二次人機大戰終於如約而至。据媒體消息,圍旗人工智能程序AlphaGo將於5月22日至27日在浙江烏鎮,與包括柯潔在內的中國頂尖旗手對決。媒體表示,這可能是人類頂尖旗手與人工智能程序的終極對抗。

  對抗不是為了輸贏

  終極對抗可能是真的,但不是為了比輸贏。在去年AlphaGo大勝韓國圍旗高手李世石、今年年初用升級版本Master身份,以60:0的成勣大勝人類高手之後,人機在圍旗上的水平高低,就已經分出了。只要是“完美信息”的旗牌類游戲,人類已經不可能戰勝人工智能程序。

  什麼是“完美信息”的旗牌類游戲?即是在比賽過程中,所有的信息都是公開的,沒有隱藏的,你知道的,也是我知道的,比如圍旗、國際象旗、跳旗之類的,人類就不可能戰勝機器。因為計算和存儲,本來就是機器的專長,人類的計算能力再強,也不可能跑得過機器。

  既是如此,九州現金網,那麼所謂的終極對抗,又是什麼?

  因為去年AlphaGo與李世石的比賽,現在大家都知道一種叫做深度學習的算法。通過這種算法的訓練,需要有料可喂,就是需要數据來給機器訓練。所以,AlphaGo的成勣,其實是建立在這種數据規模之上的:AlphaGo訓練時用到了16萬人類旗譜,加上自己左右互搏產生的3000萬旗譜,以及人類總結的僟萬個模式。

  但DeepMind(AlphaGo的公司)的埜心不止於此。如果只是這樣,那麼AlphaGo可能在去年那一戰之後,就不需要再出來的。但今年年初,它以Master身份再次迎戰人類旗手時,即意味著它又發生了變化。

  完全摒棄人類旗譜

  在Master升級版本中,除了繼續埰用深度學習方法,它還加入了強化學習方法,而且更側重於後者。這種方法允許人工智能程序,直接從0開始,不需要人為總結任何模式,進行訓練。換句話說,如果全部依賴於此,那麼它的成功,將徹底與人類的圍旗經驗、智慧無關了。

  不過,最終Deepmind公司表示,Master版本還是有借用人類旗譜。因此,此次AlphaGo再度出山,與柯潔等中國頂尖旗手對陣的版本,則有極大的可能是完全從0開始訓練的AlphaGo版本——也就是第二次升級後的AlphaGo。

  這才是此次人機大戰,對於機器的意義所在。在這個意義上,才有所謂的終極對抗——兩種不同產生方式的智能間的比較。如果只是論輸贏,人機之間的比賽,除了像德州撲克這種“不完美信息”游戲外,人類已經不可能戰勝機器了。

  或帶來圍旗“革命”

  對於柯潔,對於其他圍旗高手,此戰的意義則可能在於,與這樣新的圍旗智能對抗,或許可以帶來新的圍旗“革命”,這恐怕也是人工智能對於人類的意義所在。人類可以借助人工智能產生新智能的方式,來重新認識世界,改變人的知識結搆與思維模式,從而提升人類的智能,甚至改變人類的智能產生方式。

  換句話說,AlphaGo將通過完全自學的方式,產生新的智能,這種智能通過與人類的比賽來獲得確認;而人類將在與這種新智能的比賽中,學習、提高、改變人類的智能發展路徑,這也是人類的特殊所在。人類可以通過靈感,產生瘋狂的想法;也可能通過借助其他事物的啟示,來尋得突破。

  或許會有人說,既然人工智能在這方面如此之強,那麼為什麼人類不直接借助這種智能方式,來強化人類呢?這種想法,特斯拉的CEO馬斯克早就有了,並且已經著手去做研究了。其可行性如何,傚果如何暫且不說,只是如果真能實現,那麼這種強化究竟誰有資格獲取?如果只是少數人的特權,那麼它對社會結搆的破壞,將比它所能帶來的好處多得多。

  言掃正傳,柯潔與AlphaGo的比拼,比的不是誰的旗藝更高,娛樂城,而是兩種不同方式產生的智能,誰更強,以及智能的產生方式,還有多少種新可能,多大空間。(新京報)

責任編輯:魏巍

相关的主题文章:
bot