作者查詢 / oldTim

總覽項目: 發文 | 留言 | 暱稱
作者 oldTim 在 PTT [ GO ] 看板的留言(推文), 共656則
限定看板:GO
[新聞] AI科學家詳解AlphaGo Zero的偉大與局限已刪文
[ GO ]168 留言, 推噓總分: +38
作者: qweewqq - 發表於 2017/10/21 19:13(6年前)
2FoldTim: 用圍棋規則來反證無師自通很怪,意思只需懂規則就可當10/21 21:29
3FoldTim: AlphaGO的老師,這比較像裁判而不是老師了八10/21 21:30
15FoldTim: 開頭那段無師自通看起來像是為了維護人類尊嚴,硬凹把10/21 22:17
16FoldTim: 人類的經驗知識與圍棋規則混為一談10/21 22:17
84FoldTim: 人類訂定的遊戲規則和人類經驗根本是兩回事10/22 19:39
85FoldTim: 想說AI不會失控或是人類不論如何都在指導AI就直說就好10/22 19:40
86FoldTim: 不需要偷換概念10/22 19:40
108FoldTim: 沒人否認AlphaGO仍是監督式學習,所謂偷換概念是指將監督10/23 00:32
109FoldTim: 學習所需輸入的人類訂定的遊戲規則,和無師自通所需輸入10/23 00:32
110FoldTim: 的人類知識混為一談,若是要硬凹圍棋規則也是人類知識的10/23 00:34
111FoldTim: 一種,而哪啟不是所有會下圍棋的人都有資格當AlphaGO老師10/23 00:35
112FoldTim: 如果只單看AI專機發言是沒啥問題,問題是編輯拿無監督學習10/23 00:40
113FoldTim: 來為人類的知識並不多餘來做辯護,可是看上下文,本文中10/23 00:41
114FoldTim: 先引用柯潔的話:人類的知識太多餘,顯然這裡的知識根本10/23 00:42
115FoldTim: 不是啥圍棋規則而是職棋的棋理,編輯就是這樣偷換觀念10/23 00:44
131FoldTim: 就編輯搞混無師自通的定義,硬要把兩種觀念嫁接10/23 16:13
132FoldTim: 編輯一開始引用柯潔的話"人類太多餘",然後接下來說10/23 16:14
133FoldTim: "雖說人類的知識和經驗沒多大作用,但也不至於多餘"10/23 16:15
134FoldTim: 隨後以"但這演算法依然需要人類向它灌輸圍棋的規則"來做為10/23 16:20
135FoldTim: 人類知識經驗並不多餘的根據,這就是把圍棋規則當成是10/23 16:22
136FoldTim: 人類的經驗知識的一種,明顯魚目混珠,而後引用AI專家的話10/23 16:23
137FoldTim: 時,因為已有編輯錯誤的前提:圍棋規則也是人類知識一種10/23 16:25
138FoldTim: 等於是AI專家對非監督學習的解釋已經被扭曲成對非無師自通10/23 16:27
139FoldTim: 的辯護,實際上無監督跟無人類圍棋知識根本是兩回事10/23 16:28
140FoldTim: 再者,一開頭柯潔說的人類太多餘,和文中AI專家說的人類10/23 16:31
141FoldTim: 並非無用,也明顯是兩個不同觀念,前者是指職棋後者是指10/23 16:32
142FoldTim: 輸入規則的工程師,編輯用後者的回答來說明前者的論點不對10/23 16:33
143FoldTim: 也是張飛打岳飛,確實如ddavid大所說兩者應該並列來看10/23 16:34
144FoldTim: 但編輯就是要偷換概念把兩者混為一談我也無言10/23 16:35
145FoldTim: 事實上單獨看AlphaGO Zero,傳統職棋確實沒有幫助,若想幫10/23 16:40
146FoldTim: 職棋辯護,應該從軟體發展歷程角度切入,至少一開始版本是10/23 16:42
147FoldTim: 有學人類棋譜的,而不是硬凹反而讓說服力降低10/23 16:43
[新聞] 聶衛平:AlphaGo一些招法沒法學 越學越糟糕已刪文
[ GO ]45 留言, 推噓總分: +19
作者: qweewqq - 發表於 2017/10/22 13:28(6年前)
5FoldTim: https://www.youtube.com/watch?v=m13QHNMHAa410/22 14:05
15FoldTim: 照本文說法,絕藝、DeepZen、CGI都只達到AlphaGO Lee程度10/23 10:07
16FoldTim: 而絕藝是可以讓職棋兩~三子的10/23 10:08
17FoldTim: 阿,是上一篇,推錯。10/23 10:09
[情報] Deepmind AlphaGo AMA
[ GO ]60 留言, 推噓總分: +36
作者: HeterCompute - 發表於 2017/10/20 02:22(6年前)
8FoldTim: AMA裡面有回說code不會開源,交大去應該也爭取不到啥10/20 11:41
[情報] AlphaGo Zero,新版本的AlphaGo
[ GO ]193 留言, 推噓總分: +71
作者: HeterCompute - 發表於 2017/10/19 01:37(6年前)
28FoldTim: 推10/19 08:32
40FoldTim: https://www.yikeweiqi.com/news/searching/36893/10/19 10:38
48FoldTim: 投nature審稿也要審個幾個月八10/19 12:14
106FoldTim: 圍棋有唯一解可以用策梅洛定理(Zermelo's theorem)來證明10/19 20:44
107FoldTim: 策梅洛定理:在二人的有限遊戲(即完成遊戲下的步數有限)中10/19 20:45
108FoldTim: 如果雙方皆擁有完全的資訊,並且運氣因素並不牽涉其中10/19 20:45
109FoldTim: 那先行或後行者當一必有一方有必勝/必不敗的策略10/19 20:46
172FoldTim: 不過有看到一種說法,AlphaGO也有inductive bias,只是10/20 10:03
173FoldTim: 剛好它的算法跟人類下棋的bias是同一路數,所以有可能某日10/20 10:05
174FoldTim: 來了個外星人用全新的算法避開AlphaGO和人的bias達到更高10/20 10:06
176FoldTim: 境界,也就是說現在Zero自學得出和人類類似的的定式未必能10/20 10:07
177FoldTim: 證明這些定式就是正確無誤10/20 10:08
[新聞]DeepMind橫掃了人類圍棋高手 卻虧損1.6億美已刪文
[ GO ]30 留言, 推噓總分: +21
作者: qweewqq - 發表於 2017/10/07 06:44(6年前)
2FoldTim: 研發部門就是燒錢啊10/07 07:17
[討論] 未來「人機大戰」巔峰對決還會上演嗎?已刪文
[ GO ]19 留言, 推噓總分: +12
作者: qweewqq - 發表於 2017/09/22 17:33(6年前)
1FoldTim: 看看日本那個最強棋士決定戰明年是否還會舉辦八09/22 17:59
[新聞] 世界排名柯潔朴廷桓差距縮小 羅玄躥升第18已刪文
[ GO ]296 留言, 推噓總分: +76
作者: qweewqq - 發表於 2017/09/18 13:31(6年前)
138FoldTim: 圍棋有解可以用策梅洛定理(Zermelo's theorem)來說明09/20 18:18
139FoldTim: 策梅洛定理:在二人的有限遊戲(即完成遊戲下的步數有限)中09/20 18:21
140FoldTim: ,如果雙方皆擁有完全的資訊,並且運氣因素並不牽涉其中09/20 18:21
141FoldTim: ,那先行或後行者當一必有一方有必勝/必不敗的策略09/20 18:21
142FoldTim: 排除掉N劫循環、讓完成遊戲需要的步數->無限的情況09/20 18:24
143FoldTim: 圍棋應該是有解的09/20 18:25
181FoldTim: 圍棋怎麼會沒有終局條件?兩方都選擇不落子不就終局了?09/23 13:00
182FoldTim: 只要設定AI在計算時除了盤面上可落子點外再加上虛手一點09/23 13:05
183FoldTim: 那終局就跟普通落子是同樣的計算問題,不需要額外的判斷09/23 13:06
187FoldTim: 暴力解沒有計算是啥意思?暴力解不就是最笨的計算法嗎?09/23 13:22
190FoldTim: 增加虛手是回應你說圍棋沒有終局條件的解法09/23 15:20
191FoldTim: 至於變化減少,圍棋只有19X19有限的著手,你一直下下去09/23 15:22
192FoldTim: 自然到最後棋盤上會沒有著手或是剩下的著手之勝率皆低於09/23 15:23
193FoldTim: 虛手(N劫循環已經以規則排除成為非法著手)09/23 15:24
205FoldTim: 抱歉勝率兩字是我筆誤,更正為:一直下下去自然棋盤上會09/23 21:00
206FoldTim: 沒有著手或是即使有少數著手但每條路窮舉算完後發現沒有09/23 21:04
207FoldTim: 比虛手好所以選擇虛手,你如果把虛手當作是一種著手就不需09/23 21:05
208FoldTim: 要額外的判斷,跟第一手開始下一樣是計算問題09/23 21:05
213FoldTim: 你說的其中一方永遠不選虛手當然也是其中一個變化,可是09/23 21:56
214FoldTim: 棋盤可下的點是有限的,即便下棋過程中有提子使盤面子減少09/23 21:58
215FoldTim: 但你每提一顆子就代表至少盤面上會多一顆以上的子來緊氣09/23 21:59
216FoldTim: 所以盤面上的子的數量只會上昇或維持不變,再加上ddavid大09/23 22:00
217FoldTim: 所說的"盤面同形判負"規則,盤面落子數不可能一直停在某個09/23 22:01
218FoldTim: 數字,比如說盤面有N顆黑n顆白,這個盤面可能出現的變化09/23 22:03
221FoldTim: 是有限的,就算雙方很有默契試圖讓盤面停在共(N+n)子情況09/23 22:05
222FoldTim: 但等能下的(N+n)子的組合都下完後若不想被判負只能往讓盤09/23 22:07
225FoldTim: 面的子數繼續增加,就這樣一步步棋盤走到最後一定會沒有09/23 22:08
226FoldTim: 地方可落子09/23 22:08
231FoldTim: 禁盤面同形是電腦vs電腦的規則,跟提子數無關09/23 23:19
232FoldTim: 不過我之前確實忽略了某方可一直填子填到全死的可能性09/23 23:20
233FoldTim: 剛剛查了一下計算圍棋endgame複雜度是PSPACE-hard09/23 23:21
236FoldTim: 就跟連環劫強制判和的規則一樣的目的八,你也可說這規則09/23 23:25
237FoldTim: 限制圍棋的可能性,但換來觀賞性09/23 23:26
251FoldTim: 規則只寫禁止同形就代表提子數相同與否根本無關緊要09/24 07:12
252FoldTim: 你若要去解你理想中的暴力解情況當然可以不理規則09/24 07:15
253FoldTim: 但不能說其他人依照規則解的暴力解是不對的,因為規則不同09/24 07:16
254FoldTim: 嚴格上說是不同遊戲,討論失焦了09/24 07:19
[情報] 柯潔和deepmind檢討人機大戰
[ GO ]105 留言, 推噓總分: +41
作者: HeterCompute - 發表於 2017/09/15 19:25(6年前)
7FoldTim: 終於出了!先推再看09/15 22:40
45FoldTim: 這期的流程中因為常有等待Alpha搜的閒置時間略顯鬆散了些09/17 15:02
46FoldTim: 如果把中間搜的時間剪掉,多搜一些變化會更好09/17 15:03
96FoldTim: 基本上在搜尋中間講的東西都是墊檔用,不用太認真09/18 11:27
[新聞] 交大CGI圍棋程式勝率達85% 與職業棋士合作已刪文
[ GO ]32 留言, 推噓總分: +16
作者: qweewqq - 發表於 2017/09/13 23:23(6年前)
8FoldTim: 三年才600萬真的是太超值了09/14 06:22
[新聞] 孔傑:自己未配合好AI 加藤:AI前半盤較強已刪文
[ GO ]37 留言, 推噓總分: +15
作者: qweewqq - 發表於 2017/08/18 15:39(6年前)
1FoldTim: 我是很好奇孔傑是如何判斷前半盤AI計算有誤的?是根據AI的08/18 15:58
2FoldTim: 變化圖嗎?還是只是傳統人類對局部的死活計算?若是後者,不08/18 15:59
3FoldTim: 能排除AI是看到人所忽略的全局所以局部損了08/18 16:01
23FoldTim: 開局還是應該多聽AI的八,畢竟以目前人類的認知很難判斷08/18 18:49
24FoldTim: 開局的好壞,更多是風格的選擇。可惜孔傑似乎開局都在下08/18 18:50
25FoldTim: 自己的,所以才會在執白的情況下開局勝率落後 = =08/18 18:51