作者查詢 / oldTim
作者 oldTim 在 PTT [ GO ] 看板的留言(推文), 共656則
限定看板:GO
看板排序:
全部NBA1081basketballTW820Gossiping700GO656IA611HatePolitics492Baseball439LoL292Olympics_ISG159Military99historia45Trans-nctu41EAseries40NBA_Film37WorldCup33MobileComm29DummyHistory21Steam19MLB18PublicIssue17Hunter16Isayama15movie12Japandrama11Railway11Stock10Asian-MLB9CMWang9G-S-WARRIORS9worldbasket9StarCraft8WarringState8WomenTalk8iOS7Jeremy_Lin7Rockets7HCKuo5LaClippers5MGL-history5Nuggets5OverWatch5Tsao5Warfare5BLAZERS4CLHu4Feminism4Football4FuMouDiscuss4Hearthstone4joke4NCHU-CE-364Pistons4Tennis4book3Cobras3Elephants3Grizzlies3Guardians3MiamiHeat3politics3Raptors3Tech_Job3Thunder3Trans-nthu3UTAH-JAZZ3Ang_Lee2Billiard2Celtics2CourtBasketB2Employee2EverQuest22humanity2JinYong2Kings2Mavericks2MRT2NBAEasyChat2nCoV20192Nets2Physics2Pilots2PureYouth2rent-exp2SP2_Basket2Windows2Adachi1AIR_JORDAN1Anthrodunker1asciiart1Baseball_Sim1BattleRoyale1Cardinals1Cavaliers1CCF1Cheer1ChicagoBulls1ck55th3321ck56th3321CSMU-MED901CTSH923021Dodgers1Golden-Award1Gov_owned1HarukiMuraka1HIS_Basket1HSNU_10551HSNU_8201HwangYih1Ichiro1IVERSON1JapanHistory1KevinGarnett1KMT1L_TalkandCha1Lakers1LawBasketbal1Lions1Mariners1mknoheya1Monkeys1NARUTO1NBAGAME1Nintendo1northtrans1NTPU-COECOBA1Okajima1ONLINE1PACERS1Paradox1paranormal1PokeMon1PUBG1PublicServan1RayAllen1Redology1RedSox1specialman1Spurs1SW_Job1TFSHS61th3021Tigers1TKU_EW94B1toberich1TuTsau1TW-language1Volleyball1XBOX1YAKYU1YLJH_3011<< 收起看板(149)
2F推: 用圍棋規則來反證無師自通很怪,意思只需懂規則就可當10/21 21:29
3F→: AlphaGO的老師,這比較像裁判而不是老師了八10/21 21:30
15F推: 開頭那段無師自通看起來像是為了維護人類尊嚴,硬凹把10/21 22:17
16F→: 人類的經驗知識與圍棋規則混為一談10/21 22:17
84F推: 人類訂定的遊戲規則和人類經驗根本是兩回事10/22 19:39
85F→: 想說AI不會失控或是人類不論如何都在指導AI就直說就好10/22 19:40
86F→: 不需要偷換概念10/22 19:40
108F推: 沒人否認AlphaGO仍是監督式學習,所謂偷換概念是指將監督10/23 00:32
109F→: 學習所需輸入的人類訂定的遊戲規則,和無師自通所需輸入10/23 00:32
110F→: 的人類知識混為一談,若是要硬凹圍棋規則也是人類知識的10/23 00:34
111F→: 一種,而哪啟不是所有會下圍棋的人都有資格當AlphaGO老師10/23 00:35
112F推: 如果只單看AI專機發言是沒啥問題,問題是編輯拿無監督學習10/23 00:40
113F→: 來為人類的知識並不多餘來做辯護,可是看上下文,本文中10/23 00:41
114F→: 先引用柯潔的話:人類的知識太多餘,顯然這裡的知識根本10/23 00:42
115F→: 不是啥圍棋規則而是職棋的棋理,編輯就是這樣偷換觀念10/23 00:44
131F推: 就編輯搞混無師自通的定義,硬要把兩種觀念嫁接10/23 16:13
132F→: 編輯一開始引用柯潔的話"人類太多餘",然後接下來說10/23 16:14
133F→: "雖說人類的知識和經驗沒多大作用,但也不至於多餘"10/23 16:15
134F→: 隨後以"但這演算法依然需要人類向它灌輸圍棋的規則"來做為10/23 16:20
135F→: 人類知識經驗並不多餘的根據,這就是把圍棋規則當成是10/23 16:22
136F→: 人類的經驗知識的一種,明顯魚目混珠,而後引用AI專家的話10/23 16:23
137F推: 時,因為已有編輯錯誤的前提:圍棋規則也是人類知識一種10/23 16:25
138F→: 等於是AI專家對非監督學習的解釋已經被扭曲成對非無師自通10/23 16:27
139F→: 的辯護,實際上無監督跟無人類圍棋知識根本是兩回事10/23 16:28
140F→: 再者,一開頭柯潔說的人類太多餘,和文中AI專家說的人類10/23 16:31
141F→: 並非無用,也明顯是兩個不同觀念,前者是指職棋後者是指10/23 16:32
142F→: 輸入規則的工程師,編輯用後者的回答來說明前者的論點不對10/23 16:33
143F→: 也是張飛打岳飛,確實如ddavid大所說兩者應該並列來看10/23 16:34
144F→: 但編輯就是要偷換概念把兩者混為一談我也無言10/23 16:35
145F推: 事實上單獨看AlphaGO Zero,傳統職棋確實沒有幫助,若想幫10/23 16:40
146F→: 職棋辯護,應該從軟體發展歷程角度切入,至少一開始版本是10/23 16:42
147F→: 有學人類棋譜的,而不是硬凹反而讓說服力降低10/23 16:43
5F推: https://www.youtube.com/watch?v=m13QHNMHAa410/22 14:05
15F推: 照本文說法,絕藝、DeepZen、CGI都只達到AlphaGO Lee程度10/23 10:07
16F→: 而絕藝是可以讓職棋兩~三子的10/23 10:08
17F→: 阿,是上一篇,推錯。10/23 10:09
8F推: AMA裡面有回說code不會開源,交大去應該也爭取不到啥10/20 11:41
28F推: 推10/19 08:32
40F推: https://www.yikeweiqi.com/news/searching/36893/10/19 10:38
48F推: 投nature審稿也要審個幾個月八10/19 12:14
106F推: 圍棋有唯一解可以用策梅洛定理(Zermelo's theorem)來證明10/19 20:44
107F→: 策梅洛定理:在二人的有限遊戲(即完成遊戲下的步數有限)中10/19 20:45
108F→: 如果雙方皆擁有完全的資訊,並且運氣因素並不牽涉其中10/19 20:45
109F→: 那先行或後行者當一必有一方有必勝/必不敗的策略10/19 20:46
172F推: 不過有看到一種說法,AlphaGO也有inductive bias,只是10/20 10:03
173F→: 剛好它的算法跟人類下棋的bias是同一路數,所以有可能某日10/20 10:05
174F→: 來了個外星人用全新的算法避開AlphaGO和人的bias達到更高10/20 10:06
176F→: 境界,也就是說現在Zero自學得出和人類類似的的定式未必能10/20 10:07
177F→: 證明這些定式就是正確無誤10/20 10:08
2F推: 研發部門就是燒錢啊10/07 07:17
1F推: 看看日本那個最強棋士決定戰明年是否還會舉辦八09/22 17:59
138F推: 圍棋有解可以用策梅洛定理(Zermelo's theorem)來說明09/20 18:18
139F→: 策梅洛定理:在二人的有限遊戲(即完成遊戲下的步數有限)中09/20 18:21
140F→: ,如果雙方皆擁有完全的資訊,並且運氣因素並不牽涉其中09/20 18:21
141F→: ,那先行或後行者當一必有一方有必勝/必不敗的策略09/20 18:21
142F推: 排除掉N劫循環、讓完成遊戲需要的步數->無限的情況09/20 18:24
143F→: 圍棋應該是有解的09/20 18:25
181F推: 圍棋怎麼會沒有終局條件?兩方都選擇不落子不就終局了?09/23 13:00
182F推: 只要設定AI在計算時除了盤面上可落子點外再加上虛手一點09/23 13:05
183F→: 那終局就跟普通落子是同樣的計算問題,不需要額外的判斷09/23 13:06
187F推: 暴力解沒有計算是啥意思?暴力解不就是最笨的計算法嗎?09/23 13:22
190F推: 增加虛手是回應你說圍棋沒有終局條件的解法09/23 15:20
191F→: 至於變化減少,圍棋只有19X19有限的著手,你一直下下去09/23 15:22
192F→: 自然到最後棋盤上會沒有著手或是剩下的著手之勝率皆低於09/23 15:23
193F→: 虛手(N劫循環已經以規則排除成為非法著手)09/23 15:24
205F推: 抱歉勝率兩字是我筆誤,更正為:一直下下去自然棋盤上會09/23 21:00
206F→: 沒有著手或是即使有少數著手但每條路窮舉算完後發現沒有09/23 21:04
207F→: 比虛手好所以選擇虛手,你如果把虛手當作是一種著手就不需09/23 21:05
208F→: 要額外的判斷,跟第一手開始下一樣是計算問題09/23 21:05
213F推: 你說的其中一方永遠不選虛手當然也是其中一個變化,可是09/23 21:56
214F→: 棋盤可下的點是有限的,即便下棋過程中有提子使盤面子減少09/23 21:58
215F→: 但你每提一顆子就代表至少盤面上會多一顆以上的子來緊氣09/23 21:59
216F→: 所以盤面上的子的數量只會上昇或維持不變,再加上ddavid大09/23 22:00
217F→: 所說的"盤面同形判負"規則,盤面落子數不可能一直停在某個09/23 22:01
218F→: 數字,比如說盤面有N顆黑n顆白,這個盤面可能出現的變化09/23 22:03
221F→: 是有限的,就算雙方很有默契試圖讓盤面停在共(N+n)子情況09/23 22:05
222F→: 但等能下的(N+n)子的組合都下完後若不想被判負只能往讓盤09/23 22:07
225F→: 面的子數繼續增加,就這樣一步步棋盤走到最後一定會沒有09/23 22:08
226F→: 地方可落子09/23 22:08
231F推: 禁盤面同形是電腦vs電腦的規則,跟提子數無關09/23 23:19
232F→: 不過我之前確實忽略了某方可一直填子填到全死的可能性09/23 23:20
233F→: 剛剛查了一下計算圍棋endgame複雜度是PSPACE-hard09/23 23:21
236F推: 就跟連環劫強制判和的規則一樣的目的八,你也可說這規則09/23 23:25
237F→: 限制圍棋的可能性,但換來觀賞性09/23 23:26
251F推: 規則只寫禁止同形就代表提子數相同與否根本無關緊要09/24 07:12
252F→: 你若要去解你理想中的暴力解情況當然可以不理規則09/24 07:15
253F→: 但不能說其他人依照規則解的暴力解是不對的,因為規則不同09/24 07:16
254F→: 嚴格上說是不同遊戲,討論失焦了09/24 07:19
7F推: 終於出了!先推再看09/15 22:40
45F推: 這期的流程中因為常有等待Alpha搜的閒置時間略顯鬆散了些09/17 15:02
46F→: 如果把中間搜的時間剪掉,多搜一些變化會更好09/17 15:03
96F推: 基本上在搜尋中間講的東西都是墊檔用,不用太認真09/18 11:27
8F推: 三年才600萬真的是太超值了09/14 06:22
1F推: 我是很好奇孔傑是如何判斷前半盤AI計算有誤的?是根據AI的08/18 15:58
2F→: 變化圖嗎?還是只是傳統人類對局部的死活計算?若是後者,不08/18 15:59
3F→: 能排除AI是看到人所忽略的全局所以局部損了08/18 16:01
23F推: 開局還是應該多聽AI的八,畢竟以目前人類的認知很難判斷08/18 18:49
24F→: 開局的好壞,更多是風格的選擇。可惜孔傑似乎開局都在下08/18 18:50
25F→: 自己的,所以才會在執白的情況下開局勝率落後 = =08/18 18:51