作者查詢 / sadmonkey
作者 sadmonkey 在 PTT [ GO ] 看板的留言(推文), 共440則
限定看板:GO
看板排序:
全部Gossiping5160C_Chat2067Baseball1848LoL606GO440GirlsDay382Tennis333Monkeys209KoreaDrama208FuMouDiscuss176KR_Entertain154WorldCup152PublicIssue116MuscleBeach93KoreaStar63Military50joke34Stock27RO_Mobile22KoreanPop20Salary19car18NBA17HatePolitics16LamiGirls16RakutenGirls16movie15Teacher15sex14CrayonPop13TPC_Police12BoardGame11VALORANT10FORMULA19HsinChuang9Little-Games9specialman9Violation9EarthQuake268EarthQuake438L_TalkandCha8Kaohsiung6Wen-Shan6Hearthstone5WorkinChina5Hiking4Insurance4nCoV20194WomenTalk4YOLO4Aviation3biker3home-sale3Lions3Neihu3Olympics_ISG3BattleRoyale2DivingSport2fastfood2FCBarcelona2ForeignEX2Guardians2HIMYM2KOTDFansClub2KS98-3022Nantou2NetSecurity2PUBG2ScienceNote2streetfight2StupidClown2SuperBike2SuperJunior2swim2Tainan2Taoyuan2Tech_Job2AfterPhD1Anchors1Aves1BEG1Brasil1Buddhism1BUZZ1Cga1Davichi1Ecophilia1Eda_Pitcher1facelift1FJU1gallantry1Gintama1historia1HOT_Game1HsinTien1Hualien1Hunter1I-Lan1KARA1Keelung1KSU1Marginalman1MenTalk1Militarylife1MOD1model1NDHU1NTUmed001Nuggets1NY-Yankees1PingTung1RTS1SET1Shu-Lin1ShuangHe1Soft_Job1soho1SongShan1sp_teacher1speech1studyteacher1TFG05Book1TigerBlue1TKU_Talk1TWvoice1Volleyball1Wanhua1<< 收起看板(127)
3F推: 圍棋本來就是有限賽局,比賽就是比誰失誤少的贏03/12 21:07
4F→: 很訝異原來很多學棋的人其實不懂賽局03/12 21:08
8F推: 我以為那是圍棋的根本第一堂就會教,看來我想多了03/12 21:10
12F→: 不過就像王建民不需要懂白努力也可以投伸卡球就是了03/12 21:12
16F推: 遊戲理論也可以教的很有趣,我以為對圍棋有興趣的小孩03/12 21:14
17F→: 也自然會對賽局有興趣03/12 21:15
30F推: 反串只會讓版面越來越亂,台灣是有言論自由的地方,你03/12 18:32
31F→: 不喜歡某人的言論就不要理他就好,當大多人都不理他時03/12 18:33
32F→: 自然會讓版面回歸平靜03/12 18:33
185F推: 真可憐連李昌鎬也被黏上,有些人不理他是最好的辦法03/12 17:19
12F推: 李世石的勇氣已經在歷史上留名,三十年後人們會記得李03/12 17:10
13F→: 世石而不是在旁邊敲邊鼓的柯潔03/12 17:12
12F推: 分享一下個人對演算法的理解,AG每步棋下棋模式就像是03/12 00:40
13F→: 一位長期練習後的業餘棋手,已經懂得每步棋要下時大約03/12 00:41
14F→: 可以下的哪五步棋比較好,而這時他會請一千名跟他同等03/12 00:41
15F→: 級業餘棋手分五組兩兩配對來對那五步棋開始下,直到下03/12 00:41
16F→: 完這一千盤統計這五步哪步勝率高,最後就決定下那步。03/12 00:41
17F→: 而AG的長期練習就是不斷的跟自己同等級的人下,每步棋03/12 00:41
18F→: 依據前面的下法,每局下完後會依據勝負檢討黑方白方誰03/12 00:41
19F→: 下的好,並就依勝負加權那方中間下過的每步棋,而且他03/12 00:41
20F→: 記憶力驚人永不忘記,體力驚人永不會累,並永遠可以找03/12 00:42
21F→: 到一位跟他一模一樣棋力的人下,經過上千萬棋局的自我03/12 00:42
22F→: 修練後來跟人類下棋。03/12 00:42
23F→: 只要他檢討棋局的方向正確,他就會一直的進步下去,而03/12 00:42
28F推: 過去即使用影分身可能要練一百年,AG找到精神時光屋所03/12 00:44
29F→: 以練了四年打敗樊麾,多練半年打敗李世石03/12 00:46
33F推: 用deepmind來研究圍棋是近四五年才開始成立的公司03/12 00:49
7F推: 很棒的解說03/11 23:06
32F推: 很好奇是否有可能人類過去的經驗導致低估了中央虛空的03/11 22:23
33F→: 潛力,像第二盤黑37看似無太大用處,結果隨著戰局到最03/11 22:24
34F→: 後不但幫助了左下兩子逃出也在右下中空區圍了不少地03/11 22:25
35F→: 因為中央的討論太複雜了也沒有較有準則的指標,所以人03/11 22:26
36F→: 們也較少的研究,也因為較少的研究就更不會去下他03/11 22:27
37F→: 以這次人工智慧的程式演算法他不管邊角中央他都會去嘗03/11 22:28
38F→: 試自我對奕時下下看,而經由大量對奕累積的數據對於在03/11 22:29
39F→: 中央落子的效益可能會做得比較好03/11 22:30
58F→: 如果把電腦想像成一位神童,在還沒下贏他前他的下法就03/11 14:42
62F→: 是目前所能知道的最好的下法之一(也許每一步都有三五種03/11 14:43
65F→: 不同的落點能得到相同的勝率)03/11 14:43
69F→: 發覺學程式的用賽局去想圍棋,學圍棋的用棋譜去想圍棋03/11 14:44
78F→: AG本來就不是已經找到最佳路徑了,他只是用MC法不斷自03/11 14:45
83F→: 我鍛鍊後得出的最佳勝率的步法,如果你覺得那步很差請03/11 14:46
87F→: 提出有效的攻擊手段,左邊的一坨龍看似會虧很多,結果03/11 14:46
94F→: AG用了黑37莫名其妙的一手,最後即使讓頂尖棋士來攻也03/11 14:47
99F→: 沒讓AG虧多少,我們要去想那一坨龍是否真的很虧?03/11 14:48
305F→: AG演算法不一定會越來越優化,但兩盤棋局看下來優化到03/11 15:33
306F→: 超過人類是可以做這樣推斷的03/11 15:33
313F→: AG也不是用回推法找最佳解,而是效法人類多下幾盤棋依03/11 15:34
317F→: 照最終勝負結果形成經驗來慢慢推估出較好的一手03/11 15:35
325F→: 只可惜人類歷史上職業棋士能下出總合上億盤棋局就很不03/11 15:36
328F→: 得了了,但是AG可以用一年的時間自我對局上千萬局03/11 15:36
340F→: 演算法不一定會越來越優化啦,所以Google才開了這個局03/11 15:39
345F→: Google就是想驗證Deepmind能否優化到超過人類的水準03/11 15:40
353F→: 類神經概念很簡單,如何讓他有效的初始值才是關鍵03/11 15:42
373F→: 這就是MC法的魅力阿,甚麼都不懂卻可以解決問題 XD03/11 15:45
399F→: ddavid大,建議用MC去想AG而不要從回推法去想AG03/11 15:51
409F→: 抱歉可能語意不清,因為MC中本來就有可能會有自相矛盾03/11 15:53
414F→: 對電腦來說他可能只是從一樣好的那三五步隨機選一步走03/11 15:54
420F→: 我不認為他是連續性的最優解,不過圍棋勝率也許不在連03/11 15:55
423F→: 續性的最優解,而是減少錯誤可能就自然能提高勝率03/11 15:56
429F→: 勝率跟從頭到尾最優解次數也許相關性很低,反而是跟發03/11 15:57
434F→: 生小失誤讓自己損目的相關性高很多03/11 15:57
453F→: 我同意AG有可能無法收斂到最優解,不過AG能收斂到超越03/11 16:00
456F→: 人類的解依結果來看是可以期待的03/11 16:01
483F→: 大量訓練可能收斂到90%可能收斂到80%,沒人知道他會收03/11 16:05
485F→: 斂到哪裡,只是目前人類可能只有60%所以明顯被超過了03/11 16:06
490F→: 沒人知道如何修正AG,這也是Google最想知道的問題03/11 16:06
495F→: D大只是提出我們不該這麼篤定他會收斂到100%03/11 16:08
505F→: 感謝D大給了我新啟發,有限時間下最優解跟勝率可能並非03/11 16:10
508F→: 如我們所想的那麼正相關,反而是有效率的好解更重要03/11 16:11
526F→: 我反而持另一種看法,在有限時間下能做的計算量是固定03/11 16:17
528F→: 且有限的,與棋去找每步的最佳解(過去人類思想),不如03/11 16:17
530F→: 去思考哪樣的下法才是真正有效計算幫助自己提高勝率的03/11 16:18
532F→: 所以AG在開局下的簡明下厚,中盤真的利益競爭較大時才03/11 16:19
533F→: 會開始尋求戰鬥並從中奪利03/11 16:19
536F→: 而打劫就是最無效計算的地方,考慮了一大堆爭不到兩目03/11 16:20
539F→: 我覺得AG會成功就是他在找的甚至不是局部最佳解而是最03/11 16:21
541F→: 高效率的解,所以甚至角邊的死活定石他搞不好都不一定03/11 16:22
543F→: 參照過去定石,因為用他的演算法比從一堆定石找最適合03/11 16:23
545F→: 的可能更有效率03/11 16:23
548F→: 因為找最佳解太花時間跟效能,我的最佳解是樹狀圖回推03/11 16:24
550F→: 下的最佳解,不過本人程式不夠好,對我來說即便在收官03/11 16:25
551F→: 階段最佳解都是很花效能來計算的03/11 16:25
557F→: 回想程式設計課程,最佳解就是最高效解 XD03/11 16:29
561F→: 前面提的最佳解是上帝知道的那手棋,看來在學程式的人03/11 16:30
562F→: 眼中那手棋其實沒有太大討論的意義,我同意這樣的說法03/11 16:31
564F→: 不過在學圍棋的人眼中,那手棋才是最重要的呢03/11 16:32
568F→: 演算法中大多沒法證明是最高效的吧,反正好用就好03/11 16:34
574F→: 其實我感覺圍棋更注重最佳的一步而非最高效的一步(連思03/11 16:37
576F→: 考時間都一起來算),否則早有人在探討每步棋該花多少時03/11 16:38
578F→: 間才是最好的,像這次AG所花時間就是一個很有趣的題目03/11 16:38
581F→: 不過其實很單純用第幾手該用多少時間就能有不錯效果03/11 16:39
582F→: 但是如果是兩三小時的比賽,某一步花了太多時間以人類03/11 16:40
583F→: 來說會說那手很重要所以要好好想,以電腦來說給一個好03/11 16:40
584F→: 的函數來處理前中後盤所需時間是更高效的演算法03/11 16:41
588F→: 好的用時函數應該都可寫一篇論文了,不過都被買下來了03/11 16:43
590F→: 看來也會被當商業機密保存吧03/11 16:44
598F→: 我是覺得從第二盤來看李要下贏很困難,電腦序盤的布局03/11 17:16
599F→: 讓所有專家一致看說電腦沒救了,沒想到黑37竟然最後真03/11 17:17
600F→: 的達到救活黑兩子的效用,整條黑龍被攻白也沒佔到便宜03/11 17:17
601F→: 不過也是要比了才知道,就算沒有贏如果李世石下一次大03/11 17:20
602F→: 賽反而功力大增拿到冠軍,那也是另一種震撼03/11 17:21
52F推: 看著自己的偶像在對面被自己設計的程式打敗而沮喪,黃03/11 11:02
53F→: 博士心中必然也是五味雜陳吧03/11 11:02
54F推: 佐為再世照漫畫描述對圍棋是好的,但現實中真的如此嗎?03/11 11:05
57F推: 先好好學會尊重兩個子再來評論吧03/11 11:11
24F推: 只要把電腦每步選點跟人類每步走法造成的勝率變化攤開03/11 10:50
25F→: 來檢討,就是很有效的復盤了,上萬盤只是MC法中的統計03/11 10:52
26F→: 過程,真正的決策步數以及最後數個最適解依現在電腦運03/11 10:53
27F→: 算能力推估並不會太多03/11 10:53