作者查詢 / Wush978

總覽項目: 發文 | 留言 | 暱稱
作者 Wush978 在 PTT [ GO ] 看板的留言(推文), 共129則
限定看板:GO
看板排序:
全部Gossiping4484HatePolitics2855R_Language1255Statistics355NTUMath91294nCoV2019264Soft_Job260NTHU_STAT97238GO129LoL125Military124NTHU_STAT96118C_Chat110NTU67Philo-0364BabyMother62DataScience61CrossStrait59C_and_CPP55PHP42BoardGame39Hearthstone31NTHU_STAT9831Programming23PUBG22Tech_Job22BattleRoyale21Python18SLG15MOD14NBA13sex13Ikariam12NTUMath9210HSNU_9789joke9NCCU07_Ghis8CVS7L_TalkandCha7NTUcourse7Sub_CS7Wen-Shan7feminine_sex6PathofExile6Baseball5Hate5Steam5HSNU_9854LawBasketbal4Linux4marriage4Prob_Solve4Salary4TKU_TSPCB934W-Philosophy4Warfare4eSports3FATE_GO3FBG3Federer3PhD3PLT3Poker3StupidClown3SWhite3Tainan3Tennis3Windows3EngTalk2GossipPicket2LGS2Magic2MdnCNhistory2MenTalk2NBME_Lab2NTUHistory882PublicIssue2PublicServan2specialman2Sub_GOnline2WomenTalk2AfterPhD1B88A011XX1Boy-Girl1Broad_Band1Chan_Mou1chess1ck54th3051Cloud1CodeJob1consumer1CPU_FS7411CS92Lien1Daan1Database1dlsh-7th-3031Ecophilia1EZsoft1Fantasy1FCSH_133101FCU_EE00B1FJU1FJU-ACCR941FJU-Stat95A1FJU-STAT95B1FLAT_CLUB1Google1Haruhi1home-sale1HomeTeach1Hornets1Hsinchu1HsinYi1HSNU_11431HSNU_9861Jeremy_Lin1Ju-881KOTDFansClub1KS95-3181KS96-3141KS97-3131LAW1Management1Math1media-chaos1movie1NCCU00_Histo1NCCU_C-Baske1NCHU-Stat971NCTU-STAT98G1NCU91Finance1NSYSU1NSYSU_EE95-11NTHU-EE-CAPT1NTUCH-901NTUE-CS1021NTUE-CS1041NTUE-CS981NTUE-DC991NTUE-EPC-1001NTUEE_BL5271NTUEOE-IOL1NTUmed911NUK_AC981Orzhong97cl1Policy1PTHS95-3101RealPlaying1RS6171scu_transfer1SM04th011SM05th3xx1SorryPub1studyabroad1Taipei1toberich1TypeMoon1TYSH50-3031UTAH-JAZZ1Volunteer1YOLO1YP91-3111<< 收起看板(162)
[新聞] 柯潔朴廷桓分差達歷史最低值 第一人告急已刪文
[ GO ]107 留言, 推噓總分: +31
作者: qweewqq - 發表於 2017/11/30 23:36(6年前)
59FWush978: 呵呵12/02 17:06
[新聞] 中國版人機大戰緣何沉寂?劉:缺乏專業人才
[ GO ]466 留言, 推噓總分: +39
作者: zkow - 發表於 2016/11/25 21:50(7年前)
130FWush978: 樓上要不要先去學一下再來問?11/26 22:18
131FWush978: 否則說的內容像外行,口氣卻很衝,很不協調11/26 22:19
233FWush978: 同領域的看推文就知道有沒有料了11/27 13:22
234FWush978: 樓上太佛了11/27 13:23
251FWush978: 那你前面講的supervised 用你自己論點打不就更可笑嗎?XD11/27 15:00
258FWush978: alpha go 的重點是過去人類的棋譜還是他自己下的?11/27 15:05
261FWush978: 所以說你外行啊,這行哪有這麼簡單「有用這個就會強」11/27 15:06
262FWush978: 「因為aja過去的AI只拿一次冠軍所以reinforcement learni11/27 15:08
263FWush978: ng 不重要」 能下出這種推理,我是覺得也太...11/27 15:08
279FWush978: Alpha GO棋力會強是因為過去人類的棋譜還是他自己對自己11/27 16:15
280FWush978: 的棋譜?11/27 16:15
295FWush978: 論文裡面的描述是學習有三階段, SL of policy network,11/27 16:28
296FWush978: RL of policy network, RL of value network11/27 16:29
297FWush978: 我是不太喜歡爭論SL重要還是RL重要,因為這種行為本身就11/27 16:29
298FWush978: 外行。但是說RL不重要,我是笑了11/27 16:29
313FWush978: RL不是improved SL,這兩個東西不一樣11/27 18:20
322FWush978: @blacktom,我是在相關領域工作多年了,只是看到有人發11/27 19:28
323FWush978: 表一些錯誤概念,上來聊聊罷了11/27 19:28
324FWush978: 要說服當事人我看是很難,但求錯誤的資訊別誤導人就好11/27 19:29
325FWush978: RL對於alpha go 是相當重要的,根據nature 上的Mastering11/27 19:37
326FWush978: the game of Go with deep neural networks and tree sea11/27 19:37
327FWush978: rch 中可以得知,Alpha go 的機器學習分成三階段:SL of11/27 19:37
328FWush978: policy network, RL of policy network and RL of value11/27 19:38
329FWush978: network. 其中SL of policy network的部分,主要都是採用11/27 19:38
330FWush978: 相關工作的方法,並沒有看到太多新的東西, Paper中主要11/27 19:39
331FWush978: cite了5篇之前關於圍棋AI的工作。RL of policy network的11/27 19:40
332FWush978: 部分讓SL的結果從預測下一手的問題轉成贏棋>11/27 19:42
333FWush978: 事實上,這篇paper自稱最大的改善是在policy 和 value11/27 19:43
334FWush978: function 上,所以他們主要的貢獻在於導入Deep Learning11/27 19:44
335FWush978: 相關方法來解決圍棋AI的問題。11/27 19:44
336FWush978: 看下來,說RL對Alpha Go不重要的理由到底是什麼?11/27 19:44
337FWush978: 明明內容中都在講RL比較多了,SL都是之前的工作11/27 19:45
338FWush978: 不過Alpha GO說不定最主要的貢獻是發展在GPU上根據policy11/27 19:49
339FWush978: and value network做搜尋的算法,因為他們propose的做法11/27 19:49
340FWush978: 計算量太大了,所以需要借助GPU等硬體工具做大大的加速11/27 19:49
354FWush978: 不同啊,因為兩個方法看待資料的角度是不同。11/27 20:02
355FWush978: 以這為例,RL的資料是自己產生資料,SL是觀察的資料一11/27 20:06
356FWush978: 個是觀察的資料,一個是自我產生的資料11/27 20:06
357FWush978: SL的S在強調的是資料有提供答案,而RL則是要具備能產生11/27 20:10
358FWush978: 資料的環境11/27 20:10
360FWush978: 以上是ML的一般知識,你想反駁請找定義11/27 20:11
361FWush978: 不用拿一個應用的paper中的一句話來戰11/27 20:12
362FWush978: 你那句話只代表這個問題剛好SL和RL都能解11/27 20:13
364FWush978: 你不信就算了,其他網友別被誤導就好11/27 20:18
407FWush978: @semihumanity 我只是指出,要拿該句話論證RL=SL的問題點11/28 03:30
408FWush978: 感謝@aoeu大大仔細解析那句話的意思以及SL/RL在Paper中的11/28 03:34
409FWush978: 角色。11/28 03:34
416FWush978: 我是覺得不離譜。這不代表重現paper簡單,但是當別人把11/28 03:41
417FWush978: 做法的核心都放出來後,要達到接近的高度,已經比無中生11/28 03:42
418FWush978: 有還要容易的多了。畢竟已經有前人走在前面,並且達到高11/28 03:43
419FWush978: 度。像我自己在做研究時,多的是方法難做,也不清楚做出11/28 03:43
420FWush978: 來是不是真的能夠比現有的好... 痛苦阿11/28 03:43
[問題] 麻煩推薦不會太強的線上免費對奕網站?
[ GO ]26 留言, 推噓總分: +13
作者: seattlegood - 發表於 2014/06/02 00:24(10年前)
11FWush978:http://www.cosumi.net/en/mobile/06/02 16:16
Re: [公告] 看版成立
[ GO ]13 留言, 推噓總分: +12
作者: longman - 發表於 2013/07/14 14:09(11年前)
5FWush978:推cabon07/14 16:51
[棋訊] 悠悠24載 富士通盃劃下句點
[ GO ]13 留言, 推噓總分: +11
作者: etei - 發表於 2011/12/20 21:56(12年前)
7FWush978:接著下來就是停七大賽吧12/21 00:48
[心得] AI 總結之 2--讓子與貼目的關係
[ GO ]25 留言, 推噓總分: +1
作者: farmerlu - 發表於 2011/08/05 21:21(12年前)
10FWush978:看完四個認知後, 我就覺得這系列是廢文08/06 11:44
11FWush978:不放煙霧彈 --> 表示你推理過程中只要有誤, 別人指証, 你08/06 11:45
12FWush978:就可以用這條來脫罪08/06 11:45
13FWush978:大師都是無師自通的: 這更扯, 你都講到用統計了, 你要不要08/06 11:46
14FWush978:統計一下無師自通和透過學習而成為大師的比率相差多少?08/06 11:46
15FWush978:就拿圍棋高手來統計就好了, 期待你的數據08/06 11:46
16FWush978:真理往往與一般認知的相反: 大錯特錯, 應該是"吸引人注意"08/06 11:47
17FWush978:才與一般認知的相反. 那只是一種時代進步的必然過程, 你卻08/06 11:47
18FWush978:拿來當通則...08/06 11:47
19FWush978:拿MC方法為例子, 之前不能用是因為電腦的運算速度不夠08/06 11:48
20FWush978:現代電腦相關的很多理論基礎都是五十年前沒有電腦就有的08/06 11:48
[棋訊] 十段戰第三局 井山裕太VS張栩
[ GO ]13 留言, 推噓總分: +11
作者: tomyu611 - 發表於 2011/04/07 18:20(13年前)
2FWush978:沒記錯的話是2:104/07 18:58
Re: [棋訊] 兵聖盃最新戰況
[ GO ]4 留言, 推噓總分: +4
作者: darkskyioi - 發表於 2010/09/13 16:29(13年前)
4FWush978:吃了兩塊...09/13 17:40
Re: [棋訊] 三星盃32強分組出爐
[ GO ]4 留言, 推噓總分: +3
作者: seadogX - 發表於 2010/09/10 00:51(13年前)
3FWush978:大李好像贏了?09/10 16:02
Re: [棋訊] 三星盃32強分組出爐
[ GO ]8 留言, 推噓總分: +3
作者: Wush978 - 發表於 2010/09/09 16:11(13年前)
1FWush978:羽根輸業餘... 常昊最後好像走出昏著... 韓國今天笑呵呵09/09 16:11