Re: [請益] 想從零開始轉行當AI軟體工程師

看板Soft_Job作者 (竹科管理處網軍研發人員)時間2年前 (2021/11/11 01:20), 編輯推噓23(23086)
留言109則, 15人參與, 2年前最新討論串10/16 (看更多)
大家討論了很多高深的數學,或是頂會。 實際上,我真的很懷疑有多少人真的在業界上搞 AI。 只論台灣吧。首先市場上純研發,需要數學或考績強制發論文的職缺,占不到5%。而且這兩年職缺越來越少。更何況頂會… 台灣業界一年也沒看多少人在發頂會,幾乎沒有吧。就連國際研討會,比例來說也沒看到多少人在發,常常看論文的我都沒搜到台灣業界發的論與。板上動不動就需要數學與改模型架構,真的感受差很大,可能是我看得不夠多? 好啦,如果你在國外大公司當我錯了。的確很多人搞數學,但是人數比例還是超級少。 再來談產品。首先論產品的效果,資料面就決定結果論了。實際工作時,有大部份的時間在處理資料。然後還是要花很多時間做特徵工程。當然特徵工程你可以搞很深的數學啦,但是可能需求方,多給你一個有用的資料特徵,都比搞數學重要。 特徵工程需要用到數學或頂會能力嗎? 前面說可利用數學方法,或各種模型做特徵工程或過濾雜訊,這要看任務。至少我比較熟的語音訊號,NLP,搜尋,推薦排序,跟本就沒有好方法。沒有一套數學方法論,特徵可以有什麼突飛猛進的提升,沒見過。喔有人說預訓練,就能突飛猛進了啊,問題是,你用預訓練需要什麼數學? 你要重新設計一套預訓練模型,即使自己設計,也很難別人好阿。搞數學設計演算法要用在哪? 實際上真的沒機會發揮居多吧。說數學有用的可以回文討論一下嗎。如果是說常用數學,都是寫在 pptx 上用來震撼長官用,我還稍微相信。 非深度學習,各種企業的結構化或數字型資料,也不需要設計什麼數學來做特徵工程吧。常見的不平衡標籤的狀況,用數學重新去設計 loss function, 效果提升真的有限,而且改來改去可能還不如用別人設計好的方法。改來改去不如前面搭一層規則引擎過濾修改 bad case結果。 資料與特徵搞得差不多了,來談談模型吧。 正常有經驗的人,怎麼會馬上跳到複雜的模型,或自己設計。拜託,恨不得模型越簡單越好嗎。能達到產品規格的模型就好,模型用越簡單越好,計算成本才能壓低,性能才會好。 這時有人會跳出來說了:我們會為了提升AI能力,用複雜的模型,然後蒸餾,這時需要數學了吧? 沒吧,機會有夠少的。現成open source的蒸餾模型,scaling,都是經過研發與實驗的,你自己設計跟本很難效果贏別人。當那些世界名校學數學的人,是塑膠做的嗎?自己隨便搞就能贏人? AI又不只 監督學習, RL,圖學習,各種複雜AI,總會用到數學了吧?問題是有多少人可以搞數學搞到比現成方法好? 要花多少成本呢? 再來跳針一下,面試推導總該需要數學了吧。喔對,大廠工作基本工。問題是,你面完你就忘得差不多了。下次找工作再複習。而且台灣真的多數公司不考。 不是說數學不重要,或 學AI不需要學數學,而是單純找個混口飯吃的工作,還真的不用特別去學數學。只是要有 AI工作,沒頂會,沒kaggle也一堆工作。這才是現況吧。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.148.218 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1636564801.A.21C.html

11/11 01:31, 2年前 , 1F
我覺得會數學跟甚麼頂會、比賽是兩碼子事吧
11/11 01:31, 1F

11/11 01:32, 2年前 , 2F
如果要去看別人論文實作,不懂數學會連符號都看不懂
11/11 01:32, 2F

11/11 01:33, 2年前 , 3F
對,我也覺得兩碼子的事情。文中有錯可多指正。
11/11 01:33, 3F

11/11 01:34, 2年前 , 4F
跟設計演算法也是兩碼子事,只是單純讀得懂的而已
11/11 01:34, 4F

11/11 01:35, 2年前 , 5F
看論文實作或復現的工作在台灣也很少。多數不需要。
11/11 01:35, 5F

11/11 01:38, 2年前 , 6F
嵌入式環境需要吧 可沒有python的一堆套件可以用
11/11 01:38, 6F

11/11 02:23, 2年前 , 7F
數學 頂會 KAGGLE這三樣沒甚麼關係吧
11/11 02:23, 7F

11/11 02:51, 2年前 , 8F
重造輪子的工作比你想得多了,需要數學的
11/11 02:51, 8F

11/11 08:10, 2年前 , 9F
有啦ECCV 會在Kaggle辦比賽,請第一名去會議上分享
11/11 08:10, 9F

11/11 08:34, 2年前 , 10F
要在業界做applied ML軟工比數學重要太多了QQ
11/11 08:34, 10F

11/11 09:39, 2年前 , 11F
其實依照你的前提“只是要糊口飯吃”,不要說ai了,所有
11/11 09:39, 11F

11/11 09:39, 2年前 , 12F
行業都不需要數學了,沒什麼討論點吧。再來,你提到模型
11/11 09:39, 12F

11/11 09:39, 2年前 , 13F
的部分不就說了數學的重要性,還是你其實是想告誡大家不
11/11 09:39, 13F

11/11 09:39, 2年前 , 14F
要妄想跟世界名校數學人競爭而不是數學的重要性?最後,
11/11 09:39, 14F

11/11 09:39, 2年前 , 15F
你提到的部份把前提假設的這麼美好當然就不用數學,來聊
11/11 09:39, 15F

11/11 09:39, 2年前 , 16F
聊推薦系統好了,今天老闆給你一行為人的一堆網頁點擊資
11/11 09:39, 16F

11/11 09:39, 2年前 , 17F
料,跟一堆他看過的文本圖片,而且都還稀疏各種缺漏,接
11/11 09:39, 17F

11/11 09:39, 2年前 , 18F
著就什麼都沒有了,叫你弄推薦系統,你是打算現在流行方
11/11 09:39, 18F

11/11 09:39, 2年前 , 19F
法套一套然後交差然後說抱歉我盡力了嗎?還是或嘗試用統
11/11 09:39, 19F

11/11 09:39, 2年前 , 20F
計方法處理一下資料?
11/11 09:39, 20F

11/11 09:44, 2年前 , 21F
或是股市資料,今天老闆就給你開高低收量,叫你寫策略,
11/11 09:44, 21F

11/11 09:44, 2年前 , 22F
你一樣是會用現行流行方法套一套然後說沒辦法,還是嘗試
11/11 09:44, 22F

11/11 09:44, 2年前 , 23F
去機率建模分析?
11/11 09:44, 23F

11/11 10:00, 2年前 , 24F
樓上 你確定現在推薦系統是這樣做的? XD 從數學做
11/11 10:00, 24F

11/11 10:00, 2年前 , 25F
老板會叫你回家吃自己.... 別人都上市了 你在那刻
11/11 10:00, 25F

11/11 10:03, 2年前 , 26F
更別提還有很多美麗的數學解不了的工程問題
11/11 10:03, 26F

11/11 10:07, 2年前 , 27F
再提一下模型的部分,模型越小越好除了成本考量,最重要
11/11 10:07, 27F

11/11 10:07, 2年前 , 28F
的是降低capacity導致的overtraining的問題,深入研發的
11/11 10:07, 28F

11/11 10:07, 2年前 , 29F
部分有一大派就是在想辦法降低這個部分,但你只有兩條路
11/11 10:07, 29F

11/11 10:07, 2年前 , 30F
,一是改變模型架構這也是,純學術在做的事,因為不用考
11/11 10:07, 30F

11/11 10:07, 2年前 , 31F
慮有的沒的只要專注降低capacity跟訓練成本就好,像tran
11/11 10:07, 31F

11/11 10:07, 2年前 , 32F
sformer極大程度降低了capacity跟能夠平行運算,另一條路
11/11 10:07, 32F

11/11 10:07, 2年前 , 33F
就是想辦法丟進模型的資訊少一點,因為根據Universal ap
11/11 10:07, 33F

11/11 10:07, 2年前 , 34F
真覺得這麼厲害也有用 可以去對岸試試
11/11 10:07, 34F

11/11 10:07, 2年前 , 35F
proximation theorem能在模型上幹的事有限,結果不管怎麼
11/11 10:07, 35F

11/11 10:07, 2年前 , 36F
搞就是那樣,所以要嘛像你說的伸手牌去跟需求端要更好的
11/11 10:07, 36F

11/11 10:07, 2年前 , 37F
特徵,要嘛就是自己搞,對就是用數學,就算是那些常見手
11/11 10:07, 37F

11/11 10:07, 2年前 , 38F
法你不會就不能用
11/11 10:07, 38F

11/11 10:09, 2年前 , 39F
實務上就一堆數學搞不定的 就是叫工程的搞破壞搞定
11/11 10:09, 39F
還有 30 則推文
11/11 10:35, 2年前 , 70F
純數還沒有遇到幾個 還真不知道他們在幹嘛
11/11 10:35, 70F

11/11 10:35, 2年前 , 71F
但我知道沒有很常在做網路就是了
11/11 10:35, 71F

11/11 11:50, 2年前 , 72F
四類寫後端又念資管碩寫AI論,非相關科系根本不懂那數學符號
11/11 11:50, 72F

11/11 11:52, 2年前 , 73F
我寫完論文我還是不懂, 問幾個中階的問題我就死了
11/11 11:52, 73F

11/11 15:56, 2年前 , 74F
我在業界AI到現在的確是沒什麼碰到數學
11/11 15:56, 74F

11/11 15:56, 2年前 , 75F
頂會workshop倒是有個一篇
11/11 15:56, 75F

11/11 16:14, 2年前 , 76F
我在IC設計公司用過濾波器數學
11/11 16:14, 76F

11/11 17:05, 2年前 , 77F
回上面的:你確定現在推薦系統是這樣做+1(好啦我沒
11/11 17:05, 77F

11/11 17:05, 2年前 , 78F
有要參戰XD
11/11 17:05, 78F

11/11 17:38, 2年前 , 79F
應該說在台灣 不是職稱有AI就以為自己在搞AI
11/11 17:38, 79F

11/11 17:39, 2年前 , 80F
寫作人工智慧 讀作工人智慧
11/11 17:39, 80F

11/11 20:24, 2年前 , 81F
不過現在台灣業界對AI的定義就是這樣沒錯
11/11 20:24, 81F

11/11 20:25, 2年前 , 82F
台灣的純軟公司體量沒有大到像國外可以真的搞研究
11/11 20:25, 82F

11/11 20:25, 2年前 , 83F
發paper 台灣業界就是要速成有效和部署
11/11 20:25, 83F

11/12 02:02, 2年前 , 84F
囧> 我也沒有要參戰啊 只是覺得事必有因 這樣XD
11/12 02:02, 84F

11/12 02:03, 2年前 , 85F
再看幾個回應 嗯 果然不出所料XD
11/12 02:03, 85F

11/12 02:04, 2年前 , 86F
其實全世界真做nn研究的真的很少 每年做出來的都可
11/12 02:04, 86F

11/12 02:04, 2年前 , 87F
以用手指數的@_@~ cv來說過去幾年也就某一派大殺四方
11/12 02:04, 87F

11/12 02:05, 2年前 , 88F
說實話我自認智商不足 還是去一邊畫圈好了XD
11/12 02:05, 88F

11/12 02:06, 2年前 , 89F
我覺得有效部署不是錯事 因為更多ai都是紙上談兵
11/12 02:06, 89F

11/12 02:08, 2年前 , 90F
而且要有資金才有新研究 還是要能有錢才轉得動啊
11/12 02:08, 90F

11/12 02:11, 2年前 , 91F
幾乎所有公司都是拿別的養ai部門 沒有別的搶上市先
11/12 02:11, 91F

11/12 02:11, 2年前 , 92F
賺一波也不是壞事啊
11/12 02:11, 92F

11/12 12:35, 2年前 , 93F
現在推薦系統複雜多了 都是pipeline組合 基本上是工
11/12 12:35, 93F

11/12 12:35, 2年前 , 94F
程問題 只是每個環節上有不同model針對該環節指標優
11/12 12:35, 94F

11/12 12:35, 2年前 , 95F
化 但說實在看起來很work的論文 套用到在家data上根
11/12 12:35, 95F

11/12 12:35, 2年前 , 96F
本不一定work 對資料的研究 前處理 這些工程事情才真
11/12 12:35, 96F

11/12 12:35, 2年前 , 97F
的是關鍵 另外像是推薦系統這種雖然有指標但每個人體
11/12 12:35, 97F

11/12 12:35, 2年前 , 98F
感大不相同的東西 為了幾%的指標提升從ML改DL 然後每
11/12 12:35, 98F

11/12 12:35, 2年前 , 99F
個月燒的數字多一個0 這方案絕對不會被採用的
11/12 12:35, 99F

11/12 12:44, 2年前 , 100F
推薦系統,或人的行為紀錄,現在根本沒有好的數學可以提升
11/12 12:44, 100F

11/12 12:44, 2年前 , 101F
點擊效果,購買效果。也是考大力出奇蹟。實務上真的沒機會
11/12 12:44, 101F

11/12 12:44, 2年前 , 102F
給你用數學去提升。
11/12 12:44, 102F

11/12 12:57, 2年前 , 103F
這篇才接近現實
11/12 12:57, 103F

11/12 23:32, 2年前 , 104F
基本上你公司誰算力大誰就贏一半了
11/12 23:32, 104F

11/12 23:34, 2年前 , 105F
不用算數學 積木設計好丟下去NAS搞定
11/12 23:34, 105F

11/14 00:09, 2年前 , 106F
同意原po說的 看起來是業內人XD 推薦系統跟數學完全
11/14 00:09, 106F

11/14 00:09, 2年前 , 107F
無關 完全是domain knowledge跟工程 有時候抓到key f
11/14 00:09, 107F

11/14 00:09, 2年前 , 108F
eature就吊打千千萬萬模型了
11/14 00:09, 108F

11/14 00:09, 2年前 , 109F
不行的話就是大力出奇蹟XD
11/14 00:09, 109F
文章代碼(AID): #1XY_z18S (Soft_Job)
討論串 (同標題文章)
完整討論串 (本文為第 10 之 16 篇):
文章代碼(AID): #1XY_z18S (Soft_Job)