作者查詢 / vfgce

總覽項目: 發文 | 留言 | 暱稱
作者 vfgce 在 PTT [ Python ] 看板的留言(推文), 共235則
限定看板:Python
Re: [閒聊] 菜鳥上Kaggle: 房價預測
[ Python ]37 留言, 推噓總分: +19
作者: pipidog - 發表於 2018/03/07 04:33(8年前)
3Fvfgce: kaggle的測試集,通常不附target..沒辦法用cross-validation03/07 07:30
4Fvfgce: emsemble learning通常也沒有比單一模型好很多..03/07 07:32
5Fvfgce: pandas真的要好好學,但sklearn最大問題在於對類別屬性的03/07 07:37
6Fvfgce: 處理不佳.03/07 07:37
7Fvfgce: pandas已經有category,但sklearn還無法使用03/07 07:39
8Fvfgce: 目前只有Y能夠以分類處理,X的部分都轉成int,然後被轉成03/07 07:42
11Fvfgce: flaot去處理了.這是頗不合理的處理方式....03/07 07:44
12Fvfgce: 用過R的大概知道我說的是什麼..這部分希望sklearn能否直接03/07 07:45
13Fvfgce: 支援pandas就方便多了.03/07 07:45
21Fvfgce: 所以你有一堆數值和類別混合的data,用python做真的會想XXX03/07 17:07
22Fvfgce: R內建有factor類別,套件也多能配合,用起來方便多了.03/07 17:08
23Fvfgce: 明明sklearn是一個豐富的PACKAGE,當初怎沒將這個考慮進去.03/07 17:21
24Fvfgce: 用上決策樹的感受特別明顯.03/07 17:23
25Fvfgce: ONE HOT 也不是萬靈丹,當屬性含有很多類別時,會製造出更多03/07 17:25
26Fvfgce: 屬性,整個屬性維度又更大.03/07 17:29
27Fvfgce: R內建的FACOTR,套件大多考慮到這一層,用起來方便多了.03/07 17:31
28Fvfgce: 或許SKLEARN 只考慮到配合NUMPY使用,但這問題應該還多人都03/07 17:32
29Fvfgce: 遇到了. 希望後面的版正能修正這個問題...03/07 17:33
[問題] 多組數據線性迴歸
[ Python ]36 留言, 推噓總分: +15
作者: abc95007 - 發表於 2018/03/05 14:54(8年前)
2Fvfgce: 你是要用30個點找出一個直線來擬合曲線?03/05 17:22
3Fvfgce: 然後你的30個點是給定的,還是要學習出來的?03/05 17:26
4Fvfgce: 這比較不像deep learning做的,比較像數學吧..03/05 17:43
5Fvfgce: 255點中取30點的組合就不像deep learning要處理的,03/05 17:46
7Fvfgce: 不過若是你的y,都是X的1次方以上,那麼斜率變化較小的前30點03/05 17:54
8Fvfgce: 就是要擬合直線最佳的30點...,當然不是次方而是其他函數03/05 17:55
9Fvfgce: 就不一定了.03/05 17:55
22Fvfgce: 所以你的曲線為12條不同的冪函數,那麼這30點一定是連續,03/06 08:19
23Fvfgce: 否則X越散,Y越散,問題就簡化為從頭開始找連續的30點,所得03/06 08:30
24Fvfgce: 的誤差最小,但若gamma值皆大於1,那麼就是前30點,若gamma03/06 08:31
25Fvfgce: 值皆大於1,那麼就是後30點.03/06 08:32
26Fvfgce: 這兩種狀況所得到的最佳解同時也是各曲線的最佳解.03/06 08:32
27Fvfgce: 但若gamma值為>1及<1混合,那麼,這30點應該是往中間靠,就03/06 08:34
28Fvfgce: 從第一點,開始算連續30點誤差,再來第二點算連續30 點,03/06 08:35
29Fvfgce: 一直做下去,再看從那一點開始的連續30點所得誤差最小.03/06 08:36
30Fvfgce: 這個最佳解就非各曲線的最佳解.03/06 08:36
31Fvfgce: 總之,這根本不是deep learning.03/06 08:37
32Fvfgce: 硬要用deep learning 解會弄得非常怪異.且未必得到最佳解03/06 08:38
Re: [問題] 請問有什麼辦法加快這個 for loop 嗎?
[ Python ]22 留言, 推噓總分: +8
作者: f496328mm - 發表於 2018/02/28 15:47(8年前)
4Fvfgce: python將list a 改成dict,速度比R還快...02/28 18:00
6Fvfgce: 對R沒偏見,語法較python簡潔且內建支援矩陣,但原生R真的02/28 19:23
7Fvfgce: 大部分情況都比python慢.02/28 19:24
[問題] 請問有什麼辦法加快這個 for loop 嗎?
[ Python ]14 留言, 推噓總分: +6
作者: CaptPlanet - 發表於 2018/02/27 15:53(8年前)
11Fvfgce: 樓上的解法有誤...也沒有比dict快.02/28 11:58
12Fvfgce: Y大解法ok,只是map回傳的是iterator,再轉成list似乎沒有02/28 12:03
13Fvfgce: 比直接用list comprehension快.02/28 12:04
[問題] pandas塊狀(?)的運算
[ Python ]8 留言, 推噓總分: +3
作者: goldflower - 發表於 2018/02/21 22:41(8年前)
3Fvfgce: 你的資料是檢查index 1-5,6-10,11-15...還是1-5,2-6,3-7...02/23 09:50
Re: [問題] sorting cmp_to_key
[ Python ]19 留言, 推噓總分: +4
作者: suhang - 發表於 2018/02/21 06:51(8年前)
1Fvfgce: 你自己po的key=lambda word:[alphabet.index(c) for c...]02/21 07:50
2Fvfgce: 這個就可以了.你的問題在那?02/21 07:50
3Fvfgce: 化成list,list的比法就是依序比大小...02/21 07:53
4Fvfgce: 前面幾個都一樣,就看長度,如[1,2]<[1,2,3]02/21 07:53
5Fvfgce: 幹嘛自己刻比較方法?02/21 07:54
6Fvfgce: 程式碼要改,for c in word[0]是因為它的資料分兩部分,02/21 08:35
7Fvfgce: 取第一部分來比,你照抄不改當然錯...02/21 08:35
8Fvfgce: 改成for c in word就可以了....02/21 08:36
9Fvfgce: 你用for c in word[0],只取每個字第一字母,當然錯....02/21 08:37
14Fvfgce: 你對python的資料結構及常用函式還不夠熟,多了解一下list,02/21 12:21
15Fvfgce: tuple,set,dict,str有些什麼東西,該怎麼用..另外,別把其他02/21 12:22
16Fvfgce: 程式語言的想法用在python,取較短序列比較的寫法用02/21 12:24
17Fvfgce: for aa,bb in zip(a,b):來寫即可,多了解一下內建函式,02/21 12:27
18Fvfgce: 忘掉C及java...02/21 12:27
[問題] sorting cmp_to_key
[ Python ]12 留言, 推噓總分: +1
作者: suhang - 發表於 2018/02/20 08:46(8年前)
2Fvfgce: 你用那一版的python,3版都是key,2版才用cmp.02/20 12:30
3Fvfgce: 然後,key一般接受一個parameter,cmp才有兩個parameter.02/20 12:30
4Fvfgce: 一般用key 就02/20 12:32
5Fvfgce: 是將傳入的parameter轉成可進行比較的object如number.02/20 12:33
6Fvfgce: 就可以進行比較了,不必像cmp接受兩個parameter還要自行定義02/20 12:34
7Fvfgce: 比較規則....02/20 12:34
8Fvfgce: 你要進行反向比較,將sorted的reverse設成true也就可以....02/20 12:36
[問題] Numpy如何傳回一對多的方程式值?
[ Python ]12 留言, 推噓總分: +2
作者: leubin - 發表於 2018/02/18 20:34(8年前)
5Fvfgce: 用x,y去np.polyfit()得到f多項式,然後np.polyval(f,x)會得02/19 18:56
6Fvfgce: 到對應的y,我試過沒問題,程式碼附上來看.....02/19 18:57
[問題] 如何於除法取到小數42位數?
[ Python ]18 留言, 推噓總分: +3
作者: doun - 發表於 2018/02/11 11:53(8年前)
12Fvfgce: 另外一個解法,使用sympy..02/12 13:56
13Fvfgce: from sympy import S;S('156/283').n(30)02/12 13:58
14Fvfgce: n()可以設定要的精確度............02/12 13:59
[問題] 比對兩個串列,缺少的項目加上'--'
[ Python ]6 留言, 推噓總分: +2
作者: giftedguilt - 發表於 2018/01/23 11:27(8年前)
2Fvfgce: d=dict(list2)01/23 13:58
3Fvfgce: c=[[x,d.get(x)] if d.get(x) else ['--','--'] for x in\01/23 13:59
4Fvfgce: list1]]01/23 13:59
5Fvfgce: print(c)01/23 13:59