作者查詢 / vfgce
作者 vfgce 在 PTT [ Python ] 看板的留言(推文), 共235則
限定看板:Python
看板排序:
全部Gossiping2575Spurs723historia620DummyHistory472NBA359medstudent331Python235Guardians220Stock193Soft_Job149medache117HatePolitics70politics49Baseball36R_Language33Policy28KMT25DataScience18CrossStrait15home-sale13CareerPlan11gallantry10JapanHistory8PublicIssue8Dragons6emprisenovel5Future-Star5L_TalkandCha5SAN5CMWang4Fund3Health3TW-history3ASM2BabyBears2GuardRookies2Prob_Solve2AfterPhD1BLAZERS1CFP1Eng-Class1Hualien1java1L_LifeJob1Militarylife1<< 收起看板(45)
3F推: kaggle的測試集,通常不附target..沒辦法用cross-validation03/07 07:30
4F→: emsemble learning通常也沒有比單一模型好很多..03/07 07:32
5F推: pandas真的要好好學,但sklearn最大問題在於對類別屬性的03/07 07:37
6F→: 處理不佳.03/07 07:37
7F→: pandas已經有category,但sklearn還無法使用03/07 07:39
8F→: 目前只有Y能夠以分類處理,X的部分都轉成int,然後被轉成03/07 07:42
11F→: flaot去處理了.這是頗不合理的處理方式....03/07 07:44
12F→: 用過R的大概知道我說的是什麼..這部分希望sklearn能否直接03/07 07:45
13F→: 支援pandas就方便多了.03/07 07:45
21F推: 所以你有一堆數值和類別混合的data,用python做真的會想XXX03/07 17:07
22F→: R內建有factor類別,套件也多能配合,用起來方便多了.03/07 17:08
23F推: 明明sklearn是一個豐富的PACKAGE,當初怎沒將這個考慮進去.03/07 17:21
24F推: 用上決策樹的感受特別明顯.03/07 17:23
25F→: ONE HOT 也不是萬靈丹,當屬性含有很多類別時,會製造出更多03/07 17:25
26F推: 屬性,整個屬性維度又更大.03/07 17:29
27F→: R內建的FACOTR,套件大多考慮到這一層,用起來方便多了.03/07 17:31
28F→: 或許SKLEARN 只考慮到配合NUMPY使用,但這問題應該還多人都03/07 17:32
29F→: 遇到了. 希望後面的版正能修正這個問題...03/07 17:33
2F推: 你是要用30個點找出一個直線來擬合曲線?03/05 17:22
3F推: 然後你的30個點是給定的,還是要學習出來的?03/05 17:26
4F推: 這比較不像deep learning做的,比較像數學吧..03/05 17:43
5F推: 255點中取30點的組合就不像deep learning要處理的,03/05 17:46
7F推: 不過若是你的y,都是X的1次方以上,那麼斜率變化較小的前30點03/05 17:54
8F→: 就是要擬合直線最佳的30點...,當然不是次方而是其他函數03/05 17:55
9F→: 就不一定了.03/05 17:55
22F推: 所以你的曲線為12條不同的冪函數,那麼這30點一定是連續,03/06 08:19
23F推: 否則X越散,Y越散,問題就簡化為從頭開始找連續的30點,所得03/06 08:30
24F→: 的誤差最小,但若gamma值皆大於1,那麼就是前30點,若gamma03/06 08:31
25F→: 值皆大於1,那麼就是後30點.03/06 08:32
26F→: 這兩種狀況所得到的最佳解同時也是各曲線的最佳解.03/06 08:32
27F→: 但若gamma值為>1及<1混合,那麼,這30點應該是往中間靠,就03/06 08:34
28F→: 從第一點,開始算連續30點誤差,再來第二點算連續30 點,03/06 08:35
29F→: 一直做下去,再看從那一點開始的連續30點所得誤差最小.03/06 08:36
30F→: 這個最佳解就非各曲線的最佳解.03/06 08:36
31F→: 總之,這根本不是deep learning.03/06 08:37
32F→: 硬要用deep learning 解會弄得非常怪異.且未必得到最佳解03/06 08:38
4F推: python將list a 改成dict,速度比R還快...02/28 18:00
6F推: 對R沒偏見,語法較python簡潔且內建支援矩陣,但原生R真的02/28 19:23
7F→: 大部分情況都比python慢.02/28 19:24
11F推: 樓上的解法有誤...也沒有比dict快.02/28 11:58
12F推: Y大解法ok,只是map回傳的是iterator,再轉成list似乎沒有02/28 12:03
13F→: 比直接用list comprehension快.02/28 12:04
3F推: 你的資料是檢查index 1-5,6-10,11-15...還是1-5,2-6,3-7...02/23 09:50
1F推: 你自己po的key=lambda word:[alphabet.index(c) for c...]02/21 07:50
2F→: 這個就可以了.你的問題在那?02/21 07:50
3F推: 化成list,list的比法就是依序比大小...02/21 07:53
4F→: 前面幾個都一樣,就看長度,如[1,2]<[1,2,3]02/21 07:53
5F→: 幹嘛自己刻比較方法?02/21 07:54
6F推: 程式碼要改,for c in word[0]是因為它的資料分兩部分,02/21 08:35
7F→: 取第一部分來比,你照抄不改當然錯...02/21 08:35
8F→: 改成for c in word就可以了....02/21 08:36
9F→: 你用for c in word[0],只取每個字第一字母,當然錯....02/21 08:37
14F推: 你對python的資料結構及常用函式還不夠熟,多了解一下list,02/21 12:21
15F→: tuple,set,dict,str有些什麼東西,該怎麼用..另外,別把其他02/21 12:22
16F→: 程式語言的想法用在python,取較短序列比較的寫法用02/21 12:24
17F→: for aa,bb in zip(a,b):來寫即可,多了解一下內建函式,02/21 12:27
18F→: 忘掉C及java...02/21 12:27
2F推: 你用那一版的python,3版都是key,2版才用cmp.02/20 12:30
3F→: 然後,key一般接受一個parameter,cmp才有兩個parameter.02/20 12:30
4F→: 一般用key 就02/20 12:32
5F→: 是將傳入的parameter轉成可進行比較的object如number.02/20 12:33
6F→: 就可以進行比較了,不必像cmp接受兩個parameter還要自行定義02/20 12:34
7F→: 比較規則....02/20 12:34
8F→: 你要進行反向比較,將sorted的reverse設成true也就可以....02/20 12:36
5F推: 用x,y去np.polyfit()得到f多項式,然後np.polyval(f,x)會得02/19 18:56
6F→: 到對應的y,我試過沒問題,程式碼附上來看.....02/19 18:57
12F推: 另外一個解法,使用sympy..02/12 13:56
13F→: from sympy import S;S('156/283').n(30)02/12 13:58
14F→: n()可以設定要的精確度............02/12 13:59
2F推: d=dict(list2)01/23 13:58
3F→: c=[[x,d.get(x)] if d.get(x) else ['--','--'] for x in\01/23 13:59
4F→: list1]]01/23 13:59
5F→: print(c)01/23 13:59