[心得] 2023使用機器學習選股的年報

看板Stock作者 (123)時間4月前 (2024/01/01 22:37), 編輯推噓33(34141)
留言76則, 41人參與, 4月前最新討論串1/1
過去每年都是自己憑感覺玩,處於那種賺了抱不住,賠了一停損馬上漲 只會google以為kd<20可以進場,kd>80準備要出場 或是覺得營收很好欸,結果進場一路崩 最後搞到賺的吐回去甚至還賠,然後就心態崩潰不玩了,但過一陣子又手癢那種輪迴 所以我自認我沒有玩股票的天分,那所幸我研究所玩過一點機器學習(但不是用在股票) 就想說自己搞不懂,那我就讓機器模型幫我搞懂,跟我講要買什麼就好 以下紀錄2023年的過程,但其實模型2022年8月開始實戰,那時候是125萬 2023年開始成本:141萬 年底損益:43萬+18萬股息 對帳單:https://upload.cc/i1/2024/01/01/AYbTO4.png
選股買賣週期:每個月all in Input:一點點基本面+一堆技術指標共45個特徵 Training範圍:2005~2015 Testing範圍:2016~2022/7 模型:Weighted Ensemble (類神經網路+XGBRegressor+ARDRegression+KNeighborsRegressor+ExtraTreesRegressor) Output:模型Ranking後推薦的TOP 3分散投資 過濾:剔除交易金額1千萬以下的個股 (後來還是覺得金額還是太少,但再濾,資料量勝率跟報酬率都會降) 心得: 1.相信模型,很多時候推薦出來我心裡都os,師傅真的要這樣買嗎,kd鈍化了欸 結果過程中間可能會賠,但最後就是會賺 2.找出場機制,因為買賣週期是1個月,但回頭看其實不一定是賣在相對最佳的時間點, 一開始我逼自己嚴守紀律一定要時間到才賣,但少賺很多 後來自己套用一些開頭寫的那種kd簡單規則進行出場,並且做一些變化回測看看 結果那種google的到的規則突然有用了 這邊也可以分享"交易量"是最重要的,什麼規則幾乎都要配合量來看 3.整體績效來說應該有贏0050,截止10月也還贏正2,但不知道為何11月開始上漲這一波 模型選的股票沒跟到,導致績效輸正2,有點小灰心,覺得自己在忙什麼 可能隨時做好模型失效的準備 以上 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.158.68.138 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1704119878.A.8CA.html

01/01 22:44, 4月前 , 1F
線型選股策略在完全的多頭年 小輸正二還好吧...
01/01 22:44, 1F

01/01 22:47, 4月前 , 2F
模型在大多頭跟大空頭年都會失真,因為這是特殊事件
01/01 22:47, 2F

01/01 22:48, 4月前 , 3F
模型一般在普通年份會表現比較好也比較準,我認為
01/01 22:48, 3F

01/01 22:51, 4月前 , 4F
不熟模型 但這樣應該也是在trade策略嗎,那應該會
01/01 22:51, 4F

01/01 22:51, 4月前 , 5F
有吞吐量的問題,輸正二也還好 你等於拿去跟槓桿比
01/01 22:51, 5F

01/01 22:51, 4月前 , 6F
,那你也可以拿你的策略去開槓。
01/01 22:51, 6F

01/01 22:53, 4月前 , 7F
大多頭年輸正二就算了啦..盤整跟空頭年贏回來就好了
01/01 22:53, 7F

01/01 22:55, 4月前 , 8F
有沒有一種可能面對有趨勢的需要另一種指標?
01/01 22:55, 8F

01/01 22:56, 4月前 , 9F
大多頭跟大空頭才是魚身
01/01 22:56, 9F

01/01 23:17, 4月前 , 10F
有沒有入門推薦?
01/01 23:17, 10F

01/01 23:18, 4月前 , 11F
我漏掉最重要的心得,就是今年是多頭年...
01/01 23:18, 11F

01/01 23:19, 4月前 , 12F
模型沒經過空頭洗禮過...還需要更多時間驗證
01/01 23:19, 12F

01/01 23:58, 4月前 , 13F
結論買正二就好? 困罷數錢 XD
01/01 23:58, 13F

01/02 00:15, 4月前 , 14F
他是前測2005~2015然後後測2016~2022驗證是否有效
01/02 00:15, 14F

01/02 00:17, 4月前 , 15F
機器學習我不懂就從略,不過還是講一下
01/02 00:17, 15F

01/02 00:17, 4月前 , 16F
理論模型本來就不可能達到100%效率,你回頭看只是
01/02 00:17, 16F

01/02 00:19, 4月前 , 17F
因為你看到"未來"走勢才能評斷的,模型當下不會知道
01/02 00:19, 17F

01/02 00:41, 4月前 , 18F
只有我覺得成本141萬股息18萬很詭異嗎 台股有那麼
01/02 00:41, 18F

01/02 00:41, 4月前 , 19F
多殖利率超過10%還填息的股票?
01/02 00:41, 19F

01/02 00:41, 4月前 , 20F
績效輸+2不是問題 如果DD也比+2損更多才是沒用
01/02 00:41, 20F

01/02 00:45, 4月前 , 21F
推 希望可以看到長期分享 很有趣
01/02 00:45, 21F

01/02 01:13, 4月前 , 22F
01/02 01:13, 22F

01/02 01:54, 4月前 , 23F
股息18萬是用了榨汁的玩法吧 領息一檔後去領下一檔
01/02 01:54, 23F

01/02 01:55, 4月前 , 24F
大多頭年用這招很爽 填息率愈高週轉率也可愈高
01/02 01:55, 24F

01/02 04:12, 4月前 , 25F
我看盤整盤Ai要怎麼玩
01/02 04:12, 25F

01/02 04:38, 4月前 , 26F
如果永遠都漲確實會贏呀 畢竟回調後 下次往回漲一定
01/02 04:38, 26F

01/02 04:38, 4月前 , 27F
比前一次高
01/02 04:38, 27F

01/02 05:06, 4月前 , 28F
你試試[KD鈍化]買入條件,會不會績效大爆發?
01/02 05:06, 28F

01/02 05:15, 4月前 , 29F
回測就知道答案了
01/02 05:15, 29F

01/02 05:22, 4月前 , 30F
你有做cross validation嗎? 還有你怎麼判斷模型處於
01/02 05:22, 30F

01/02 05:22, 4月前 , 31F
overfitting還是underfitting? 你data選的時間區間
01/02 05:22, 31F

01/02 05:22, 4月前 , 32F
的邏輯是?
01/02 05:22, 32F

01/02 06:44, 4月前 , 33F
因為他週期是月 所以股息才這麼少
01/02 06:44, 33F

01/02 06:45, 4月前 , 34F
可以考慮部分用年做交易週期
01/02 06:45, 34F

01/02 06:50, 4月前 , 35F
模型不準,不就是data set有問題? 簡單來說, 你的
01/02 06:50, 35F

01/02 06:50, 4月前 , 36F
資料不就只是籌碼面?
01/02 06:50, 36F

01/02 06:52, 4月前 , 37F
例如,你的模型怎麼判斷AMD的AI晶片能不能追上NVDA
01/02 06:52, 37F

01/02 06:52, 4月前 , 38F
?第幾季開始影響?
01/02 06:52, 38F

01/02 07:14, 4月前 , 39F
你賺的是beta
01/02 07:14, 39F

01/02 07:22, 4月前 , 40F
真麻煩 全丟00929就好
01/02 07:22, 40F

01/02 07:57, 4月前 , 41F
推一個
01/02 07:57, 41F

01/02 08:20, 4月前 , 42F
推AI機器人模型操股LoL
01/02 08:20, 42F

01/02 08:49, 4月前 , 43F
我覺得你的模型如果2022,2023都是賺那值得參考
01/02 08:49, 43F

01/02 09:01, 4月前 , 44F
多頭年就看敢不敢壓而已
01/02 09:01, 44F

01/02 09:17, 4月前 , 45F
雖然你有賺 不過train/validation最好別這樣切
01/02 09:17, 45F

01/02 09:47, 4月前 , 46F
你模型是做分類任務 然後把output Ranking?
01/02 09:47, 46F

01/02 09:49, 4月前 , 47F
四十幾個特徵都是價格衍生技術指標?
01/02 09:49, 47F

01/02 09:49, 4月前 , 48F
不考慮將股票池做類股分群嗎?
01/02 09:49, 48F

01/02 09:51, 4月前 , 49F
dd多少
01/02 09:51, 49F

01/02 09:51, 4月前 , 50F
資料 也可以考慮用TimeSeries CV來切
01/02 09:51, 50F

01/02 09:59, 4月前 , 51F
噢 沒看清 你是做Regression
01/02 09:59, 51F

01/02 10:21, 4月前 , 52F
股市走多頭,怎麼買都會贏,走空頭,怎麼買都會輸,
01/02 10:21, 52F

01/02 10:21, 4月前 , 53F
說到底還是本多終勝
01/02 10:21, 53F

01/02 10:33, 4月前 , 54F
輸入只有kd資料做學習嗎?
01/02 10:33, 54F

01/02 10:34, 4月前 , 55F
我去年十月買股 至今沒一檔不賺的,你先等你模型能
01/02 10:34, 55F

01/02 10:34, 4月前 , 56F
躲過開頭再說
01/02 10:34, 56F

01/02 10:40, 4月前 , 57F
未來會不會有AI巴菲特
01/02 10:40, 57F

01/02 10:47, 4月前 , 58F
其實這績效只證明你是白忙一場,根本選不贏人類啊
01/02 10:47, 58F

01/02 10:47, 4月前 , 59F
選半天跟大盤差不多,風險高很多
01/02 10:47, 59F

01/02 11:35, 4月前 , 60F
別看淨報酬 要看Sharpe
01/02 11:35, 60F

01/02 11:43, 4月前 , 61F
有書單可以推薦嗎?
01/02 11:43, 61F

01/02 12:02, 4月前 , 62F
個人比較喜歡看Calmar Ratio,比較在意風險。
01/02 12:02, 62F

01/02 12:31, 4月前 , 63F
01/02 12:31, 63F

01/02 13:17, 4月前 , 64F
請問下單是人工下還是程式下的
01/02 13:17, 64F

01/02 13:54, 4月前 , 65F
人工下單 dd約10%左右
01/02 13:54, 65F

01/02 13:54, 4月前 , 66F
我沒看書 我直接買線上課程 拿程式回來改
01/02 13:54, 66F

01/02 13:58, 4月前 , 67F
如何知道有沒有overfitting,我只會看traing和vali
01/02 13:58, 67F

01/02 13:59, 4月前 , 68F
dation兩者的趨勢
01/02 13:59, 68F

01/02 14:01, 4月前 , 69F
好奇G大不建議這樣分割資料是為何呢? 沒測到08年嗎
01/02 14:01, 69F

01/02 14:43, 4月前 , 70F
印象中cross-validation應該是全部資料去切?
01/02 14:43, 70F

01/02 14:45, 4月前 , 71F
切k段然後拿k-1段train,第k段拿來驗證,這樣資料
01/02 14:45, 71F

01/02 14:46, 4月前 , 72F
比較不浪費 個人觀點是把時間拉長,把每個短期shock
01/02 14:46, 72F

01/02 14:46, 4月前 , 73F
都變成循環的一部分,這樣模型應該表現會越來越好
01/02 14:46, 73F

01/02 14:48, 4月前 , 74F
參考一下這篇量化報導,https://reurl.cc/rr1OAZ
01/02 14:48, 74F

01/02 14:50, 4月前 , 75F
另外你的模型可能有潛在問題 1.生存者偏差
01/02 14:50, 75F

01/02 14:52, 4月前 , 76F
2除權息調整 3太過集中持股,建議放寬持股看敏感性
01/02 14:52, 76F
文章代碼(AID): #1baiv6ZA (Stock)