作者查詢 / luli0034

總覽項目: 發文 | 留言 | 暱稱
作者 luli0034 在 PTT [ DataScience ] 看板的留言(推文), 共34則
限定看板:DataScience
首頁
上一頁
1
下一頁
尾頁
[心得] FinMind 台股開源資料庫
[ DataScience ]9 留言, 推噓總分: +8
作者: f496328mm - 發表於 2021/01/24 20:39(3年前)
7Fluli0034: 推推02/14 19:57
同時feed Bert跟TFIDF to Dense layer
[ DataScience ]10 留言, 推噓總分: +4
作者: e9904567 - 發表於 2020/10/27 17:03(3年前)
5Fluli0034: fine tune會回去update BERT裡面的parameters吧 如果像10/28 12:03
6Fluli0034: 圖片這樣用feature-based的做法concat TFIDF這樣有辦法b10/28 12:03
7Fluli0034: ack propagation嗎(?10/28 12:03
8Fluli0034: 我自己的經驗這樣做的話就是將BERT當作一個representati10/28 12:05
9Fluli0034: on跟其他representation 結合訓練下游分類器了XD 不太10/28 12:05
10Fluli0034: 像fine tune10/28 12:05
[問題] 中文 詞向量 相似度
[ DataScience ]24 留言, 推噓總分: +9
作者: s3714443 - 發表於 2020/08/08 00:19(3年前)
14Fluli0034: BERT直接算cosine similarity你會fail09/04 12:47
15Fluli0034: The construction of BERT makes it unsuitable for sem09/04 12:47
16Fluli0034: antic similarity search as well as for unsupervised09/04 12:47
17Fluli0034: tasks like clustering.09/04 12:47
18Fluli0034: 不過我不太清楚中文有什麼開源的任務來fine tune..XD09/04 12:49
19Fluli0034: 英文的話SBERT是利用NLI與Siamese network來讓bert的vec09/04 12:50
20Fluli0034: tor representation可以直接用cosine similarity來衡量09/04 12:50
21Fluli0034: 語意相似~09/04 12:50
22Fluli0034: 我一開始也期待BERT能夠捕捉到”語意” 但是實驗看來他09/04 12:53
23Fluli0034: 的output並不是一個vector space的representation~09/04 12:53
[問題] crop and warp
[ DataScience ]12 留言, 推噓總分: +8
作者: ucrxzero - 發表於 2020/06/24 17:54(4年前)
4Fluli0034: 蝦皮淚推06/25 17:54
[問題] 怎麼確保資料分布跟真實世界相近 ?
[ DataScience ]11 留言, 推噓總分: +5
作者: sssh - 發表於 2020/05/27 10:14(4年前)
11Fluli0034: 推 你永遠不能知道未來的世界(真實資料)會長什麼樣06/10 12:27
[問題] 數據少時如何做文章分類
[ DataScience ]30 留言, 推噓總分: +14
作者: del680202 - 發表於 2020/02/18 23:45(4年前)
25Fluli0034: SVM對小量資料比較不友善 support vectors不夠具代表性05/05 13:09
26Fluli0034: 的話分類準確度不好 少量資料可以靠pretrained 在大量05/05 13:09
27Fluli0034: 文本上的shallow embedding去些微提升 或者做些基本的da05/05 13:09
28Fluli0034: ta augmentation (提升有限)05/05 13:09
29Fluli0034: 是說資料的語言是?05/05 13:10
[問題] loss 一直降不下來
[ DataScience ]13 留言, 推噓總分: +6
作者: jagerwu - 發表於 2019/09/14 16:29(4年前)
11Fluli0034: lr09/18 12:39
[問題] val_loss < loss
[ DataScience ]25 留言, 推噓總分: +8
作者: keven92110 - 發表於 2019/03/06 08:26(5年前)
22Fluli0034: 應該說今天小類別對你來說是不是很重要 如果是的話才是03/09 00:11
23Fluli0034: 問題(如何提升recall) 類別不平衡可以over/under sampli03/09 00:11
24Fluli0034: ng或是在training 前調整class weight等等 也可以試試03/09 00:11
25Fluli0034: 看切資料集的時候維持原類別比例(val也是維持1:19)03/09 00:11
Re: [問題] 取得大量數據的管道?
[ DataScience ]13 留言, 推噓總分: +13
作者: Equalmusic - 發表於 2019/01/23 11:49(5年前)
12Fluli0034: 推02/21 19:36
[問題]class imbalance
[ DataScience ]13 留言, 推噓總分: +2
作者: qwe85158 - 發表於 2019/02/09 22:54(5年前)
10Fluli0034: 30%應該不太會有class imbalance 的問題(? Classifer02/21 19:34
11Fluli0034: 在訓練過程中可以調‘小類別’權重可以試看看 應該估狗c02/21 19:34
12Fluli0034: lass_weight看看參數怎麼調就可以了 不過我個人認為是02/21 19:34
13Fluli0034: 分類器選不好不是類別不平衡的問題02/21 19:34
首頁
上一頁
1
下一頁
尾頁