作者查詢 / coeric
作者 coeric 在 PTT [ Python ] 看板的留言(推文), 共309則
限定看板:Python
看板排序:
全部MJ727Insurance645Python309Cga257TaichungBun216MapleStory206tutor172Badminton145ForeignEX95Fund93PingTung57car49tellstory45CFP44biker40NCHU-FINGRA539tennis_life36MOD_AP34einvoice32Master_D31Militarylife23Soft_Job20story18Tennis18NTU-MJ17Pisces16L_LifePlan15Bank_Service14About_Life13studyteacher13HomeTeach11Broad_Band10Linux9CodeJob8kartrider8graduate7rent-exp7army_58-1T6Bus6creditcard6NCHUS5ROHAN5tax4Boy-Girl3CS_TEACHER3customers3GIS3Gossiping3Printer_scan3Trading3Violation3Aquarium2BCC_Midnight2CarShop2FCU_Talk2ID_Multi2LaTeX2Math2StupidClown2Teacher2Uni-Service2AntiVirus1ASIA-uni1ChungYu-Cr1CSMU-SO1Database1fastfood1FCU_EE97A1Finance1Flash1FTV1GBR_Tennis1Henin1KMT1Navy1NCHU-FINGRA61NCUT1NIT1NTUE-CS981NTUT_EE493A1PC_Shopping1PHP1Poker1SENIORHIGH1sex1SMSlife1Statistics1Stock1TaichungCont1<< 收起看板(89)
2F→: 這問題我也遇過,沒辦法直接使用pd.read_csv(url)09/05 11:02
3F→: 我的方法是:先下載下來,再去讀09/05 11:02
4F→: pd.read_csv(url,encoding='big5') 才可以09/05 11:02
5F→: 更正 是pd.read_csv(file,encoding='big5')09/05 11:03
14F噓: 網頁頁面是人寫的,沒人規定tag要怎麼用 頁面要怎麼排09/03 11:28
15F→: 簡單一句話:case by case09/03 11:29
3F推: print(data1[2]) 即可09/01 11:02
2F推: 看來 是原始資料的問題阿........08/28 08:13
3F推: 如果推測沒錯的話 2006年1月26 發生恆春大地震08/28 08:22
4F→: 股市暫停交易(兩天) 沒有資料是很正常的.........08/28 08:23
5F→: 再者,你是用py3 是否跟decode encode有關?(我是用py2)08/28 08:28
6F→: 因為我一直覺得 都跑到if(smt != s1):return smt08/28 08:31
7F→: 沒資料情況,並沒有跳到else:return False08/28 08:31
8F→: 你把soup.text丟進去smt內時,都已經變成unicode08/28 08:43
9F→: unicode一直都不會等於utf-8 所以並不會跳到else去08/28 08:44
2F→: 我猜,例如:if=>如果 else=>其他 when=>當08/15 10:02
19F→: 將近一年前,我就是想去把線上看的漫畫抓回來看08/17 10:10
20F→: 我不喜歡還要等網頁在那邊換頁讀取的時間08/17 10:11
21F→: 完成後,練就了一些爬蟲皮毛.....08/17 10:11
1F→: 新手表示:應該是ok的~~就怕有漏...08/14 22:31
2F→: read write08/11 22:54
7F→: 你從txt讀到的是一整串的字串,先把他變成list吧.....08/09 10:19
8F→: 你要直接變成字串,用re去找也ok08/09 10:20
9F→: text=text.split() #會變成list08/09 10:22
10F→: 如果你只是單純要抓到email,直接轉成字串 用findall找08/09 10:27
11F→: 如果還要針對每一個email做動作,先把它切開成list08/09 10:28
12F→: 才方便做後續動作....否則,你findall以後,要再做一次for08/09 10:28
16F→: fp.readlines() 會多個很討厭的\n,在做資料處理時08/09 23:11
17F→: 我很討厭中間多一堆沒必要的東西,例:\n \t 之類的08/09 23:11
18F→: 修正上面說的,我會選擇使用text=text.split('\n')08/09 23:12
4F→: 樓上的湯被偷了........08/04 11:14
5F→: pandas很強,但也很雞肋 遇到一些很亂的網頁時08/04 12:07
6F→: 所要的資訊盡亂塞在表格很奇怪的地方 而且還是分開的08/04 12:07
7F→: 我就放棄pandas,改回歸原始的美麗的湯08/04 12:08
8F→: 不過,用美麗的湯,也是得突破千萬難關 才有辦法抵達08/04 12:09
9F→: 就是同你說的 ("div", {class}:...08/04 12:09
10F→: 昨天在撈統聯客運的訊息時,差點沒吐血........08/04 12:10
11F→: 就你說的 一樣是看html找標籤08/04 13:07
12F→: 按F12 進到開發人員模式去看08/04 13:11
3F→: i.find('a') 改成i.a即可07/27 22:59