作者查詢 / coeric

總覽項目: 發文 | 留言 | 暱稱
作者 coeric 在 PTT [ Python ] 看板的留言(推文), 共309則
限定看板:Python
[問題] pandas read_csv(網址)
[ Python ]5 留言, 推噓總分: 0
作者: uncle925 - 發表於 2017/09/04 23:03(8年前)
2Fcoeric: 這問題我也遇過,沒辦法直接使用pd.read_csv(url)09/05 11:02
3Fcoeric: 我的方法是:先下載下來,再去讀09/05 11:02
4Fcoeric: pd.read_csv(url,encoding='big5') 才可以09/05 11:02
5Fcoeric: 更正 是pd.read_csv(file,encoding='big5')09/05 11:03
[問題] 爬蟲出網站中所有的內文
[ Python ]18 留言, 推噓總分: -4
作者: tosakashiron - 發表於 2017/09/01 22:42(8年前)
14Fcoeric: 網頁頁面是人寫的,沒人規定tag要怎麼用 頁面要怎麼排09/03 11:28
15Fcoeric: 簡單一句話:case by case09/03 11:29
[問題] 爬蟲遇到一樣的class如何篩選
[ Python ]4 留言, 推噓總分: +2
作者: skyivan - 發表於 2017/08/31 16:31(8年前)
3Fcoeric: print(data1[2]) 即可09/01 11:02
[問題] json.loads的問題
[ Python ]16 留言, 推噓總分: +3
作者: niburger1001 - 發表於 2017/08/27 02:47(8年前)
2Fcoeric: 看來 是原始資料的問題阿........08/28 08:13
3Fcoeric: 如果推測沒錯的話 2006年1月26 發生恆春大地震08/28 08:22
4Fcoeric: 股市暫停交易(兩天) 沒有資料是很正常的.........08/28 08:23
5Fcoeric: 再者,你是用py3 是否跟decode encode有關?(我是用py2)08/28 08:28
6Fcoeric: 因為我一直覺得 都跑到if(smt != s1):return smt08/28 08:31
7Fcoeric: 沒資料情況,並沒有跳到else:return False08/28 08:31
8Fcoeric: 你把soup.text丟進去smt內時,都已經變成unicode08/28 08:43
9Fcoeric: unicode一直都不會等於utf-8 所以並不會跳到else去08/28 08:44
[問題] 很新的新手
[ Python ]22 留言, 推噓總分: +3
作者: kittor - 發表於 2017/08/15 09:29(8年前)
2Fcoeric: 我猜,例如:if=>如果 else=>其他 when=>當08/15 10:02
19Fcoeric: 將近一年前,我就是想去把線上看的漫畫抓回來看08/17 10:10
20Fcoeric: 我不喜歡還要等網頁在那邊換頁讀取的時間08/17 10:11
21Fcoeric: 完成後,練就了一些爬蟲皮毛.....08/17 10:11
[問題] 在無網路電腦安裝模組
[ Python ]4 留言, 推噓總分: +1
作者: gecer - 發表於 2017/08/14 22:29(8年前)
1Fcoeric: 新手表示:應該是ok的~~就怕有漏...08/14 22:31
[問題] 如何把整份文件 ASCII轉UTF-8?
[ Python ]9 留言, 推噓總分: +2
作者: opengood5566 - 發表於 2017/08/11 22:32(8年前)
2Fcoeric: read write08/11 22:54
[問題] 讀取檔案後使用正規表示法將字串列出
[ Python ]18 留言, 推噓總分: +3
作者: schedule6666 - 發表於 2017/08/08 20:03(8年前)
7Fcoeric: 你從txt讀到的是一整串的字串,先把他變成list吧.....08/09 10:19
8Fcoeric: 你要直接變成字串,用re去找也ok08/09 10:20
9Fcoeric: text=text.split() #會變成list08/09 10:22
10Fcoeric: 如果你只是單純要抓到email,直接轉成字串 用findall找08/09 10:27
11Fcoeric: 如果還要針對每一個email做動作,先把它切開成list08/09 10:28
12Fcoeric: 才方便做後續動作....否則,你findall以後,要再做一次for08/09 10:28
16Fcoeric: fp.readlines() 會多個很討厭的\n,在做資料處理時08/09 23:11
17Fcoeric: 我很討厭中間多一堆沒必要的東西,例:\n \t 之類的08/09 23:11
18Fcoeric: 修正上面說的,我會選擇使用text=text.split('\n')08/09 23:12
[問題] 用beautifulsoup抓網頁中的表格
[ Python ]15 留言, 推噓總分: +1
作者: cawaiilulu - 發表於 2017/08/04 03:50(8年前)
4Fcoeric: 樓上的湯被偷了........08/04 11:14
5Fcoeric: pandas很強,但也很雞肋 遇到一些很亂的網頁時08/04 12:07
6Fcoeric: 所要的資訊盡亂塞在表格很奇怪的地方 而且還是分開的08/04 12:07
7Fcoeric: 我就放棄pandas,改回歸原始的美麗的湯08/04 12:08
8Fcoeric: 不過,用美麗的湯,也是得突破千萬難關 才有辦法抵達08/04 12:09
9Fcoeric: 就是同你說的 ("div", {class}:...08/04 12:09
10Fcoeric: 昨天在撈統聯客運的訊息時,差點沒吐血........08/04 12:10
11Fcoeric: 就你說的 一樣是看html找標籤08/04 13:07
12Fcoeric: 按F12 進到開發人員模式去看08/04 13:11
[問題] 爬蟲抓不到href
[ Python ]3 留言, 推噓總分: +1
作者: LaughPoint - 發表於 2017/07/27 17:30(8年前)
3Fcoeric: i.find('a') 改成i.a即可07/27 22:59