作者查詢 / grapherd
作者 grapherd 在 PTT [ Python ] 看板的留言(推文), 共73則
限定看板:Python
看板排序:
全部Gossiping316SuperBike235biker181HatePolitics129DSLR117car100Python73LoL63C_Chat55DigiCurrency43KUAS26Road26V_ScHooL26Kaohsiung24FireEmblem18Japan_Travel9NSwitch8movie7MobileComm6Aviation5creditcard5SENIORHIGH5Stock5joke4Military4NTU4Soft_Job4Baseball3GirlsFront3NBA3Tech_Job3GossipPicket2NTUSA2StupidClown2Test2WomenTalk2Ant1CATCH1graduate1Insurance1iOS1Keelung1LoL_Picket1Militarylife1Nantou1NKFUST1PttCurrent1PublicIssue1PuzzleDragon1sex1YOLO1Zastrology1<< 收起看板(52)
1F→:import glob; html_list = glob.glob("*.htm*")04/11 19:36
2F→:html_list = map(lambda x: open(x), html_list)04/11 19:37
3F→:讀取local的html應該不用用到urllib2, 用open就夠了04/11 19:37
8F→:改用urllib.urlopen就可以了,不過效果跟open是一樣的04/11 22:26
9F→:不知道你是用什麼html parser?04/11 22:28
18F→:這樣當然錯誤了,資料夾內沒有 "*.html"這個檔案啊04/11 23:04
21F→:用最上面的方法,然後把open(x)改成open(x).read()04/11 23:05
23F→:然後 html_list 內的資料就是每一個html file的字串了04/11 23:05
1F推:說到nltk, 昨天在pypi上看到jieba還滿好玩的~04/08 19:24
2F→:pyUnihan:http://ppt.cc/mx8w 從unihan資料庫做的04/05 01:59
3F→:還有看到一個cjklib: http://ppt.cc/RLy~04/05 01:59
38F→:請問各位,如果佈署在DigitalOcean or Linode上面,需要04/16 18:40
39F→:需要設定 iptables 嗎?04/16 18:40
3F→:如果是wxPython, 可以用wxHtmlWindow03/29 17:52
4F→:把report_does_not_hav 放到 nth_element上面看看03/21 22:03
5F→:......兩個函數名稱錯了而已..03/21 22:04
2F→:第一個問題用timer更新, http://ppt.cc/HgRV02/16 11:56
1F推:第一個用'\n'來split,第二個用 ','來split, 寫個函式01/24 20:17
2F→:read_in("test.txt", sep = '\n') read_in(sep=",") 這樣01/24 20:18
1F→:import glob; glob.glob("*.txt")01/09 16:07
3F→:根據Document *1, Python對路徑位置不使用萬用字元,01/09 18:16
4F→:但是 glob 模組調用 fnmatch模組, 所以可以使用萬用字元01/09 18:17
5F→:*1: http://ppt.cc/FNIl, glob: http://ppt.cc/4VJ_01/09 18:19
6F→:fnmatch: http://ppt.cc/fkEt01/09 18:20
1F推:如果要挑戰難題,SPOJ是很好的選擇, http://www.spoj.com01/09 18:23
2F→:支援48種程式語言,包含Python01/09 18:24