Re: [問題] txt內容切割加總

看板Python作者 (會喵喵叫的大叔)時間9年前 (2014/10/10 00:37), 9年前編輯推噓2(208)
留言10則, 4人參與, 最新討論串2/8 (看更多)
※ 引述《PTT007 (優質單身好男人)》之銘言: : 如果我有一個txt內容如下: : 0.01 : 0.02 : 0.03 : 0.09 : 1.03 : 1.02 : 1.01 : 我想將 0.X 和 1.X 各自累加起來 : 輸出結果為 0.15 和 3.06 : 我目前的做法是 : number_of_line = len(txt) # txt總共幾行 : result = 0 : for i in range(2): : for j in range(number_of_line): : if i == int(current_row_value): : result += current_row_value : print result : result = 0 : 但我這樣寫,資料量多的話就會跑很久 : 請問有其他較好的方法嗎 : 謝謝 txt = open("input.txt") s = txt.readline() # 先讀一行進來 result1 = 0 # 一次就可以做完,loop兩次幹嘛? result2 = 0 while s != '': # 檢查檔案尾 if s[0] == '0': # 如果你很確定只有 0 和 1 需要分開的話... result1 += float(s) else: result2 += float(s) s = txt.readline() # 進下一行 print(result1, result2) -- 你喜歡下列哪一個學妹? 1. 雖然吉他彈得比學姊好,在樂團裡卻甘願只當個副手 2. 擁有夏天一到必然黑化的體質,連同學好友都認不出來 3. 雖然嘴巴很嚴厲,但只要用甜點就可以收買,尤其喜歡鯛魚燒 4. 討厭學姊給她取的奇怪綽號,卻給小貓取了同一個名字 5. 極力維持自己嚴肅的形象,但是一戴上貓耳就會不自覺喵喵叫 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.110.141.102 ※ 文章網址: http://www.ptt.cc/bbs/Python/M.1412872665.A.EF6.html

10/10 00:45, , 1F
不只0和1,還會有23456...等
10/10 00:45, 1F
那就多設幾個 result23456...,下面多幾個 elif 啊! 不過還有更簡單的。 先把上面的 result1, result2 改成 result = [0] * 10 下面的 while loop 改成 while s != '' result[int(s[0])] += float(s) s = txt.readline() 唔,這樣比原來還更簡潔耶。 ※ 編輯: wohtp (123.110.141.102), 10/10/2014 00:58:33 ※ 編輯: wohtp (123.110.141.102), 10/10/2014 01:00:54

10/10 01:16, , 2F
可能會有上百個,不可能設這麼多elif吧QQ
10/10 01:16, 2F

10/10 01:20, , 3F
下面那方法我再看一下 感謝~
10/10 01:20, 3F
你只說 0 和 1,我就只分 0 和 1;你只說有23456...,我就只分個位數。 不講清楚誰知道你需要什麼 -_- ※ 編輯: wohtp (123.110.141.102), 10/10/2014 01:28:17

10/10 01:29, , 4F
呃 我後面不是有打....嗎 就表示那會延伸下去阿 =.=
10/10 01:29, 4F

10/10 01:33, , 5F
另一個方法剛試了OK~感謝您~
10/10 01:33, 5F

10/10 12:06, , 6F
那就用 split() 啊,第一個元素當做 dict 的 key
10/10 12:06, 6F

10/11 00:57, , 7F
這個方法比較好
10/11 00:57, 7F

10/11 01:00, , 8F
雖然需要知道值域範圍 跟有可能浪費 memory 但應不是
10/11 01:00, 8F

10/11 01:00, , 9F
問題
10/11 01:00, 9F
用dict不需要知道值域範圍吧,看到幾個加幾個key進去就是了。 以下是大豬大豬大的建議: result = {} # 空的 dict s = txt.readline() while s != '': intPart = s.split(',')[0]    # 把整數部分拉出來 if intPart in result: # 測看看是否已經有這一項了 result[intPart] += float(s) # 有就直接加在一起 else: result[intPart] = float(s) # 沒有的話要多添這項 s = text.readline() 只有 0 和 1 有只有 0 和 1 的寫法,只有個位數有只有個位數的寫法, 中間不跳號有中間不跳號的寫法,資料有沒有排序也當然有差。 現在這個是最一般,什麼(abcd.wxyz)這種形式丟進去都能處理的程式。 可是也必然比較大比較慢。 ※ 編輯: wohtp (123.110.141.102), 10/11/2014 01:33:30 ※ 編輯: wohtp (123.110.141.102), 10/11/2014 01:33:49 ※ 編輯: wohtp (123.110.141.102), 10/11/2014 01:34:54

10/11 02:25, , 10F
split應該是. 另外result = defaultdict(float)更方便
10/11 02:25, 10F
文章代碼(AID): #1KDhdPxs (Python)
討論串 (同標題文章)
文章代碼(AID): #1KDhdPxs (Python)