Re: [問題] 讀入字串之後搜索並列印該行
※ 引述《Bedouine (ji )》之銘言:
: ※ 引述《Arton0306 (Ar藤)》之銘言:
: : 基因庫抓出來的 ">"應該是固定當做一筆資料一個
: : 不知你為什麼要用raw_input
: : 要用這個就用alist.index找 或是if ">" in astring
: 我也是初學者
: 我之前寫過類似的東西
: 我覺得一定有更好的方法
: 我把input 存在 list 裡面用
: alist = file("input.txt", "r").readlines()
: start_number = alist.index('>')
: 然後下一行就是 seq = alist[start_number+1]
: 拋磚引玉一下
: 請高手提供更聰明的方法
: : 只是>應該都在第一位吧 而且一筆資料就只有一個>
: : 我以前遇到的是這樣
: : 我是直接讀檔 f.read().split(">")
: : 這樣就把每一筆基因資料拆開了
可以用regular expression:
import re
example_input = """>gi|123456|gb|NC_111.3|Homo sapiens silly sequence
AGGTGGCCAAAACTCGTCTT
>asdfsadfsadfsadf
AGGGGGGGG"""
matches = re.finditer("^>(.*)$\n^(.*)$", example_input, re.MULTILINE)
for match in matches:
print match.group(1), match.group(2)
執行結果:
gi|123456|gb|NC_111.3|Homo sapiens silly sequence AGGTGGCCAAAACTCGTCTT
asdfsadfsadfsadf AGGGGGGGG
--
http://blog.nigelliang.com
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 50.46.147.226
※ 編輯: liangjr 來自: 50.46.147.226 (03/21 15:45)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):