Re: [問題]有關資料擷取部分的一個小問題
※ 引述《anysomething (努力一點比在實在!)》之銘言:
: ※ 引述《LinusChen (騙自己)》之銘言:
: : 我的做法是直接判斷該行是否是 ">"開頭, 不是就直接輸出...
: 謝謝LinusChen提供的建議,判斷">"的部分我不太會寫
: 現在有一個問題是,我是要
: >ENSP00000332127
: MGLLAFRDVALEFSPEEWECLDPAQRSLYRDVMLENYRNLISLGEDSFNMQFLFHSLAMS
: KPELIICLEARKEPWNVNTEKTARHSVLSSYLTEDILPEQGLQVSFQKVMLRRYERCCLE
: KLRLRNDWEIPCEDVLASPLPSAMILSFLRPPQKQKHVKPTEPIQSKTLQWL
試試看這個可不可以用
open (IN, 'X:\filename.txt');
while ($line = <IN>){
chomp($line);
if ($line=~ /^>(ENSP.*?)\s/) {
$ENSP = $1;
open (OUT, ">>$ENSP.fasta");
print OUT ">$ENSP\n";
}else{
print OUT "$line\n";
}
}
close IN;
close OUT;
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.104.147.233
討論串 (同標題文章)