sraファイルをダウンロードする

NCBIなどにアップロードされたfastqファイルは、sraという形式に変換され、保管されています。論文などにアクセッションナンバーが書かれていることが多いのですが、それをググってもなかなかダウンロードするリンクを見つけることが難しいので、コマンドでダウンロードしたほうが簡単です。

ダウンロード方法

例えば、SRR1234567 というIDのsraファイルをダウンロードするとします。ダウンロードの仕方は以下の通りです。
wget ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR123/
SRR1234567/SRR1234567.sra
SRR/のあとは、IDの最初の三桁のディレクトリ、その後はすべてのIDの数字のディレクトリ、その中に、sraファイルがあります。
また、複数のファイルをダウンロードする場合は以下の通りです。例えばSRR1234567~SRR1234570 までのファイルをダウンロードするとします。
for i in {67..70}
do
wget ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR123/
SRR12345$i/SRR12345$i.sra
done

Prefetchでもできるかもしれないけど

sra-toolkitのprefetchでsraをダウンロードできるらしいのですが少なくとも僕はできませんでした一応そのコマンドも書いておきます
#sra-toolkitのインストール
conda install sra-tools

#prefetch
prefetch SRR1234567