糞便からのMetatranscriptomeのデータにヒト由来のTranscriptomeがあるか確かめる
Queryとなった、MetatranscriptomeのFastaファイル
Blastでヒットした、おそらくヒトのTrnascriptomeだろうというデータ
参考文献
metatranscriptome of human faecal.pdf
Fastq dataをダウンロード
SRR6451715のみダウンロード
ダウンロード
wget https://ift.tt/2vnzdHf
SRR6451715/SRR6451715.sra
fastq-dump (sra-tools)のインストール
今のバージョンだとなぜかうまくいかない
前のバージョンだとうまくいった
wget http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.6-1/sratoolkit.2.9.6-1-ubuntu64.tar.gz
tar -zxvf sratoolkit.2.9.6-1-ubuntu64.tar.gz
fastq-dumpを使ってSRAデータをfastqに変換
fastq-dump SRR6451715.sra
fastqをfastaに変換
awk '(NR - 1) % 4 < 2' SRR6451715.fastq | sed 's/@/>/' > SRR6451715.fasta
BlastでヒトのReferenceにアノテーション
ヒトのリファレンスをダウンロード
wget https://ift.tt/2tJP5Uh
Blastをかける
blastn -query fasta/$1.fasta -db $2 -out blastn_$1_$2_6_1.blast -outfmt 6 -max_target_seqs 1
結果を見る
Queryとなった、MetatranscriptomeのFastaファイル
grep ">" fasta/SRR6451715.fasta | wc -l
4579924
Blastでヒットした、おそらくヒトのTrnascriptomeだろうというデータ
wc -l blast/out/blastn_SRR6451715_human_genomic_6_1.blast
870749 blast/out/blastn_SRR6451715_human_genomic_6_1.blast
870749/4579924 * 100 = 19 %
つまり19%ぐらいはヒト由来のTranscriptomeである可能性!