Kraken2は、シーケンスデータ(メタゲノムデータなど)を高速に分類するためのツールです。k-mer(短い塩基配列の断片)を利用して、各リードがどの生物種に由来する可能性が高いかを判定します。 ここでは、Kraken2の基本的な使い方について説明します。 1. Kraken2のインストール Kraken2は、Conda(MinicondaやAnaconda)を使って簡単にインストールできます。 conda create -n kraken2 kraken2 conda activate kraken2 また、GitHubからソースコードをクローンしてコンパイルすることも可能です。 git clone https://github.com/DerrickWood/kraken2.git cd kraken2 ./install_kraken2.sh < インストール先のディレクトリ > 2. データベースの準備 Kraken2を使用するには、分類の基準となるデータベースが必要です。Kraken2のチームが提供している標準データベースを利用するか、自分でカスタムデータベースを構築することができます。 標準データベースのダウンロード よく使われるのは、NCBIのRefSeqデータベースに基づいたものです。kraken2-buildコマンドを使用してダウンロードと構築を行います。 まず、ライブラリをダウンロードします。 kraken2-build --download-taxonomy --db < データベース名 > kraken2-build --download-library bacteria --db < データベース名 > --threads < スレッド数 > kraken2-build --download-library archaea --db < データベース名 > --threads < スレッド数 > kraken2-build --download-library viral --db < データベース名 > --threads < スレッド数 > # 必要に応じて他のライブラリも追加 (human, fu...