【備忘録】HISAT2の準備【RNA-Seq】

RNA-Seq

RNA-Seqデータ解析などで用いる HISAT2 のインストール方法と使い方についてメモします。

ダウンロード

こちらから「Binaries」の「Version: HISAT2 2.2.1」をクリックし、「Version: HISAT2 2.2.1」の「Linux_x86_64」の横にある「https://cloud.biohpc.swmed.edu/index.php/s/oTtGWbWjaxsQ2Ho/download」をクリックしてダウンロードします。

インストール

解凍します。

$ unzip hisat2-2.2.1-Linux_x86_64.zip

解凍して得られたフォルダの中に、hisat2hisat2-buildがあり、これらをそのままコマンドとして使うことができます。

インデックスの作成方法

インデックスの作成は以下のように行います。

Hisat2_build=/home/neko/bin/hisat2-2.2.1/hisat2-build
Ref=/home/neko/src/Homo_sapiens.GRCh38.dna.toplevel.fa
Index_name=/home/neko/src/Homo_sapiens.GRCh38.dna.toplevel

$Hisat2_build $Ref $Index_name

シングルエンドのマッピング方法

シングルエンドマッピングは以下のように行います。

BASE=/home/neko
fname=$1

Cpu=14

Read=$BASE/fastq_clean
Dir=$BASE/bam

Hisat2=/home/neko/bin/hisat2-2.2.1/hisat2
Ref=/home/neko/src/Homo_sapiens.GRCh38.dna.toplevel.fa
IndexName=/home/neko/src/Homo_sapiens.GRCh38.dna.toplevel

samtools=/home/neko/bin/samtools/samtools

mkdir -p $Dir
$Hisat2 -x $IndexName \
       	-U $Read/$fname.clean.fastq.gz \
		-p $Cpu | $samtools view -Shb - > $Dir/$fname.bam

ペアエンドのマッピング方法

ペアエンドマッピングは以下のように行います。

BASE=/home/neko
fname=$1

Cpu=14

Read=$BASE/fastq_clean
Dir=$BASE/bam

Hisat2=/home/neko/hisat2-2.2.1/hisat2
Ref=/home/neko/src/Homo_sapiens.GRCh38.dna.toplevel.fa
IndexName=/home/neko/src/Homo_sapiens.GRCh38.dna.toplevel

samtools=/home/neko/bin/samtools/samtools

mkdir -p $Dir
$Hisat2 -x $IndexName \
       	-1 $Read/${fname}_paired_1.fq \
	-2 $Read/${fname}_paired_2.fq \
	-p $Cpu | $samtools view -Shb - > $Dir/$fname.bam

コメント