【備忘録】Trimmomaticの準備【RNA-Seq】

RNA-Seq

SNP callingRNA-Seqデータ解析などで用いる Trimmomatic のインストール方法と使い方についてメモします。

はじめに

Trimmomatic は Java で書かれているアダプタートリミング/クオリティチェックのツールです。

具体的にはリードの末端から一定数の塩基をトリムしたり、クオリティの基準に満たないリードを除去することができます。

そこで、Trimmomatic による前処理は、マッピング前に実施しておくのがセオリーとなっています。

勿論、シングルエンドリードペアエンドリードの両方に対応しています。

また、gzip (拡張子 .fq.gz など)や bzip2 (拡張子 .fq.bz2 など)で圧縮されている FASTQ ファイルを展開せずに処理することができます。

インストール方法

Trimmomatic 配布ウェブサイトからバイナリファイル(“Version 0.39: binarysource and manual“の”binary”)をクリックあるいはwgetなどでダウンロードします。

wget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.33.zip
unzip Trimmomatic-0.33.zip
cd Trimmomatic-0.33
ls
LICENSE       adapters        trimmomatic-0.33.jar

zipを解凍すれば準備完了です。

configureコマンド等によるインストール操作は不要です。

使い方

展開されて得られた trimmomatic-0.33.jar がそのまま使えます。

例えばシングルエンドのfastqについては以下のように使用します。

BASE=/home/neko/rnaseq
fname=$1

cd $BASE
Cpu=14

# 1. Quality Filtering (Trimmomatic)
Min=36

Read=$BASE/fastq
Dir=$BASE/fastq_clean
Rep=$BASE/reports/main/trimmo

Trimmo=/home/neko/bin/Trimmomatic-0.39/trimmomatic-0.39.jar
Iclip=/home/neko/bin/Trimmomatic-0.39/adapters/all.SE.fa

mkdir -p $Dir $Rep
java -jar $Trimmo \
	SE -phred33 -threads $Cpu \
	-trimlog $Rep/$fname.log \
	$Read/$fname.fastq.gz \
	$Dir/$fname.clean.fastq.gz \
	ILLUMINACLIP:$Iclip:2:30:10 \
	MINLEN:$Min

ペアエンドについては以下です。

BASE=/home/neko/rnaseq
fname=$1

cd $BASE
Cpu=14


# 1. Quality Filtering (Trimmomatic)
Min=36

Read=$BASE/fastq
Dir=$BASE/fastq_clean
Rep=$BASE/reports/main/trimmo

Trimmo=/lustre/home/70834888/bin/Trimmomatic-0.39/trimmomatic-0.39.jar
Iclip=/lustre/home/70834888/bin/Trimmomatic-0.39/adapters/all.SE.fa

mkdir -p $Dir $Rep
java -jar $Trimmo \
	PE -phred33 -threads $Cpu \
	-trimlog $Rep/$fname.log \
	$Read/${fname}_1.fq.gz \
	$Read/${fname}_2.fq.gz \
	$Dir/${fname}_paired_1.fq \
	$Dir/${fname}_unpaired_1.fq \
	$Dir/${fname}_paired_2.fq \
	$Dir/${fname}_unpaired_2.fq \
	ILLUMINACLIP:$Iclip:2:30:10 \
	MINLEN:$Min

アダプターについて

Trimmomatic の実施に際しては、前節で示したように ILLUMINACLIP によるアダプター配列の指定が必要です。

ライブラリ調製などの方法が特殊である場合、自分でアダプターのfastaファイルを用意する必要があります。

ただし、アダプターのトリミングについて cutAdapat やカスタムスクリプトで実施するのであれば、その限りではありません。

通常のライブラリの際と同じように、Trimmomatic に用意されているアダプターファイルを以下のようにマージして用いて良いでしょう。

cd /home/neko/bin/Trimmomatic-0.39/adapters
cat *.fa > all.SE.fa

コメント