SNP calling や RNA-Seqデータ解析などで用いる Trimmomatic のインストール方法と使い方についてメモします。
はじめに
Trimmomatic は Java で書かれているアダプタートリミング/クオリティチェックのツールです。
具体的にはリードの末端から一定数の塩基をトリムしたり、クオリティの基準に満たないリードを除去することができます。
そこで、Trimmomatic による前処理は、マッピング前に実施しておくのがセオリーとなっています。
勿論、シングルエンドリードとペアエンドリードの両方に対応しています。
また、gzip (拡張子 .fq.gz など)や bzip2 (拡張子 .fq.bz2 など)で圧縮されている FASTQ ファイルを展開せずに処理することができます。
インストール方法
Trimmomatic 配布ウェブサイトからバイナリファイル(“Version 0.39: binary, source and manual“の”binary”)をクリックあるいはwgetなどでダウンロードします。
wget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.33.zip unzip Trimmomatic-0.33.zip cd Trimmomatic-0.33 ls LICENSE adapters trimmomatic-0.33.jar
zipを解凍すれば準備完了です。
configureコマンド等によるインストール操作は不要です。
使い方
展開されて得られた trimmomatic-0.33.jar がそのまま使えます。
例えばシングルエンドのfastqについては以下のように使用します。
BASE=/home/neko/rnaseq fname=$1 cd $BASE Cpu=14 # 1. Quality Filtering (Trimmomatic) Min=36 Read=$BASE/fastq Dir=$BASE/fastq_clean Rep=$BASE/reports/main/trimmo Trimmo=/home/neko/bin/Trimmomatic-0.39/trimmomatic-0.39.jar Iclip=/home/neko/bin/Trimmomatic-0.39/adapters/all.SE.fa mkdir -p $Dir $Rep java -jar $Trimmo \ SE -phred33 -threads $Cpu \ -trimlog $Rep/$fname.log \ $Read/$fname.fastq.gz \ $Dir/$fname.clean.fastq.gz \ ILLUMINACLIP:$Iclip:2:30:10 \ MINLEN:$Min
ペアエンドについては以下です。
BASE=/home/neko/rnaseq fname=$1 cd $BASE Cpu=14 # 1. Quality Filtering (Trimmomatic) Min=36 Read=$BASE/fastq Dir=$BASE/fastq_clean Rep=$BASE/reports/main/trimmo Trimmo=/lustre/home/70834888/bin/Trimmomatic-0.39/trimmomatic-0.39.jar Iclip=/lustre/home/70834888/bin/Trimmomatic-0.39/adapters/all.SE.fa mkdir -p $Dir $Rep java -jar $Trimmo \ PE -phred33 -threads $Cpu \ -trimlog $Rep/$fname.log \ $Read/${fname}_1.fq.gz \ $Read/${fname}_2.fq.gz \ $Dir/${fname}_paired_1.fq \ $Dir/${fname}_unpaired_1.fq \ $Dir/${fname}_paired_2.fq \ $Dir/${fname}_unpaired_2.fq \ ILLUMINACLIP:$Iclip:2:30:10 \ MINLEN:$Min
アダプターについて
Trimmomatic の実施に際しては、前節で示したように ILLUMINACLIP によるアダプター配列の指定が必要です。
ライブラリ調製などの方法が特殊である場合、自分でアダプターのfastaファイルを用意する必要があります。
ただし、アダプターのトリミングについて cutAdapat やカスタムスクリプトで実施するのであれば、その限りではありません。
通常のライブラリの際と同じように、Trimmomatic に用意されているアダプターファイルを以下のようにマージして用いて良いでしょう。
cd /home/neko/bin/Trimmomatic-0.39/adapters cat *.fa > all.SE.fa
コメント