【生命科学】トランスクリプトーム【用語解説】

生命科学

トランスクリプトーム(transcriptome)は、ある時点における細胞や組織の全遺伝子についてのmRNA量のことです。

意義

細胞の状態はゲノムだけでは決まりません。機能する実体であるタンパク量が細胞の状態や機能を決定します。そのため、全てのタンパク質の量であるプロテオームの測定が重要です。

しかしながら、プロテオームの測定には時間と労力がかかるため、しばしば代わりにトランスクリプトームが測定されます。mRNA量とタンパク量は必ずしも比例しませんが、おおまかには相関しています。

なお、RNA-Seqを応用したリボソームプロファイリングと呼ばれる実験では、各遺伝子mRNA上のリボソームの位置と数を決定することができ、リボソーム数を考慮することでタンパク量を精度良く推定することができます。

実験手順

トランスクリプトームを測定するには一般的に次の手順を踏みます。

  • 1. まず、試料(細胞や組織)からRNAを分離・精製します。このとき、必要に応じてmRNAのみを選択するときもあります。
  • 2. 次に、RNA逆転写酵素を用いてcDNA(complementary DNA)に変換する等をしてライブラリーを調製します。
  • 3. ライブラリーを次世代シーケンサでシーケンシング(配列決定)する、または、DNAマイクロアレイで定量します。

解析手順

次世代シーケンサで測定したトランスクリプトームを解析するには一般的に次の手順を踏みます。

  • 1. 次世代シーケンサが出力する情報はmRNA断片に由来するリードで、これはFASTQファイルに記載されています。解析において最初にすべきことはFASTQファイル内に記載されたリードのクオリティチェックです。これにはTrimmomaticなどのツールが利用されます。
  • 2. クオリティチェックをパスしたリードをレファレンスゲノム配列にマッピングします。レファレンスゲノムの情報はEnsembl等から入手できます。マッピングをするツールは多数あり、例えばBWA、Bowtie2、STAR、HISAT2などがあります。
  • 3. 各遺伝子上にマッピングされたリード数をカウントします。ゲノム上の遺伝子の位置を記したファイルはGFFあるはGTFファイルであり、こちらもEnsembl等から入手できます。GFFあるいはGTFを用いてリード数をカウントするツールにはSubread等があります。
  • 4. サンプル間でmRNA量が有意に異なる遺伝子を調べます。検定をするツールも多数あり、例えば edgeRやDESeq2等があります。検定結果はVocano Plot等で可視化されます。Volcano Plotでは横軸に発現量の比の$\log_2$をとった値を、縦軸に$\log_{10} (\text{P-Value})$を取った値をプロットします。

RNA-SeqとDNAマイクロアレイ

トランスクリプトームの解析方法として主に用いられるのが、RNA-SeqDNAマイクロアレイです。

RNA-Seqは高速な塩基配列情報を取得するための手法であり、非常に高い解像度と感度でトランスクリプトームを評価することが可能です。これにより、遺伝子発現量だけでなく、新規転写産物の同定や転写開始位の選択、スプライシングパターンの変化などの情報も得られます。

一方、DNAマイクロアレイ遺伝子の発現プロファイルを一度に多数解析するための手法で、特定の遺伝子群の発現差を比較したい場合や、大規模なスクリーニングが必要な場合に有用です。

歴史と経緯

トランスクリプトーム解析の歴史は比較的新しく、1990年代後半に進歩したシーケンス技術を背景に発展してきました。当初はDNAマイクロアレイによる遺伝子発現解析が主流でしたが、次世代シーケンシング技術の発展とともにRNA-Seqが主流となりました。

トランスクリプトームの応用

トランスクリプトームを複数のサンプルで比較してサンプル間の差異を説明する重要な遺伝子を見出す解析や、シングルセルレベルでトランスクリプトームを決定して新たな細胞集団を調べる解析などが行われます。

参考書籍

バイオ実験基本セット

バイオ実験イラストレイテッド

生命科学基礎セット

生命科学用語解説
スポンサーリンク
猫森ひなたをフォローする
バイオインフォの森

コメント