学習コース

備忘録

【Python/Pandas】書式設定を制御してExcelに出力【StyleFrame】

本記事では、PythonのライブラリであるpandasからExcelファイルへ出力する際に、セル内改行や行または列の幅などを指定して出力する方法について説明します。1. StyleFrameの準備StyleFrameというライブラリを利用す...
備忘録

【ChEMBL】化合物のIC50/ID50を調べる

本記事では化合物のIC50およびID50をChEMBLから取得する手順を説明します。IC50は化合物の標的タンパクの半分が活性を阻害される化合物の濃度です。ID50は細胞や生物の半分が化合物の毒性によって死ぬ化合物の濃度です。1. ChEM...
備忘録

【Python】デコレータ【時間計測・Try】

本記事では、Pythonのデコレータ(関数の上の行に付与する@から始まる文言)の使用方法について、関数の時間計測やTry構文を例に説明します。1. 時間計測デコレータは@hogeのように宣言された下の行から始まる関数を引数に取り、その関数を...
備忘録

【Python】化合物名からIUPAC名・InChIKey・CAS番号を取得【pubchempy】

本記事では、alanineのような化合物名からIUPAC名などの他の情報を取得する方法を説明します。具体的には以下の内容の取得について取り扱います。synonyms:別名CIDInChIInChIKeycanonical SMILESiso...
備忘録

【Python】混合ガウス分布【scikit-learn】

1. 理論2. 学習2.1. 基本モデルを宣言し、fitでデータを当てはめます。当てはめた後のオブジェクト(gmm)が学習後のモデルです。means_メソッドやbicメソッド、predictを利用して下流の解析に用います。# librari...
備忘録

【Python】Fisherの正確確率検定【scipy】

1. 理論例として、全タンパクを化合物 $i$の標的であるかという観点、Pathway $j$の構成タンパクであるという観点から以下のような分割表を作成することを考えます。全タンパク ($N$)化合物 $i$ に合計含まれない含まれるPat...
pandas

【R】遺伝子IDおよび遺伝子シンボルの相互変換【biomaRt】

遺伝子名のフォーマットはEnsemblやUniProt等のデータベース毎に異なります。例えばARF5は遺伝子シンボルと呼ばれるフォーマットですが、この遺伝子のEnsemblにおける名称はENSP00000000233、UniProt IDに...
備忘録

【備忘録】PythonのSympyで(n元連立)(m次)方程式を解く【代数】

Sympyを用いると方程式を代数的に解いてくれます。本記事では2元連立1次方程式10元連立1次方程式2次方程式(実数解)2次方程式(複素数解)を例に挙げて Sympy の使い方をメモします。SympyのインストールSympyを用いるので、下...
RNA-Seq

【備忘録】RNA-Seqの解析パイプライン【ペアエンド】

ペアエンド の RNA-Seq データ解析のパイプラインをメモします。はじめにLinux OS 上で Shellscript を用いて各種NGS解析ツールを走らせて解析をします。解析内容は以下です。md5sumによるデータの確認Trimmo...
RNA-Seq

【備忘録】RNA-Seqの解析パイプライン【シングルエンド】

Single End の RNA-Seq データ解析のパイプラインをメモします。はじめにLinux OS 上で Shellscript を用いて各種NGS解析ツールを走らせて解析をします。解析内容は以下です。md5sumによるデータの確認T...
スポンサーリンク