【Python】Fisherの正確確率検定【scipy】

備忘録

1. 理論

例として、全タンパクを化合物 iの標的であるかという観点、Pathway jの構成タンパクであるという観点から以下のような分割表を作成することを考えます。

タンパク (N)化合物 i合計
含まれない含まれる
Pathway j含まれるaba+b
含まれないcdc+d
合計a+cb+da+b+c+d=N

合計部分を固定した場合、上記のような表が得られる確率は超幾何分布に従います(詳しくはこちらの記事)。

具体的には以下のようにしてpijを計算できます。

pij=a+cCa×b+dCbnCa+b

2. 分割表を作成する関数

Python

3. 分割表から正確確率検定のp値/オッズ比を返す関数

Python

4. 使用例

任意の組合せに対してFisherの正確確率検定を実施。

Python

コメント