Fpkm是什麼意思

FPKM(Fragments Per Kilobase of transcript per Million mapped reads)是一種用於衡量轉錄本表達水平的指標,常用於RNA-seq數據分析。它是對RPKM(Reads Per Kilobase of transcript per Million mapped reads)的一種改進,考慮了轉錄本的長度以及測序深度。

在RNA-seq實驗中,reads是根據基因模型(gene model)被映射到基因組上的。FPKM值表示每千 bases 的轉錄本上平均有多少個片段(fragments),這些片段是從一百萬個映射的reads中計算出來的。FPKM值可以用來比較不同基因的表達水平,也可以用來分析不同條件下的基因表達變化。

計算FPKM值需要以下幾個步驟:

  1. 計算每個基因的reads數。
  2. 計算每個基因的片段數(fragments),通常認為一個雙端測序的read對代表一個fragment。
  3. 計算每個基因的表達量,即每千 bases 的片段數。
  4. 將這個值除以該基因的測序深度(即一百萬個reads),得到FPKM值。

FPKM值是一個無量綱的值,它可以消除基因長度和測序深度的影響,使得不同基因的表達量可以進行直接比較。然而,FPKM值也存在一些局限性,例如它假設每個reads都是均勻分布的,而且它不考慮reads的定位信息。