今天画单细胞基因表达量的一个问题。(一)

-Tycoon 20240315 (转载请留言说明)

今天下午画基因表达量在细胞类型表达量变化的时候,发现了一个问题。

Q:  假设- 细胞类型 CT1 在特定基因 A 上的平均表达量 Avg(CT1_A) [注:表达量为0的细胞也要算进去高于 细胞类型 CT2 在特定基因 A 上的平均表达量 Avg(CT2_A)。那么问题是,当细胞类型的每个细胞取ln( 表达量 + 1) 之后, 细胞类型 CT1 的平均表达量Avg(CT1_ln(A+1) ) 还会 高于 细胞类型 CT2 的平均表达量 Avg(CT1_ln(A+1) )吗?

 

好了,说人话吧:

  已知: 细胞类型 CT1 有 m 个细胞,每个细胞类型在特定基因 A 上 的原始表达量分别为:x1, x2, x3, ... xm ;

                   细胞类型 CT2 有 n 个细胞,每个细胞类型在特定基因 A 上 的原始表达量分别为:y1, y2, y3, ... ym ; 

咋眼一看,好像是成立的,但好像又不成立。似乎和两种细胞类型的细胞数目m,n有很大的关系, 或者说大部分的情况是成立的,今天就碰到了不成立的时候。

具体解函数等有时间去解决下,我想有一种情况可能是:

当细胞类型 CT1 的细胞数目比较多,且大部分细胞在A 基因上表达量为0或者是低表达;反观细胞类型CT2 细胞数目比较少,且大部分细胞在基因A上都是高表达的时候,它们在ln(X+1) 的时候,CT1变换后的平均表达量就会被CT2 超越。也就是说,这个公式会缩小两个细胞类型平均表达量的差距,甚至大小关系会被逆转!

当然这是一种猜测,具体的情况,等有时间好好分析下那个公式。

 

热门相关:不负荣光,不负你   大唐扫把星   校花之高手无敌   天龙剑尊   赠我深爱如长风