Fråga:
Hur man beräknar chansen att inte upptäcka en gen med tanke på detektionsgränsen för ett protokoll
gc5
2017-12-19 06:24:43 UTC
view on stackexchange narkive permalink

I Shapiro et al., när man diskuterar förlust av molekyler som källa till fel i encells-sekvensering, står det att:

En annan källa till fel är förluster, som kan vara allvarliga. Detektionsgränsen för publicerade protokoll är $ 5 $ - $ 10 $ molekyler av mRNA. Om det, som verkar troligt, detektionsgränsen i första hand bestäms av förluster under provberedningen, skulle detta indikera att $ 80 $ - $ 90 \% $ av mRNA förlorades. Eller, för att uttrycka det tvärtom, en förlust på $ 90 \% $ leder till en chans på ungefär $ 50 \% $ att inte upptäcka en gen som uttrycks på en nivå av sju mRNA-molekyler (från binomialfördelningen).

Hur beräknas denna sannolikhet med binomialfördelningen? Jag trodde att $ 90 \% $ förlust motsvarar $ 5 $ detekterade molekyler, och jag antar att $ k = 7 $ för binomialberäkningen, men jag kan inte gå längre.

Ett svar:
Devon Ryan
2017-12-19 14:10:58 UTC
view on stackexchange narkive permalink

En 90% förlust kan omformuleras som en 10% chans att upptäcka något. Så vad vi vill hitta är sannolikheten att detektera 0 molekyler, när vi börjar med 7 och har 10% sannolikhet för framgång. En gång kan göra det i R enligt följande:

  > pbinom (0, 7, 0.1) 0.4782969  

Så ~ 50%, som de angav. Jag misstänker att en del av förvirringen härrör från det faktum att detektionsgränsen beror på att gener / transkript som är lågt uttryckta påverkas starkt av denna förlust. Så sannolikheten att detektera en enda molekyl av fyra ursprungliga molekyler (förutsatt 90% mRNA-förlust) är 34%, för 3 molekyler är det 27%, för 2 är det 19% och för 1 är det 10%. Jag tror att tröskeln på 5 nämns mer eftersom det är ett trevligt runt antal än det finns något särskilt annorlunda för att detektera en gen med 4 mot 5 molekyler (34 mot 41% sannolikhet).

Jag läste igen ditt svar för att förstå den första meningen. Om jag förstod rätt händer kartläggningen från $ 90 \% $ förlust till $ 10 \% $ chans och beräknar sannolikheten att detektera en enskild molekyl av $ 1 $ originalmolekyl. Rätt?
Korrekt, eftersom det finns 90% förlust av all signal, är det 10% sannolikhet att detektera en viss molekyl.
Detektering av nollmolekyler av 7 kan omformuleras så att den inte detekterar en molekyl, 7 gånger oberoende. Sannolikheten för detta är 0,9 till kraften 7. Python säger till mig (`0,9 ** 7`) att detta är 0,4782969. Det är nog vad modelliseringen i termer av binomial fördelning betyder, men för mig är det mycket lättare att förstå i termer av denna mycket grundläggande sannolikhetsberäkning.


Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...