Intuitiv förklaring av GSVA-analys

Fråga:

Intuitiv förklaring av GSVA-analys

J. Doe

2018-03-11 02:33:00 UTC

view on stackexchange narkive permalink

Jag försöker förstå hur GSVA-analysen fungerar bakom kulisserna. Och jag undrade om det finns något sätt att förstå det mer intuitivt hela processen.

Så först enligt papper det börjar med att utvärdera om en gen i uttrycks starkt eller lågt i prov j i samband med provpopulationens fördelning. De använder dessa kärnuppskattningar av kumulativa densitetsfunktioner för att transformera de initiala värdena så att de inte påverkas av de problematiska intensiteterna.

Efter denna "transformation" och en efterföljande normalisering beräknar GSVA berikningsresultaten med Kolmogorov-Smirnov (KS) som slumpmässigt promenadstatistik .

Som jag vet kollar Kolmogorov-Smirnov efter skillnader i distributioner. Vilka distributioner kontrollerar den? Gene-set är mot alla andra gener? Och vilken roll har slumpmässig promenad?

Finns det något intuitivt sätt att förstå denna typ av Kolmogorov-Smirnov (KS) som en slumpmässig statistik? Hur fungerar det egentligen? Vilken är noll och vilken alternativ hypotes i så fall?

Ett svar:

llrs

2018-03-14 22:08:33 UTC

view on stackexchange narkive permalink

Den mest intuitiva förklaringen förklaras också i bakgrundssektionen:

Konceptuellt kan denna metod förstås som en förändring i koordinatsystem för genuttrycksdata, från gener till genuppsättningar.

Vilket jag tror det förklaras i figur 1 i papperet, vilket också är en av de mest informativa jag hittade om metoderna för en algoritm ¹. Jag ska använda den för att förklara vad som händer.

Anpassa en fördelningsfunktion per gen

För varje genuttryckningsprofil ... utförs en icke-parametrisk kärnauppskattning ... -funktion.

Jag kan inte ge mer detaljer eftersom jag inte förstår det fullständigt

Sedan normaliseras de för att göra raderna symmetriska runt noll

Det är en inbyggd formel mellan ekvationerna 2 och 3.
Kolmogorov-Smirnov som slumpmässig gångstatistik tillämpas på de normaliserade distributionerna av kärnuppskattningar.

Vilka två distributioner jämför den? Genen i en genuppsättning och alla andra (men jag är inte helt säker)

Rollen av slumpmässig promenad förklaras lite senare från ditt citat:

[den slumpmässiga gången] producerar en fördelning över generna för att bedöma om generna i genmängden är mer benägna att hittas i endera svansen av rangfördelningen

Som senare används för att beräkna anrikningspoängen genom att se den maximala avvikelsen från noll, eller genom att summera de största och lägsta avvikelserna.

För att ta itu med några andra frågor:

GSVA beräknar provmässiga anrikningsresultat för genuppsättningar som en funktion av gener i och utanför genen set, analogt med ett konkurrenskraftigt genuppsättningstest

1: Försök hitta vilka kopplingar och approximationer som görs inom limma

ⓘ

Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.

about - legalese

Loading...