probeset till probeset mappningar mellan Affymetrix arrays

neilfws

2017-05-19 06:18:14 UTC

view on stackexchange narkive permalink

Om din fråga är: kan probeset-ID: n från olika plattformar mappas till varandra på liknande sätt som att mappa probesets till gener, så är svaret: Ja. Med BioMart kan du kartlägga nästan allt som har ett ID till allt annat som har ett ID.

Du kan använda BioMart antingen via webbgränssnittet eller programmatiskt. En kort guide till att använda webbgränssnittet för att kartlägga HG U133 Plus 2 till HuGene 1.0:

Gå till startsidan
Välj H sapiens Ensembl - gener för din databas; Mänskliga gener (GRCh38.p10) för din dataset
Klicka på filter i den vänstra kolumnen
Expandera "REGION", bläddra ner till GENE och välj "Mata in microarray-sonder / probesets ID lista [Max 500 rekommenderas] "
Välj AFFY HG U133 PLUS 2 sond-ID (er) och antingen kopiera / klistra in eller ladda upp en lista, en per rad
Klicka på Attribut till vänster -handkolumn
Bläddra igenom, avmarkera vad du inte vill se och välj vad du gör, till exempel Gene Stable ID, AFFY HuGene 1 0 st v1 probe och AFFY HG U133 Plus 2 probe
Klicka äntligen på "Resultat" i menyn högst upp i den vänstra kolumnen

Och du bör se ett resultat som detta (du Du måste klicka på knappen "Resultat").

Du bör inte förvänta dig att det finns en en-till-en-mappning av två skäl:

Gener har flera transkript och probesets mappas till varje transkript
Vissa transkript har mer än en probeset: i detta fall mappar HuGene ID 8002301 och 8002303 till transkript för denna gen

Slutligen: här är ett programmatiskt exempel som använder R / BioMart:

  biblioteket (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") resultat <- getBM (attribut = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filter = "affy_hg_u135" .hs) resultat ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at

rmflight

2017-05-19 06:53:56 UTC

view on stackexchange narkive permalink

Istället för biomaRt är det också möjligt att använda de mappningsdatabaser som är inbyggda i Bioconductor själv och kartlägga från probe till gen och sedan från gen till probe i den andra. Någon R-kod för att konvertera mellan hgu133 och hgu95 med samma sond-ID som tillhandahålls i en annan:

  bibliotek (hgu133plus2.db) bibliotek (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- välj (hgu133plus2.db, tangenter = query_probe, kolumner = "ENSEMBL") ensembl_hgu95 <- välj (hgu95av2.db, tangenter = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", kolumner = "PROBEID") dplyr :: inner_join (h_gugu) , av = "ENSEMBL", suffix = c (". 133", ".95"))

rmflight

2017-05-19 06:57:32 UTC

view on stackexchange narkive permalink

Andra svar förklarar varför det kanske inte finns en till en kartläggning mellan sonderna.

AbsID-databasen gör konvertering baserat på att kartlägga probsekvenserna till en genombyggnad, och bestämmer sedan mappningar baserat på överlappande genominriktningskoordinater. Detta är verkligen användbart om du vill vara säker på att två sonder faktiskt troligt mäter samma transkript.

Det är dock beroende av att båda sonderna anpassar sig till genomet.

Ansvarsfriskrivning: Jag arbetade i gruppen som tillhandahåller AbsID-mappningsverktyget.