Fråga:
probeset till probeset mappningar mellan Affymetrix arrays
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Jag är intresserad av att identifiera mappningar mellan olika typer av Affymetrix-matriser. Jag är medveten om att kartläggningar mellan gen och probeset kan extraheras med hjälp av Ensembls Biomart-databas.

  Ensembe-gen-ENSG00000181019 kartläggs till 1. AFFY HG-U133_Plus_2s 210519_s_at2. AFFY HuGene-1_0-st-v1's 8002303  

Finns det något sätt att extrahera mappningar av probeset-ID mellan två matriser (t.ex.: HG-U133_Plus_2, HuGene-1_0-st-v1)?

  t.ex.: 210519_s_at och 8002303  
Är din fråga hur man hittar överlappande sonduppsättningar mellan matriser? Eller hur man identifierar sonduppsättningar i allmänhet? Det är inte klart.
Jag har lagt till ett exempel. Är det vettigt nu?
Så i princip kan du hämta två gen-id-mappningar från Ensembls Biomart. Korrekt? Vad hindrar dig från att gå med i dessa två tabeller baserat på Ensembl-gen-id? Du kan använda 'slå samman' funktion i R eller 'JOIN' uttalande i SQL.
@IakovDavydov eller en Unix `join 'skulle också fungera
Problemet är: Alla mappningar är inte exakt en-mot-en. Antingen probesets för HG-U133_Plus_2 eller HuGene-1_0-st-v1-mappning till en ensembl-gen-id.
@Prradep om du förklarar vad det bakomliggande problemet är som du försöker lösa, kan vi kanske erbjuda bättre råd
Du bör inte nödvändigtvis förvänta dig att se en-till-en-mappningar, se mitt svar nedan.
Tre svar:
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Om din fråga är: kan probeset-ID: n från olika plattformar mappas till varandra på liknande sätt som att mappa probesets till gener, så är svaret: Ja. Med BioMart kan du kartlägga nästan allt som har ett ID till allt annat som har ett ID.

Du kan använda BioMart antingen via webbgränssnittet eller programmatiskt. En kort guide till att använda webbgränssnittet för att kartlägga HG U133 Plus 2 till HuGene 1.0:

  1. Gå till startsidan
  2. Välj H sapiens Ensembl - gener för din databas; Mänskliga gener (GRCh38.p10) för din dataset
  3. Klicka på filter i den vänstra kolumnen
  4. Expandera "REGION", bläddra ner till GENE och välj "Mata in microarray-sonder / probesets ID lista [Max 500 rekommenderas] "
  5. Välj AFFY HG U133 PLUS 2 sond-ID (er) och antingen kopiera / klistra in eller ladda upp en lista, en per rad
  6. Klicka på Attribut till vänster -handkolumn
  7. Bläddra igenom, avmarkera vad du inte vill se och välj vad du gör, till exempel Gene Stable ID, AFFY HuGene 1 0 st v1 probe och AFFY HG U133 Plus 2 probe
  8. Klicka äntligen på "Resultat" i menyn högst upp i den vänstra kolumnen

Och du bör se ett resultat som detta (du Du måste klicka på knappen "Resultat").

Du bör inte förvänta dig att det finns en en-till-en-mappning av två skäl:

  • Gener har flera transkript och probesets mappas till varje transkript
  • Vissa transkript har mer än en probeset: i detta fall mappar HuGene ID 8002301 och 8002303 till transkript för denna gen

Slutligen: här är ett programmatiskt exempel som använder R / BioMart:

  biblioteket (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") resultat <- getBM (attribut = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filter = "affy_hg_u135" .hs) resultat ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

Istället för biomaRt är det också möjligt att använda de mappningsdatabaser som är inbyggda i Bioconductor själv och kartlägga från probe till gen och sedan från gen till probe i den andra. Någon R-kod för att konvertera mellan hgu133 och hgu95 med samma sond-ID som tillhandahålls i en annan:

  bibliotek (hgu133plus2.db) bibliotek (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- välj (hgu133plus2.db, tangenter = query_probe, kolumner = "ENSEMBL") ensembl_hgu95 <- välj (hgu95av2.db, tangenter = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", kolumner = "PROBEID") dplyr :: inner_join (h_gugu) , av = "ENSEMBL", suffix = c (". 133", ".95"))  
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Andra svar förklarar varför det kanske inte finns en till en kartläggning mellan sonderna.

AbsID-databasen gör konvertering baserat på att kartlägga probsekvenserna till en genombyggnad, och bestämmer sedan mappningar baserat på överlappande genominriktningskoordinater. Detta är verkligen användbart om du vill vara säker på att två sonder faktiskt troligt mäter samma transkript.

Det är dock beroende av att båda sonderna anpassar sig till genomet.

Ansvarsfriskrivning: Jag arbetade i gruppen som tillhandahåller AbsID-mappningsverktyget.



Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...