Fråga:
Hur uppstår PCR-dubbletter och varför är det viktigt att ta bort dem för NGS-analys?
gc5
2017-11-16 22:55:21 UTC
view on stackexchange narkive permalink

Jag försöker förstå PCR-dubbletter i NGS-analyser (faktiskt helgenom). Jag sökte och det bästa svaret jag hittade finns i den här bloggen.

Men jag förstår inte om jag förstod hur PCR-dubbletter uppstår korrekt eftersom jag inte kan se problemet med att ha dem i nedströmsanalysen - bortsett från beräkningsproblem, dvs onödig redundans.

Om jag förstod rätt uppstår PCR-duplikat under biblioteksförberedelser när PCR förstärker fragmenten med adaptrar. I det här fallet, om du har dubbletter av fragment, kommer du att förstärka några av dem två gånger eller mer.

Men när du gör kartläggningen bör de falla på samma region, troligen minska kartläggningens kvalitet (eftersom de ökar samförståndet om en specifik sekvens, som kunde ha varit föremål för sekvenseringsfel). Men bortsett från det borde du ha samma kartläggning med avseende på kartläggningen där dubbletter tas bort, men med minskad kvalitet.

Är kvalitetsproblemet den verkliga anledningen till att ta bort PCR-dubbletter eller finns det något som jag saknas?

Två svar:
Daniel Standage
2017-11-16 23:22:54 UTC
view on stackexchange narkive permalink

I alla situationer där täckningsdjup är en viktig faktor, blåser PCR-duplikat felaktigt upp täckningen och kan, om den inte tas bort, ge en illusion av högt självförtroende när den inte är där. , överväga följande hypotetiska scenario.

  * TTTCATACTAACTAGCCTGCGGTCTGTGTTTCCCGACTTCTGAGTCATGGGGTTTCAATGCCTATAGATTC .......................... C. ............................ ............. T ........ ...... .................. C ......... ................ ............ ............................ .......... .................. ..... C ...................... ..C. ........................  

Den markerade positionen har en täckning på 9 (9 överlappande läsningar), 4 varav antyder närvaron av en alternativ allel. Eftersom dessa 4 läser kartor till olika positioner, är de oberoende observationer som stöder samma förmodade enkelnukleotidvariant (SNV). T i den tredje läsningen kan säkert ignoreras som ett sekvenseringsfel, eftersom det bara visas en gång.

Tänk nu på följande hypotetiska scenario.

  * TTTCATACTAACTAGCCTGCGGTCTGTGTTTCCCGACTTCTGAGTCATGGGGTTTCAATGCCTATAGATTC ............................ ............. T .... .......... .................. C ......... ............ ...... C ......... .................. C ......... ...... ............ C ......... ............................ ............................ ...................... ......  

I det här fallet har den markerade positionen också en täckning på 9, men 7 av dessa läser verkar vara PCR-duplikat. Om vi ​​tar bort dubbletterna har den markerade positionen endast en täckning på 4 och endast en C på den markerade positionen, vilket inte är tillräckligt förtroende för att ringa SNV.

Bästa förklaringen jag har sett hittills
Jag håller med BCArg, mycket enkel och tydlig förklaring. Tack.
user172818
2017-11-16 23:20:58 UTC
view on stackexchange narkive permalink

PCR-polymeraser introducerar fel. När ett fel uppstår under de första förstärkningscyklerna, kommer det att visas i en ganska hög del av DNA-fragment i biblioteket. Efter sekvensering kan samma fel uppstå vid flera läsningar. Om du tar bort PCR-dubbletter när du anropar varianter reduceras alla fel till en läsning. För data med hög täckning kallar du inte felet som en falsk variant. Men om du behåller PCR-dubbletter kan felets flera förekomster få felet att se ut som en riktig variant. Detta är särskilt dåligt för att anropa SNV från orena tumörprover.



Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...