Jag skulle vilja ändra några referensutskrifter från Ensembl ( D. melanogaster ) för att införa en kontrollerad frekvens av slumpmässiga fel i sekvenserna. Tanken skulle vara att införa slumpmässiga bassubstitutioner i dessa sekvenser, inga indelar för nu, för jag skulle vilja behålla transkriptionssekvenslängden som den är i referensen.
Felhastigheten per transkript kommer att bestämmas enligt en felprofil beräknad från en extern uppsättning RNA-seq-läsningar (t.ex. genereras med ONT MinION)
Syftet med detta modifiering skulle vara att skapa ett grovt riktmärke för prestanda hos aligners att använda över transkript från skarvläsningar (rna-till-genom), aka med mer än ett exon. för detta ändamål?