Fråga:
Ladda ner flera SRA-filer
user2300940
2017-10-17 00:23:49 UTC
view on stackexchange narkive permalink

Jag vill ladda ner alla SRA-filer från följande projekt. Finns det en metod för att ladda ner alla SRA-filer samtidigt?

Du kan använda R / Bioconductor-paketet [SRAdb] (https://www.bioconductor.org/packages/release/bioc/html/SRAdb.html)
@JohnBlischak Detta kan vara ett svar om det utvidgas och förklarar hur SRAdb hjälper till att svara på frågan
Fem svar:
benn
2017-10-17 12:46:11 UTC
view on stackexchange narkive permalink

En snabb titt på din länk berättar att SRR-numren går från SRR837819 till SRR837856. Du kan använda fastq-dump från sratoolkit och skapa en for-loop runt den i bash.

Något liknande bör fungera:

  för ((i = 19; i < = 56; i ++)) gör fastq-dump --access SRR8378 $ idone  

Efter att ha läst Devon Ryan: s svar, inser jag att du bad om SRA-filer istället för fastq. Detta kan också göras med förhämtning av sratoolkit:

  för ((i = 19; i < = 56; i ++)) gör prefetch SRR8378 $ idone  
Eric A Brenner
2017-10-17 04:35:59 UTC
view on stackexchange narkive permalink

Förutsatt att du i slutändan bara vill ha fastq-filerna och att du känner till SRR-nummer (kör), skulle jag ladda ner dem härifrån: ftp://ftp.sra.ebi.ac.uk/vol1/fastq/

När det gäller att ladda ner flera filer har jag just använt flera wget-kommandon. Jag känner inte till ett sätt att ladda ner alla filer tillsammans i en mapp med blixtlås eller något annat: /

Devon Ryan
2017-10-17 13:19:28 UTC
view on stackexchange narkive permalink

Jag föreslår att du följer råden i Eric A Brenners svar och bara laddar ner fastq-filerna. Men om du verkligen vill använda SRA-filerna av någon anledning, notera att du kan använda parallell-fastq-dump för att göra saker snabbare. Följ dess råd angående användning av prefetch.

Du måste kombinera det med svaret från b.nota (dvs. sätt kommandona i en för -slinga).

Kai Fung
2020-04-24 03:06:45 UTC
view on stackexchange narkive permalink

Jag kunde hitta en lösning på detta med Entrez Direct och SRA-verktygslåda :) Om du har projektnummer eller SRA-projektnummer skulle ditt vara SRP022054 i det här fallet för de 36 SRA: erna, du kan använda esearch för att göra en fråga så och rör den i SRA-verktygslåda med den här liner:

esearch -db sra -query SRP022054 | efetch --format runinfo | klipp -d ',' -f 1 | grep SRR | huvud -5 | xargs fastq-dump - skips-tekniska --läsningar - läsfilterpass - dumpbas - splitt-3

rightskewed
2020-04-24 08:36:29 UTC
view on stackexchange narkive permalink

Du kan ladda ner ett helt projekt med pysradb:

  pysradb download -p SRP022054  

Det behåller samma schema som SRA.



Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...