Jag letar efter molntjänster som kan användas för att göra bioinformatik. Ett exempel jag hittade är InsideDNA och det finns naturligtvis Amazon. En liten beskrivning av dessa skulle uppskattas.
Jag letar efter molntjänster som kan användas för att göra bioinformatik. Ett exempel jag hittade är InsideDNA och det finns naturligtvis Amazon. En liten beskrivning av dessa skulle uppskattas.
Jag har testat den kostnadsfria versionen av InsideDNA, och dessa var mina anteckningar:
wget
frågorna var långsamma och scp
var blockerad. Det kan dock vara lösbara problem. Sammantaget kände jag att InsideDNA kunde vara användbart för grupper utan egen beräkningsinfrastruktur och kunde användas för att enkelt dela resurser mellan grupper. Paketen som erbjuds verkar inte dyra, men jag hade några problem och jag vet inte hur bra deras systemadministratörsstöd skulle vara.
Jag har inte använt Amazon-tjänsten, så jag kan inte kommentera bortom detaljerna på deras webbplats. Det finns också några alternativa företag, som Genestack och DNAnexus, men jag har inte heller testat dem heller.
Jag är inte säker på vilka typer av bioinformatikuppgifter du vill utföra, därför är det svårt att ge en bra rekommendation.
Om du specifikt arbetar med statistisk genetik kan jag rekommendera Hail [1]. Hail är ett open source-verktyg för att analysera genetikdata i tiotals terabyte-skala. De flesta av Hagels användare gör sin vetenskap i Jupyter-anteckningsböcker som stöds av Google Cloud Platform Dataproc-kluster. Hail tillåter dig att utföra en mängd olika statistiska genetiska uppgifter inklusive:
Att lära sig specifikt om hur du använder Hail med Google Cloud Plattforms- och Jupyter-anteckningsböcker, jag rekommenderar starkt Liams Hail-foruminlägg om hans molnverktygsförvar.
Här är ett exempel från Hail-handboken, av använder Hail för att utföra en viss kvalitetskontroll och visa en spridningsdiagram över de två första huvudkomponenterna hos individerna:
från hagelimport * import m atplotlib.pyplot som pltimport matplotlib.patches som mpatcheshc = HailContext () tabell = hc.import_table ('data / 1kg_annotations.txt', impute = True) .key_by ('Sample') common_vds = (hc.read ('data / 1kg .vds ') .annotate_samples_table (tabell, root =' sa '). sample_qc () .filter_samples_expr (' sa.qc.dpMean > = 4 && sa.qc.callRate > = 0,97 ')' .filter_ '.' = g.ad [1] / g.ad.sum () i ((g.isHomRef && ab < = 0,1) || (g.isHet && ab > = 0,25 && ab < = 0,75) || (g.isHomVar && ab > = 0.9)) '' '.) .variant_qc () .filter_variants_expr (' va.qc.AF > 0.01 ') .ld_prune (memory_per_core = 512, num_cores = 4 )vd.ca = 'sa.pca', k = 5, egenvärden = 'global.eigen') pca_table = pca.samples_table (). to_pandas () colours = {'AFR': 'green', 'AMR': 'red', 'EAS ':' svart ',' EUR ':' blå ',' SAS ':' cyan '} plt.scatter (pca_table ["sa.pca.PC1"], pca_table ["sa.pca.PC2"], c = pca_table ["sa.SuperPopulation"]. karta (färger), alfa = .5) plt.xlim (-0.6, 0.6) plt.xlabel ("PC1") plt.ylabel ("PC2") legend_entries = [mpatches.Patch (färg = c, etikett = feno) för feno, c i färger. artiklar ()] plt.legend (handtag = legend_entries, loc = 2) plt.show ()
[1 Ansvarsfriskrivning: Jag jobbar med hagel
Beroende på dina applikationer och användningar kan du vara intresserad av att kolla in CyVerse. Det är ett NSF-finansierat initiativ som ger dig datalagring, högpresterande datorresurser och enkel åtkomst till vanliga verktyg. Så vitt jag vet är det gratis att använda när du har ett konto. Jag stöter också vanligtvis på att den används med växt- och mikrobiell genomik, så jag är inte säker på hur det kommer att fungera med något som humana genomikprojekt. Men det kan vara värt att kolla in åtminstone. :)
Mer information: http://www.cyverse.org/about
Det beror verkligen på vad du försöker göra, men här är några tjänster jag känner till.
Google har ett API som heter Google Genomics.
"SNPedia är en wiki som undersöker mänsklig genetik . "snpedia.com
" Promethease är ett litteraturhämtningssystem som bygger en personlig DNA-rapport "promethease.com
"Jämför DNA med referensdata från olika populationer" dna.land
Och det finns CyDAS-projektet som har ett API som kan analysera ISCN-formler. Enligt deras webbplats: deras API "låter dig analysera en Karyotype för praktiskt taget all information som kan extraheras från karyotyper och omlagringar däri: vinster och förluster av kromosomalt material, brytpunkter, korsningar ..." Det är en gratis tjänst, men jag vet inte hur uppdaterad den är.
DNAnexus - http://dnanexus.com
BaseSpace - http://basespace.illumina.com
Seven Bridges Genomics - http://www.sbgenomics.com
Curoverse http://curoverse.com
InsideDNA http://insidedna.me/
Det finns ton av dem. Utöver de utmärkta som alla nämnde
iRods
Arvados
Galaxy