RCAC - Knowledge Base: Biocontainers: ska

Bell User Guide
Gilbreth User Guide
Weber User Guide
Scholar User Guide
Hammer User Guide
Negishi User Guide
Geddes User Guide
Anvil User Guide
Gautschi User Guide
Datasets
iGenomes
Software Catalog
Compilers
MPIs
Applications
Utilities
Biocontainers
- abacas
- abismal
- abpoa
- abricate
- abyss
- actc
- adapterremoval
- advntr
- afplot
- afterqc
- agat
- agfusion
- alfred
- alien-hunter
- alignstats
- allpathslg
- alphafold
- amptk
- ananse
- anchorwave
- angsd
- annogesic
- annovar
- antismash
- anvio
- any2fasta
- arcs
- asgal
- assembly-stats
- atac-seq-pipeline
- ataqv
- atram
- atropos
- augur
- augustus
- bactopia
- bali-phy
- bam-readcount
- bamgineer
- bamliquidator
- bamsurgeon
- bamtools
- bamutil
- barrnap
- basenji
- bazam
- bbmap
- bbtools
- bcftools
- bcl2fastq
- beagle
- beast2
- bedops
- bedtools
- bioawk
- biobambam
- bioconvert
- biopython
- bismark
- blasr
- blast
- blobtools
- bmge
- bowtie
- bowtie2
- bracken
- braker2
- brass
- breseq
- busco
- bustools
- bwa
- bwameth
- cactus
- cafe
- canu
- ccs
- cd-hit
- cdbtools
- cegma
- cellbender
- cellphonedb
- cellranger
- cellranger-arc
- cellranger-atac
- cellranger-dna
- cellrank
- cellrank-krylov
- cellsnp-lite
- celltypist
- centrifuge
- cfsan-snp-pipeline
- checkm-genome
- chewbbaca
- chopper
- chromap
- cicero
- circexplorer2
- circlator
- circompara2
- circos
- ciri2
- ciriquant
- clair3
- clairvoyante
- clearcnv
- clever-toolkit
- clonalframeml
- clust
- clustalw
- cnvkit
- cnvnator
- coinfinder
- concoct
- control-freec
- cooler
- coverm
- cramino
- crisprcasfinder
- crispresso2
- crispritz
- cross_match
- crossmap
- csvtk
- cufflinks
- cutadapt
- cuttlefish
- cyvcf2
- das_tool
- dbg2olc
- deconseq
- deepbgc
- deepconsensus
- deepsignal2
- deeptools
- deepvariant
- delly
- dendropy
- diamond
- dnaio
- dragonflye
- drep
- drop-seq
- dropest
- dsuite
- easysfs
- edta
- eggnog-mapper
- emboss
- ensembl-vep
- epic2
- evidencemodeler
- exonerate
- expansionhunter
- fasta3
- fastani
- fastp
- fastq-scan
- fastq_pair
- fastqc
- fastspar
- faststructure
- fasttree
- fastx_toolkit
- filtlong
- flye
- fraggenescan
- fraggenescanrs
- freebayes
- freyja
- fseq
- funannotate
- fwdpy11
- gadma
- gambit
- gamma
- gangstr
- gapfiller
- gatk
- gatk4
- gemma
- gemoma
- genemark
- genemarks-2
- genmap
- genomedata
- genomepy
- genomescope2
- genomicconsensus
- genrich
- gfaffix
- gfastats
- gfatools
- gffcompare
- gffread
- gffutils
- gimmemotifs
- glimmer
- glimmerhmm
- glnexus
- gmap
- goatools
- graphlan
- graphmap
- gridss
- gseapy
- gtdbtk
- gubbins
- guppy
- hail
- hap.py
- helen
- hic-pro
- hicexplorer
- hifiasm
- hisat2
- hmmer
- homer
- how_are_we_stranded_here
- htseq
- htslib
- htstream
- humann
- hyphy
- idba
- igv
- impute2
- infernal
- instrain
- intarna
- interproscan
- iqtree
- isoquant
- isoseq3
- ivar
- jcvi
- kaiju
- kakscalculator2
- kallisto
- khmer
- kissde
- kissplice
- kissplice2refgenome
- kma
- kmc
- kmer-jellyfish
- kmergenie
- kneaddata
- kover
- kraken2
- krakentools
- lambda
- last
- lastz
- ldhat
- ldjump
- ldsc
- liftoff
- liftofftools
- lima
- links
- lofreq
- longphase
- longqc
- lra
- ltr_finder
- ltrpred
- lumpy-sv
- lyveset
- macrel
- macs2
- macs3
- mafft
- mageck
- magicblast
- maker
- manta
- mapcaller
- marginpolish
- mash
- mashmap
- mashtree
- masurca
- mauve
- maxbin2
- maxquant
- mcl
- mcscanx
- medaka
- megadepth
- megahit
- megan
- meme
- memes
- meraculous
- merqury
- meryl
- metabat
- metachip
- metaphlan
- metaseq
- methyldackel
- metilene
- mhm2
- microbedmm
- minialign
- miniasm
- minimap2
- minipolish
- miniprot
- mirdeep2
- mirtop
- mitofinder
- mlst
- mmseqs2
- mob_suite
- modbam2bed
- modeltest-ng
- momi
- mothur
- motus
- mrbayes
- multiqc
- mummer4
- muscle
- mutmap
- mykrobe
- n50
- nanofilt
- nanolyse
- nanoplot
- nanopolish
- ncbi-amrfinderplus
- ncbi-datasets
- ncbi-genome-download
- ncbi-table2asn
- neusomatic
- nextalign
- nextclade
- nextflow
- ngs-bits
- ngsld
- ngsutils
- orthofinder
- paml
- panacota
- panaroo
- pandaseq
- pandora
- pangolin
- panphlan
- parabricks
- parallel-fastq-dump
- parliament2
- parsnp
- pasta
- pbmm2
- pbptyper
- pcangsd
- peakranger
- pepper_deepvariant
- perl-bioperl
- phast
- phd2fasta
- phg
- phipack
- phrap
- phred
- phylosuite
- picard
- picrust2
- pilon
- pindel
- pirate
- piscem
- pixy
- plasmidfinder
- platon
- getorganelle
- platypus
- plink
- plink2
- plotsr
- pomoxis
- poppunk
- popscle
- pplacer
- prinseq
- prodigal
- prokka
- proteinortho
- prothint
- pullseq
- purge_dups
- pvactools
- pyani
- pybedtools
- pybigwig
- pychopper
- pycoqc
- pyensembl
- pyfaidx
- pygenometracks
- pygenomeviz
- pyranges
- pysam
- pyvcf3
- qiime2
- qtlseq
- qualimap
- quast
- quickmirseq
- r
- r-rnaseq
- r-rstudio
- r-scrnaseq
- racon
- ragout
- ragtag
- rapmap
- rasusa
- raven-assembler
- raxml
- raxml-ng
- reapr
- rebaler
- reciprocal_smallest_distance
- recycler
- regtools
- repeatmasker
- repeatmodeler
- repeatscout
- resfinder
- revbayes
- rmats
- rmats2sashimiplot
- rnaindel
- rnapeg
- rnaquast
- roary
- rsem
- rseqc
- run_dbcan
- rush
- sage
- salmon
- sambamba
- samblaster
- samclip
- samplot
- samtools
- scanpy
- scarches
- scgen
- scirpy
- scvelo
- scvi-tools
- segalign
- seidr
- sepp
- seqcode
- seqkit
- seqyclean
- shapeit4
- shapeit5
- shasta
- shigeifinder
- shorah
- shortstack
- shovill
- sicer
- sicer2
- signalp4
- signalp6
- simug
- singlem
- ska
- skewer
- slamdunk
- smoove
- snakemake
- snap
- snap-aligner
- snaptools
- snippy
- snp-dists
- snp-sites
- snpeff
- snpgenie
- snphylo
- snpsift
- soapdenovo2
- sortmerna
- souporcell
- sourmash
- spaceranger
- spades
- sprod
- squeezemeta
- squid
- sra-tools
- srst2
- stacks
- star
- staramr
- starfusion
- stream
- stringdecomposer
- stringtie
- strique
- structure
- subread
- survivor
- svaba
- svtools
- svtyper
- swat
- syri
- t-coffee
- talon
- targetp
- tassel
- taxonkit
- tetranscripts
- tiara
- tigmint
- tobias
- tombo
- tophat
- tpmcalculator
- transabyss
- transdecoder
- transrate
- transvar
- trax
- treetime
- trim-galore
- trimal
- trimmomatic
- trinity
- trinotate
- trnascan-se
- trtools
- trust4
- trycycler
- ucsc_genome_toolkit
- unicycler
- vadr
- usefulaf
- vardict-java
- varlociraptor
- varscan
- vartrix
- vatools
- vcf-kit
- vcf2maf
- vcf2phylip
- vcf2tsvpy
- vcftools
- velocyto.py
- velvet
- veryfasttree
- vg
- viennarna
- weblogo
- vsearch
- whatshap
- wiggletools
- winnowmap
- wtdbg
- bayescan
- aspera-connect
NVIDIA NGC containers
AMD ROCm containers
FAQs
Storage
Data Depot User Guide
Fortress User Guide
REED Folder User Guide
Box Research Lab Folder User Guide
Scratch User Guide
Home Directory User Guide
Services
High-Performance Computing
Services Guides
Slurm
Depot Object User Guide
Environment Management with the Module Command
Protected Data Filesystem User Guide
Protected Data Archive User Guide
Purdue GenAI Studio
Environment Management with the Module Command
Environment Management with the Module Command
Profilers

ska

Link to section 'Introduction' of 'ska' Introduction

SKA (Split Kmer Analysis) is a toolkit for prokaryotic (and any other small, haploid) DNA sequence analysis using split kmers. A split kmer is a pair of kmers in a DNA sequence that are separated by a single base. Split kmers allow rapid comparison and alignment of small genomes, and is particularly suited for surveillance or outbreak investigation. SKA can produce split kmer files from fasta format assemblies or directly from fastq format read sequences, cluster them, align them with or without a reference sequence and provide various comparison and summary statistics. Currently all testing has been carried out on high-quality Illumina read data, so results for other platforms may vary.

Docker hub: https://hub.docker.com/r/staphb/ska
Home page: https://github.com/simonrharris/SKA

Link to section 'Versions' of 'ska' Versions

Link to section 'Commands' of 'ska' Commands

Link to section 'Module' of 'ska' Module

You can load the modules by:

module load biocontainers
module load ska

Link to section 'Example job' of 'ska' Example job

Using #!/bin/sh -l as shebang in the slurm job script will cause the failure of some biocontainer modules. Please use #!/bin/bash instead.

To run ska on our clusters:

#!/bin/bash
#SBATCH -A myallocation     # Allocation name
#SBATCH -t 1:00:00
#SBATCH -N 1
#SBATCH -n 1
#SBATCH --job-name=ska
#SBATCH --mail-type=FAIL,BEGIN,END
#SBATCH --error=%x-%J-%u.err
#SBATCH --output=%x-%J-%u.out

module --force purge
ml biocontainers ska

Helpful?