Rosen Center for Advanced Computing

Bell User Guide
Gilbreth User Guide
Weber User Guide
Scholar User Guide
Rossmann User Guide
Hammer User Guide
Negishi User Guide
Geddes User Guide
Anvil User Guide
Gautschi User Guide
Datasets
iGenomes
Software Catalog
Applications
Biocontainers
- abacas
- abismal
- abpoa
- abricate
- abyss
- actc
- adapterremoval
- advntr
- afplot
- afterqc
- agat
- agfusion
- alfred
- alien-hunter
- alignstats
- allpathslg
- alphafold
- amptk
- ananse
- anchorwave
- angsd
- annogesic
- annovar
- antismash
- anvio
- any2fasta
- arcs
- asgal
- assembly-stats
- atac-seq-pipeline
- ataqv
- atram
- atropos
- augur
- augustus
- bactopia
- bali-phy
- bam-readcount
- bamgineer
- bamliquidator
- bamsurgeon
- bamtools
- bamutil
- barrnap
- basenji
- bazam
- bbmap
- bbtools
- bcftools
- bcl2fastq
- beagle
- beast2
- bedops
- bedtools
- bioawk
- biobambam
- bioconvert
- biopython
- bismark
- blasr
- blast
- blobtools
- bmge
- bowtie
- bowtie2
- bracken
- braker2
- brass
- breseq
- busco
- bustools
- bwa
- bwameth
- cactus
- cafe
- canu
- ccs
- cd-hit
- cdbtools
- cegma
- cellbender
- cellphonedb
- cellranger
- cellranger-arc
- cellranger-atac
- cellranger-dna
- cellrank
- cellrank-krylov
- cellsnp-lite
- celltypist
- centrifuge
- cfsan-snp-pipeline
- checkm-genome
- chewbbaca
- chopper
- chromap
- cicero
- circexplorer2
- circlator
- circompara2
- circos
- ciri2
- ciriquant
- clair3
- clairvoyante
- clearcnv
- clever-toolkit
- clonalframeml
- clust
- clustalw
- cnvkit
- cnvnator
- coinfinder
- concoct
- control-freec
- cooler
- coverm
- cramino
- crisprcasfinder
- crispresso2
- crispritz
- cross_match
- crossmap
- csvtk
- cufflinks
- cutadapt
- cuttlefish
- cyvcf2
- das_tool
- dbg2olc
- deconseq
- deepbgc
- deepconsensus
- deepsignal2
- deeptools
- deepvariant
- delly
- dendropy
- diamond
- dnaio
- dragonflye
- drep
- drop-seq
- dropest
- dsuite
- easysfs
- edta
- eggnog-mapper
- emboss
- ensembl-vep
- epic2
- evidencemodeler
- exonerate
- expansionhunter
- fasta3
- fastani
- fastp
- fastq-scan
- fastq_pair
- fastqc
- fastspar
- faststructure
- fasttree
- fastx_toolkit
- filtlong
- flye
- fraggenescan
- fraggenescanrs
- freebayes
- freyja
- fseq
- funannotate
- fwdpy11
- gadma
- gambit
- gamma
- gangstr
- gapfiller
- gatk
- gatk4
- gemma
- gemoma
- genemark
- genemarks-2
- genmap
- genomedata
- genomepy
- genomescope2
- genomicconsensus
- genrich
- gfaffix
- gfastats
- gfatools
- gffcompare
- gffread
- gffutils
- gimmemotifs
- glimmer
- glimmerhmm
- glnexus
- gmap
- goatools
- graphlan
- graphmap
- gridss
- gseapy
- gtdbtk
- gubbins
- guppy
- hail
- hap.py
- helen
- hic-pro
- hicexplorer
- hifiasm
- hisat2
- hmmer
- homer
- how_are_we_stranded_here
- htseq
- htslib
- htstream
- humann
- hyphy
- idba
- igv
- impute2
- infernal
- instrain
- intarna
- interproscan
- iqtree
- isoquant
- isoseq3
- ivar
- jcvi
- kaiju
- kakscalculator2
- kallisto
- khmer
- kissde
- kissplice
- kissplice2refgenome
- kma
- kmc
- kmer-jellyfish
- kmergenie
- kneaddata
- kover
- kraken2
- krakentools
- lambda
- last
- lastz
- ldhat
- ldjump
- ldsc
- liftoff
- liftofftools
- lima
- links
- lofreq
- longphase
- longqc
- lra
- ltr_finder
- ltrpred
- lumpy-sv
- lyveset
- macrel
- macs2
- macs3
- mafft
- mageck
- magicblast
- maker
- manta
- mapcaller
- marginpolish
- mash
- mashmap
- mashtree
- masurca
- mauve
- maxbin2
- maxquant
- mcl
- mcscanx
- medaka
- megadepth
- megahit
- megan
- meme
- memes
- meraculous
- merqury
- meryl
- metabat
- metachip
- metaphlan
- metaseq
- methyldackel
- metilene
- mhm2
- microbedmm
- minialign
- miniasm
- minimap2
- minipolish
- miniprot
- mirdeep2
- mirtop
- mitofinder
- mlst
- mmseqs2
- mob_suite
- modbam2bed
- modeltest-ng
- momi
- mothur
- motus
- mrbayes
- multiqc
- mummer4
- muscle
- mutmap
- mykrobe
- n50
- nanofilt
- nanolyse
- nanoplot
- nanopolish
- ncbi-amrfinderplus
- ncbi-datasets
- ncbi-genome-download
- ncbi-table2asn
- neusomatic
- nextalign
- nextclade
- nextflow
- ngs-bits
- ngsld
- ngsutils
- orthofinder
- paml
- panacota
- panaroo
- pandaseq
- pandora
- pangolin
- panphlan
- parabricks
- parallel-fastq-dump
- parliament2
- parsnp
- pasta
- pbmm2
- pbptyper
- pcangsd
- peakranger
- pepper_deepvariant
- perl-bioperl
- phast
- phd2fasta
- phg
- phipack
- phrap
- phred
- phylosuite
- picard
- picrust2
- pilon
- pindel
- pirate
- piscem
- pixy
- plasmidfinder
- platon
- getorganelle
- platypus
- plink
- plink2
- plotsr
- pomoxis
- poppunk
- popscle
- pplacer
- prinseq
- prodigal
- prokka
- proteinortho
- prothint
- pullseq
- purge_dups
- pvactools
- pyani
- pybedtools
- pybigwig
- pychopper
- pycoqc
- pyensembl
- pyfaidx
- pygenometracks
- pygenomeviz
- pyranges
- pysam
- pyvcf3
- qiime2
- qtlseq
- qualimap
- quast
- quickmirseq
- r
- r-rnaseq
- r-rstudio
- r-scrnaseq
- racon
- ragout
- ragtag
- rapmap
- rasusa
- raven-assembler
- raxml
- raxml-ng
- reapr
- rebaler
- reciprocal_smallest_distance
- recycler
- regtools
- repeatmasker
- repeatmodeler
- repeatscout
- resfinder
- revbayes
- rmats
- rmats2sashimiplot
- rnaindel
- rnapeg
- rnaquast
- roary
- rsem
- rseqc
- run_dbcan
- rush
- sage
- salmon
- sambamba
- samblaster
- samclip
- samplot
- samtools
- scanpy
- scarches
- scgen
- scirpy
- scvelo
- scvi-tools
- segalign
- seidr
- sepp
- seqcode
- seqkit
- seqyclean
- shapeit4
- shapeit5
- shasta
- shigeifinder
- shorah
- shortstack
- shovill
- sicer
- sicer2
- signalp4
- signalp6
- simug
- singlem
- ska
- skewer
- slamdunk
- smoove
- snakemake
- snap
- snap-aligner
- snaptools
- snippy
- snp-dists
- snp-sites
- snpeff
- snpgenie
- snphylo
- snpsift
- soapdenovo2
- sortmerna
- souporcell
- sourmash
- spaceranger
- spades
- sprod
- squeezemeta
- squid
- sra-tools
- srst2
- stacks
- star
- staramr
- starfusion
- stream
- stringdecomposer
- stringtie
- strique
- structure
- subread
- survivor
- svaba
- svtools
- svtyper
- swat
- syri
- t-coffee
- talon
- targetp
- tassel
- taxonkit
- tetranscripts
- tiara
- tigmint
- tobias
- tombo
- tophat
- tpmcalculator
- transabyss
- transdecoder
- transrate
- transvar
- trax
- treetime
- trim-galore
- trimal
- trimmomatic
- trinity
- trinotate
- trnascan-se
- trtools
- trust4
- trycycler
- ucsc_genome_toolkit
- unicycler
- vadr
- usefulaf
- vardict-java
- varlociraptor
- varscan
- vartrix
- vatools
- vcf-kit
- vcf2maf
- vcf2phylip
- vcf2tsvpy
- vcftools
- velocyto.py
- velvet
- veryfasttree
- vg
- viennarna
- weblogo
- vsearch
- whatshap
- wiggletools
- winnowmap
- wtdbg
- bayescan
- aspera-connect
NVIDIA NGC containers
AMD ROCm containers
FAQs
Storage
Data Depot User Guide
Fortress User Guide
REED Folder User Guide
Box Research Lab Folder User Guide
Scratch User Guide
Home Directory User Guide
Services
High-Performance Computing
Services Guides
Depot Object User Guide
Rowdy User Guide
Environment Management with the Module Command
Protected Data Filesystem User Guide
Protected Data Archive User Guide
Purdue GenAI Studio
Profilers
Geoscience Foundation Models

Expand Topics

cd-hit

Link to section 'Introduction' of 'cd-hit' Introduction

Cd-hit is a very widely used program for clustering and comparing protein or nucleotide sequences.

For more information, please check its website: https://biocontainers.pro/tools/cd-hit and its home page on Github.

Link to section 'Versions' of 'cd-hit' Versions

4.8.1

Link to section 'Commands' of 'cd-hit' Commands

Link to section 'Module' of 'cd-hit' Module

You can load the modules by:

module load biocontainers
module load cd-hit

Link to section 'Example job' of 'cd-hit' Example job

Using #!/bin/sh -l as shebang in the slurm job script will cause the failure of some biocontainer modules. Please use #!/bin/bash instead.

To run Cd-hit on our clusters:

#!/bin/bash
#SBATCH -A myallocation     # Allocation name 
#SBATCH -t 1:00:00
#SBATCH -N 1
#SBATCH -n 1
#SBATCH --job-name=cd-hit
#SBATCH --mail-type=FAIL,BEGIN,END
#SBATCH --error=%x-%J-%u.err
#SBATCH --output=%x-%J-%u.out

module --force purge
ml biocontainers cd-hit

cd-hit -i Cm_pep.fasta  -o Cmdb90 -c 0.9 -n 5 -M 16000 -T 8

cd-hit-est -i Cm_dna.fasta  -o Cmdb90_nt -c 0.9 -n 5 -M 16000 -T 8

Helpful?