6.3 常用生物数据库下载

1 基因组下载

下面案例下载人全基因组序列,人全基因组序列分为多个版本,可以从多个站点进行下载。 1、NCBI 下载地址:ftp://ftp.ncbi.nih.gov/genomes/Homo_sapiens http://www.ncbi.nlm.nih.gov/projects/genome/guide/human/

#NCBI hs37-1kg  与千人基因组计划一致
ftp://ftp-trace.ncbi.nih.gov/1000genomes/ftp/technical/reference/human_g1k_v37.fasta.gz

2、ENSEMBL ENSEMBL网址:http://ensemblgenomes.org/

#EnsEMBL primary
http://ftp.ensembl.org/pub/current_fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz

3、UCSC 详细文档:http://hgdownload.soe.ucsc.edu/downloads.html#hg38sequence

#UCSC hg19
wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz
#UCSC hg38
wget http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz

2 其余数据库下载

nt库:ftp.ncbi.nlm.nih.gov:/blast/db/nt*.tar.gz

NR库: ftp.ncbi.nlm.nih.gov:/blast/db/nr*.tar.gz

COG/KOG ftp://ftp.ncbi.nlm.nih.gov/pub/COG/

基因组数据库 ftp://ftp.ncbi.nlm.nih.gov/genomes/

质粒数据库 ftp://ftp.ncbi.nlm.nih.gov/genomes/Plasmids/

病毒基因组:ftp.ncbi.nlm.nih.gov/refseq/release/viral

Swissprot: ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/swissprot.gz

物种分类数据库:ftp://ftp.ncbi.nih.gov/pub/taxonomy/