6.3 常用生物数据库下载
1 基因组下载
下面案例下载人全基因组序列,人全基因组序列分为多个版本,可以从多个站点进行下载。 1、NCBI 下载地址:ftp://ftp.ncbi.nih.gov/genomes/Homo_sapiens http://www.ncbi.nlm.nih.gov/projects/genome/guide/human/
#NCBI hs37-1kg 与千人基因组计划一致
ftp://ftp-trace.ncbi.nih.gov/1000genomes/ftp/technical/reference/human_g1k_v37.fasta.gz
2、ENSEMBL ENSEMBL网址:http://ensemblgenomes.org/
#EnsEMBL primary
http://ftp.ensembl.org/pub/current_fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
3、UCSC 详细文档:http://hgdownload.soe.ucsc.edu/downloads.html#hg38sequence
#UCSC hg19
wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz
#UCSC hg38
wget http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz
2 其余数据库下载
nt库:ftp.ncbi.nlm.nih.gov:/blast/db/nt*.tar.gz
NR库: ftp.ncbi.nlm.nih.gov:/blast/db/nr*.tar.gz
COG/KOG ftp://ftp.ncbi.nlm.nih.gov/pub/COG/
基因组数据库 ftp://ftp.ncbi.nlm.nih.gov/genomes/
质粒数据库 ftp://ftp.ncbi.nlm.nih.gov/genomes/Plasmids/
病毒基因组:ftp.ncbi.nlm.nih.gov/refseq/release/viral
Swissprot: ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/swissprot.gz