数据库下载错误

yes y | ./download_eggnog_data.py Download main annotation database? [y,n] Downloading "eggnog.db" at /opt/biosoft/eggnog-mapper-2.1.11/data... cd /opt/biosoft/eggnog-mapper-2.1.11/data && wget -nH --user-agent=Mozilla/5.0 --relative --no-parent --reject "index.html*" --cut-dirs=4 -e robots=off -O eggnog.db.gz http://eggnogdb.embl.de/download/emapperdb-5.0.2/eggnog.db.gz && echo Decompressing...

eggNOG完整化本地注释

  1. 如果你无法使用 download_eggnog_data.py 脚本下载,你也可以手动下载 DIAMOND 数据库。到 EggNOG 官网或者数据库下载页下载相应的数据库文件并按照需要的路径解压。

    例如:

    wget http://eggnog5.embl.de/download/eggnog_5.0/eggnog_proteins.dmnd.tar.gz tar -zxvf eggnog_proteins.dmnd.tar.gz

步骤 2: 下载并解压其他注释文件

除了 DIAMOND 数据库,你还需要下载 EggNOG 注释数据库(例如 annotations.tsv.gz 和 eggNOG.db 文件)。

eggNOG进行本地化注释

1. 找到 eggnog-mapper 的默认数据库目录

运行以下命令查看 eggnog-mapper 数据库的默认位置:

emapper.py --data_dir

这会输出当前使用的数据库目录(例如 /path/to/eggnog-mapper/data)。

2. 将手动下载的数据库移动到默认位置

将您的 HMM 数据库文件移动到刚才查询的 data 目录下。假设默认数据库路径是 /path/to/eggnog-mapper/data,运行以下命令:

mv EggNOG_Eukaryota.hmm* /path/to/eggnog-mapper/data/

确保数据库和索引文件都在同一目录下。

3. 使用 --database 参数指定数据库

在运行 emapper.py 时,使用 --database 参数指定手动下载的数据库。例如:

emapper.py -i input_proteins.fasta --output results --database EggNOG_Eukaryota.hmm --cpu 8

已经成功执行的8个库和5个库的命令

#进入工作目录

/home/train/hd/interproscan-5.72-103.0

#执行八个库的命令-成功

 ./interproscan.sh -t p -i 100.fasta -f TSV,gff3 -d ArHeCHN/ -appl Pfam,PANTHER,Gene3D,SMART,funfam,CDD,SUPERFAMILY,prints -goterms -iprlookup -cpu 8 > ArHeAnnot.log 2>&1

##又或者执行五个库的命令-成功

./interproscan.sh -t p -i ArNa.pep.fasta -f TSV,gff3 -d ArNa/ -appl cdd,Gene3D,SUPERFAMILY,Pfam,PANTHER -goterms -iprlookup -cpu 8

interpro的8个重要库

以下是推荐的 8 个综合性功能库,这些库覆盖了结构预测、功能注释、蛋白质家族分析和功能位点识别的多个方面,能够满足大多数基因组和蛋白质功能注释的需求:

1. Pfam (37.1)

  • 功能:识别蛋白质家族和功能域。
  • 特点:基于 HMM,广泛使用的蛋白质家族数据库。
  • 适用场景:常规蛋白功能域注释。

2. PANTHER (19.0)

  • 功能:蛋白质功能分类和基因组功能分析。
  • 特点:提供进化关系和功能预测。
  • 适用场景:研究基因功能和信号通路分析。

3. ProSitePatterns (2023_05)

156硬盘调整

1.删除~/hd3

2.原来挂载在~/hd3的/dev/sdb????

3.将/dev/sdb挂载到~/hd上,并设置好/etc/fstab------------------/dev/sdb的容量为4T

基因组下载

lftp代替wget从ncbi ftp下载基因组数据暨aira2多线程下载

lftp -c "open https://ftp.ncbi.nlm.nih.gov; mirror -c -e /genomes/all/GCA/951/799/435/GCA_951799435.1_drIleAqui2.1_alternate_haplotype/ ./Ilex_aquifolium"

#lftp可以代替wget下载,实现更快的速度
#下载打开10个并行连接,同时打开断点续传

lftp -e "pget -n 10 -c http://eggnog5.embl.de/download/eggnog_5.0/per_tax_level/2759/2759_hmms.... quit"

 

####用aria2多线程下载工具显著提高下载速度

下载对应 lookup功能

#我已经wget --no-check-certificate -c https://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/5/5.60-92.0/lookup_...下载这个lookup

#需要下载对应的interpro

https://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/5/5.60-92.0/

#需要验证md5

#怎样使用还没有测试

######下为以前内容

为InterProScan 5.54-87.0版本下载和安装匹配的查询服务的具体步骤:

下载匹配版本的查询服务:
bash

hmmer安装

# Installing hmmer (http://hmmer.org/)
#wget http://eddylab.org/software/hmmer/hmmer-3.3.2.tar.gz -P ~/software/
wget http://eddylab.org/software/hmmer/hmmer.tar.gz
tar zxf hmmer.tar.gz
cd hmmer-3.4/
./configure --prefix=/opt/biosoft/hmmer-3.4 && make -j 4 && make install
cd .. && rm -rf hmmer-3.4
echo 'PATH=/opt/biosoft/hmmer-3.4/bin/:$PATH' >> ~/.bashrc
source ~/.bashrc
cd /opt/biosoft/hmmer-3.4

 panther报错解决

1.修改

InterProScan 配置文件

Pages

Subscribe to 我们的生信博客-QFNU RSS