eggNOG完整化本地注释

  1. 如果你无法使用 download_eggnog_data.py 脚本下载,你也可以手动下载 DIAMOND 数据库。到 EggNOG 官网或者数据库下载页下载相应的数据库文件并按照需要的路径解压。

    例如:

    wget http://eggnog5.embl.de/download/eggnog_5.0/eggnog_proteins.dmnd.tar.gz tar -zxvf eggnog_proteins.dmnd.tar.gz

步骤 2: 下载并解压其他注释文件

除了 DIAMOND 数据库,你还需要下载 EggNOG 注释数据库(例如 annotations.tsv.gz 和 eggNOG.db 文件)。

  1. 你可以使用以下命令来下载注释文件:

    /opt/biosoft/eggnog-mapper-2.1.11/download_eggnog_database.py --data_dir /opt/biosoft/bioinfomatics_databases/EggNOG --download_annotations

    该命令会自动下载相关的注释文件,包括:

    • eggNOG.db:包含基因的注释信息。
    • annotations.tsv.gz:包含蛋白质对应的 GO、COG、KEGG 等信息。
  2. 也可以从 EggNOG 网站手动下载:

    例如:

    wget http://eggnog5.embl.de/download/eggnog_5.0/annotations.tsv.gz gunzip annotations.tsv.gz

步骤 3: 确认文件完整性

确保你已经下载了以下文件并且路径正确:

  • HMM 文件(如 EggNOG_Eukaryota.hmm 和相关的 .h3f、.h3i、.h3m、.h3p 文件)。
  • DIAMOND 数据库(eggnog_proteins.dmnd)。
  • 注释文件(如 eggNOG.db、annotations.tsv)。

你可以通过以下命令确认文件是否存在:

ls /opt/biosoft/bioinfomatics_databases/EggNOG

步骤 4: 使用 eggNOG-mapper 完整注释

完成上述步骤后,你就可以使用 eggNOG-mapper 进行完整的注释了。

/opt/biosoft/eggnog-mapper-2.1.11/emapper.py -i input_proteins.fasta --output results --data_dir