eggNOG注释时内存不够的处理方式

 

###eggNOG32G内存注释完整步骤

#开启screen

screen -S eggArHeCHN

#diamond比对

diamond blastp --db eggnog_proteins --query ./ArHeCHN.chr.pep --out eggNOG.xml --outfmt 5 --sensitive --max-target-seqs 20 --evalue 1e-5 --id 10 --tmpdir /dev/shm --index-chunks 1

运行时间1h7min

  ? --threads  是否可以调整命令时采用的线程数 ?#In-house Perl脚本提取xml比对结果

parsing_blast_result.pl --no-header --max-hit-num 1 --HSP-num 1 eggNOG.xml | cut -f 1,2,11,12 > eggNOG.emapper.seed_orthologs

 

#在111上测试执行下面的命令

vi下黏贴小技巧

注意:如果粘贴后代码格式混乱,可以:

  1. 在粘贴之前,先进入 vi 编辑器
  2. 输入 :set paste 按 Enter
  3. 然后再按 i 进入插入模式
  4. 粘贴代码
  5. 完成后按 Esc,然后 :wq 保存退出

这样可以保持代码的原有格式。

RNAheatmapShow.cgi程序速度递进

优化点总结
1.使用 Plotly.react() 代替 Plotly.newPlot(),加快绘图速度。
2.去除 @linked_gene_ids,防止 <a> 标签导致 JavaScript 解析问题。
✅ 确保 data 里的值是数值,避免 null 或字符串影响 Plotly 解析。
✅ 改用 document.addEventListener("DOMContentLoaded", function() {...}) 确保 DOM 先加载。
✅ 提前渲染 div,避免 JavaScript 过早执行而找不到 div。

这样应该可以提高速度和稳定性,你可以试试看! 🚀

#经过严格测试,发现1.不使用json速度会很快; 2.把js文件放到本地/var/www/html/Artocarpus/javascript/文件夹下速度很快.以下为修改后的代码:

#!/usr/bin/perl
use strict;
use warnings;
use DBI;
use CGI;
use List::Util qw(max min);

RockyLinux系统如果停留在GRUB无法进入时的修复

解决步骤

1. 使用 Rocky Linux 安装介质进入救援模式

  1. 下载 Rocky Linux 的 ISO 镜像,制作启动 U 盘(使用工具如 Rufus 或 dd)。
  2. 将系统设置为从 U 盘启动。
  3. 在启动菜单中选择:

    Troubleshooting > Rescue a Rocky Linux system

  4. 系统会提示是否尝试挂载现有的 Linux 系统,选择 1(继续挂载到 /mnt/sysimage)。

2. 进入系统环境

如果救援模式成功挂载了你的系统根分区,执行以下命令切换到系统环境:

chroot /mnt/sysimage

此时你已经进入了你的系统环境,可以尝试修复 GRUB。

3. 重新安装或修复 GRUB

检查分区表和 GRUB 配置

  1. 确认 /boot 分区是否存在:

    ls /boot

数据库下载错误

yes y | ./download_eggnog_data.py Download main annotation database? [y,n] Downloading "eggnog.db" at /opt/biosoft/eggnog-mapper-2.1.11/data... cd /opt/biosoft/eggnog-mapper-2.1.11/data && wget -nH --user-agent=Mozilla/5.0 --relative --no-parent --reject "index.html*" --cut-dirs=4 -e robots=off -O eggnog.db.gz http://eggnogdb.embl.de/download/emapperdb-5.0.2/eggnog.db.gz && echo Decompressing...

eggNOG完整化本地注释

  1. 如果你无法使用 download_eggnog_data.py 脚本下载,你也可以手动下载 DIAMOND 数据库。到 EggNOG 官网或者数据库下载页下载相应的数据库文件并按照需要的路径解压。

    例如:

    wget http://eggnog5.embl.de/download/eggnog_5.0/eggnog_proteins.dmnd.tar.gz tar -zxvf eggnog_proteins.dmnd.tar.gz

步骤 2: 下载并解压其他注释文件

除了 DIAMOND 数据库,你还需要下载 EggNOG 注释数据库(例如 annotations.tsv.gz 和 eggNOG.db 文件)。

eggNOG进行本地化注释

1. 找到 eggnog-mapper 的默认数据库目录

运行以下命令查看 eggnog-mapper 数据库的默认位置:

emapper.py --data_dir

这会输出当前使用的数据库目录(例如 /path/to/eggnog-mapper/data)。

2. 将手动下载的数据库移动到默认位置

将您的 HMM 数据库文件移动到刚才查询的 data 目录下。假设默认数据库路径是 /path/to/eggnog-mapper/data,运行以下命令:

mv EggNOG_Eukaryota.hmm* /path/to/eggnog-mapper/data/

确保数据库和索引文件都在同一目录下。

3. 使用 --database 参数指定数据库

在运行 emapper.py 时,使用 --database 参数指定手动下载的数据库。例如:

emapper.py -i input_proteins.fasta --output results --database EggNOG_Eukaryota.hmm --cpu 8

已经成功执行的8个库和5个库的命令

#进入工作目录

/home/train/hd/interproscan-5.72-103.0

#执行八个库的命令-成功

 ./interproscan.sh -t p -i 100.fasta -f TSV,gff3 -d ArHeCHN/ -appl Pfam,PANTHER,Gene3D,SMART,funfam,CDD,SUPERFAMILY,prints -goterms -iprlookup -cpu 8 > ArHeAnnot.log 2>&1

##又或者执行五个库的命令-成功

./interproscan.sh -t p -i ArNa.pep.fasta -f TSV,gff3 -d ArNa/ -appl cdd,Gene3D,SUPERFAMILY,Pfam,PANTHER -goterms -iprlookup -cpu 8

interpro的8个重要库

以下是推荐的 8 个综合性功能库,这些库覆盖了结构预测、功能注释、蛋白质家族分析和功能位点识别的多个方面,能够满足大多数基因组和蛋白质功能注释的需求:

1. Pfam (37.1)

  • 功能:识别蛋白质家族和功能域。
  • 特点:基于 HMM,广泛使用的蛋白质家族数据库。
  • 适用场景:常规蛋白功能域注释。

2. PANTHER (19.0)

  • 功能:蛋白质功能分类和基因组功能分析。
  • 特点:提供进化关系和功能预测。
  • 适用场景:研究基因功能和信号通路分析。

3. ProSitePatterns (2023_05)

156硬盘调整

1.删除~/hd3

2.原来挂载在~/hd3的/dev/sdb????

3.将/dev/sdb挂载到~/hd上,并设置好/etc/fstab------------------/dev/sdb的容量为4T

Pages

Subscribe to 我们的生信博客-QFNU RSS