关于interpro注释时8个库选择的总结

#两次成功执行的八个库qw(CDD FunFam Gene3D PANTHER Pfam PRINTS SMART SUPERFAMILY);  qw(CDD Gene3D MobiDBLite PANTHER Pfam PRINTS SMART SUPERFAMILY);

#实际理论可尝试9种注释(CDD FunFam MobiDBLite Gene3D PANTHER Pfam PRINTS SMART SUPERFAMILY)

./interproscan.sh -t p -i 100.fasta -f TSV,gff3 -d ArHeCHN/ -appl Pfam,PANTHER,Gene3D,SMART,FunFam,MobiDBLite,CDD,SUPERFAMILY,PRINTS -goterms -iprlookup -cpu 8 > ArHeAnnot.log 2>&1

                ####9个库九库注释成功的执行脚本

用chatGPT进行SCI写作润色的提示词

    你是一个英文学术论文写作专家,以下是一篇学术论文中的一段内容,请先对其进行翻译为英文,并将此部分润色以满足学术标准,提高语法、清晰度和整体可读性,尽量使用被动语态,更像美国native writer一些,写作风格尽量精简,提高文章的学术性:在中国背景下,创业意向影响因素可划分为两层次(个体特质水平和个体资源水平)六维度(成就动机、风险承担、自主性、创业回馈、资源获得和未来就业)。这较之于传统对创业意向影响因素的探索主要集中于个体特质水平因素已有长足的进步。个人特质水平因素和个人资源水平因素在预测个体创业意向方面具有良好的互补性,同时考虑两个方面的因素可以更准确掌握个体创业意向。
https://zhuanlan.zhihu.com/p/637211471?utm_id=0

运行Gmap由CDS得到gff3

1.CDS和genome的序列名简洁,不要出现|等
2.将CDS序列统一为一行序列一行序列名
3.在运行 GMAP 前,需要先用 gmap_build 对基因组文件构建索引
gmap_build -d A.hirsutus.genome A.hirsutus.genome.fasta

#用测试数据执行
gmap -d A.hirsutus.genome -f gff3_gene -t 8 50.CDS.fasta > 50.CDS.gff3

#可能实际运行了下面的命令

 gmap.avx2 -d A.hirsutus.genome -f gff3_gene -t 8 A.hirsutu.oneline.CDS.fasta

#没能建立结构gff3索引的数据

BinPay虚拟信用卡平台

 

SRR解压为fastq流程

#1.登陆111.14.177.46

#2.切换到train用户

su train

#PASSWD与root一样

#3.进入SRR存储目录(以下面的目录为例)

cd /home/train/hd/SRP078467_leaf

#4.拷贝sra2fq.sh脚本

cp /home/train/hd/scripts/sra2fq.sh .

#5. 建立输入和输出文件夹

mkdir -p input

mkdir -p out

#6.input文件夹准备数据

mv SRR122* input

#7.执行脚本

nohup sh sra2fq.sh input out &

# 解压后的fq文件在 out文件夹里

tips:如出现报错,可能是文件夹的权限问题, 执行 sudo  chown -R train:train *  输入root密码

mysql数据库在cgi网页端显示?解决

#修改cgi程序中的sql语句,添加{    }内容

my $dbh = DBI->connect("dbi:mysql:tomatopan","tomatopan","tomatopan", {mysql_enable_utf8 => 1,}) or die "DB connect failed\n";

pathwayTools注释生成cyc时的步骤

1.提取intron,执行py脚本需要搭建python27的conda环境

#extract intron
#conda create -n python27 python=2.7
#conda activate python27  #注意老版本的miniconda是使用source activate ------不同版本的conda似乎有一个conda init的是否执行的区别?注意学习总结
#conda install -c bioconda misopy
python extract_intron_gff3_from_gff3.py Charmono_v1.1.gff3 Charmono_v1.1.introns.gff3
grep "intron" Charmono_v1.1.introns.gff3_introns.gff3 > Charmono_v1.1.introns.gff3
perl parseIntron.cgi Charmono_v1.1.introns.gff3 > Charmono_v1.1_introns.txt

perl单行集锦

perl -ne 'print unless $seen{(split /\s+/)[1].(split /\s+/)[2]}++' input_file.txt > output_file.txt

perl -ne 'print unless $. == 1 || $. == 2 || $. == 3' file

Deepseek 答

  • 论文方面
    • 合作署名(挂名导师通讯作者,提升论文竞争力)。
  • 课题方面
    • 聚焦 地方需求(如山东省海洋经济、农业升级相关选题)。
    • 申请 青年项目(如山东省自然科学基金青年基金,资助率更高)。

四、可行性评估与建议

1. 6年完成任务的可行性

  • 乐观场景(有团队支持+学科适配):
    ✅ 3年内发表SCI → 4-5年获批课题 → 成功率>70%
  • 保守场景(独立研究+实验学科):
    ⚠️ 4-5年发表SCI → 课题申请竞争激烈 → 成功率约50%

2. 提升成功率的策略

从eggNOG注释结果得到KEGG数据库

eggNOG注释可以间接获得KEGG注释结果,但需通过其整合的数据库映射实现。以下是具体机制、操作方法和注意事项:

一、eggNOG与KEGG的关联机制

eggNOG(Evolutionary Genealogy of Genes: Non-supervised Orthologous Groups)是一个跨物种的直系同源基因数据库,其注释整合了多个公共数据库(包括KEGG)。具体关联方式如下:

Pages

Subscribe to 我们的生信博客-QFNU RSS