DNAstar蛋白分析入门
准备介绍一下DNAstar里面的蛋白分析功能,不过只是入门级别的介绍,我是做生化实验的,对于生物软件,只关心他们对我的实验有什么帮助,不关心后面的算法、程序等等生物信息学的东西。
DNAstar蛋白分析功能特点:
1、蛋白一级和二级结构分析在同类软件里面算比较全面; 2、用户设定功能少,所以比较傻,容易上手; 3、结果报告图形漂亮。 缺点:
1、绝大多数分析功能的报告都不能保存且无法输出,只能拷屏,简直就象demo软件; 2、因为用户设定功能太少,结果常常不让人满意也无法修改,比如氨基酸颜色无法改变;
3、没有基于结构的 alignment 分析;
4、功能模块分割,做一个工作要进入不同模块,就象完成一个任务要打开几个软件,这是DNAstar最为愚蠢的地方。当然这主要是因为原来的版本从unix发展而来,是历史遗留问题。
同样也因为是基于 unix 的原因,让我得到一个好处,老版本安装以后,直接拷贝目录,完全可以成为绿色免安装软件。我到现在仍然在用这最早的版本,好像没有感觉到新版本有任何提高(除了网络查询功能,而DNAstar的网络功能跟CM7比,简直就不如没有),所以安装了新版本以后马上也就删除了。
―――――――――――――――――――――――――――――――――――――――
第一步:editseq 建立蛋白序列和初步分析蛋白生化特性
进入 editseq 模块后,由于默认序列文件是核酸文件,所以必须关闭默认窗口,重新建立一个序列文件,选择蛋白序列文件类型。
建立新序列的方式非常多,包括:手工输入、剪贴板拷贝、直接导入序列以及通过网络查询导入,这里不深入讨论,举例用手工输入一个短序列。在序列输入过程中,我们即可以看见蛋白生化性质相关的一些数据显示,并且随输入序列而改变,见下图红圈中的内容,显示氨基酸序数,蛋白质分子量、电荷以及等电点。
通过蛋白统计数据显示,可以看见更多的蛋白质序列组成及生化特性的详细分析,注意分析前必须选中一段序列,这种方法可以用于分析蛋白序列中某区段的序列。
以下是刚才那段序列的统计结果:
DNAstar Editseq 模块一个最为突出的功能是可以发声朗读序列,序列输入完毕,通过电脑模拟读音念一遍,可以进行序列校对。 1、把光标定位到准备校对部分的起始
2、选中windows voice
3、执行ProofRead Sequence命令
保存蛋白序列文件,文件后缀自动生成为.pro,蛋白序列构建完毕。
第二步:Protean 进行蛋白二级结构预测
下面这个图是 dnastar Protean 模块预测 GM-CSFR (NCBI accession number: NP_034100) 的结果。新版 dnastar 可以直接通过 entrez 得到这个序列,序列调入 protean 后自动出现默认预测结果。我们后面的讨论将以这个蛋白为例分析几个比较常用的(或者说我曾经在论坛看见有人提问的)几个预测方法。