生物信息学的打怪升级—初段小白必备
写在前面
生物信息学是什么?
Bio + informatics=Bioinformatics
生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
作为一门跨学科的科学领域,生物信息学将计算机科学,统计学,数学和工程学结合起来,分析和解释生物学数据。生信未来整体前景非常好,需求超过了供给。对于做烦实验的科研人员来说,生信能够给你的更多,并且能够使你迅速转到进展更快的研究上,就算以后不走学术研究,计算技能也是高度可转移的,并且是终生受益的。虽然现在还没有很系统的教材和资料,不过你不妨从这篇入手开始或者重振生信之路。
这里转载和整理了博耘生物老师的博客,快来看看你在初段的哪一级别吧!
对于一个初学者或者已经入门的
如何来确定自己的方向
首先是从事或者学习生物信息要经历的几个阶段的划分:
∞ 初级,菜鸟,入门
∞ 初中级,数据处理员,执行员,操作员
∞ 中级,讲师,助理研究员
∞ 初高级,学者,老师,副研究员
∞ 高级,研究员,大师,学家
再次是职业发展方向的划分,存在哪些生态位:
ʚ 生物信息实习生
ʚ 生物信息学分析人员
ʚ 生物信息学工程师
ʚ 生物信息学研究主管
ʚ 生物信息学研究员
01
初级
生命科学的重点已由实验分析和数据积累
开始向数据分析及其指导下的实验验证转移
生命科学正在经历着从分析还原思维到系统整合思维的转变
正是因为这样的转变,
生物信息初级阶段
已经成为分子生物学的相关的专业的一个普遍要求,会查找和利用数据资源,会对数据进行基本的分析,或许你的方向不同,所要求你掌握的重点也不同
如果刚刚开始,下面的提纲,可以供你参考,
这是来自于实践的,而不是某种教学大纲。
生物学背景
Ø 熟悉核酸、蛋白质、RNA、中心法则等遗传学的相关概念,原理;
Ø 熟悉基因、基因组、基因组计划,测序方法、遗传图谱、物理图谱等相关知识;
Ø 了解基本的实验流程,比如PCR、凝胶电泳、文库、基因克隆、RC-PCR、x杂交、芯片等基因工程方面的实验的原理、流程;
Ø 专业英文基础
计算机背景
Ø 了解基础的网络知识,网络使用方法,如用Google进行搜索;
Ø 了解操作系统,会软件的安装与卸载;
Ø 了解基本的文件类型,比如什么是文本文件,会使用不同的程序打开相同的文件;
生物信息学
Ø 熟悉NCBI、EBI、DDBJ等网站的数据库,会熟练对核酸、蛋白质数据库进行检索,并对检索结果按照指定格式进行批量下载;
Ø 熟悉常用的数据格式,比如FASTA,Genbank,Swissprot,aln等,并会使用文本编辑器查看、编辑这些文件;
Ø 会使用网络版的BLAST、Cluster等软件的基本功能,会简单的结果分析;
会对测序结果进行处理比如去除载体,序列核对,鉴定等,了解峰图的含义;
Ø 会DNAMAN、Primer5、MEG、BioEidt等软件的安装与使用;
你可以做什么了
Ø 了解基因组研究进展,为实验设计做前期的调研,分析准备工作;
Ø 测序结果的分析,得出结论;
示例
Ø 基因的clone与鉴定,比如通过16s RNA序列鉴定新物种;
参考书目
Ø 《基因组》
Ø 《生物信息》
02
初中级
这个级别可以根据自己的发展方向、兴趣爱好
选择侧重点,可以选择偏向生物方面的对于生物统计、生物化学、物理化学等学科深入学习
方向侧重于算法研究方面;另一方面可以侧重计算方面,对于linux操作系统、数据库、perl、java、web技术等深入进行学习
当然这两个方向又是互补的
不是仅仅选择一个就可以了
生物学方面
Ø 系统生物学方面,对于物种演化等有深入的理解;
Ø 对于组学,比如基因组、蛋白组、代谢组、表达谱等等的理解;
Ø 对于线性代数、生物统计等的深入学习;
Ø 对于蛋白质的二级、三级结构,核酸的结构、物理化学性质进行深入的学习;
Ø 专业英文的学习,多看外文资料
计算机方面
Ø linux操作系统的熟悉,系统的安装、环境的配置,软件的编译安装,涉及到操作系统,要学习的地方就有很多。
Ø perl的学习;
Ø Java、C++的学习;
Ø 数据库比如mysql的初步了解,安装,建表,简单的查询;
Ø Apache的了解
生物信息学方面
Ø 学习一些算法,Blast、Cluster等比对如何实现的;
Ø Blast的本地化,可以进行库对库的比对,并可以对结果进行处理;
Ø 了解常用的软件,并能根据操作手册进行安装使用,并能说明你为什么要用这个软件;
Ø 了解NCBI上的各个数据库,会使用BLAST的高级功能,会使用seqin提交数据;
Ø 会使用bioperl,进行数据格式的转变等
你可以做什么了
画系统树,可以得到专家的认可。
参考书目
Ø 《生物化学》
Ø 《生物信息》
03
初高级
这个级别的特点体现在创新
新的算法,得到新的结论
新的流程,提高了效率
新的界面,提高了可用性
新的平台,促进了数据的交流与共享
各种表达谱数据处理
系统生物学方面
算法开发方面
综合分析平台的建立
蛋白质组方面
功能基因组方面
没有列到的其他方面
0301
综合分析平台的建立
Ø 复杂数据库的设计;
Ø 并行集群的使用;
Ø 海量数据的存储与检索;
0302
各种表达谱数据的处理
Ø 更加易用的软件的开发,多种处理方法的集合
0303
蛋白质组方面
Ø 符合规范共享系统的建立
0304
功能基因组方面
Ø 基因预测的精度
Ø 比较基因组
参考资料
基本没有什么书可以参考,要靠你出书了。
科研路其修远兮,吾将上下而求索。有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。
踌躇满志无限期
扬帆起航正当时
科研小助理为您在线解答