注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

杨鸿智-后现代理论医学博客

《后现代医学》、《正反馈医学》、《自体原位器官重构技术》

 
 
 

日志

 
 
关于我

这是一个宣传后现代理论医学的博客.后现代理论医学是以系统理论为指导的新医学.该理论认为,在生命组织中干细胞是决定机体功能状态最基本的因素.通过调节机体内环境和为干细胞提供再生所需要的物质和能量,就可以使干细胞在患者体内原位再生,实现器官重构,使器质性病变得到治疗.现在,已经在北京医药信息学会内成立了后现代理论医学专业委员会,杨鸿智是主任委员.

网易考拉推荐

(6)阮奇桢:生物信息学的发展、现状与展望  

2013-06-23 19:07:51|  分类: 干细胞病 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

6)阮奇桢:生物信息学的发展、现状与展望 

阮奇桢

2006-02-25 15:55:41

http://shylockbaby.blog.163.com/blog/static/605330200612535541882/

 

摘要:

 

生物信息学(Bioinformatics)是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科。是计算机技术在命科学中的应用中的一个成功典范。本文着重介绍了在生物信息学中如何运用计算机科学的方法生物学数据进行收集、筛选、编辑、整理、管理和显示等等,从而达到研究生物学的目的。

 

. 生命科学简介

 

生命科学是当代世界科学发展的一个重要领域,有人称生命科学是21世纪的科学。千百年来,人类一直在对自身生命的奥秘进行探索。19世纪细胞学说的创立,把生命的研究层次带到了细胞水平。如何从更高的层次来了解生命的秘密、掌握生命的本质、最后达到控制生老病死的目标,这是人类长期以来的愿望。

 

随着2000年人类基因组测序的初步完成,以及水稻、牛、羊等其他生物基因组计划的全面实施,人类对生命的认识发展到分子阶段。这样生命科学从定性描述性的研究向定量确定性的方向迈进了一大步。当代生命科学研究的模式与传统的生物学研究模式有很大的区别,要求借助新的技术来研究分子水平的各种生命现象。基于计算机科学的信息技术,与生命科学相结合,在基因、制药、临床医疗等方面的研究取得了明显的进展,说明计算机与生命科学紧密相关。

 

生物信息学(Bioinformatics)是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的。由于当前生物信息学发展的主要推动力来自分子生物学,生物信息学的研究主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。生物信息学最终是一门研究生物系统中信息现象的学科,但目前的生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是网上的各种计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。

 

生物信息学不仅仅是一门科学学科,它更是一种重要的研究开发工具。 从科学的角度来讲,它是一门研究生物和生物相关系统中信息内容物和信息流向的综合系统科学,只有通过生物信息学的计算处理,我们才能从众多分散的生物学观测数据中获得对生命运行机制的详细和系统的理解。 从工具的角度来讲,它是今后几乎进行所有生物医药研究开发所必需的舵手和动力机,只有基于生物信息学通过对大量已有数据资料的分析处理所提供的理论指导和分析,我们才能选择正确的研发方向,同样,只有选择正确的生物信息学分析方法和手段,我们才能正确处理和评价新的观测数据并得到准确的结论。

可见生物信息学在今后的无论是生物医药科研还是开发中都具有广泛而关键的应用价值;而且,由于生物信息学是生物科学与计算科学、物理学、化学和计算机网络技术等密切结合的交叉性学科,使其具有非常强的专业性,这就使得专业的生物医药科研或开发机构自身难以胜任它们所必需的生物信息学业务,残酷的市场竞争及其所带来的市场高度专业化分工的趋势,使得专业的生物医药开发机构不可能在自身内部解决对生物信息学服务的迫切需求,学术界内的生物科研机构也是如此,而这种需求,仅靠那些高度分支化和学术化的分散的生物信息学科研机构是远远不能满足的。可见,在生命科学的新世纪,生物信息学综合服务将是一个非常重要的也是一个极具挑战性的领域。

 

. 生物信息学诞生的历史必然性

 

生物信息学就其萌生而言,是一门相当古老的学科,因为早在计算机初创期的1956年就已经在美国田纳西州的Gatlinburg召开过首次“生物学中的信息理论讨论会”;而就其发展而言,却是一门相当年轻的学科,因为继20余年的沉默之后,只有伴随着八九十年代计算机技术的迅猛发展,它才同时得以获得自身的大发展。无论从理论上来讲还是从现实情况来看,生物信息学的实质就是利用计算机科学和网络技术来解决生物学问题。它的诞生和发展是应时所需,是历史的必然,已经悄然渗透到生物科学的每一个角落,以至人们在意识到它的存在之前就已经离不开它了。

 

二十世纪尤其是末期,生物科学技术的迅猛发展,无论从数量上还是从质量上,都极大地丰富了生物科学的数据资源,数据资源的急剧膨胀首先迫使我们不得不考虑寻求一种强有力的工具去组织他们,以利于对已知生物学知识的储存和进一步加工利用。大量多样化的生物学数据资源中必然蕴含着大量重要的生物学规律,这些规律是我们解决许多生命之谜的关键所在,然而继续沿用传统手段以人脑来分析如此庞杂的数据实在是太勉为其难了,人们同样需要寻求一种强有力的工具去协助人脑完成这些分析工作。可以说,伴随着二十一世纪的到来,生物科学的重点和潜在的突破点已经由二十世纪的实验分析和数据积累转移到数据分析及其指导下的实验验证上来,生物科学也正在经历着一个从分析还原思维到系统整合思维的转变。

 

那么,我们所寻求的那种强有力的数据处理分析工具就成为未来生物科学的关键所在。似乎是上帝的恩赐,伴随着生物科学这一需求的加剧,以数据处理分析为本质的计算机科学技术和网络技术同样获得了突飞猛进的进展,自然就成为生物科学家的必然选择。计算机科学技术和网络技术日益渗透到生物科学的方方面面,一门崭新的、正是如火如荼的、拥有巨大发展潜力的生物信息学也就悄然而坚定地发展和成熟起来了。可以说,历史必然性的选择了生物信息学——生物科学与计算科学的融合体——作为下一代生物科学研究的重要工具。

 

. 生物信息学的研究内容

 

纵观当今生物信息学界的现状可以发现,大部分人都把注意力集中在基因组、蛋白质组、蛋白质结构以及与之相结合的药物设计上,其研究内容大致包括以下几个方面: 

 

1 生物信息的收集、存储、管理与提供。

 

包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息可视化和专家系统。

 

1.1 生物信息数据库。

 

建立数据库是生物信息学的重要内容,当前在Internet上可找到的各种数据库几乎覆盖了生命科学的各个领域,核酸序列数据库有GenBankEMBLDDBJ等,蛋白质序列数据库有SWISS-PROTPIROWLNRL3DTrEMBL等,三维结构数据库有PDBNDBBioMagResBankCCSD等,与蛋白质结构相关的数据库还有SCOPCATHFSSP3D-ALIDSSP等,与基因组有关的数据库有ESTdbOMIMGDBGSDB等,文献数据库有MedlineUncover等,此外还有其他数据库数百种。另外一些公司还开发了商业数据库如MDL等。

 

1.2 生物信息数据库发展现状。

 

数据库内容的爆炸性增长是生物信息学数据库的重要特征,这种趋势主要是因为基因组等计划的实施。除了在数量上的增长,数据库的复杂程度在不断增加,它包括了大量注释、参考文献及软件,并通过指针将相关内容连接到其它数据库。数据库结构层次的加深客观上要求管理的进步,当今面象对象数据库管理方法正在逐步取代旧的模式。在基因组相关数据库的发展中,以下几个方面特别引起人们的重视:建立基因组信息的评估与检测系统;数据标准化;进行基因组信息的可视化和专家系统的研究;发展次级与专业数据库。用户与数据库间迅速、有效地传递信息是基因组信息的收集、管理与使用一个要素,目前与基因组信息相关的数据库都有了自己的Internet地址和主页,同时在网上还出现了很多相关的在线服务器。

 

1.3 生物信息学网络上的数据库服务进展。

 

生物信息学各个领域中的软件数目庞大,并行算法、遗传算法、面向对象算法、并行虚拟机技术等已被应用到最新的程序中。生物信息学数据库覆盖面广,分布分散且格式不统一,因此一些生物计算中心将多个数据库整合在一起提供综合服务,提供了数据库的一体化和集成环境,生物信息网格中的数据库服务广泛采用服务器一客户式结构,这些服务器包括为数众多的数据库搜索和序列对比服务器以及各专业领域的服务器,甚至有服务器将各搜索算法硬件化,实行并行计算和先进的内存管理,令搜索速度大幅度提高。我国在基因组信息的收集与提供方面有了一定的工作:北京大学物理化学研究所建立了PDB数据库中国节点;北京大学生命科学院建立了EMBL数据库的中国节点;中国科学院生物物理所与日本JIPID的合作,收集了我国科学家测定的DNA和蛋白质序列并与国际相应数据库进行交流;中国医学科学院肿瘤研究所建立的NEE-HOW服务器等。相信这一领域在我国会迅速发展。

 

2 基因组序列信息的提取和分析。

 

包括基因的发现与鉴定,如利用国际ESTExpressed Sequence Tags)数据库 (dbEST) 和各自实验室测定的相应数据,经过大规模并行计算发现新基因和新SNPs以及各种功能位点;基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与DNA折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。

 

2.1 新基因的发现。

 

包括通过计算分析从EST序列库中拼接出完整的新基因编码区,也就是通俗所说的“电子克隆”;通过计算分析从基因组DNA序列中确定新基因编码区,经过多年的积累,已经形成许多分析方法,如根据编码区具有的独特序列特征、根据编码区与非编码区在碱基组成上的差异、根据高维分布的统计方法、根据神经网络方法、根据分形方法和根据密码学方法等。

 

2.2 非蛋白编码区生物学意义的分析。

 

非蛋白编码区约占人类基因组的95%,其生物学意义目前尚不是很清楚,但从演化观点来看,其中必然蕴含着重要的生物学功能;由于它们并不编码蛋白,一般认为,它们的生物学功能可能体现在对基因表达的时空调控上。对非蛋白编码区进行生物学意义分析的策略有两种,一种是基于已有的已经为实验证实的所有功能已知的DNA元件的序列特征,预测非蛋白编码区中可能含有的功能已知的DNA元件,从而预测其可能的生物学功能,并通过实验进行验证;另一种则是通过数理理论直接探索非蛋白编码区的新的未知的序列特征,并从理论上预测其可能的信息含义,最后同样通过实验验证。

 

3 功能基因组相关信息分析。

 

包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究。

 

3.1 基因组整体功能及其调节网络的系统把握。

 

把握生命的本质,仅仅掌握基因组中部分基因的表达调控是远远不够的,因为生命现象是基因组中所有功能单元相互作用共同制造出来的。基因芯片技术由于可以监测基因组在各种时间断面上的整体转录表达状况,因此成为该领域中一项非常重要和关键的实验技术,对该技术所产生的大量实验数据进行高效分析,从中获得基因组运转以及调控的整体系统的机制或者是网络机制,便成了生物信息学在该领域中首先要解决的问题。

 

3.2 基因组演化与物种演化。

 

尽管已经在分子演化方面取得了许多重要的成就,但仅仅依靠某些基因或者分子的演化现象,就想阐明物种整体的演化历史似乎不太可靠。例如,人与黑猩猩之间有98%-99%的结构基因和蛋白质是相同的,然而表型上却具有如此巨大的差异,这就不能不使我们联想到形形色色千差万别的建筑楼群,它们的外观如此不同,但基础的部件组成却是几乎一样的,差别就在于这些基础部件的组织方式不同,这就提示我们基因组整体组织方式而不仅仅是个别基因在研究物种演化历史中的重要作用。由于基因组是物种所有遗传信息的储藏库,从根本上决定着物种个体的发育和生理,因此,从基因组整体结构组织和整体功能调节网络方面,结合相应的生理表征现象,进行基因组整体的演化研究,将是揭示物种真实演化历史的最佳途径。

 

4 蛋白质组学研究。

 

基因组对生命体的整体控制必须通过它所表达的全部蛋白质来执行,由于基因芯片技术只能反映从基因组到RNA的转录水平上的表达情况,由于从RNA到蛋白质还有许多中间环节的影响,因此仅凭基因芯片技术我们还不能最终掌握生物功能具体执行者——蛋白质的整体表达状况;因此,近几年在发展基因芯片的同时,人们也发展了一套研究基因组所有蛋白质产物表达情况——蛋白质组学技术,从技术上来讲包括二维凝胶电泳技术和质谱测序技术。通过二维凝胶电泳技术可以获得某一时间截面上蛋白质组的表达情况,通过质谱测序技术就可以得到所有这些蛋白质的序列组成。这些都是技术实现问题,最重要的就是如何运用生物信息学理论方法去分析所得到的巨量数据,从中还原出生命运转和调控的整体系统的分子机制。  

 

5 蛋白质结构和功能的预测。

 

结构基因组和蛋白质组研究的迅猛发展,使许多新的蛋白序列涌现出来,然而要想了解它们的功能,只有氨基酸序列是远远不够的,因为蛋白质的功能是通过其三维结构来实现的,而且蛋白质三维结构也不一定是静态的,在行使功能的过程中其结构也会相应的有所改变。因此,得到这些新蛋白的完整、精确和动态的三维结构就成为摆在我们面前的紧迫任务。目前除了通过诸如X射线衍射晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法得到蛋白质三维结构之外,另外一种广泛使用的方法就是通过计算机辅助预测的方法。目前,一般认为蛋白质的折叠类型只有数百到数千种,远远小于蛋白质所具有的自由度数目,而且蛋白质的折叠类型与其氨基酸序列具有相关性,这样就有可能直接从蛋白质的氨基酸序列通过计算机辅助方法预测出蛋白质的三维结构。

 

6 生物大分子结构模拟和药物设计。

 

包括RNA的结构模拟和反义RNA的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于DNA结构的药物设计等。近年来随着结构生物学的发展,相当数量的蛋白质以及一些核酸、多糖的三维结构获得精确测定,基于生物大分子结构知识的药物设计成为当前的热点。生物信息学的研究不仅可提供生物大分子空间结构的信息,还能提供电子结构的信息,如能级、表面电荷分布、分子轨道相互作用等以及动力学行为的信息,如生物化学反应中的能量变化、电荷转移、构象变化等。理论模拟还可研究包括生物分子及其周围环境的复杂体系和生物分子的量子效应。

 

7 生物信息分析的技术与方法研究。

 

包括发展有效的能支持大规模作图与测序需要的软件、数据库以及若干数据库工具,诸如电子网络等远程通讯工具;改进现有的理论分析方法,如统计方法、模式识别方法、隐马尔科夫过程方法、分维方法、神经网络方法、复杂性分析方法、密码学方法、多序列比较方法等;创建一切适用于基因组信息分析的新方法、新技术。包括引入复杂系统分析技术、信息系统分析技术等;建立严格的多序列比较方法;发展与应用密码学方法以及其他算法和分析技术,用于解释基因组的信息,探索DNA序列及其空间结构信息的新表征;发展研究基因组完整信息结构和信息网络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。

 

8 应用与发展研究。

 

汇集与疾病相关的人类基因信息,发展患者样品序列信息检测技术和基于序列信息选择表达载体、引物的技术,建立与动植物良种繁育相关的数据库以及与大分子设计和药物设计相关的数据库。

 

其实生物信息学的任务远不止于此。在以上工作的基础上,最重要的是如何运用数理理论成果对生物体进行完整系统的数理模型描述,使得人类能够从一个更加明确的角度和一个更加易于操作的途径来认识和控制自身以及其他的生命体。

 

. 生物信息学发展的现状

 

随着基因组计划的不断进展,我们拥有的海量数据必须通过生物信息学的手段进行收集、分析和整理后,才能成为有用的信息和知识,也就是说,只有经过生物信息学手段的分析处理,我们才能获得对基因组的正确理解,因此可以说是人类基因组计划为生物信息学提供了兴盛的契机,创造了施展身手的巨大空间。生物信息学已然深入到了生命科学的方方面面。

 

国外一直非常重视生物信息学的发展,各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增。但由于对生物信息学的需求是如此迅猛,即使是象美国这样的发达国家也面临着供不应求、人才匮乏的局面。近来,英国鉴于国内对生物信息学专业人才日益迫切的需求,所有主要的研究资助机构[医学研究委员会(MRCMedical Reasearch Council)、生物技术和生物科学研究委员会、工程学和物理科学研究委员会(EPSRCEngineering and Physical Sciences Research Council)、粒子物理和天文学研究委员会(PPARCParticle and Astronomy Research Council)和Wellcome Trust]不仅已经达成共识,认为应该高度优先地满足对生物信息学技术的需求,而且已经实现了对生物信息学人才培养的大力资助。

 

事实上,欧美等发达国家在生物信息方面已有较长时间的积累。从数据库的角度来讲,早在60年代,美国就建立了手工搜集数据的蛋白质数据库。美国洛斯阿拉莫斯国家实验室1979年就已经建立起GenBank数据库,欧洲分子生物学实验室1982年就已经提供核酸序列数据库EMBL的服务,日本也于1984年着手建立国家级的核酸序列数据库DDBJ并于1987年开始提供服务。从专业机构的角度来讲,美国于1988年在国会的支持下成立了国家生物技术信息中心(NCBI),其目的是进行计算分子生物学的基础研究,构建和散布分子生物学数据库;欧洲于19933月就着手建立欧洲生物信息学研究所(EBI,日本也于19954月组建了自己的信息生物学中心(CIB)。从数据分析技术的角度来讲,早在1962年,ZuckerkandlPauling就将序列变异分析与其演化关系联系起来,从而开辟了分子演化的崭新研究领域;1964年,Davies开创了蛋白质结构预测的研究;1970年,NeedlemanWunsch发表了广受重视的两序列比较算法;1974年,Ratner首先运用理论方法对分子遗传调控系统进行处理分析;1975年,PipasMcMahon首先提出运用计算机技术预测RNA二级结构;随着1976年之后大量生物学数据分析技术的涌现,Science1980年第209卷就已经发表了关于计算分子生物学的综述;正如我们现在所看到的那样,在八九十年代,生物学数据分析技术在国外更是获得了突飞猛进的发展。从专业出版业来看,由于没有专业领域专门的期刊,起初的专业文献都散落在各种其他领域的期刊中;到了1970年,出现了Computer Methods and Programs in Biomedicine这本相关期刊;到19854月,就有了第一种生物信息学专业期刊——Computer Application in the Biosciences;现在,我们可以看到的专业期刊已经很多了,包括书面期刊和网上期刊两种,如Bioinformatics (formerly Computer Applications in the Biosciences) Acta BiotheoreticaBio Informatics Technology & Systems Bioinform Newsletter Briefings in Bioinformatics 以及Journal of Computational Biology 等。从网络资源来看,国外互联网上的生物信息学网点非常繁多,大到代表国家级研究机构的、小到代表专业实验室的都有,大型机构的网点一般提供相关新闻、数据库服务和软件在线服务,小型科研机构一般是介绍自己的研究成果,有的还提供自己设计的算法的在线服务,总体而言,基本都是面向生物信息学专业人士,各种分析方法虽然很全面,但却分散在不同的网点,分析结果也需专业人士来解读。

 

目前,绝大部分的核酸和蛋白质数据库由美国、欧洲和日本的3家数据库系统产生;他们共同组成了DDBJ/EMBL/GenBank国际核酸序列数据库,每天交换数据,同步更新。其他一些国家,如德国、法国、意大利、瑞士、澳大利亚、丹麦和以色列等,在分享网络共享资源的同时,也分别建有自己的生物信息学机构、二级或更高级的具有各自特色的专业数据库以及自己的分析技术,服务于本国生物医学研究和开发,有些服务也开放于全世界。

 

国内对生物信息学领域也越来越重视,自北京大学物理化学研究所于1996年建立了国内第一家生物信息学网络服务器以来,我国生物信息学也蓬勃发展了起来,国内近年来开展生物信息学研究的单位主要有:北京大学、清华大学、中国科学院生物物理所、军事医学科学院、上海生命科学研究院、中国科学院微生物所、中国科学院遗传所人类基因组中心、中国医学科学院、天津大学、复旦大学、南开大学、中国科技大学、东南大学、内蒙古大学等。北京大学于19973月成立了生物信息学中心,中科院上海生命科学研究院也于20003月成立了生物信息学中心,分别维护着国内两个专业水平相对较高的生物信息学网站,但从全国总体上来看与国际水平差距很大。一方面,国内生物(医药)科学研究与开发对生物信息学研究和服务的需求市场非常广阔,另一方面,真正开展生物信息学具体研究和服务的机构或公司却相对较少,仅有的几家科研机构主要开展生物信息学理论研究,声称提供生物信息学服务的公司所提供的服务也仅局限于简单的计算机辅助分子生物学实验设计,而且服务体系并不完善;目前国内互联网上已经有了几家生物信息学网站,但大部分偏于所有生物(医)学领域的新闻报道,生物信息学专业技术服务的含量太少,研究力量薄弱,这就与国外有了较大差距。

 

. 生物信息学的发展展望

 

生物信息学是适应人类基因组信息分析的需要而出现的一门与信息科学、数学、计算机科学等交叉的新兴学科,生物信息学已经成为基因组研究中强有力的必不可少的研究手段,被广泛地用来加快新基因的寻找过程,以达到将"有用"新基因抢先注册专利的目的。在这场世界范围内的竞争中,中国科学家以及科研资金投向的决策部门如何结合我国科研水平的现状、优势领域等客观情况将有限的投资投入以求获得最大可能的科学研究以及商业回报,是一个无法回避的新课题。 面对挑战,生物信息学在21世纪的发展进程中,应该考虑到它的历史使命。在今后的工作中,应该做好以下几个方面的工作:

 

1.    理论研究

 

任何学科的发展都离不开基础理论的研究,生物信息学也不例外。它对许多学科都提出了巨大的挑战。今后科学家在理论研究方面要做好几个主要工作:人类基因组信息结构复杂性研究;序列(特别是非编码区)信息分析;基因组结构与遗传语言;语法和词法分析;大规模基因表达谱分析,相关算法、软件研究;基因表达调控网络研究;基因组信息相关的蛋白质功能分析。

 

2.    软件开发。

 

现在虽然已经开发出大量的软件工具,但是大多数软件缺乏技术细节的描述,使得新软件编制时不能很好的利用已有的软件资源,造成各种软件都有自己的输入输出格式,相互之间互不通用。同时,大量软件的出现带来一个新问题,即生物学家面对数量众多的软件无从选择。这两个问题的解决需要对各种软件的功能特性和技术细节进行详尽的介绍,并进行比较。

 

3 集成数据库。

 

公共数据库与因特网相连,为世界各地的科学家提供快速高效的服务,因而成为获取生物学数据的最佳媒介。目前,国际上著名的公共数据库有GenbankEMBLDDBJSwiss-PortPIRPDB等。

 

4 生物数据的质量监控。

 

监控已有的生物数据究竟具有多大的可信度,对于物理图谱的构建工作有十分重大的意义。

 

5 学科交叉。

 

长期以来,生物学家、计算机科学家、数学家这三类科学家都是埋头于各自的研究领域,而不关心其它学科的发展和要求。这种状况在我国尤为突出。生物信息学的发展要求三者之间加强沟通,其意义不仅在于推动生物信息学自身的发展,而且将成为促进整个生物学发展的强大动力。

 

生物信息学是一门对已有数据进行研究和理解的学科。根据统计学原理,在一定程度上,统计结果的显著性与数据量的对数成正比。因此,随着数据库中数据量的飞速增长基于数据库的研究工作必将有所突破。可以相信,随着人类基因组计划的即将完成以及蛋白质组研究的逐步开展,生物信息学在揭示生命的奥秘中会更加成熟和完善,生物信息学科也将随之得到巨大发展。相信在人类基因组计划和即将开始的中国人基因组研究计划中,生物信息学将发挥越来越大的作用,并推动生物学进入一个全新的境界。

 

  评论这张
 
阅读(135)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017