注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

杨鸿智-后现代理论医学博客

《后现代医学》、《正反馈医学》、《自体原位器官重构技术》

 
 
 

日志

 
 
关于我

这是一个宣传后现代理论医学的博客.后现代理论医学是以系统理论为指导的新医学.该理论认为,在生命组织中干细胞是决定机体功能状态最基本的因素.通过调节机体内环境和为干细胞提供再生所需要的物质和能量,就可以使干细胞在患者体内原位再生,实现器官重构,使器质性病变得到治疗.现在,已经在北京医药信息学会内成立了后现代理论医学专业委员会,杨鸿智是主任委员.

网易考拉推荐

(14)系统生物学的文章  

2013-06-13 09:34:25|  分类: 干细胞病 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

14)系统生物学的文章

 

系统生物学是生物学的新研究领域,其目的在于从系统水平来理解生物学系统。分子生物学使生物系统的理解取得显著进展,目前它主要专注于基因的鉴别及其产物的功能等一些部分。随之而来的挑战是从系统水平理解分子生物学所揭示的各个部分所组成的生物学系统。科学发展总是周而复始,从系统水平来理解并非全新的尝试。然而,由于基于分子水平的坚实的知识基础,却是第一次使我们能理解生物学系统。现在正是揭示生物学系统基本原理、深刻理解系统行为并加以应用的黄金时刻。为了抓住这一机遇,建立从整体上来理解生物学系统的方法和技术是其根本。通过它们,可以研究:1)系统结构,如基因、代谢、信号转导网络以及物理结构;2)这些系统的动力学特性;3)控制系统的方法;4)设计和修改系统的方法。系统生物学提供了系统水平对生命的理解,这里我们给出了系统生物学领域的概述。

 

    1 引言

 

生物学的根本目标是理解生物学系统的每一个细节及原理。大约50年前,WatsonCrick发现了DNA的结构(Watson and Crick, 1953),从此开辟了生物学的全新道路。他们工作的完美在于他们将生物学现象建立于分子基础之上。因此,基于坚实的理论基础描述诸如遗传、发育、疾病、进化等生命现象成为可能。生物学成为基于物理学基本规律的坚实的知识结构的一部分。从此,分子生物学研究领域形成,并取得巨大的成功。分子生物学使我们将生物学系统理解为分子机器。今天,我们深刻的理解了遗传、进化、发育、疾病背后的基本过程。那些机制包括复制、转录、翻译等等。

 

随着DNA被完整测序,大量的基因及其转录后产物的功能被鉴别出来。诸如支原体、大肠杆菌(E. Coli)C. elegansDrosophila melanogaster以及现代人(Homo sapiens)DNA序列均被完全测定。目前已有方法能在mRNA水平全面测量得到基因表达特征。测量蛋白质水平及其相互作用的方法也取得进展(Ito et al.,2000; Schwikowski et al. 2000)。与此同时,很多用来破坏基因转录的方法也得以发明,如使特定基因功能失效的knockout 以及对C. elegans特别有效正被推广到其他种类的RNA干扰(RNAi)方法。

 

毫无疑义,对生物学系统分子水平机制的理解将加速发展。然而,这样的知识并不能提供给我们对生物学系统在系统层次上的理解。基因和蛋白质都是系统的组成成分。理解组成系统的各个部分对理解系统非常必要,但不充分。系统生物学作为新的生物学研究领域,其目的在于从系统水平对生物学系统进行理解。系统水平的理解需要一组原理和方法来联系分子行为和系统特征、功能。最终,细胞、器官和人将在系统水平得以理解,其理解基于物理学基本原理支撑的坚实的知识结构。科学总是周而复始,从系统水平理解生物学系统这不是第一次。Norbett Wiener是最早提出系统层次理解的先驱,这导致控制论、生物控制论的产生(Wiener,1948)。Ludwig von Bertalanffy1968年试图建立通用的系统理论(von Bertalanffy, 1968),虽然该理论由于太抽象而不是很有根据。Cannon1933)早期的工作中也可见类似工作,他提出了“动态平衡”(homeotasis)的概念。由于分子生物学有限的知识,大多数这样一些尝试都集中于在生理水平上描述和分析生物学系统。区别系统生物学和过去的尝试的唯一特征在于,系统生物学有可能将系统水平的理解直接建立于分子水平如基因、蛋白质等,而过去的尝试不可能建立系统水平描述和分子水平知识之间充分的联系。因此,尽管这不是第一次从系统水平进行理解,却是第一次有机会从分子水平到系统水平建立坚实的知识结构进而理解生物学系统。

 

系统生物学潜在的研究范围十分广泛,每一个研究目标可能采用不同的技术。它需要来自多个研究领域如分子生物学、高精度测量、计算机科学、控制理论以及其他科学与工程研究领域集体的努力。它需要在以下四个关键领域进行研究:1)基因学及其它分子生物学研究;2)计算科学研究如仿真、生物信息学及软件工具;3)系统动力学分析;以及4)高精度综合测量技术。这样组成的多学科研究使我们能从将生物学系统当作一个系统来理解。这是什么意思?”系统”本身是一个抽象的概念。它基本上是一组组分按特定格式组成的集合,然而它不仅仅是组分的简单累积。理解系统,仅仅在细节上予以描述是远远不够的,还需要理解特定刺激或破坏下系统的行为。最终,我们将能够设计系统以满足特定的功能需求。因此,它不仅仅是简单的深入的描述,它需要更多积极的综合来确保我们充分的理解。

 

    特别地,为了从系统角度理解生物学系统,我们需要完成以下一些工作。

 

    系统结构的辨识

 

首先,系统结构需要被辨识,特别是诸如基因与信号转导、代谢通路相关的蛋白质相互作用的调控关系,以及有机体、细胞、细胞器、染色质以及其他组分的物理结构。组分所构成的网络的拓扑关系以及每一种关系的参数都需要被确定。其中高通量DNA芯片、蛋白质芯片、RT-PCR以及其他监测批量生物学过程的方法十分重要。不过从这样一些实验数据识别基因、代谢网络的方法已经建立起来。

 

    由于细胞与细胞之间通信、三维空间物理构形等的影响,多细胞有机体的基因调控网络的识别十分复杂。多细胞有机体结构的识别不可避免地包括,不仅需要辨识基因调控网络、代谢网络地结构,而且还需要在细胞层次精确理解整个动物的物理结构。显然需要开发新的仪器系统来收集必要的数据。

 

    系统行为分析

 

    一旦系统结构在一定程度上被弄清楚,它的行为就需要被研究了。可以使用多种分析方法。譬如,有人想知道特定行为对外界扰动的敏感性,系统在刺激后多长时间恢复到正常状态。这样的分析不仅仅揭示了系统水平的特征,而且可以通过发现细胞对特定化学物质的反应来深入理解医学治疗,以至最大程度减少副作用提高效果。

 

    系统控制

 

    为了应用来自系统结构和行为理解的知识成果,有必要建立一个控制生物学系统状态的方法。我们如何将功能异常的细胞改变成健康的细胞?我们如何控制癌细胞使之成为正常细胞或调亡?我们能控制特定细胞成为干细胞的情形吗,能控制它成为想要的细胞类型吗?完成这些控制的技术对人类健康造福无穷。

 

    系统设计

 

最终,我们希望建立技术允许我们为了治疗疾病设计生物学系统。我们未来的例子将是从病人自己的组织设计和生长器官。这样的器官克隆技术对需要器官移植的疾病治疗有巨大的用途。通过为机器人、计算等使用生物学材料,它也有广泛的工程用途。自修复、自维持能力的材料对工业系统将是革命性的。本章讨论了深入理解系统相关的科学与工程问题。

 

2、测量技术与实验方法

 

    综合测量

 

    为了掌握研究的整个有机体,需要产生一组全面的数据集。例如,推导酵母的整个序列,使用基因芯片测量所有已知基因表达。此外使用two-hybrid方法进行蛋白质之间相互作用的广泛研究(Ito et al.,2000; Schwikowski et al.,2000)。又如正在进行的蛋白质的高精度时空定位数据的获取。C. elegans是一例得以广泛测量的多细胞有机体。整个细胞系都被识别(Sulston et al., 1983; Sulston and Horvitz,1977,神经系统的拓扑结构得以完全描述(White et al.,1986),DNA序列被完全测定(The C. elegans Sequencing Consortium, 1988),一个使用整体原位杂交(whole-mount in situ hybridization)来完全描述其发育过程中基因表达模式的项目也正在进行中(Tabara et al.,1996),一个系统的详尽的变异体库也开始构建。此外,还有一系列的相关项目已经启动,诸如活体测量其神经活动,使用专门显微术、先进图像处理技术实时观测细胞系自动构造(Yasuda et al., 1999; Onami et al., 2001a)。当酵母、C. elegans为例得以全面、详尽的研究时,其他很多生物学系统也有类似研究计划。尽管这些研究目前仍局限于理解系统的各个部分,以及各个部分之间的关系,但那些详尽的实验、计算、理论研究工作有机的组合将给系统生物学提供可行的基础。

 

    系统生物学测量

 

尽管系统的获得全面的、精确的数据集的工作正在进行,系统生物学更需要实验生物学家而不是现在生物学实践。它需要全面的数据,并控制产生数据的质量,把它当作仿真、建模以及系统辨识的参考。最后,现在很多的实验程序将被自动化,从而允许高通量的实验来精确控制质量。不必说,并非所有的生物学实验都必须是自动化的形式,尽管小规模的实验起重要作用,然而大规模的实验却奠定系统水平理解的基础。

 

高通量、全面、精确的测量是生物学的最基本的一点。对计算方法期望过高,认为能克服传统生物学的局限,当缺少计算研究所引以为基础的实验数据时,它是不可能产生重要的结果。对成功的计算系统方法,测量必须是1)全面的;2)量化精确的;3)系统的。对量化精确的需要是显然的,其他两条准则则需要进一步澄清。全面性可进一步分为三类:

    Factor comprehensiveness:目标要素必须得以全面测量,如众多的基因和蛋白质。对与所研究的中心基因和蛋白质相关的所有要素进行测量是十分重要的。除非所有基因、蛋白质都已经被测量过,否则测量方法的有效性比要素数目的测量更加重要。

 

Time-series comprehensiveness:在对动态系统进行建模和分析的时候,获取精细粒度的时间序列行为非常重要。传统生物学实验往往倾向于仅测量特定事件的变化前后。对计算分析而言,恒定时间间隔的采用数据是基本的。

 

Item comprehensiveness:有些情况下,对特定目标的几个特征譬如转录水平、蛋白质相互作用、磷酸化等必须全面测量。”系统”就是意味着测量所得到的数据必须是一致的完整的。理想的系统测量是对一个样本的多个特征同时测量。开发先进的模型并进行mRNA或蛋白质水平的分析是远远不够。多类数据必需整合。得到数据点的样本在不同测量中必须一致。如果样本按实质上不同的方法准备,两数据点就不能被整合。尽管这一要求听起来很显然,现在却很少有数据集可以满足这一准则。

 

这些准则由下面需要实验数据的例子进一步说明。

 

例如,为了从表达特征(expression profile)推导基因调控网络,需要全面测量基因表达特征。通用类型(wild-type)的表达数据往往难以满足要求。它需要每个基因缺失和过表达(overexpression)所导致的变异体的完整数据集。所有knock out基因的数据集使用基因芯片测量。如果因为价格或时间限制仅仅有限个基因被knock out,那么knock out紧耦合的基因比在整个调控网络上稀疏地knock out一些基因要好的多。这是因为从特征数据重构基因调控网络地逆向工程算法特征所决定。使用该算法,稀疏数据点给可能的网络结构留下了很多不确定因素。即算是使用相同数量的数据,测量密切相关的基因所产生的网络也更可靠。这就是要素全面性。时间序列全面性则对时间排序的现象是必须的。时间序列数据需要特别谨慎,保证样本同步测量。

 

在传统生物学实验中往往是这样的情况:只有两个测量点,一个在事件前,一个在事件后。例如,许多关于细胞衰老的研究测量年轻细胞、年老细胞以及不变细胞的衰老相关的基因表达,而不按精细的时间序列来记录表达水平的变化。很多情况下,表达水平随时间的变化对于产生或否定假设可能是十分重要的。除了需要在感兴趣的生物学时间前后需要测量外,还必须固定时间间隔的采样测量。表达特征数据具有可靠的采用时间和恒定的间隔对计算算法拟合模型、参数与实验数据十分有益。其他来自蛋白质之间相互作用的信息,譬如酵母two-hybrid实验,对推导蛋白质水平的交互,填充基因调控研究的差距就十分有用。蛋白质相互作用及表达特征必须在相同制备的样本上进行测量。这个系统测量的要求现在是十分难以满足的,因为很少的研究组可以提供多种测量技术。

 

在得到基因调控网络以后,就需要找出网络中特定的参数。为了理解动力学特性,必须得到网络的每一个参数,这样不同的数值仿真和分析才能得以进行。那些参数约束常数、转录速率、转换速率、化学反应、化学反应速率、退化速率、扩散率、转导速度等。除了一些特殊情况,譬如红细胞,这些常数不容易得到。通过提取的测量可以提供一定的信息,但是活体情况下这些速率常数往往变化迅速。理想情况下,大多数参数进行活体的全面测量,但是能给出合理估计的测量也十分有帮助。除了测量参数,高精度测量磷酸化状态也十分重要。

 

当精度很重要的时候,精度的水平根据所测量系统部分的不同而不同。在网络中的某些部分,系统行为对特定参数值十分敏感,因此需要高精度测量。另外一些部分,系统可能对大幅度波动比较稳定,这样确定系统稳定的范围可能就可以了,而无需得到高精度图示。这一点就是说并非系统的所有部分必须使用相同的精度。例如喷气式引擎的组件需要高精度,但是座椅绑带显然就无须和引擎同样的精度。将来类型及其对实验的精度需求可以通过理论条件确定。

 

    迄今为止,这些例子集中在生化网络结构和参数的辨识上,为所有物质在环境中均匀分布的简单假设下,生化网络的仿真和分析提供可能。不幸地是,实际生物学系统不是这样的情况。亚细胞结构以及转录产物的分布使其远非简单的模型。多细胞系统需要测量细胞之间的接触、扩散、细胞系、发育中的基因表达等等。对精确的模拟和分析,这些特征必须在全面、精确、系统的方式下进行测量。我们尚未开发装置得到这些特征的高通量测量。这是必须强调的重要事情。

 

    3、下一代实验系统

 

为了应付不断增长的全面、精确测量的需求,需要开发一系列新技术、新仪器提供高自动化程度、高精度的测量。首先常规实现的自动化程度需要大幅度提高以满足不断增长的建模和系统水平分析的需要。除非自动化程度大幅度提高否则高通量实验是一种体力劳动的梦魇。实验程序进一步的自动化程度提供将有益于实验的可靠性、通量以及长时间运行的整体成本。其次,需要采用刀刃技术(Cutting-edge)如微流系统、纳米技术、飞秒化学来设计和建造下一代实验装置。使用这些技术使我们可以测量、观察基因和蛋白质活动,这些观察目前尚不可能。已存设备的测量速度和精确度的提高也十分必要。在这些领域,测序、蛋白质组学是显然需要的,这些目标目前已经在进行。在使用高密度毛细管阵列电极开发高通量测序器外,在单个微器件上进行PCR和毛细管电极的集成微结构器件也正在开发中(Lagally et al., 1999; Simpson et al.,1998)。这样一些器件不仅仅容许小型化的精确测量,而且将明显提高自动化水平。

 

    C. elegans的发育生物学中,细胞系的辨识是帮助分析基因调控网络区别必须完成的主要工作。最初辨识细胞系的尝试完全手工进行(Sulston et al., 1983; Sulston and Horvitz, 1977),它耗费了几年时间辨识wild type细胞系。四维显微术允许我们收集恒定时间间隔的多层共焦图像,但是细胞系的辨识不是自动的。当可以对C.elegans使用彻底RNAi knockout时候,高通量细胞系辨识变得十分基本。全自动细胞系辨识,核的三维位置数据采集(Onami et al.,2001a)都正采用先进的图像处理算法以及大规模并行超级计算机在进行。这样一些设备满足前述的一些准则,提供细胞位置高精度的全面测量。自动化才能是高通量数据采集成为可能。如果项目成功的话,就可以用于早期胚胎所有RNAi knockout后的细胞系的自动辨识。随着不断努力,这些技术的增强将使细胞之间接触、蛋白质定位等能得以自动检测。和整体原位杂交结合,不久的将来单细胞表达特征、基因调控网络完全辨识都将成为可能。

 

    系统结构辨识

 

有很多不同的系统结构如发育过程中细胞之间的结构关系、细胞之间接触细节、细胞膜、细胞内结构以及基因调控网络都需要测定。其中每一项对系统生物学都有重要意义,本节集中于基因调控网络结构的辨识。这是考虑到基因组信息迅速揭示后,它是引起广泛兴趣的研究点,此外它也是不同细胞现象的控制中心。为了理解一个生物学系统,我们必须首先辨识系统的结构。例如,为了表示基因调控网络,必须辨识网络的所有组成部分,每一部分的功能,相互作用,所有相关的参数。所有可能的实验数据都必须被用来完成这些细微的工作。同时已有实验的推论结果可能预测并实验证实未知的基因与相互作用。

 

困难在于基于一些原则或泛泛的规则从实验数据不可能自动推导出网络。这是因为生物学系统通过统计过程进化,而并非一定最优。此外,对目标网络肯定有多个网络、参数值可以产生类似行为,因此必须从其中选择。

 

    这个过程可以分为两个主要部分:1)网络结构辨识;2)参数辨识。辨识基因调控网络有一些尝试正在进行,他们基本上可以分为两类:

 

    从下而上的方法

 

从下而上的方法试图基于整理独立的实验数据构建基因调控网络,譬如通过文献搜索、一些专门的实验来获取感兴趣的非常特定的一些网络概念的数据。这个方法早期的一些尝试可见于 抗菌素决策电路(McAdams and Shapira, 1995)Drosophila早期胚胎起源(Reinitz et al., 1995; Hamahashi and Kitano, 1998; Kitano et al., 1997),以及腿的形成(Kyoda and Kitano, 1999a),翅膀形成(Kyoda and Kitano, 1999b),基于R-Cell区分和小眼簇的眼的形成(Morohashi and Kitano, 1998),基于反应-扩散的眼形成模型(Ueda and Kitano, 1998)。这一方法适合于大多数基因及其调控网络已经得以相对理解的情况。特别适合大多数部分已经了解,只需寻找最后一点的情况。大多数情况下,生化参数可以被测量,很多精细的仿真可以进行。当大多数参数已经可用,研究的主要目的就是建立一个精确的仿真模型用于分析参数改变时系统的动态特性,而这些参数改变在实际系统中难以满足,最后有用的知识通过仿真产生与有用的实验数据一致的结果。

 

    已有工作从文献建立基因和代谢通路数据库,如KEGGKanehisa and Goto,2000)和EcoCycKarp et al.,1999)。这样一些数据库对建模和仿真十分有用,但他们也必须精确并且能表示为仿真和分析所直接使用。有一些早期的尝试来预测一些未知的基因(Morohashi and Kitano, 1998; Kyoda and Kitano 1999a,b)。这些尝试手工搜索可能的相互作用而得到与实验数据一致的仿真结果,并未穷举搜索网络结构的所有可能空间。

 

    从上而下的方法

 

从上而下的方法试图使用如DNA芯片及其他新测量技术获取高通量数据。对酵母细胞周期(Brown and Botstein, 1999; DeRisi et al., 1997; Spellman et al.,1999)及鼠中央神经系统发育(Dhaeseleer et al.,1999)使用聚类技术分析DNA芯片数据已经有一些工作推断基因组。聚类方法适合处理大规模数据但不能直接推导网络结构。这些方法只能提供具有相似时间谱的共同表达的基因分类。通常需要易于理解的可视化(Michaels et al.,1998)

 

如果我们试图从这一方法推断网络,必须有一些启发性的思路。从表达特征(Morohashi and Kitano, 1999; Liang et al.,1999)和广法的基因缺失数据(Akutsu et al., 1999; Ideker et al.,2000)直接推断网络结构的其他方法也正在发展中。过去发展的这些方法大多将表达数据直接转换为二进制值,这样简化计算成本。然而这些方法在二进制转换过程中必然严重丢失信息,不能得到精确的网络结构。在不增加计算成本的情况下Kyoda et al., (200b)以及Onami et al., (2001b)提出了一种可以直接处理值连续表达数据的方法。这一方法的扩展对基因调控网络的推导十分有前途。在自动重构通路,拟合参数方面已经采用有基因算法。这一方法需要巨大的计算能力,已经有一个采用1000CPU集群的Beowulf级超级计算机例子。在处理器芯片期望速度提高的情况下,这个方法很有潜力。

 

进一步可混和从上而下和从下而上的方法。在应用任何推理方法前不可能没有可用知识,在实际情况下,可以假设多种基因及其相互作用已经部分理解,只需辨识网络的其余部分。通过使用充分精确的知识,网络结构的解空间得到明显缩小。一个最大的问题是这些方法不能直接推导可能的修饰和翻译控制。进一步的研究需要强调表达特征、蛋白质交互、以及其他实验数据的整合。

 

    参数辨识

 

    辨识网络结构是重要的,因为所有计算结果必须与实际实验结果一致,参数的辨识同样重要。所辨识出来的网络必须被用来对系统响应、行为特征进行量化分析的仿真。大多数情况下,参数集基于实验数据予以估计。多种参数优化方法如基因算法、模拟退火算法都被用来寻找参数拟合实验数据(Hamahashi and Kitano, 1999)。在寻找参数集的时候,必须注意可能有很多参数能使仿真结果同样符合实验数据。用于这一目的的参数优化算法的一个重要特征是能发现局部最优而不是全局最优。这就需要结合其他的方法来辨识哪一组参数才是正确的参数。有几种方法可以用于寻找最优参数集,如蛮力穷举、基因算法、模拟退火等。这些方法大多数极耗计算资源,在过去常被认为不可行,在将来将改变。尽管精确测量、估测真实参数值相当重要,但有些情况下却不尽然。例如通过对Drosophila分段极性网络的广泛仿真,该网络表现出对参数较高的鲁棒性(von Dassow et al.,2000)。对特定的网络而言,对遗传变异、外部干扰引起的参数变化具有高鲁棒性是其得以生存的基础。对这类网络,本质蕴涵于网络结构中,而不是网络参数中。正如细菌趋化性(Yi et al.,2000)中所见,这不过是电路中采用反馈获得鲁棒性的一个特例。这样,参数估计、测量必须和特定参数敏感性的理论分析相结合。

 

    系统行为分析

 

    一旦我们理解了系统的结构,就需要集中于系统动态行为的研究。它如何改变自身以适应环境的变化如营养、不同刺激等?它如何消除DNA破坏、变异对系统的潜在影响维持稳定?特定回路如何展示出可供观察的功能?为了获得系统层次的理解,最基本地需要理解系统鲁棒性、稳定性、回路功能性后的机制。理解复杂生物学网络的行为不是微不足道的工作。计算机仿真、理论分析等对回路后面机制的深入理解十分必要。

 

    仿真

 

基因与代谢网络行为的仿真在系统生物学研究上扮演着重要的角色,目前已有很多仿真器的开发(Mendes and Kell, 1998; Tomita et al., 1999; Kyoda et al., 2000a; Nagasaki et al., 1999)。因为网络行为复杂,组分众多,直观的理解网络的行为几乎不可能。对通过改变参数和基因、代谢网络结构来分析系统动态特性来说,建立精确的模型是首要条件。尽管这样的分析对理解动态特性是必须的,但是对实际的生物学系统却不能这样操作。仿真不仅仅是理解行为的基本工具,而且是设计过程的基本工具。在复杂的工程系统设计中,使用了许多不同形式的仿真。今天很多大型的工程项目不使用仿真来设计是难以想象的。VLSI设计需要大量的设计模拟,这样也就造就了超级计算机的巨大市场。商业航空器又是另外一个例子,波音777整个设计几乎完全基于仿真和数字预制。一点我们进入生物学系统设计和控制的阶段,仿真必然是设计过程的核心。

 

因为仿真是生物学系统研究的可行方法,因此需要开发高实用化的、精确的、用户友好的仿真系统。仿真器和相关的软件系统常常需要巨大的计算能力,这些系统往往必须运行在高并行集群机器上,如Beowulf PC集群(Okuno et al., 1999)。尽管目前有很多仿真系统,但是没有一个系统能充分覆盖生物学研究的广泛需求。这些仿真系统必须能仿真单个和多个细胞的基因表达、新陈代谢、信号转导。它必须能仿真使用微分方程描述高浓度蛋白质和统计过程描述的低浓度蛋白质。统计过程(McAdams and Arkin, 1998)及其与高浓度水平的仿真相结合的研究都在进行中。

 

   在很多情况下,模型不仅仅需要基因表达网络及代谢网络,而且需要高层的染色体结构如异染色质。在衰老模型中,对异染色质动态过程的建模已见一些尝试(Kitano and Imai 1998; Imai and Kitano, 1998)。然而如何对这些动态过程进行建模,如何从稀疏的数据及现有理解水平预测其结构是主要挑战。

 

仿真系统需要与参数优化工具、假设生成器、分析工具结合。然而这些软件后面的算法需要针对生物学研究精确设计。前面已经提到的一个例子是软件优化工具必须尽可能的发现局部最优值,因为尽管有多种可能而只有一个是实际解。对生物系统而言,全局最优解往往不是实际解。而大多数工程设计、问题求解的参数最优化方法往往都是用以寻找全局最优。当已有算法提供可靠的起点时,必须注意把它修改为适合生物学研究。这对其他软件工具也是类似的。

 

系统生物学研究需要开发一系列软件系统,这些软件包括

 

Ÿ           存储实验数据的数据库

Ÿ           细胞与组织仿真系统

Ÿ           参数优化软件

Ÿ           分叉(bifurcation)和系统分析软件

Ÿ           假设生成器、实验指导专家系统

Ÿ           数据可视化软件

 

    这些模块如何联系并被用于实际工作流中,可见于图1.1。尽管很多这些软件方面有独立的工作,但迄今为止仅有有限的工作用于生成集成模块的通用平台。最近一组研究人员发起了一个为系统生物学定义软件平台的研究。尽管在这样一个软件平台需要从事很多工作,本章余下部分给出了一些描述。提供一个通用、多用途系统生物学研究的软件平台的工作正在进行。SBW项目旨在提供一个通用中间件来综合多个插件模块构成一个统一软件环境。除了软件模块之外,数据的交换、软件模块之间的接口在数据驱动的研究工具中都是重要因素。SBML是一个多用途通用的开放标准,它允许在大量的软件系统之间交换数据和建模信息(Hucka et al.,2000,2001)。它是扩展XML,期望成为数据、模型交换格式的工业与学术标准。最终,需要一组软件工具用来完成对疾病、器官生长进行建模,它需要一个全面的、高集成的仿真与分析环境。

分析方法

 

已有些工作试图使用分叉分析、代谢控制分析、敏感性分析等来理解系统动态特性。例如,分叉分析备用来理解Xenopus细胞循环(Borisuk and Tyson,1998)。这一个分析基于描述Xenopus细胞循环基本过程的一组方程生成了一个阶段性描述。它给出了系统激活的工作点,以及其随系统参数变化而变化的行为。通过该图,可以进行系统鲁棒性的初步分析。

 

一组分析方法,如流量均衡分析(FBA)Varma and Palsson,1994; Edward and Palsson,1999)、代谢控制分析(MCA)(Kacser and Burns, 1973; Heinrich and Rapoport, 1974; Fell, 1996为来理解不同环境和内部破坏的条件下代谢回路在系统水平的行为提供了手段。已有研究表明,这样的分析方法能够提供与实验数据一致的代谢通路的知识(Edward et al.,2001)。当采用线性近似分析稳态行为时,动态、非线性分析的扩展将为系统水平的代谢回路分析提供强有力的工具。在复杂工程系统的研究中已有几种分析方法,特别是在控制动力学系统领域里。研究中最重要的跳转是采用控制理论的语言描述生物学系统,这样我们能够使用生物学与工程学统一的语言来抽象系统各个基本部分。

 

4、生物学系统的鲁棒性

 

    鲁棒性是生物学系统的基本特征。理解鲁棒性后面的机制十分重要,透过它可以深入理解系统如何在各种扰动情况下维持自身功能特性。特别是,我们应该理解生物体如何对下述情况作出响应:1)环境的改变(营养水平的丧失,化学引诱,与受体相关的化学试剂,温度)以及2)内部故障(DNA损害,代谢通路基因故障)。如果我们最终期望找到疾病的治疗方法,理解系统的本质功能十分重要的。

 

    复杂工程系统教程

 

在工程系统与生物学系统之间有很多有趣的相似之处。二者都通过一些进化的过程增量设计,对给定的问题一般获得次优解。为了获得更高的鲁棒性和稳定性系统复杂度递增。以飞机为例,如果气流稳定,飞机无须改变姿态、海拔、重量平衡,甚至无须起降、飞机可以用很少的组件建造。怀特兄弟建造的第一架飞机也仅100多个组件。而现在波音747飞机,组件多大数百万个。其中一个最重要的原因就是增加复杂性提高稳定性及鲁棒性。在生物学系统中是否也是这种情况呢?支原体是最小的自生存的的生物体,仅有400个基因。它仅能生活在特定的环境下,易受环境波动。另一方面,E. Coli有大约4000个基因,能够生活在变化的环境中。随着E.Coli的进化,它获得遗传、生化回路来响应多样的环境压力以及基本的行为模式如趋药性(Alon et al.,1999; Barkai and Leibler, 1997)。这些响应回路形成一组负反馈环。类似的机制在真核细胞中同样存在。

 

    粗略地考虑一下,复杂性带给从多细胞系统到人类适用其相应生态位点的不同位置的功能。在工程系统中,鲁棒性、稳定性通过使用1)系统控制;2)冗余;3)模块设计;以及4)结构稳定性来获得。假设这些方法都是复杂系统本质的特征,他们是自然存在还是人工构造的?

 

    系统控制

 

    复杂工程系统中使用了多种控制模式。前馈与反馈控制是两种主要的控制模式,二者在生物学系统中无处不在。前馈控制是一种开环控制,其中预先定义好的动作序列被特定刺激触发。反馈是一种高级的控制,其构成闭环获得期望的系统控制。负反馈系统探测期望输出和实际输出之间的差别,通过调节输入来消除这种差别。和前馈控制相比,反馈控制更加先进,并能确保系统正确控制。它是工程系统中最广泛使用的增加系统稳定性和鲁棒性的方法。

 

    冗余

 

    冗余通过提供多条通路来完成功能,抵抗对系统组件的损伤,从而提高系统鲁棒性。复制基因以及类似功能基因是冗余的基本例子。有回路水平的冗余,如多通路信号转导以及代谢回路等在不同条件下功能互补。

 

    标准模块设计

 

    模块设计避免故障的无限制扩散,同时简化组件升级。同时,可以通过使用多个次要模块来克服系统主要部分的失效。细胞系统就是一个模块系统的典型例子。

 

    结构稳定性

 

很多基因调控网络对大范围的参数变化和遗传多态表现稳定。这些回路常常混和有多个吸引子,每一个对应回路一个功能状态,这样其功能能抵抗参数变化和遗传多态。不清楚这样的工程巧妙是不是也可见于生物学系统。然而,可以假设这在复杂系统中是相当普遍的。可以想象由于系统的本质不一样,其中肯定有差别。工程系统往往针对特定单一的功能设计,而自然系统其繁殖只有一个目标,所有功能评价于其综合效应。无论怎样,研究其规律的普遍性是值得的。如果没有区别,那么,他们是什么?

 

    本节余下的内容针对三个生物学系统中存在的鲁棒性原理。当然并非所有生物学系统都是健壮的,因此了解系统的哪一部分不健壮,为什么,就相当重要。在这里我们针对其鲁棒性,因为我们最感兴趣。

 

    控制

 

    显式控制是提高鲁棒性有效的方法。前馈控制反馈控制是两种主要方法(见图1.2)。

前馈控制开环、简单,仅仅在可能情形与对策都高度可预见情况下使用。反馈控制,如负反馈控制,广泛应用于工程。它反馈期望值和实际值的反误差给输入,使输入型号收到正比于误差的调整。其基本形式中,表现为减少输出误差值的效果。反馈在生物学过程很多概念下扮演着重要角色,如E.Coli趋药性,热冲击响应,生理节奏,细胞周期以及发育的不同方面。

 

最典型的例子是细菌趋药性中的整体反馈。细菌表现出对很大浓度范围下化学试剂的适应性,因此可以感知化学浓度变化来决定其行为。这是通过一个包含闭环反馈的回路实现的(Alon et al., 1999; Barkai and Leibler 1997)。如图1.3所示,趋药性中的配体和特定的受体MCP结合形成了一带CheACheW的稳定复合体。CheA磷酸化CheBCheY。磷酸化的CheBMCP复合体去甲基,磷酸化的CheY触发紊乱行为。实验和仿真都表明这形成了一个反馈回路从而适应配体浓度变化。特别是对配体浓度的突然变化,平均活动水平可以通过迅速会聚到稳态值的紊乱频率刻划。这意味着仅仅可以探测配体浓度额变化而对浓度绝对值不敏感。因此,系统不管绝对浓度多高都不会饱和其传感系统,从而可以探测并控制其行为至高吸引区域。详细的分析表明该回路是一个整体反馈(Yi et al.,2000)——最典型的自动控制策略。在细菌中,还有很多高级控制嵌在系统中。如处理热冲击的回路,就是一个前馈控制和反馈控制完美结合的例子(1.4)

 

    在热冲击下,E.Coli的蛋白质不再维持它正常的折叠结构。控制系统的目标是通过激活热冲击蛋白(HSP)修复误折叠的蛋白。当热冲击产生,快速翻译修饰通过影响编码 rpoH mRNA的三维结构促进 因子的生成。这导致 -RNAP holo酶的形成,从而激活HSP修复误折叠的蛋白质。这个过程是一个前向控制,它预先编码热冲击和反应的关系。在这个过程中,不对误折叠的蛋白质进行检测,来调整 的翻译。独立地,有DnaKDnaJ探测误折叠蛋白质,释放和DnaKDnaJ绑在一起地 。自由地 激活HSP的转录,因此误折叠蛋白质得以修复。这个过程则是负反馈,因为误折叠的蛋白质水平被监测,并控制 因子的活性。

另一个展示反馈系统重要性的例子是人类细胞的生长控制。生长控制是细胞功能最重要的部分。图1.5给出了反馈的一个清晰例子。

 

    DNA被破坏,依赖DNA的激酶DNA-PK就被激活。ATM被磷酸化,ATM进入激活状态,促使p53蛋白质特定位点的磷酸化。当位点被磷酸化后,p53不再与MDM32形成复合体,磷酸化位点则依赖于DNA所受破坏的种类。在特定破坏下,磷酸化发生在p35Ser15位置,促使p21的转录,最终导致G1抑止。其他情况下,它促进诱导基因的调亡,如pig-3,引起调亡。对那些G1抑止的细胞,DNA一经修复DNA-PKATM活性马上减少。DNA-PKATM活性减少降低p53磷酸化,因此p53讲绑定MDM2并融解。没有磷酸化时,p53促进mdm-2转录。理解mdm-2蛋白质形成复合物去激活p53蛋白质很有意思。这是系统中所蕴涵的另一个负反馈。

 

    冗余

 

冗余在获取系统鲁棒性、应付系统组件的意外损坏上起重要作用。例如波音747采用4条独立的水力控制系统,即使一。两条被破坏,系统仍能正常工作。在航空器中,控制系统、引擎都设计得具有很高的冗余。在细胞系统中,信号转导、细胞周期等价于控制系统、引擎。一个典型的系统转导通路是MAP激酶链。MAP激酶链包括并联的通路之间广泛的相互作用(cross talk)。因为变异或其他原因导致通路中的一条失效,MAP激酶通过仍能通过其他通路传导信号保持功能(1.6)

 

细胞周期是细胞活动的基本过程。在酵母细胞周期中,ClnClb家族对细胞周期起着支配作用。他们和Cdc28激酶结合形成Cdk复合物。Cln是冗余的,因为Knock-out三个Cln(Cln1,Cln2,Cln3)的两个并不影响细胞周期。三个全部Knock-out则影响细胞周期。六个Clb也有类似的特征,可能来源于基因备份。六个Clb的任何一个失效变异会影响酵母细胞的生长。CLB1CLB2CLB2CLB3同时变异则是致命的,但是其他任何两个变异组合则不影响显型。因此说细胞周期的基本机制冗余是有道理的,它能抵抗多种扰动。冗余也可以用来应付统计过程中的不确定性。McAdamsArkin指出基因的备份和同源基因的存在提高了可靠性,这样基因转录在仅有少量转录子的情况下也能得以进行(McAdams and Arkin, 1999)。使用正反馈环来自动调控基因,维持其表达水平则是确保触发不被噪声淹没的有效方法。

 

尽管其功能实现尚未研究透彻,但是有对MAP酶链的研究指出它在级链的每一步都使用了非线性特性和正反馈构成一个稳定的All-or-None开关(Ferrel and Machleder,1998)。在更广泛意义上来说,在改变环境情况下维持细胞生长的其他可功能替代的代谢通路也可以认为是冗余。细菌如果在丧失某种营养的情况下可以切换代谢通路,使用其他类型的营养来替代。理论与时间数据表明不同的通路被用来维持基本相同的功能(Edward et al.,2001)。

 

    一旦我们理解了系统的稳定性和鲁棒性,我们就能理解如何控制和变换细胞。我们准备来谈谈如何将故障的细胞转换成正常的细胞,如何预测疾病的危险,如何抢先治疗潜在的疾病。

 

    模块化设计

 

模块化设计是鲁棒性的一个重要方面。它确保系统一部分的失效不会扩散到整个系统。也确保进化过程的高效重构,从而获取新特征。多细胞生物体的细胞结构是一个明显的例子。它物力上分割结构从而整个系统不会因为局部损伤而崩溃。

 

基因调控回路被认为体现了一定水平的模块性。甚至当因为变异或注入化学物质而使回路的一部分被瓦解,它也不一定影响回路的其他部分。例如p53的变异破坏细胞周期Check Point系统从而引起癌症。然而它并不破坏代谢通路,细胞仍然可以继续繁殖。现在对模块形是如何维持及其原因仍不了解。模块形反应了系统的系列组织,如下所述:

 

组件:一个系统的基本单位。在电子学中,晶体管、电容、电阻都是组件。在生物学系统中,基因、蛋白质等转录产物都是组件。

 

器件:最小功能装配单位。与非门(NAND)flip-flop都是器件的例子。转录复合物,复制复合物都是器件的例子。一些信号转导回路也可以认为是器件。

 

模块:一簇器件。CPU、内存以及放大器都是模块。在生物学系统中细胞器、细胞周期的基因调控回路都是模块的例子。

 

    系统:模块的上层组合。从不同角度,细胞或整个动物都可以认为是一个系统。

    在工程智能(Engineering Wisdom)中,甚至底层模块都被认为是充分自生存和封装的。高层结构的变化不影响底层模块的内部动态特性。在生物学系统中是否也是这样,在系统观点下它又是如何形成的值得研究。

 

    结构稳定性

 

一些回路在系统收到多种扰动情况下恢复为多个吸引子(points or periodic)的一个。反馈在这个可能变化中起主要作用。然而反馈并不显性控制回路跟踪、适应刺激时的状态。回路的动态特性表明特定的功能在更大的子系统中起作用。目前理解得较为透彻得一个最简单得生物体 抗菌素(McAdams and Shapiro,1995)。 抗菌素采用反馈机制来稳定状态、切换通路。当 抗菌素感染E.Coli,它选择两条通路之一:LysogenyLysis。在commitment早期存在统计过程,两个包括CICro的正负反馈在维持committed decision稳定中起重要作用。在这种情况下,反馈是否得以维持决定于帮定到 区域的催化剂的数量。如果催化剂量超过一定水平它切断反馈回路。这是一个尚未在其他地方发现的有趣的分子开关。总的来说,Cro的浓度机制通过正负反馈维持在一定水平。有研究指出即使 绑定位改变, 抗菌素切换回路的功能特性也不改变(Little et al.,1999)。这表明 抗菌素的决策回路是多反馈回路的本质特征,而不是诸如绑定位置等的特定参数特征。

 

特定参数的相对独立也是健壮系统的一个重要特征。最近计算研究表明,在Xenopus细胞周期和整体分段形成(von Dassow et al., 2000)中回路对较大范围的参数变化表现的很稳定(Morohashi et al. unpublished)。通过对Drosophilaparasegment的仿真,发现回路中一些对特征形成起作用的参数能够容许主要的参数变化。这强有力地表明回路结构而不是特定参数值对特征形成起主导作用(von Dassow et al.,2000)

 

这样结构稳定的回路特征在发育中同样起重要作用。最近一片评论文章(Freeman,2000)阐明在发育过程中,一些反馈回路的情形起主要作用。这些情形包括JAK/STAT信号通路中信号传递的时间安排、包括UbxDppDrosophila的模式形成,以及肢体发育AER形成中sonic hedgehog(Shh)构成ZPAFgf的表达模式的维护。在这些例子中,回路的结构而不是参数值起了支配作用。

 

7、结论

 

    系统生物学生物学新兴研究领域,其目标在于从系统水平理解生物学系统。系统水平的理解需要大量的新的分析技术、测量技术、实验方法、软件工具、以及理解生物学系统的新观点新思路。这一工作刚刚开始,在我们达到深入理解生物学系统这一步还有很长的路。然而,作者相信系统生物学必将成为生物学的主导学科,其中蕴涵着很多的医疗应用、科学发现。

 

    8、致谢

 

    感谢Kitano Symbiotic Systems Project (Shuichi Onami, Shugo Hamahashi, Koji Kyoda, Mineo Morohashi, John Doyle, Mel Simon, Hamid Bolouri, Tau-Mu Yi, Mark Borisuk, Michael Hucka, Andrew Finny, Herbert Sauro, Yoshi Kubota)的讨论。特别是JohnMel一直是系统生物学强有力的支持者,他们也是灵感的源泉。Shin-ichirou Imai一致是最优秀的合作者,正是他引导我从计算机科学与机器人学进入生物学领域。Mario TokoroToshi Doi允许我在维持与Sony公司联系的同时致力于生物学研究。

 

 

  评论这张
 
阅读(247)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017