您的位置:中国科技新闻网 > 医药健康 > 储存“健康”——大数据时代的生物银行
储存“健康”——大数据时代的生物银行
发表时间 2017-03-15 10:14 来源 本站原创

  访上海交通大学医学院附属新华医院王伟业教授

  进入二十一世纪以来,随着现代生物技术的迅速发展,分子遗传学取得了巨大的发展,对基因的研究密切了基础医学与药物研发、临床医学之间的联系,使人们可以更准确地理解环境和人类遗传分子之间的相互作用,从而改进对于疾病的诊查和治疗。由此诞生了从实验室到病床,把基础研究所获得的知识、成果快速转化为临床上治疗的转化医学(Translational Medicine)。而建立专门的生物样本库(Biobank),大规模、高效的搜集和利用生物样本、生物信息和数据,则是了解人类遗传分子与疾病发生,发展和转归相关的基础和转化医学的需要。



2015年北京-科学中国人年度人物受奖大会现场

  生物样本库,又称生物银行,主要是指标准化收集、处理、储存和应用(健康或疾病)生物体的生物大分子、细胞、组织和器官等样本,以及与这些生物样本相关的临床、病理、治疗、随访、知情同意等资料及其质量控制、信息管理与应用系统等。目前,美国、欧洲以及国际卫生组织都投入了几亿到几百亿美元建立大型生物样本库。随着国家科技计划的逐步推进,我国的分子生物学、生物信息学、基因组学、蛋白质组学以及人类基因组测序技术等其他相关领域科学技术的长足进步,我国的生物样本库建设也随之蓬勃发展起来。

  美国RAND公司的研究报告指出,本世纪初美国生物银行存贮的人体组织样本数量超3亿份,并以每年2000万份的速度增加。而我国的国家基因库也拥有3000万份人、动植物和微生物样本,被认为是世界级的生物样本库和组学数据库。在如今这样的大数据时代下,这些数量庞大的数据有什么作用?为此,《科技文摘报》记者专程采访了我国生物样本库研究方面的知名专家、上海交通大学医学院附属新华医院生物样本库主任王伟业教授,让他科普一下我国生物样本库建设与发展研究的现状和未来,并解答公众关心的“生物银行如何储存我们的健康”等问题。

  博采众长,回国建设“生物样本库”

  《科技文摘报》:王主任您好!请您介绍一下您的求学和工作历程,尤其是您在美国的求学和研究经历,还有当初您回国发展的动力是什么?

  我的专业起点是临床基础医学,而后去美国留学获得美国M.D. Anderson 肿瘤研究中心的生物化学和分子生物学博士。在美国留学和长期工作期间,先后在M.D. Anderson Cancer Center、Baylor College of Medicine、Wyeth Research和Medical College of Wisconsin等科研机构从事生物医学研究,包括机体在胚胎发育过程中基因调控细胞分化的分子机理;激素类细胞与细胞衰老的基因调控机理;神经系统细胞死亡的分子生物基础研究和新药研发。



参加中国生物样本库建设发展战略研讨会

  鉴于自己的专长,随着人类基因库解码工作的发展,不可缺少地涉足应用相关计算机软件分析基因信息和应用,由此而逐步把生物信息学技术和分析方法应用到自己的研究工作,也就启动了我对生物信息学兴趣和发展,并在此后转到分析和应用人类疾病相关基因在人类和大小老鼠基因信息学研究,得以发挥所学,承担与负责人类疾病相关基因在大鼠基因库相应匹配和注释方法学的研究和应用,并曾应邀去非洲从事生物信息应用和管理方面的培训工作。

  作为留学生和研究者,我求学和研究的经历相对算比较广泛,经历过不同的工作环境和各种方法。从大学到跨国制药企业的研究部门,从事信息化项目研发和团队管理,再到医学院平台建设和管理,之后回国进入大学附属的研究型医院。所从事的专业包括基础研究、新药研究、信息化技术应用与研究、生物样本库建设与管理。跨学科的学习和工作历程拓展和丰富了我考虑和管理方面的经验,尤其是在不同类型的工作环境和经验,对于我管理团队运作和发展有很大帮助,尤其是在临床资源构建和信息化管理与应用方面。

  回国工作最初源于我曾入选中国科学院“百人计划”,聘为中国科学院细胞研究所(上海)分子发育生物学研究室主任,但后来因为个人原因,没有能够到岗位赴任。当时回国的动机归于分子发育生物学的发展需要,因为我的专业和研究方向正符合当时的发展趋势和需要。多年之后,随着国际生物样本库的发展以及我在美国从事的相关工作,我开始关注中国方面的相应发展,相信中国相关领域一定也会随之发展起来。尤其了解到2009年相关报道,看到中国生物样本库工作已经启动。后来与我国该领域发展中起积极推动和倡导的关键人物,郜恒骏教授多次交流,证实中国样本库建设在这段时期内的兴起与发展。因此,我个人习惯把2009年作为中国生物样本库建设兴起与发展的起点。得益于良好的发展机遇、机会和需要,2012年我回国工作,借此感谢在我回国后相关工作领导给予我工作方面的大力支持和提供有效的发展平台。



参加中国生物样本库建设发展战略研讨会

  《科技文摘报》:您是怎么进入“生物样本库”这个研究领域的? 您认为样本库在国外如何影响生物医疗产业模式改变,转化为健康财富的?

  我算是从生物信息应用而逐步进入生物样本库领域。生物样本资源应用于医学研究并不是新事物,应用生物样本是从有临床实验室诊断和研究就开始了。但2009年美国时代周刊将生物样本库列为改变世界的十大观念之一,就赋予生物样本一个全新的理念,也可以说是重新定义或者第一次来完善定义“生物样本库”(也称生物银行)。这是现代生物样本库与传统生物样本资源的一个分水岭。两者最大或最根本区别在于,2009年提出的生样样本库不只是为某个研究项目需要,而是系统性构建临床研究需要的资源;以一定的组织机构形式、管理模式和按照规范和伦理法规运作与管理的资源机构,包括了临床样本设计、规划、伦理规范、管理规范、工作流程、职能分配等工作内容,为从多个不同角度/方向研究同一个群体而提供相同的资源。

  正是由于这种区别,生物样本库建设首先应该从设计和系统化管理方面着手。在美国信息系统设计与理解都有跨专业的人员加入。美国大多生物样本库建设的目的,除了研究应用之外,最初主要是以大型制药公司,比如,辉瑞、默克等跨国制药公司为主导的资源需求。借我在医学和生物信息学的跨学科和专业背景和经验,结合我在大型医药公司研发和生物信息医药研发应用的工作经历和经验,开始从事生物样本库的信息化管理和应用工作。

  生物样本库建设与应用涉及两个层面:生物样本库科学(Biobanking Science)和生物样本库产业 (Biobanking Business),这确定了生物样本库范畴和与产业相关的潜力和利益。生物样本建设发展的趋势显著受2009年时代周刊评论的影响,在美国迅速带动了一系列与产业相关需求行业,如耗材、信息化管理与应用的研发、第三方储存与管理产业等等,但这些只是支持样本库建设的产业,其本身是辅助样本库建设与管理并从中获取价值。

  记得回国初期,我被问及生物样本库在中国与美国最大的区别是什么,我当时的简单回答是:美国以制药企业的需要为出发点而建立有多家医院来源的生物样本库,因为是药企,其对生物样本资源的需求很明确,所以样本资源的应用目的也就很明确;而中国是基于各家医院建设的生物样本库,目的一个也明确-即为医院的学科发展而建设资源,但资源的应用目的大多可能不那么明确,应用是为申请的研究项目为出发点,但有并没有目前为此目的而建立和解决存在的问题。应用于新药研发,其应用价值便与产业相关,例如奥巴马政府的精准医学计划中提出招募100万名志愿者实施“精准医学计划队列项目”,收集他们的医疗记录、基因信息和生活方式等数据,其数据资源本身就是一个生物样本库的资源转化为健康财富的例子。

  “生物银行”,储存健康的机构

  《科技文摘报》:“生物样本库”为什么会被称为“生物银行”呢?其研究有什么重大意义?

  我个人不太关注某个概念/事情的定义,也没有能力说清楚。然而,明确认识一个概念又非常关键——正确的认识决定发展的方向是否正确或及时纠正做事的方法。

  为此,经济发展与合作组织(OECD)国家特别为样本库定义了一个词语“Biobank”,其内涵为“一个有组织的搜集人口或大规模族群生物材料和相关数据和信息并加以保存的机构”。“生物样本库”之所以也会被称为“生物银行”,从中文字面上看是源自英文Biobank的翻译,但从意义上去翻译和理解才是更贴切的,它传播的是一个理念。银行,顾名思义就是个人或机构储存重要物品之处,“生物银行”更是表明其储存的内容。在银行储存的目的是为了增值,需要之时再取用,求得回报,所以“生物样本库”作为“银行”的基本有两个主要目的:一是将多来源的小量资源汇集成能够满足应用的大资源,更确切地说是满足大研究项目所需要的大资源;二是建立一个多学科交叉与合作的平台,为不同专长的科研人员提供一个共同一致性资源-生物样本和相关信息资源,粗略地说可以相当于银行的投资模式与平台。



主持会议-2015生物样本库与临床研究论坛

  生物样本库汇集资源不仅是为资源量的增加,更为扩大资源自身的价值。比如,每个项目需要的资源成分不同,汇集后的样本资源可以各取所需,满足各自的需要,而不是浪费不需要成分。这样的利用方式,相当于增加样本的应用价值,所以“生物样本库”也是意义上的“生物银行”。该机构的储存形式,不但可为科研和应用提供资源,而也可为个人储存健康或年轻时期的生物资源,譬如储存“免疫细胞”或“卵子”等,以备将来生殖、治疗或康复的应用。这也可以理解为个人储蓄,也是生物银行另一个层面的意义。当然,由于涉及伦理和相关政策法规,“生物银行”的资源价值又显著有别于资金银行的运作与管理,所以又不是常识中的银行。

  至于建设生物样本库的意义,相关的阐述很多了并且也很明确,不再赘述。但是我通常在学术交流中比较喜欢用比较直接和简单的方式来表达其意义:简单地说,现代医学发展主要依赖于两个方面:一是病人,其呈现和表达与疾病密切相关的临床信息;二是来自病人的生物样本,其体现疾病的生物活性,表达疾病的发生,发展和转归过程。所以生物样本和相关信息(包括临床信息和通过各种生物医学研究手段从生物样本获取的研究结果),二者是密不可分的共同体。

  解决和改善医疗和健康状况的根本是采用临床研究的方法,而生物样本库就是临床研究的根本资源,否则无临床研究可言。简言之,传统的循证医学以各种方式获得的临床信息为主导,而2015年初兴起的精准医学则以实验室研究获取的信息为主导。根据美国总统奥巴马的国会咨询提出的精准医学基本点,就是获取人的基因信息,也就是从基因信息特点认识疾病的个体特征,而基因信息只能来源于生物样本。所以我个人认为现在的临床研究应该同时结合传统的循证医学和现代的精准医学的根本要素,建设生物样本库(生物样本和临床信息)的意义,在于构成这两方面的临床研究资源。另外生物样本资源更是人类健康相关研究的基本资源,对人健康状况的监视、预防和干预,提高健康水平更是现代医疗健康的中心点,更需要健康人的生物样本,来维护普通大众的健康。

  生物银行建设的现状及短板

  《科技文摘报》:我国“生物样本库”研究的现状是怎样的?与发达国家有怎样的差距,又具有怎样的优势?

  我回国时,中国正处于生物样本库建设刚刚兴起和接着高速的发展时期,由此我介入各种相关学术交流活动,尤其是通过与来访人员、会议交流,与人合作研究与研发等活动比较多。以我个人观点而言,中国的生物样本库研究与发展的现状就是人们重新认识临床资源重要性和如何建设的相应观念的转变结果。现状比较全面地反映了人们理念转变中几个重要节点:认识到样本的质量、应用和相关信息对生物样本库发展的重要性。质量问题首先成为研究者讨论样本库建设的关注焦点,转变了先前人们对生物样本质量的忽略或不够重视。继关注样本质量问题之后,储存的生物样本应用问题随之变得日渐显著,起初不少样本库规划是基于“认为需要有样本库而建样本库”,但设计和规划缺乏或者不够重视样本的应用问题。第三方面的转变是基于样本应用问题认识到,生物样本本身没有什么价值,只是一种存在或转换前形式,只有获取其中的数据信息才能够获取生物样本价值,这件事如何应用资源的问题。但应用生物样本首先必须了解生物样本性能和特征,决定是否适合科研需要和符合提出要研究的科学问题。因此,临床信息对于生物样本有效应用的重要性成为生物样本库的根本所在,这也是样本库发展在认识上一个重要转折点。相应的临床数据库也成为生物样本库的重要内容和指标,生物样本库的信息化建设问题也由此成为样本库建设的主题内容。

  我国生物样本库的发展现状和趋势也将随国际发展轨迹而动,国家的精准医学研究重点专项指南已经充分体现这一要求:大规模人群队列,重大疾病专病队列研究,建立队列资源开放应用机制,样本和数据共享的机制,完成可共享的队列样本库和临床诊疗信息库资源可整合度高,要求具有专业的临床表型研究队伍,专门的数据与样本管理场地与专职工作人员队伍等。总之,随着人们对样本库建设意义的基本观点转变,具有里程碑的重要意义,也是中国样本库建设与发展的必然结果。从大层面来看,生物样本库在国际上的发展历程是以病理科的生物样本库建设作为发展起点和主体,再到生物样本库建设成为独立机构。近日,国家相关部委出台《关于全面推进卫生与健康科技创新的指导意见》提出全面加强临床医学研究,突出临床研究在医学科技创新中的地位。所以我认为中国生物样本库的发展历程可以分为两个阶段:第一个阶段是从理念认识转变走向实际方式的改变,即前面提及的由认识质量、应用和信息对生物样本价值的重要性,但策略是为研究项目建设资源。我认为第二阶段是另外一种策略,即即由研究资源启动研究项目,也是审时度势,适应临床研究发展需要,基于临床资源开展不同方向的研究,促进临床研究。上海交通大学医学院附属新华医院已经开展的生命千天计划,其中临床资源的建设模式和应用规划正是第二个发展阶段的前沿。



右二-2015年北京-科学中国人年度人物受奖大会

  另外还想提出一点,以治疗为主的生物样本库已成为中国生物样本库行业的一个部分,虽然我们通常说的都是研究型的生物样本库(Research Biobank),而以治疗为主的生物样本库(Therapeutic Biobank)也随着干细胞和肿瘤免疫治疗的发展趋势而成为日益关注的趋势,这构成生物样本库发展现状的另外一个方面。

  与国际上的生物样本库的发展相比较,中国面临的问题同样也是其它国家所面临的问题,只是问题的重心或者棘手程度有区别,而这种区别可以以优势与差距两个方面来分析讨论。中国样本库建设兴起和发展比欧美国家晚些,随后的许多方面也是随着国际上的发展而在中国兴起,精准医学的理念就是典型的例子,但中国随后的发展速度却非常迅速,生物样本库的建设与发展亦如此。

  优势体现在我国资源丰富,种类多,短时间内样本积累的速度远超过欧美国家,同时期发展的样本库的数量也非常可观,相关部门的大力支持是关键因素之一。中国这几年在该领域的发展得益于一批领军人物卓有成效的工作,加之越来越多中坚力量和年轻人的加入,发展迅速。要说最直观的优势,无疑就是样本资源极其丰富,是任何一个国家无可比拟的:医院一个月的就诊数量可能就相当于欧美国家的医院几个月积累的病例数。

  从我们自己认识的角度来看待差距,我认为主要是四个方面的差距:1. 认识(理念)不足, 2. 缺乏机制,3. 缺乏模式,4.系统性地落实方面做的不够。没有正确的认识,不可能提出合适的模式,没有相应的机制,模式也无法有效运行,当然也难以落实。

  根据我通过各种方式交流的感受,我国目前把样本库建设作为一种资源长期储存资源,或者把保存有多少份样本用以评估建设目标的样本库可能还不在少数。不突破这种认识,是一个大的差距,也显著影响规划和发展的目的。当然可喜的是这种状况也在日益变化着,从我这两年多接待过许多来来访和交流体会较深。以前来访讨论兴趣焦点大多在规划建设样本库的硬件条件,包括空间大小,仪器多少,冰箱多少和人员数量等。记得当初我还在交流中多次玩笑说,如果看样本库是看冰箱,那么应该去海尔公司,相信再过两年样本库的建设问题会转向讨论信息化建设的问题。

  2014年的下半年开始,这种讨论焦点已经悄然发生显著转移。我体会到三种变化:(1)来访团队负责人更加体现机构的重视程度;(2)参观方式希望以要求多花时间讨论为主;(3)提出讨论的问题都是很有共性,显然经过认真思考。关注的焦点演变为“采取何种方式和目标更适合各自结构的要求”,这一变化也许与2015年初兴起的精准医学研究相关。

  《科技文摘报》:我国在“生物信息应用”方面有哪些短板?

  从我回国后与他人合作研发信息化系统过程中,尤其是在为设计和指导研发BIMS系统的几年经历,谈点自己的感受和建议。了解有限,观点和看法可能会带片面性或局限性,是否有些道理,智者见智,仁者见仁吧。

  谈及生物样本库信息化相关建设,以我个人的认识从两个方面来谈:信息化管理和信息应用,这二者如同质量保证(QA)和质量控制(QC):信息化管理是为了保证信息质量,而信息应用是验证信息质量。从信息系统研发角度,我认为:(1)中国信息化的企业还需要有跨学科的专业人员,不能把生物医学信息与信息技术等同而喻:(2)相关企业需要一定的先期投入,不能仅基于客户的需求才设计和研发系统。这种方式会把系统性建设归于项目建设,可能会仅立足于为了满足不同客户的需求和操作喜好,而造成信息系统运作方式和工作流程变数不断放大,相互之间产生更大异质性,不利于样本库管理规范化管理,尤其是数据标准化发展;(3)系统功能需要一定的规范的工作流程,加强操作质量的控制,不应满足个人操作方便,汇集众多功能,但是没有既定的流程规范;(4)信息系统需要随着信息应用而发展,不应主要只是跟踪管理。信息系统的内容和运作方式应该反映样本库建设内容和质量,包括样本、信息、运作和管理几个方面的质量。

  不过,随着这几年的发展,信息应用也有反馈到信息系统中的现象。从信息整合角度来看:(1)信息整合首先了解需要的数据元素和数据集,而不是单纯的信息导入或者链接,否则整合的信息无法应用或没有具体的应用价值;(2)整合的信息,基本应用至少能够作为数据元素查询,比如应用临。