以生物医学信息学、精准医学、大数据挖掘为重点科研方向;同时在精准医学大数据、生物医学知识库、个性化医疗等方面做了大量工作,取得了一系列创新性成果——现任复旦大学生物医学研究院刘雷教授;也是《疾病研究精准医学知识库构建》整体设计与规划的项目首席。丁香园有幸采访了刘教授,就此而分享了精准医疗重点专项的核心布署与中美两国在精准医学方面的差异。
刘雷 复旦大学生物医学研究院教授
DXY:刘教授,您好,我们了解到您曾在美国生活与研究的一些碎片化经历,您看是否全面?您毕业于美国康涅狄格大学,专业方向是生物医学信息学。被受聘于美国伊利诺伊大学信息部门主任,1999年曾任职生物信息实验室第一主任,2007年入选中国科学院百人计划以及上海市「浦江人才计划」方才被引进回国。发表SCI论文70余篇,取得软件著作权20余项,获得专利6项,这些经历是否奠定了您对精准医学的认知?
刘雷教授:是的。「精准医学」对我们来说并不陌生,其实早在2011年,美国国家科学研究委员会(UnitedStatesNationalResearchCouncil)就曾提出precisionmedicine的计划,也是精准医学的前身;美国奥巴马也由此在2015年正式提出将生物医学、个体化医疗、信息化的解决方案来发展美国的医疗产业,当然这将意味着全球正在迈入「精准医学」的高速发展中。
事实上,中美在医学方面本身就存在着差异:一是两国的人口密度相差甚远、二是发展速度不同;而从人才方面,我个人认为中国并不比美国缺少人才。另外从医学技术角度的发展而言,美国首先是针对肿瘤和糖尿病这两种疾病,强调以基因为出发点来做深度研究,但中国旨在全人类的健康,因此除基因组学研究,还有代谢组学、蛋白质组学等对细胞、分子水平的研究和应用,涉及的领域更宽、更全。例如心血管疾病、神经系统、肿瘤、糖尿病、罕见病的临床研究,并不比美国差,当然也因为我们人口多的好处,我国的一些区域性罕见病数量庞大,是美国的很多倍,这种庞大的数据对科研帮助十分巨大,因此看中国,即是看世界,看医学,只「闻」中国!
DXY:精准医学数据库平台具体包括哪些内容?在中国的应用前景如何,可能惠及到哪些行业?
刘雷教授:中国的精准医学专项主要涉及五个方向:
第一.技术与测序
第二.大型队列研究:以不同区域采集健康、病患人群的数量,因为我们人口众多,这些数据容易获得。数量越大,对于医学科研与临床的帮助越大。我们曾在泰州科学院进行过20万例《遗传与发育》的健康人群对列的共享平台建置,样本数量包含:血液、唾液、齿缝、尿液、大便及固体组织,由此而承接国家级863、973重大基础专项生命科学研究。论文也发表在cell、NatureGenetics、NewEngland等期刊版头。这些均是储备知识库文献与应用的最佳途径。
第三.知识库:基于大数据的采集、归类、挖掘与多维分析,最终形成影像知识库、药学、临床诊断等全方位立体知识库。
第四.临床疾病的分子分型和精准医学的应用。
第五.精准医学应用示范。
其中,基于知识库的大数据是精准医学的核心,无论是医学上的队列研究、临床分子分型,这些都将汇聚成精准医学的数据库平台,复旦大学承担的十三五重点专项的精准医学项目,也是中国首个知识库建立立项的任务,我们将会制定规范与相对标准的医学本体语言,争取能够惠及药企、临床诊疗,最终达到为患者服务的知识库数据平台。
目前在中国市场上,生物科技公司以及医学院的科研方向,是以基因组测序、突变检查、蛋白质组学为主营方向;在基因检测方面,测序结果分析难度颇高,科研者只能通过分散的文献、有限的数据量,进行研究。因此,建立《疾病研究精准医学知识库构建》项目,是有效提高我国医疗科研水平的工具,而这项繁重的任务必须由国家分派并且与产业结合,才能快速完成使命。
最终,真正受益的是患者,未来我们可以畅想,通常的感冒发烧,直接可以用手机上的智能精准医疗服务,了解和比对大多数类似患者如何用药治疗;同时对于药企在新药研发、药物新型适应方面的作用十分可贵,这将减少上百万的药物试验费用,甚至是上亿的研发成本。此外,未来还将惠及养老产业、医疗保险等行业。
DXY:您作为「十三五」重点专项《疾病研究精准医学知识库构建》项目总负责人,能和我们简单介绍下这个项目的构建背景及内容吗?
刘雷教授:我可以简单的浅析下我的认识。
首先,我们在项目成立之初做过相关调研,发现国内外现有的知识库相对基础、单一,科研与临床分离,并不像我们想象中的权威与完善。在科研方面,虽然商业性数据库可用,但价格昂贵,每年数10万计费。在临床方面,缺乏分子层面的研究,因此临床决策支持的一些医疗系统并未达到更好的效果。
因此,我们首先在三甲医院中筛选了「够得上资格」的第一批科研机构与复旦联姻,涉及计算机、医学、生物信息等专项领域的知名专家团,分项目、阶段完成IPA(IngenuityPathwayAnalysis)数据库任务。
透过项目,我们将团队作了划分,同时精准医学知识库分成了五个课题:
第一梯队,建制标准。即形成知识库的数值标准化。从分子、细胞及个体层面的数据集,形成本体。本体语义的建立是生物医学知识库构建的最繁重的任务,但是基石。
第二梯队,知识源的采集、归类、整合。包括数以千计的文献、现有不同种类的数据库。分类将基因层面、药物层面、疾病层面一一分类,并且提炼出专业的知识点,可供后其数据挖掘与多维分析。
第三梯队,数据库整合。将现有的数据库进行收集、整合,这也是一项涉及面广而全的任务。因此团队必须在各区域的三甲医院有影响力,才能调动数据库的整合。
第四梯队,质量控制。保证整合的知识点正确,不能有错误和冲突。
第五梯队,知识库应用以及扩展。初步建立的知识库最强大的功能就是在检索、展示,而它最大的魅力在于推理与临床应用。
DXY:国家很多重大项目背后都离不开企业的支持,您觉得这些企业具备哪些条件可以承担这样的国家级项目?
刘雷教授:首先,甄选这个词,我认为还是有必要,大而全的公司故然重要,小而精的企业,也有非常可贵的专业程度,这些企业需要具备基因检测能力、IT和人工智能技术,包含数据库和知识库技术。
其次,从行业类型而言,医学科研院校、健康生物公司、IT互联网企业能够承担《疾病研究精准医学知识库构建》项目均是我们考查、选择的方向。
刘雷教授简介:
毕业于美国康涅狄格大学,专业方向:生物医学信息学、医学知识库。被受聘于美国伊利诺伊大学信息部门主任,1999年曾任职生物信息实验室第一主任,2007年入选中国科学院百人计划以及上海市「浦江人才计划」被引进回国,现就职于复旦大学生物医学研究院-首席科学家、上海生物信息研究中心副主任、全国医药技术市场协会医药健康数据处理专业委员会副主任委员。
作为前沿生命科学的发起者,于2016年承接了4632万的国家级精准医学重点研究专项「疾病研究精准医学知识库构建」,作为项目首席,统筹和规划了知识库所带来的广泛前景与精准医疗的可实现性。
在此期间,运作并参与了国内外顶级学术会议,目前与中国数据科学协会、中国医药信息学会以及国际环境学会等行业专家交流合作;并担任全国医药技术市场协会医药健康数据处理专业委员会副主任委员、中国运筹学会计算系统生物学分会理事等职务。









