新闻

2017年1月6日

哥伦比亚科学家受到交付整合临床和分子数据

Integrating data sources

目前临床和分子数据被存储在使用不同的语义和不同格式的多种不同的数据库。一个深层链接所谓的新项目旨在开发一个框架,使其能够跨越不原意相交的平台比较和分析数据。 (尼古拉斯·塔通蒂的图像提供。)

医生和基本的生物科学家倾向于谈论不同语言的人的健康。而在门诊焦点上的现象,如症状,药物作用,和治疗结果的医生,基础科学家往往在分子和细胞水平上集中的活动,如遗传改变,基因表达的变化,或蛋白质谱。虽然这些不同的层都是生理相关的,有用于存储和组织不同类型的数据来描述他们,难以让科学家系统地整合和分析在不同的生物尺度的数据没有标准的术语或框架。能够做到这一点,许多研究者现在认为,可以提供更高效,更全面地了解和防治疾病。

一个新项目最近推出 尼古拉斯·塔通蒂 (在系统生物学和生物医学信息学的太阳城网站网址部门助理教授)与联合首席调查员一起 春华翁 (生物医学信息学系)和 米歇尔·迪蒙捷 (斯坦福大学),旨在弥合这一鸿沟。与支持的国家中心推进转化科学(ncats)一$ 1.1万美元的赠款的科学家已经开始开发一个工具,他们深层链接呼叫,数据转换器将在多尺度综合与健康相关的调查结果。

作为博士。 tatonetti解释说,“我们要关闭我们所说的互操作性的差距,在语言有着根本的区别,并用来描述语义模型和知识的临床和分子域之间。我们的目标是建立一个可扩展的电子架构集成了巨大的多尺度知识,现在是可用的。”

“我们要关闭的互操作性的差距,用来描述临床和分子域之间的模型和知识的语言和语义的根本区别。”

在高通量实验技术生产的遗传和分子生​​物学研究不断增长的数据量,同时,该诊所已经被使用的电子患者病历和疾病分类的其他信息库,临床试验结果和不良事件报告转化。目前这些数据库被容纳在不同的位置并且使用不同的电子系统。健康的国家机构 ncats生物医学数据转换程序 推出支持综合系统的开发用于访问和整合这些数据,以加快其在它们所包含的信息将被转化为人类健康的改善率的目标。

深层链接是这种努力的一个早期的组件。采用新技术,如语义知识图,科学家们打算在协调健康记录和分子数据的最常用的资源发现的数据,然后使用一个名为链接的数据框架,使得原本不是统一的数据之间的连接。 tatonetti和他的同事们想到的是,补助应该使他们能够构建一个可扩展的原型,将制定出涉及与多尺度数据以这种方式处理的诸多挑战,并有可能相交的跨临床和分子数据存储库的兴趣任何类别。

科学家们提出了这样的资源应该能够通过临床医生和基础研究来解决查询。医生可能会问,比如:什么是给病人的遗传,代谢,或蛋白质组图谱疾病的最佳治疗方法?或者什么功能性变体在特定的细胞类型与不同的疾病预后有关?或者什么的代谢差异在某些细胞类型与特定疾病的不同亚型有关?同时,深层链接可以使基本的科学家来回答这样的问题:什么都在一个特定的蛋白质在功能上的改变的临床效果?或生物学途径是通过在特定的疾病病原性遗传变异体的影响?还是什么患者数据可用来评估分子衍生临床假设是什么?这样的见解可以为研究和治疗指导。

尼古拉斯·塔通蒂 & Chenhua Weng
和辰华翁(生物医学信息学系)太阳城网站网址医学中心的尼古拉斯·塔通蒂(系统生物学和生物医学信息学教研室)是深层链接项目联合首席调查员。

科学家们还打算建立深层链接以这样一种方式,它可以成长为可用的数据源改变。目前,生物信息学面临着研究通过分析数据的不断变化的集合中的特定快照经常进行的问题。这就提出了其研究结果如何可靠和可再现的是一个问题,因为当数据被添加或随时间去除施加到不同的数据源,或甚至相同的数据库的结果可能是不同的。重要的是深层连结的发展,那么,将是包括数据起源跟踪,数据更新,同步和质量保证方法。

“近年来,” tatonetti说,“生物医学的研究已成为一个令人难以置信的数据丰富的科学。开放的问题是如何进行观察的这个令人难以置信的数感和翻译我们所知道的实验室和诊所之间。我们仍然有很多工作要做,但我们希望,一旦完成深层链接将会给研究人员随处可见的方式将数据转化为真正的理解。”

— 克里斯·威廉姆斯