新闻中心
三木SEO-DNA搜索引擎MetaGraph研发成功—新闻—科学网
科技日报北京10月10日电(记者刘霞)瑞士苏黎世联邦理工学院科学家于最新一期《天然》杂志上发表论文称,他们开发出一款名为MetaGraph的DNA搜刮引擎,能快速、高效地检索大众生物学数据库中的海量信息,为研究生命科学提供了强盛的专业东西。 ? MetaGraph的研发,源在科学界对于日趋重大的基因测序数据“用欠好、找不着”的实际困境。已往几十年来,各种生物学数据库范围呈爆炸式增加,然而原始测序数据往往碎片化、噪声多、体量重大,科学家难以直接从中高效提取有效信息。 MetaGraph的焦点冲破于在采用数学中的“图布局”,将彼此堆叠的DNA片断智能联络。其道理近似在图书索引中将含有不异三木SEO-要害词的句子联系关系起来,形成常识收集。研究团队整合了7个大众资助数据库,构建出一个超过病毒、细菌、真菌、植物、动物以致人类的生命全谱系索引。该索引共涵盖1880万个怪异的DNA与RNA序列集,以和2100亿个氨基酸序列集。 基在这一重大索引,团队开发出了可直接经由过程文本提醒检索原始数据档案的搜刮引擎。团队暗示,这是一种与生物学数据交互的全新方式——数据被高度压缩,却可随时调取。MetaGraph使研究职员能直接对于“序列读取档案”(SRA)等存储库提出生物学问题,该数据库自己包罗跨越1亿个DNA字母。 为验证实在用性,团队使用MetaGraph扫描了24万多小我私家类肠道微生物组样本,征采抗生素耐药性的遗传标志。仅用一台高机能计较机,约一小时便患上出成果,揭示出强盛的阐发效率。 法国巴斯德研究所生物计较专家拉扬 希基评价称,这是一项“庞大冲破”,为阐发DNA、RNA和卵白质序列等原始生物学数据设立了新尺度。
MetaGraph索引和年夜量DNA、RNA及卵白质序列档案。图片来历:《天然》网站