人工智能机器学习工具对2019冠状病毒病的意外科学见解

时间:2020-05-09 20:33 来源:seo 作者:小可爱科技知识网 点击量:

人工智能机器学习工具对2019冠状病毒病的意外科学见解

劳伦斯伯克利国家实验室(伯克利实验室)的一组材料科学家;通常花费时间研究诸如热电材料或电池阴极的高性能材料的科学家;在创纪录的时间内建立了文本挖掘工具,帮助全球科学界综合每天产生的大量关于COVID-19的科学文献。

这个工具在covidscholar.org网站上发布,它使用自然语言处理技术,不仅可以快速扫描和搜索成千上万篇研究论文,还能帮助你发现一些原本不太明显的问题,并将它们联系起来。人们希望该工具最终能使自动化科学成为可能。

在谷歌和其他搜索引擎上,人们搜索他们认为相关的内容。伯克利实验室的科学家Gerbrand Ceder说,他是这个项目的负责人之一。我们的目标是进行信息提取,以便人们能够发现不明显的信息和关系。这就是将应用于这些数据集的机器学习和自然语言处理的全部思想。

人工智能机器学习工具对2019冠状病毒病的意外科学见解

今年3月,白宫科技政策办公室(Office of Science and Technology Policy)发出行动呼吁,要求人工智能专家开发新的数据和文本挖掘技术,以帮助找到有关COVID-19的关键问题的答案。covid - scholar就是响应这一号召而开发的。

伯克利实验室团队在大约一周内建立了COVIDScholar的原型并投入运行。一个多月后的今天,它已经收集了61000多篇研究论文。其中大约有8000个是专门针对COVID-19的,其余的是相关主题,比如其他病毒和大流行。每天都有超过100个独立用户,都是通过口碑传播的。

本周,该团队发布了一个升级版本,准备供公众使用。新版本使研究人员能够搜索相关论文。使用基于机器学习的相关性调优对文章进行排序。

人工智能机器学习工具对2019冠状病毒病的意外科学见解

任何科学领域的研究数量都令人生畏,尤其是这个领域。毫无疑问,作为科学家,我们无法跟上文学的步伐。伯克利实验室的科学家Kristin Persson说,他是这个项目的负责人之一。我们需要帮助,以便迅速找到相关论文,并在这些论文之间建立关联,而这些论文可能从表面上看并不像是在讨论同一件事情。

该团队已经构建了自动化的脚本来获取新论文,包括预印稿、清理论文并使其可搜索。在最基本的层面上,COVIDScholar就像一个简单的搜索引擎,尽管是一个高度专业化的搜索引擎。

学者有成千上万的论文供你查阅。加州大学伯克利分校(UC Berkeley)研究生、伯克利分校实验室研究员达格伦(John Dagdelen)说。然而,当你搜索脾的时候;或《;脾脏damage’mdash;现在有研究表明脾脏可能会受到病毒的攻击。你会得到十万份关于脾脏的论文,但它们与你需要的COVID-19无关。我们有关于COVID-19的最大的单主题文献集;

除了返回基本的搜索结果,COVIDScholar还会推荐类似的摘要,并自动对论文进行分类,例如测试或传播动态,允许用户进行专门的搜索。

现在,在花了最初几周时间建立收集、清理和整理数据的基础设施之后,团队正在处理下一个阶段。我们已经准备好在自动化科学的自然语言处理方面取得重大进展。Dagdelen说。

例如,他们可以训练他们的算法去寻找概念之间被忽视的联系。你可以使用机器学习模型中生成的概念表示来找出文献中没有同时出现的事物之间的相似性,这样你就可以找到应该被连接但尚未连接的事物。Dagdelen说。

另一个方面是与伯克利实验室环境基因组学和系统生物学部门以及加州大学伯克利分校创新基因组学研究所的研究人员合作,以改进covid学研究的算法。我们正在把我们正在做的无监督机器学习和他们一直在做的工作联系起来,把疾病和人类表现型之间的遗传联系的所有信息组织起来,以及我们在自己的数据中发现新联系的可能途径。Dagdelen说。

整个工具运行在国家能源研究科学计算中心(NERSC)的超级计算机上,NERSC是美国能源部位于伯克利实验室的科学用户设施办公室。从生物科学到计算机再到材料科学;是什么让这个项目成为可能。在线搜索引擎和门户由NERSC的Spin云平台提供支持;从Materials项目的成功运营中吸取的经验教训,每天为用户提供数百万条数据记录,为COVIDScholar的发展提供信息。

这件事不可能发生在别的地方,不可能发生在别的地方。Trewartha说。我们取得的进步比在其他地方可能取得的进步要快得多。这确实是一个关于伯克利实验室的故事。通过与加州大学伯克利分校生物科学(伯克利实验室)NERSC的同事们合作,我们能够快速重复我们的想法。

同样重要的是,该小组已经为材料科学建立了本质上相同的工具,称为MatScholar,这是一个由丰田研究所和壳牌公司支持的项目。这一切能够如此迅速地完成的主要原因是这个团队有三年为材料科学做自然语言处理的经验。转让人说。

他们去年在《自然》杂志上发表的一项研究表明,一种没有经过材料科学训练的算法可以发现新的科学知识。该算法扫描了330万篇已发表材料科学论文的摘要,然后分析单词之间的关系;它能够提前数年预测新热电材料的发现,并提出迄今未知的材料作为热电材料的候选材料。

除了在抗击COVID-19方面提供帮助外,该团队相信他们还能够学习到很多关于文本挖掘的知识。这是一个测试案例,看看一种算法在信息同化方面是否能比我们所有人阅读一堆论文更快更好。转让人说。

COVIDScholar项目由伯克利实验室的实验室指导研发(LDRD)项目资助。他们的材料科学工作是这个项目的基础,由美国能源部支持。加州大学伯克利分校生物科学研究所(EBI)、丰田研究所和国家科学基金会。

当前位置:主页 > 技术知识 >

声明:本文小可爱科技知识网整理不代表个人观点,转载请注明原文,点击还能查看更多的文章;本文网址: http://www.kozbods.com/jishu/1507.html

围观: 次 | 责任编辑:小可爱科技知识网



回到顶部