新华日报热评:大数据与AI驱动,上亿材料“海选”不是天方夜谭

作者:来源:新华日报、机数科技(有删改)发布时间:2021/04/08

节选自:《新华日报》热评
人工智能赋能
“海选”上亿材料组合不再天方夜谭
  2021年初,种子基金投资企业机数科技与材料科学姑苏实验室共建“机数大材库”项目,以“量子化学计算、大数据分析、人工智能赋能” 为核心技术,构建精确可控的大型化学与材料数据库,旨在建立国际一流水平的材料大数据与新材料工场,突破一批材料科学领域基础科学问题和关键共性技术难点,最终实现基础数据资源共享和材料理性化设计的伟大目标。
  近年来国际形势的发展及市场的需要都给我国材料科学的研发提出了全新的挑战。“材料研发亟需探索新的范式,就在十几年前,很多人认为围棋、蛋白质折叠等都是短期内无法解决的问题。随着人工智能近年来的快速发展,这些历史上的难题最近都被逐一攻破了。”材料大数据项目负责人陈忻告诉记者,用人工智能、大数据赋能材料设计,“海选”上亿级别的材料组合不再是天方夜谭。
人工智能、大数据赋能材料设计
基础数据
量子化学模拟
人工智能分析
新材料设计
器材设备
  “材料研发的数字化是时代的趋势,美国白宫于2011年提出了材料基因组计划,并将其上升到国家战略的层级,虽然这个计划的提出已经有将近10年了,但今天看起来它仍然具有很强的前瞻性。”陈忻说,项目计划在姑苏实验室建立一个大规模的材料科学数据库,以这个数据库为基础,开发和利用人工智能的算法,来发现并总结出各类不同材料体系的结构性质性能之间的构效关系,从而对变化莫测的材料性能实现预判,目前准确率可以达到95%,在遥远的将来,目标是让AI媲美顶尖材料科学家。
  “我们的项目实际上是探索一种数据驱动的材料开发新范式,即基于材料大数据寻找新材料设计方案。”材料大数据项目科学家江俊告诉记者,这种范式从原理上来说适用于所有材料开发,不过目前该项目主要集中在半导体、合金材料、化合物的逆向合成这三个领域,通过大数据、人工智能分析海量材料数据,帮助相关企业找到解决问题的方案,打通材料开发的瓶颈。
  10多年前一次日本之行,令江俊意识到数据积累的重要性。“我们去参观日本的一个企业重点实验室,发现里面有好多我们中文的科学期刊和杂志。我当时觉得很意外,因为那时候我们材料科学的起点还比较低,大家都倾向于多学习欧美的先进资料。对方就说,欧美学术顶刊的内容确实都是前沿,但是缺乏细致的全貌。而中国的科研队伍比较庞大,也善于跟随国际上出现的前沿新材料做,做很多细致的细节的研究,他们把这些数据拿过来,就能拼凑出某种新材料各个侧面、各种组分、各类条件下研究的全貌,能够基于这些数据找到更好的筛选设计方案。”
  受此启发,江俊意识到材料数据对产业的支撑作用,也开始进行材料数据的挖掘和积累工作。2016年前后,随着国际形势变化,很多企业在创新自己的新材料时被卡了脖子,“那时候他们还能买到很好的设备,还能请到一流的科学家和工程师回国来做事情,但是国外的数据是从来拿不到的,因为这是国外企业最核心的创新源头。”没有数据就摸索不到科学规律,江俊更坚定了积累、挖掘数据的信念,“我们必须要积累自己的数据,科学文献以及公开发布的专利、在实验室里标准化的高通量数据测量、高精度的计算机模拟等,这都是我们的数据来源。而运用大数据、人工智能技术能够从海量的、复杂的、不完善的、甚至是存在错误的数据里面找到一些规律,获得有效数据。”
  截至目前,数据库储存了约9000万余化合物的基本信息,也取得了一些令人惊喜的研究成果。“比如我们在开发一个用于变形机翼的记忆金属材料,希望在长时间使用后能保持一定记忆功能,我们在模拟近万种组成成分后,发现其中有10多种是具有比较优秀性质的。”陈忻告诉记者,筛选过程中的重点不仅是找到这十几种材料,更核心的功能是找到一种数学映射关系,可以在上亿级别的可能中去寻找适合性能的材料。陈忻充满信心地表示,“在前期的工作基础上,我们有信心取得一系列的成果,力争让姑苏实验室成为全国性的材料数据的出入口,为全国的科研和企业的研发单位提供全新的工具。”
分享至: