技术论文

AlphaGo游戏影响阿贡的新人工智能工具材料的发现

受欢迎程度

研究论文题为“学习连续行动空间发展中高维势能模型”从阿贡国家实验室的研究人员来自橡树岭国家实验室。

文摘
“强化学习(RL)方法把树搜索与深度学习在搜索过高的大发现非凡的成功,尽管离散行动空间,如国际象棋、Shogi就走。许多真实的材料发现和设计应用程序,然而,涉及多维搜索问题和学习领域,连续的行动空间。探索是一个高维的势能模型材料的例子。传统上,这些搜索耗时(通常是几年一个散装系统)和由人类的直觉和/或专长和全局/局部优化搜索最近的问题收敛和/或不规模与搜索维度。在离开这里,基于离散行动和其他梯度方法,我们引入一个RL策略基于决策树,包含修改后的奖励提高勘探、高效采样期间播出和加强“窗口伸缩计划”开发、连续行动支持高效和可扩展的搜索空间问题。使用人工景观和高维控制RL问题,我们成功的基准方法对受欢迎的全局优化方案和先进的策略梯度方法,分别。我们证明其有效性参数化潜力模型(物理基础和高维神经网络)元素周期表的54个不同的元素系统以及合金。我们分析错误趋势潜在空间中的不同元素和他们的起源可以追溯到元素结构多样性和元素能量的平滑表面。广泛地说,我们的RL策略将适用于许多其他自然科学问题涉及搜索结束连续行动空间。”

找到开放获取这里的技术论文。2022年1月出版。阿贡国家实验室新闻那样在这里

吗哪,S。吕弗勒,杰巴特拉,r . et al .学习在发展中高维连续行动空间势能模型。Nat Commun 368 (2022)。https://doi.org/10.1038/s41467 - 021 - 27849 - 6。

访问半导体工程的这里的技术论文库和发现更多的芯片行业学术论文。



留下一个回复


(注意:这个名字会显示公开)

Baidu