深度势能:发布预训练大模型DPA-2

最近,深度势能团队向社区发布了预训练大模型DPA-2,并全面开放了基于DPA-2的微调、蒸馏和应用自动化流程。相关论文已在arXiv上进行了预发表。相较于去年发布的DPA-1,DPA-2在模型架构上有显著更新,最大的特点是采用了多任务训练策略,使其能够同时学习不同计算设置和标签类型的各类数据集。由此产生的模型在下游任务上展现出了极强的少样本乃至零样本迁移能力。目前,用于训练DPA-2模型的数据集已覆盖了半导体、钙钛矿、合金、表面催化、正极材料、固态电解质、有机分子等多类体系。

论文地址:
https://arxiv.org/abs/2312.15492
Notebook链接:
https://nb.bohrium.dp.tech/detail/18475433825

搜索