浪潮信息发布千亿级开源大模型源2.0

浪潮信息正式发布了参数值分别为1026亿、518亿、21亿的千亿级开源大模型源2.0。据介绍,源2.0在数理逻辑、数学计算和代码生成能力上有了进一步的发展。它采用了LFA和局部卷积增强注意力机制的创新,能够有效地捕捉局部信息和短依赖信息,从而使模型能够更准确地理解上下文之间的强语义关联,并在编程能力方面学习人类语言习惯的本质。

未来,借助浪潮信息在AI算力平台和OGAI智算软件栈等方面的长期技术积累,源2.0将持续为大模型创业者和开发者提供更丰富、更全面的支持,并提供更开放的技术创新空间。

开源地址:
https://github.com/IEIT-Yuan/Yuan-2.0
论文链接:
https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

搜索