零一万物公布对Yi-34B训练过程

11月16日

admin

零一万物在微信公众号发文，对Yi-34B训练过程作出回应。零一万物表示，大模型的持续发展和寻求突破的核心在于训练得到的参数，而不仅仅是架构。他们从零开始训练了Yi-34B和Yi-6B模型，并重新实现了训练代码，使用自建的数据管线构建了高质量的训练数据集。此外，在基础设施方面进行了算法、硬件和软件的联合端到端优化，实现了训练效率的大幅提升和强大的容错能力等原创性突破。这些系统性的科学训练模型工作往往比基本模型结构本身具有更大的作用和价值。

对于之前的争议，零一万物做出回应称，在初次开源过程中，他们发现使用与开源社区普遍使用的Llama架构对开发者更友好。关于沿用部分Llama推理代码并经过实验更名的疏忽，他们表示原始出发点是为了充分测试模型，并非刻意隐瞒来源。零一万物解释了这一情况，并表达了诚挚的歉意。他们正在重新提交模型和代码，并补充Llama协议副本的流程，承诺尽快完成各开源社区的版本更新。

{{userData.name}}已认证

零一万物公布对Yi-34B训练过程

用AI制作宠物吃播视频，百万流量爆款视频教程直接抄

小米突然发布新模型：媲美 DeepSeek-V3.2

Google、Shopify 前高管加盟 OpenAI

OpenAI 发布新生图模型，PK Nano Banana

豆包手机：首批货源已售罄，此前行业内传闻的备货数量均不准确

OpenAI 宣布：苹果 Apple Music 即将与 ChatGPT 集成

Meta 扩大员工使用竞争对手 AI工具权限，含 ChatGPT-5、 Gemini 3 Pro 等

AI Diagram Generator：图表生成器，AI一键生成流程图、思维导图、UML图等多种图表

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注