10 月 31 日消息,据《智能涌现》报道,前阿里、字节大模型负责人杨红霞在离开字节跳动后,于 2024 年 7 月创立新公司 InfiX.ai,并于昨日在香港披露最新进展。

杨红霞提出,大模型预训练不应是少数巨头的算力竞赛,而应通过「去中心化」方式,让中小企业、研究机构甚至个人都能参与其中。
杨红霞曾在阿里达摩院主导 M6 大模型研发,后在字节继续深耕大模型方向。
她指出,现有「中心化」模型虽能带来技术突破,但在落地应用中存在局限,尤其在数据敏感和本地化部署场景下,后训练难以弥补预训练阶段的知识缺口,导致幻觉问题频发。
InfiX.ai 的核心技术路径包括:
低比特训练框架 InfiR2 FP8:在性能几乎无损的情况下,将训练速度提升最高 22%,显存消耗降低 14%;
模型融合技术 InfiFusion:通过融合不同领域的「专家模型」,避免重复训练,提升知识覆盖度;
医疗多模态大模型 InfiMed:在癌症等复杂医学任务中展现出超越同类模型的推理能力;
多智能体系统 InfiAgent:可自动分解复杂任务,降低开发成本。
杨红霞强调,未来每家企业都将拥有自己的领域大模型,并通过模型融合实现跨领域、跨地域的知识整合,形成全球化的基础模型。她认为,通用人工智能(AGI)不应局限于顶尖机构的算力比拼,而将演变为「全民协作」。