OpenAI 前 CTO 创业的首个成果公布

资讯
25年9月12日
編輯

admin

昨天，由多位 OpenAI 前高管创立的 Thinking Machines Lab（TML），终于在成立半年后，发布了其首篇重磅研究论文《Defeating Nondeterminism in LLM Inference》（克服 LLM 推理中的不确定性）。

据 TML 介绍，未来将频繁发布博客文章、开源代码以及各种研究成果，既是「造福公众」，也是为了「优化我们自己的研究文化」。而其首篇论文则作为全新博客系列《Connectionism》的开山之作。

此前，大家经常能看到 ChatGPT 等 AI 每次给出的答案都不太一样，而这一现象早就被视作习以为常——大家都认为现在的 AI 模型就是概率模型。而 TML 则试图通过本次成果来解决这个老大难。

在论文内容方面，TML 认为 AI 模型产生随机性的罪魁祸首，其实是 GPU 内核 —— 就是那些在英伟达芯片里跑的小程序 —— 在推理过程中的拼接方式有问题。

文章的核心作者是 Thinking Machines Lab 的 AI 研究员 Horace He，他的解决思路很巧妙，如果能精确控制这一层的执行流程，就有可能让 AI 模型的输出变得更加稳定可靠。

此外，除了提供更靠谱的 AI 响应，让 AI 模型生成可重复的答案还有个更大的价值——能显著改善强化学习（RL）训练效果。Horace He 认为，更一致的响应能让整个 RL 训练过程「丝滑」很多。

据了解，Mira Murati 是 OpenAI 的前 CTO，同时目前也是 Thinking Machines Lab 的创始人兼 CEO。她在 7 月份就曾表示 Thinking Machines Lab 已经完成 20 亿美元的融资，且首款产品将在未来几个月内亮相，并且会对研究人员和正在开发定制模型的初创公司大有裨益。

而据最新消息显示，TML 在「0 产品 0 用户」的情况下，估值已经狂飙 120 亿美元（折合人民币 850 亿元）。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

OpenAI 前 CTO 创业的首个成果公布

宇树科技官宣 IPO 后，王兴兴首次发声：最后悔以前没有学 AI

2025 外滩大会与人工智能带来的「新秩序」

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

宇树科技官宣 IPO 后，王兴兴首次发声：最后悔以前没有学 AI

2025 外滩大会与人工智能带来的「新秩序」

研究人员诱导AI聊天机器人泄露有害内容，成功率高达 98%

LLM AutoEval:AI平台自动评估Google Colab中的LLM

甲骨文的 OCI 生成式 AI 服务现已推出

过于追求人性化：奥尔特曼称 GPT-4o 出现“谄媚烦人”倾向，OpenAI 计划在一周内修复

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注