-
面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍
12 月 11 日消息,面壁智能官宣,VoxCPM 1.5 版本正式上线,在持续优化开发者开发体验的同时,也带来了多项核心能力升级。 VoxCPM 是一个 0.5B 参数尺寸的语音生成基座模型,于今年 9 月首次发布。 1AI附 VoxCPM 1.5 更新亮点: 高采样音频克隆:AudioVAE 采样率从 16kHz 提升至 44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音; …- 1.2k
-
智谱开源 AutoGLM:每台手机都能成为「AI手机」
12 月 10 日消息,昨天,智谱 AI 宣布正式开源 AutoGLM 项目,旨在推动「会用手机的 AI Agent」成为行业公共底座。 首个完整链路操作:2024 年 10 月 25 日,AutoGLM 在真机上实现稳定的完整操作链路,被视为全球首个具备 Phone Use 能力的 AI Agent。 云手机与安全设计:2025 年,AutoGLM 2.0 推出,采用 MobileRL、Comp…- 3.2k
-
智谱 GLM-4.6V 系列多模态 AI 大模型发布并开源,API 降价 50%
12 月 9 日消息,智谱 AI 官宣发布并开源 GLM-4.6V 系列多模态大模型,包括: GLM-4.6V(106B-A12B):面向云端与高性能集群场景的基础版; GLM-4.6V-Flash(9B):面向本地部署与低延迟应用的轻量版。 作为 GLM 系列在多模态方向上的一次重要迭代,GLM-4.6V 将训练时上下文窗口提升到 128k tokens,在视觉理解精度上达到同参数规模 SOTA…- 2.7k
-
研究:过去一年中国开源 AI 模型下载量占比首次超越美国
11 月 28 日消息,据英国《金融时报》报道,在全球开源人工智能也就是 AI模型市场,中国已经超越美国,在这项强大技术的全球应用方面获得了关键优势。 据报道,麻省理工学院和开源人工智能初创公司 Hugging Face 开展的一项研究发现,过去一年里,中国科研团队开发的开源 AI 模型在开源模型全球下载总量中的占比已上升至 17%,超过了谷歌、Meta 和 OpenAI 等美国科技公司的 15.…- 1.9k
-
中国在开源 AI 模型市场首超美国,与 OpenAI 之“封闭”形成鲜明对比
11 月 26 日,据《金融时报》报道,中国已在全球“开源”AI模型市场超越美国,从而在这一强大技术的全球应用方面获得了关键优势。 美国麻省理工学院和开源 AI 创业公司 Hugging Face 进行的一项研究发现,过去一年,中国新开发的开源模型在开源模型下载总量中的占比上升至 17%,超过了谷歌、Meta 和 OpenAI 等美国公司的 15.8%。这是中国公司首次在这一领域超越美国同行。 开…- 2.8k
-
智谱董事长刘德兵:完全支持开源,我们已开源 40 多款 AI 模型
11 月 16 日上午消息,今日举办的 2025 人工智能 + 大会上,智谱董事长刘德兵指出,“智谱对开源有着自己的执着,喜欢开源和分享,从实际战略层面,开源对人工智能行业有利,AI 需要千千万万各行业领域的人才来参与,基础模型也需要很多的人员来研究,大家一起来玩。” “我们完全支持开源,目前智谱已开源了 40 多款模型。”刘德兵表示。当然,他也指出,智谱也在考虑如何在开源的基础探索商业收益,通过…- 1.6k
-
新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手
11 月 14 日消息,新浪微博发布了其首个开源大模型 VibeThinker-1.5B,号称“小模型也可以有大智慧”。 1AI附官方介绍如下: 目前业界最强大模型参数量大都超过了 1T,甚至出现了 2T 规模的模型,是否只有巨量参数模型才有高度的智能?是否只有少量科技巨头才有能力做大模型? VibeThinker-1.5B,正是微博 AI 对此问题给出的否定答案,它证明了小模型也可以有高智商。这…- 2.6k
-
月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能超越数十亿美元投入的 OpenAI GPT 模型
11 月 9 日消息,月之暗面(Moonshot AI)本周四推出了其迄今能力最强的开源思考模型 ——Kimi K2 Thinking。 月之暗面介绍称,Kimi K2 Thinking 在人类终极考试(HLE)中取得了 44.9% 的优异成绩,这一表现超越了包括 GPT-5、Grok-4、Claude 4.5 在内的多个先进模型。 然而,CNBC 援引知情人士的话称,Kimi K2 Thinki…- 2.4k
-
Kimi 迄今能力最强开源思考模型,月之暗面 Kimi K2 Thinking 发布
11 月 7 日消息,月之暗面推出 Kimi 迄今能力最强的开源思考模型 ——Kimi K2 Thinking。 据介绍,该模型是月之暗面基于“模型即 Agent”理念训练的新一代 Thinking Agent,原生掌握“边思考,边使用工具”的能力。在人类最后的考试(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多…- 2.8k
-
美团发布并开源 LongCat-Flash-Omni 模型:支持实时音视频交互,达到 SOTA 水平
11 月 3 日消息,9 月 1 日,美团正式发布 LongCat-Flash 系列模型,现已开源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 两大版本,获得了开发者的关注。今天 LongCat-Flash 系列正式发布全新家族成员 ——LongCat-Flash-Omni。 1AI从官方介绍获悉,LongCat-Flash-Omni 以 LongCat…- 2.2k
-
教你本地部署通义万相文生视频模型,轻松实现文本生成视频
阿里巴巴推出的通义万相2.1(Wan2.1)是目前领先的开源文生视频模型,依托强大的生成能力,已成为AI视频创作的重要工具。本文将手把手教你如何快速安装和使用Wan2.1模型,助你轻松实现文本生成视频。 1.环境准备 在开始之前,确保你的设备满足以下要求: 系统支持:Windows、macOS 硬件要求:建议使用带有NVIDIA显卡的设备,显存≥16GB,推荐RTX 3060及以上型号,确保模型…- 3.3k
-
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
10 月 27 日消息,今天上午,美团 LongCat 团队发布并开源 LongCat-Video 视频生成模型。根据官方介绍,其以统一模型在文生、图生视频基础任务上达到开源 SOTA(最先进水平),并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性,在长视频生成领域具备显著优势。 根据介绍,近年来,“世界模型”(World Model)可让人工智能真正理解…- 2.1k
-
腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界
10 月 23 日消息,腾讯混元官宣,混元世界模型 1.1 版本(WorldMirror)正式发布并开源,新增支持多视图及视频输入,单卡即可部署,秒级创造 3D 世界。 今年 7 月,腾讯推出了混元世界模型 1.0,这是业界首个开源并兼容传统 CG 管线的可漫游世界生成模型,其 lite 版本在消费级显卡就可以部署。 作为一个统一(any-to-any)的前馈式(feedforward)3D 重建…- 1.1k
-
单卡日处理 20 万页文档,DeepSeek-OCR 开源上线
10 月 21 日消息,据「Al寒武纪」报道,DeepSeek 团队近日发布全新研究成果 DeepSeek-OCR,提出「上下文光学压缩」方法,为大模型长文本处理带来突破性思路。 研究显示,通过将长文本渲染为图像,再转化为视觉 token,能够在保持高精度的同时显著降低计算成本。 实验数据显示,在小于 10 倍压缩率下,OCR 解码准确率高达 97%;即便在 20 倍超高压缩率下,准确率仍能维持在…- 1.6k
-
蚂蚁集团开源全球首个万亿参数推理大模型 Ring-1T-preview,代码生成能力超 GPT-5
9 月 30 日消息,蚂蚁集团今日凌晨宣布开源其自研的首个万亿参数大模型 Ring-1T-preview,这是一款自然语言推理大模型,也是全球首个开源的万亿参数推理大模型。 据百灵大模型官方信息,Ring-1T-preview 是万亿参数推理大模型 Ring-1T 的预览版。尽管是预览版,但其自然语言推理能力已十分出色。在 AIME 25 测试中,Ring-1T-preview 获得 92.6 分…- 5.2k
-
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
9 月 29 日消息,DeepSeek 今日正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。 作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(注:一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 DeepSeek Spa…- 1.7k
-
腾讯开源「混元图像 3.0」,对标业界领先闭源模型
昨天,腾讯混元正式发布并开源原生多模态生图模型「混元图像 3.0(HunyuanImage 3.0)」,参数规模高达 80B。 据介绍,这是首个开源工业级原生多模态生图模型,也是目前效果最强、参数量最大的开源生图模型,效果对标业界头部闭源模型。 混元图像 3.0 在语义理解、美学质感和推理能力上均有显著提升,能够解析千字级复杂语义并生成高质感图像。 与传统多模型组合方案不同,混元图像 3.0 采用…- 2.8k
-
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
9 月 28 日消息,据界面新闻报道,9 月 27 日,零一万物 CEO 李开复在长江 CEO 组织 20 周年返校日庆典上表示,DeepSeek 对中国 AI 发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾 DeepSeek 怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。” 李开复提到,自 DeepSeek 开源以来,国内多家企业相继开源大…- 1.8k
-
英伟达开源 Audio2Face 模型:AI 实时生成面部动画,多语言口型同步
9 月 25 日消息,英伟达昨日(9 月 24 日)发布博文,宣布开源生成式 AI 面部动画模型 Audio2Face,涵盖模型、软件开发工具包(SDK)及完整训练框架,希望能在游戏和 3D 应用中,加速开发 AI 智能虚拟角色。 该技术通过分析音频中的音素、语调等声学特征,实时驱动虚拟角色面部动作,生成精准的口型同步和自然的情感表情,可广泛应用于游戏、影视制作和客户服务等领域。 Audio2Fa…- 2.1k
-
全球首个端到端全模态AI模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
9 月 23 日消息,又是熟悉的深夜,阿里云今日发布并开源了全新的 Qwen3-Omni、Qwen3-TTS,以及对标谷歌 Nano Banana 图像编辑工具的 Qwen-Image-Edit-2509。 Qwen3-Omni 是业界首个原生端到端全模态 AI 模型,能够处理文本、图像、音频和视频多种类型的输入,并可通过文本与自然语音实时流式输出结果,解决了长期以来多模态模型需要在不同能力之间进…- 2.7k
-
上传一张图、主演任何视频,“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源
9 月 20 日消息,阿里通义万相全新动作生成模型 Wan2.2-Animate 正式开源。该模型支持驱动人物、动漫形象和动物照片,可应用于短视频创作、舞蹈模板生成、动漫制作等领域。 Wan2.2-Animate 模型基于此前通义万相开源的 Animate Anyone 模型全面升级,不仅在人物一致性、生成质量等指标上大幅提升,还同时支持动作模仿和角色扮演两种模式: 角色模仿:输入一张角色图片和一…- 1.6k
-
小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,对话自然度、交互适配达拟人化水准
9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化。 据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据,难以适应新任务达到类人智能。 而 Xia…- 1.6k
-
阿里云发布通义 Qwen3-Next 基础模型架构,开源80B-A3B系列模型
今天凌晨,阿里通义发布了下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型。 官方表示,其认为 Context Length Scaling 和 Total Parameter Scaling 是未来大模型发展的两大趋势。为了进一步提升模型在长上下文和大规模总参数下的训练和推理效率,通义千问设计了全新的 Qwen3-Next 的模型结构。…- 2.7k
-
腾讯混元图像模型 2.1 上新开源:原生 2K 生图、中英文输入
9 月 10 日消息,腾讯昨日宣布混元图像模型 2.1 上新开源,支持原生 2K 生图和中英文原生输入。 腾讯还同步开源了“PromptEnhancer 文本改写模型”,输入“画一只可爱的猫”,会自动补全“橘色短毛猫趴在格子桌,爪边放饼干,水彩风”;支持中英文双向转换,用中文说“画带‘Dream’的星空蛋糕”,也能精准呈现,避免“表达模糊”。 混元图像模型 2.1 支持长达 1k tokens 的…- 2k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!























