-
唯一中国企业:阿里达摩院加入国际电信联盟“人工智能技能联盟”,多癌早筛 AI 已服务 9 个国家地区 2000 万人次
7 月 13 日消息,当地时间 7 月 9 日,在瑞士日内瓦召开的联合国 AI for Good 峰会上,阿里达摩院两项 AI 技术入选 AI for Good 创新影响力案例集并获优秀案例奖:“八观”气象大模型、“平扫 CT+AI”多癌早筛。阿里达摩院还与联合国下属的国际电信联盟(ITU)达成合作,共建开放的 AI 专家交流与知识分享平台。 达摩院决策智能实验室资深算法专家彭冰清在会上分享,“八…- 2k
-
Manus 与阿里合作开发或不再推进
据蓝鲸科技消息,本周 Manus AI 再传异动,数位员工证实公司将把总部迁往新加坡、国内团队大规模调整的消息。 而受此次调整波及的前 Manus 员工透露,据其当时了解,Manus 之后或将不再设立国内办公地,亦不再保留国内业务团队,全部迁移至新的总部所在地新加坡。 其表示,国内多数员工此前不清楚要迁总部的变动,「可能只是知道新加坡有办公室罢了。」直至本周一,公司才正式通知员工并进行谈话,给出的…- 4.9k
-
阿里通义开源网络智能体 WebSailor,登顶开源网络智能体榜单
7 月 7 日消息,今日阿里云宣布,通义正式开源网络智能体 WebSailor,该智能体具备强大的推理和检索能力,发布后在智能体评测集 BrowseComp 上登顶开源网络智能体榜单。1AI注意到,目前 WebSailor 的构建方案及部分数据集已在 Github 开源。 据阿里云介绍,WebSailor 网络智能体可以应用复杂场景下的检索任务,对于模糊问题可迅速在不同的网页中进行快速检索并推理验…- 9.7k
-
阿里通义开源旗下首个音频生成模型 ThinkSound:可像“专业音效师”一样思考
7 月 4 日消息,阿里“通义大模型”公众号今日发文宣布,通义实验室首个音频生成模型 ThinkSound 现已正式开源,将打破“静音画面”的想象力局限。 ThinkSound 首次将 CoT(Chain-of-Thought,思维链)应用到音频生成领域,让 AI 学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成 —— 不只是“看图配音”,而是真正“听懂画面”。 …- 9.4k
-
阿里开源 Qwen3 新模型 Embedding 及 Reranker,带来强大多语言、跨语言支持
6 月 6 日消息,阿里今日凌晨开源了 Qwen3-Embedding 系列模型(Embedding 及 Reranker),专为文本表征、检索与排序任务设计,基于 Qwen3 基础模型进行训练。 官方表示,在多项基准测试中,Qwen3-Embedding 系列在文本表征和排序任务中展现了卓越的性能。 其具备如下特点: 卓越的泛化性:Qwen3-Embedding 系列在多个下游任务评估中达到行业…- 1.4k
-
阿里发布国内首个“混合推理模型”Qwen3 并开源:支持两种思考模式,预训练约 36 万亿个 token、119 种语言和方言
4 月 29 日消息,今日凌晨,阿里巴巴发布了新一代通义千问 Qwen3 模型,一举登顶全球最强开源模型。 Models Layers Heads (Q / KV) Tie Embedding Context Length Qwen3-0.6B 28 16 / 8 Yes 32K Qwen3-1.7B 28 16 / 8 Yes 32K Qwen3-4B 36 32 / 8 Yes 32K …- 1.8k
-
阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度
4 月 28 日消息,阿里通义千问开源负责人林俊旸在 X 上发文暗示,Qwen3 模型有望今日发布。 值得一提的是,Qwen3 系列模型合集已在阿里巴巴旗下 AI 模型开源社区 ModelScope(魔搭)短暂亮相后又下线,包括 Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B 及 Qwen3-30B-A3B-Base 四款模型。所有模型均采用 Apache License …- 972
-
业界首个,阿里通义万相“首尾帧生视频模型”开源
阿里通义万相「首尾帧生视频模型」4 月 17 日宣布开源,该模型参数量为 14B,号称是业界首个百亿参数规模的开源首尾帧视频模型。 它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。 用户可在通义万相官网直接免费体验该模型,或在 Github、Hugging Face、魔搭社区下载模型本地部署后进行二次开发。 技术介…- 1.7k
-
阿里通义千问推出视觉推理模型 QVQ-Max:可分析、推理图片和视频内容
3 月 28 日消息,今天凌晨,阿里通义千问团队宣布推出新一代视觉推理模型 QVQ-Max。 据官方介绍,QVQ-Max 不仅能够理解图片和视频内容,还能为上述信息提供分析并推理。不止分析和推理,QVQ-Max 还可以完成设计插图、生成短视频剧本等内容,甚至根据用户的需求创建角色扮演内容。 核心能力:从观察到推理 QVQ-Max 的能力可以总结为三个方面:细致观察、深入推理和灵活应用。下面分别来说…- 2.4k
-
阿里将推出基于 Qwen2.5-MAX 的深度推理模型
2 月 20 日消息,据新浪科技报道,阿里巴巴集团 CEO 吴泳铭在 2025 财年第三季度财报会上表示,阿里将于近期发布基于千问 Qwen2.5-MAX 的深度推理模型。 1AI注意到,1 月 29 日新年之际,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型,号称在多个基准测试中超越 DeepSeek V3 等竞争对手。 阿里云随后又宣布,Qwen2.5-Max …- 1.8k
-
阿里发布 Qwen-Agent 框架,赋能开发者构建复杂 AI 智能体
1 月 4 日消息,阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent,基于现有 Qwen 语言模型,支持智能体执行复杂任务,并提供多种高级功能,赋能开发者构建更强大的 AI 智能体。 附上官方介绍如下: Qwen-Agent 是一个开发框架。开发者可基于本框架开发 Agent 应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力。本项目也提供了浏览器助手…- 4.9k
-
阿里通义千问开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考
阿里通义千问 Qwen 团队今天(12 月 25 日)发布博文,宣布基于 Qwen2-VL-72B 构建,推出 QVQ-72B-Preview 开源视觉推理模型,能够像物理学大师一样,面对复杂的物理问题,沉着冷静地通过逻辑推理找到解决方案。 阿里通义千问团队在 4 个数据集上评估 QVQ-72B-Preview,1AI附上相关介绍如下: MMMU:一个大学级别的多学科多模态评测集,旨在考察模型视觉…- 3.8k
-
消息称阿里投资的 AR 眼镜品牌 “致敬未知” 明年将发布新款 AI 眼镜,开辟其他应用场景
据“钛媒体”19 日报道,近期国内市场掀起了 AI智能眼镜热潮,多家品牌也先后发布了主打轻便和 AI大模型的 AI眼镜产品。而此前拿到阿里投资的 AR眼镜品牌“致敬未知”也将在明年 Q1 发布 AI 眼镜产品。 报道称,其产品与市场上其他 AI 眼镜产品,尤其是那些模仿 Ray-Ban Meta 眼镜应用场景的竞品不同,致敬未知的 AI 眼镜将“开辟其他应用场景”。AI 眼镜是致敬未知正在研发的二…- 6k
-
阿里在海外推出对话式 AI搜索引擎 Accio,面向全球商家开放
11 月 13日消息,阿里在海外推出对话式 AI搜索引擎 Accio,面向全球商家开放。 Accio 的页面主体是对话框,产品形态类似于 AI 搜索引擎 Perplexity,定位是个人采购代理。 当用户输入需求之后,它会通过供货商、定制范围、价格、终端零售销量、客户评价等信息筛选,输出符合的商家和商品。 据晚点 LatePost 报道,此前 Accio 的部分能力已在阿里国际站的“找工厂”模块中…- 6.1k
-
阿里通义千问开源 Qwen2.5-Coder 全系列模型,号称代码能力追平 GPT-4o
11 月 12 日消息,阿里通义千问开源 Qwen2.5-Coder 全系列模型,其中 Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,官方号称代码能力追平 GPT-4o。 Qwen2.5-Coder-32B-Instruct 作为本次开源的旗舰模型,在多个流行的代码生成基准(如 EvalPlus、LiveCodeBench、BigCodeBench)上都…- 4.6k
-
阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型:自由互动,无需输入文本
阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。 作为一个大规模音频语言模型,Qwen2-Audio 能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本,有两种不同的音频交互模式: 语音聊天:用户可以自由地与 Qwen2-Audio 进行语音互动,而无需文本输入 音频分析:用户可以在互动过程…- 10k
-
阿里推首个妆造大模型神力霓裳 已在古装剧中投入应用
近日,阿里大文娱推出了首个妆造大模型 ——神力霓裳。这一大模型专注于古装剧的妆造创意设计,包含了造型设计、妆发设计和纹样设计三大功能。通过设定朝代、性别、身份等条件,并输入相关提示词,只需2分钟即可生成妆造图片。这项技术已经在古装剧集《掌心》中投入应用。 图源备注:图片由AI生成,图片授权服务商Midjourney 传统的影视美术设计流程往往需要大量的人力与时间成本,而这一大模型的出现为创作者提供…- 15.4k
-
能自动化视频剪辑的开源工具,FunClip本地部署和线上体验
这几年短视频非常火爆,尤其是抖音等短视频平台的崛起,很多人都可以把自己的日常生活或者工作发到网上,吸引很多人的关注,也有一些人因此赚到了人生第一桶金。 然后剪辑视频却是一件非常耗费精力的事情,经常要几个小时才能剪出来一个视频。 今天给大家推荐一个阿里开源的自动化视频剪辑工具—FunClip,可以帮助大家轻松剪辑视频。 FunClip是一款完全开源的自动化视频剪辑工具,可以安装在我们自己的电脑上,支…- 64.1k
-
阿里投资 Kimi AI 开发商月之暗面:8 亿美元购入约 36% 股权
据阿里巴巴财报披露,该公司于 2024 财年向人工智能初创公司月之暗面(Moonshot AI)投资合共约 8 亿美元(当前约 59 亿元人民币),购入约 36% 股权,为于月之暗面的优先股投资。 阿里巴巴集团主席蔡崇信和首席执行官吴泳铭在股东信中写道,该公司“将 AI 作为改变和加速业务增长的最强大变量”。 这封致股东信表示,在过去的 25 年内,阿里经历了不断成长,也出现了一些“大公司病”的症…- 7k
-
大模型价格战升级!阿里、百度、字节跳动争相“降价”,大厂火拼,价格亲民
昨天,阿里云搞了个大动作,他们的一个叫Qwen-Long的高级AI模型突然降价了,降得特别狠,本来用这个模型要花的钱现在能省下97%,1块钱就能买到以前好几百块才能买到的服务,这跟买五本《新华字典》的钱差不多。 阿里云、百度智能云、字节跳动相继宣布重大消息,将大模型的使用成本降至冰点,这场“价格战”不仅重塑了行业格局,更为广大企业和开发者带来了前所未有的机遇。 阿里云:Qwen-Long“破局者”…- 3.4k
-
阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话
阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。 如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。 通义APP首批上线了多达80个EMO模板,涵盖了热门歌曲、网络热梗等多种内容。用户可以选择预置的音频来生成视频,但目前暂不支持用户自定义音频。 EMO模型是通义实验室精心研发的AI模型,其背后的肖像…- 5.1k
-
阿里AI职业趋势报告:AI能力正在成为职场关键竞争力
“五一”劳动节前夕,阿里巴巴发布了一份《“AI+”职业趋势报告》,详细解读了我国各行各业如何运用人工智能(AI)推动职业发展。 报告明确指出,AI在编程、设计、乃至养猪等多个领域都展现出强大的应用价值,预示着“人人都有一个AI助理”的时代正加速到来。在这样的背景下,AI能力正逐渐成为职场的核心竞争力,而“人机协作”则成为新的工作常态。 此次报告的撰写基于对这些“职场AI人”的深入采访,详细记录了他…- 5.8k
-
马云内网发声:肯定阿里变革一年成效 称 AI 时代刚刚到来
今日,阿里巴巴创始人马云在内网论坛上发表了一篇题为《致改革 致创新》的深入帖子,这是他退休后五年来首次以长篇幅分享对公司改革创新及未来前景的独到见解。马云在文章中高度赞扬了由蔡崇信和吴泳铭组成的新管理层,对他们的变革勇气给予了充分的肯定,并认为阿里巴巴已经重回健康成长的轨道,支持他们继续深化改革。 马云开篇便对蔡崇信和吴泳铭的新管理层表示了由衷的赞赏。他指出,在过去的一年里,他们直面问题、直面未来…- 2.4k
-
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源
4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到,通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。 此次开源的 320 亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡。例如,相比通义千问 14B 开源模型,32B 在智能体场景下能力更强;相比通义千问 72B 开源模型,32B 的推理成…- 3.9k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!