英伟达提出智能体式变异算子AVO,用自主编码智能体替代传统进化搜索中的人工设计方法,在Blackwell B200 GPU上连续自主运行7天无需人工干预;AVO生成的注意力内核在BF16精度下达1668 TFLOPS,超越英伟达官方cuDNN最高3.5%,超越FlashAttention-4最高10.5%;该优化可迁移至分组查询注意力,仅需30分钟自主适配即获显著性能提升,研究者称”盲编程是软件工程的未来”。
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!
