AI 无涯日报 · 2026 年 5 月 29 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. Claude Opus 4.8 发布:编码、智能体技能与推理全面升级来源:Anthropic Newsroom
Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增”动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5。
2. Grok Build 0.1 API 上线 — xAI 编码模型 100+ tokens/秒来源:xAI News
xAI 的最新编码模型 Grok Build 0.1 已通过 xAI API 进入公开测试阶段。该模型专为智能体编码任务训练,支持网页开发、调试和 MCP。推理速度超过 1 ...
AI 无涯日报 · 2026 年 5 月 28 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
产品发布/更新1. Runway 推出 Model Context Protocol 服务器Runway:News(网页)
Runway 正式推出 Runway MCP 服务器,允许任何兼容 MCP 的 AI 智能体(如 Claude、ChatGPT、Cursor)在对话界面中直接生成图像与视频,无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型,包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便,通过 runwayml.com/mcp 添加服务器并登录现有 Runway 账户即可使用,无需单独申请 API 密钥。
2. Claude Code v2.1.152 更新发布Claude Code:GitHub Releases(RSS)
Claude Cod ...
AI 无涯日报 · 2026 年 5 月 27 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题IT之家(RSS)
2. 面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上IT之家(RSS)
面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。
3. 腾讯混元新翻译模型双榜亮眼,小程序发布X:腾讯混元 (@TencentHunyuan)
腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本 ...
AI 无涯日报 · 2026-05-26
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANNIT之家(RSS)
产品发布/更新2. Grok Build Beta版向SuperGrok用户开放X:xAI (@xai)
Grok Build 现已面向所有 SuperGrok 和 X Premium+ 用户推出 Beta 版。 使用 Plan Mode,通过 Imagine 创建图像和视频,并使用 CLI 构建自动化或编排器。 访问 http://x.ai/cli 开始使用。
3. Qwen3.7-Max隐式缓存功能上线X:通义千问 / Qwen (@Alibaba_Qwen)
✅隐式缓存现已在Qwen3.7-Max上线——自动启用,无需设置。 ⚡️开箱即用,更快更便宜。 需要更高、更确定的命中率?请尝试显式缓存。🙌 🔗最佳实践🔗:https://www.alibabacloud.com/help/en/model-studio ...
AI 工具推荐 · 2026 年 5 月
每月精选实用 AI 工具与开源项目,提升你的工作效率。
🔥 本月热点Grok Build Beta — xAI 的 AI 开发平台Grok Build Beta 版已向 SuperGrok 和 X Premium+ 用户开放。支持 Plan Mode 规划模式,通过 Imagine 创建图像和视频,并提供 CLI 工具用于构建自动化流程和编排器。对于 AI 开发者来说,这是一个值得关注的新平台。
平台:X / xAI
访问:x.ai/cli
🛠 实用工具Qwen3.7-Max 隐式缓存通义千问 Qwen3.7-Max 上线隐式缓存功能——自动启用,无需手动设置。开箱即用的加速缓存让推理更快、成本更低,适合需要高频调用的场景。如果你在用通义千问的 API,这个功能可以直接降低使用成本。
平台:阿里云 Model Studio
链接:最佳实践
📚 学习资源Harness、Scaffold 与 AI 智能体术语辨析Hugging Face 发布了一篇实用的 AI 智能体术语解析文章,厘清了 Agent 生态中 ...
AI 论文速递 · 2026-05-26
精选今日 AI 领域值得关注的学术论文与研究动态。
头条1. 图灵测试 76 年后首现 AI 通过实证:GPT-4.5 以 73% 判定率超越真人
加州大学圣地亚哥分校研究首次实证现代 AI 可通过图灵测试。在获得特定提示后,GPT-4.5 在 5 至 15 分钟的对话中被误认为人类的概率高达 73%,显著超过真人参与者(被判定为人类的概率仅 67%)。这是图灵测试提出 76 年来,AI 首次在严格实证中跨越这一里程碑。
IT之家
模型与推理2. 奖励倾斜分布匹配:强化少步生成器的新框架
本文提出 RTDMD(奖励倾斜分布匹配蒸馏),一个将分布匹配蒸馏与奖励引导强化学习统一应用于少步流生成器的两阶段框架。通过最小化到奖励倾斜教师分布的 KL 散度,在图像和视频生成任务上实现了更优的质量与效率平衡。
arXiv
3. Nemotron-Labs 扩散语言模型:光速级文本生成
NVIDIA 发布 Nemotron-Labs 扩散语言模型研究,通过扩散语言模型架构大幅提升文本生成速度,可实现”光速级”的文本输出。该工作已在 Hugging Fa ...

