AI 日报 | 2026-04-29 | Tony‘s BLOG

type

Post

status

Published

date

Apr 29, 2026

slug

summary

今日重点：Anthropic ICLR 2026 论文 'The Reasoning Trap' 揭示推理增强反而加剧 tool hallucination；Google deep-research-max-preview-04-2026 与 gemini-robotics-er-1.6 同步上线；Skills 生态在 GitHub 持续爆发（mattpocock/skills 31.5k、karpathy-skills 94.8k、superpowers 169.9k）；OpenAI 发布 Symphony 项目级编排系统。攀岩 app 重点关注 ClimbingCap (LiDAR+RGB+IMU 数据集) 和 ReVSI 空间智能 benchmark。

一、今日最重要的 5 条

1. ICLR 2026 "The Reasoning Trap"：增强 LLM 推理反而放大 tool hallucination

发生了什么：本周 ICLR 2026 (Rio de Janeiro) 上一篇论文显示，让模型推理更深，tool call 的幻觉反而显著增加——尤其在 agent 系统里调用错误的工具或编造 API 参数。

为什么重要：这是继上周 AGENTS.md 论文之后，第二篇"工程默认 = 错的"重磅 paper；告诉所有做 agent 的人：reasoning ≠ reliability，特别是 tool-use 路线上。

对你：你做 coding agent / climbing app 后端 agent 时，如果用 reasoning 模型（o3 / Sonnet 5 thinking），必须把 tool-call 准确性单独评估，不要假设 "模型更聪明 → 更不会调错工具"。

链接：https://asanify.com/blog/news/ai-agent-hallucination-april-29-2026/

2. Google deep-research-max-preview-04-2026 + gemini-robotics-er-1.6-preview 上线

发生了什么：Google 在 4 月发布两个 preview 模型：deep research 子模型主打"自动 context 收集 + 综合"，robotics ER 1.6 强化空间/物理推理与仪表读取。

为什么重要：Google 不再靠单一旗舰模型推进，而是横向扩产品形态——deep research、robotics、TTS、agentic Gemma 4 各自独立模型；这是"模型 → 产品矩阵"成型的信号。

对你：deep research 子模型对你做 portfolio / 文献综述类工作很有用；robotics ER 对动作分析有间接相关（spatial reasoning 升级）。

链接：https://ai.google.dev/gemini-api/docs/changelog

3. GitHub Skills 生态爆发：mattpocock/skills 31.5k stars，superpowers 169.9k

发生了什么：本周 GitHub trending 上 "skills" 类项目持续放量。mattpocock/skills（"Skills for Real Engineers"）单周新增明显；superpowers 已突破 169.9k；4forrestchang/andrej-karpathy-skills 已到 94.8k。

为什么重要：和上周 ETH 的 AGENTS.md 论文形成戏剧性张力——社区在拼命塞 skills/context，学术告诉你别塞。这种张力本身值得在面试中讲。

对你：做 coding agent 项目时，可以把"skill 框架的真实收益" 当作一个 eval 课题；这是当前容易出 reproducible 实验结论的方向。

链接：https://github.com/obra/superpowers | https://www.ngjoo.com/en/trending/

4. OpenAI 发布 Symphony：项目级 isolated agent 编排系统（16.3k stars）

发生了什么：openai/symphony 把 "项目工作" 封装成多个 isolated、autonomous 的实现 run，让团队从 "监督 coding agent" 转为 "管理工作单元"。

为什么重要：这是 OpenAI 首次官方放出针对团队级而非个人级的 coding agent 编排框架；和 Cognition Devin（25B 估值）正面竞争。

对你：求职/项目方向上，coding agent + 多 agent 编排 + 工程纪律（隔离、可审计）这条线含金量进一步上升；可以基于 Symphony 写一个最小化的对照实验项目。

链接：https://github.com/openai/symphony

5. ClimbingCap 数据集（arXiv 2503.21268）：LiDAR + RGB + IMU 多模态攀岩动作捕捉

发生了什么：ClimbingCap 提出 AscendMotion 数据集——LiDAR + RGB camera + IMU motion capture 联合采集，配套提出 image + LiDAR point cloud 联合的 global climbing motion recovery 方法。

为什么重要：这是目前最完整的 "world coordinate 下攀岩动作"研究 baseline；解决了 monocular 方案在攀岩 self-occlusion + 全身扭转下的稳定性问题。

对你（攀岩 app）：直接相关。即使你 app 只用单目视频，ClimbingCap 的标注规范、动作分类、评测协议都可以直接借鉴；其 LiDAR-aligned ground truth 可以作为你 monocular 模型的精度上限参考。

链接：https://arxiv.org/html/2503.21268v1

二、按目标分类

A. 前沿模型 / 一手发布

A1. Anthropic Claude Sonnet 5 / Opus 4.7 状态盘点

事件：Sonnet 5 (4 月 1 号) SWE-bench Verified 92.4%，OSWorld 88.3%（超人类专家 72.4%），GPQA Diamond 96.2%；Opus 4.7 (4 月 16 号) 接替 4.6 成为默认 Opus。

核心内容：Sonnet 5 把"Sonnet 价格 → Opus 性能"实质兑现；2M token context 出 beta。

为什么重要：所有基于 Claude 的 agent / RAG / coding 工具链应当评估"Sonnet 5 + 2M context 是否能直接替换原 Opus 4.6 stack"。

我需不需要点开：需要，特别看 OSWorld computer-use 子项。

链接：https://dev.to/best_codes/anthropic-just-dropped-claude-sonnet-5-and-the-benchmarks-are-kind-of-insane-3ppc

A2. Google deep-research-max-preview-04-2026 + gemini-3.1-flash-tts-preview + gemini-robotics-er-1.6-preview

事件：4 月 Google 横向放出 3 个 preview 子模型（deep research / TTS / robotics ER）。

核心内容：Google 不再做单一通用旗舰，而是按场景拆模型。

为什么重要：是"通用 LLM → 任务专用模型"产品策略的明显信号；与 OpenAI "o3-mini 替代 o1-mini + Flex compute"的差异化定价同步发生。

我需不需要点开：需要，重点是 deep research max 用于文献综述。

链接：https://ai.google.dev/gemini-api/docs/changelog

A3. Google DeepMind Genie 3：720p 24fps 交互式 3D 世界模型

事件：Genie 3 可以生成数分钟、720p、24fps 的可交互 3D 环境。

核心内容：world model 作为通用 "sim-to-real" 训练基础设施的方向继续推进。

为什么重要：world model 是 robotics + game + sports analytics 长尾应用的潜在底层。

我需不需要点开：中，关注但不必立刻深读，距离落地仍远。

链接：https://deepmind.google/models/

A4. Qwen3.5-Omni / Qwen3.6-Plus（4 月，闭源）

事件：Alibaba 在 4 月放出 Qwen3.5-Omni（多模态全能）与 Qwen3.6-Plus（旗舰）作为 proprietary。

核心内容：中国侧的旗舰模型也开始走 "开源主线 + 闭源旗舰" 双路线。

为什么重要：意味着"完全开源就是下一代"这个 narrative 正在松动；选型时需重新评估。

我需不需要点开：中

链接：https://qwenlm.github.io/

A5. ICLR 2026 (Rio) 一批关于 "AI 系统可靠/高效/安全" 的论文

事件：12 篇 ICLR 2026 重点论文围绕 reliability / efficiency / security。

核心内容：今年 ICLR 的主旋律从"刷分"转向"工程化"。

为什么重要：和你的工程师身份契合度极高，比纯 SOTA 论文更值得读。

我需不需要点开：需要，挑 2-3 篇精读。

链接：https://lambda.ai/blog/iclr-2026-12-papers

B. AI 工程 / Agent / Coding workflow

B1. "The Reasoning Trap"（ICLR 2026）

内容：增强 LLM reasoning 反而显著放大 tool-call hallucination，尤其影响 agent 系统。

可落地价值：直接颠覆"reasoning 模型 = 更可靠 agent"的工程默认。

对我当前开发/学习的意义：你做 coding agent / climbing-app backend agent 时，eval 必须分离 reasoning quality 与 tool-call accuracy 两个维度；可与上周 AGENTS.md 论文配合做面试 "反共识系列"。

链接：https://asanify.com/blog/news/ai-agent-hallucination-april-29-2026/

B2. OpenAI Symphony（项目级 agent 编排）

内容：把项目分解为多个隔离、自治的 implementation runs；目标受众是"团队"而非"个人开发者"。

可落地价值：是"AI 不只是辅助 IDE，而是直接接管项目单元"这个方向的 OpenAI 官方答案。

对我当前开发/学习的意义：可作为你 portfolio 中 "multi-agent coordination" 项目的对照参考；面试讲 coding agent 演化路线时绕不开。

链接：https://github.com/openai/symphony

B3. mattpocock/skills + obra/superpowers + andrej-karpathy-skills（skills 生态）

内容：以 markdown / skill 为单位扩展 coding agent 能力的开源框架/资产集中爆发。

可落地价值：当前 coding agent "软件工程化"的事实底座；和 Anthropic Skills（你正在使用的同名概念）相通。

对我当前开发/学习的意义：建议只挑 1 个深度学（推荐 superpowers，因为它是"框架 + 方法论"完整版），避免被 fragmentation 吞噬时间。

链接：https://github.com/obra/superpowers | https://github.com/4forrestchang/andrej-karpathy-skills

B4. Anthropic Claude Agent SDK + 2M context 稳定

内容：Claude Agent SDK 已稳定运行 v2.1.116+；Sonnet 5 默认 2M token context。

可落地价值：长上下文 agent 工程问题从"context 不够"转为"context 太多怎么管"。

对我当前开发/学习的意义：你的项目可以重新审视 RAG 阈值——很多原来必须做向量检索的场景，现在可能直接全量塞 context 反而更稳。

链接：https://platform.claude.com/docs/en/about-claude/models/overview

C. 视觉 / 视频 / 运动人体分析（攀岩动作分析重点）

C1. ClimbingCap（arXiv 2503.21268）+ AscendMotion 数据集

内容：LiDAR + RGB + IMU 多模态攀岩 mocap，提出 image + point cloud 联合的 global motion recovery。

与攀岩 app 相关性：极高，是当前"world coordinate 下攀岩动作"最完整研究 baseline。

可迁移到项目的点：标注规范 / 动作分类 / 评测指标可直接借鉴；LiDAR ground truth 当作 monocular 精度上限参考。

优先级：高

链接：https://arxiv.org/html/2503.21268v1

C2. ReVSI（spatial intelligence benchmark, 2026-04-27, Simon Fraser University）

内容：修复当前空间智能评测的标注与帧采样问题，构建更严格 benchmark。

与攀岩 app 相关性：中-高，攀岩本质就是空间推理（手脚关系 / 重心 / 路线规划）。

可迁移到项目的点：评测协议设计思路；之后做"动作建议合理性"评估时可参考其控制变量方法。

优先级：中

链接：https://huggingface.co/papers/date/2026-04-28

C3. The Way Up（arXiv 2505.12854）— 仍是最实用 baseline

内容：22 段标注攀岩视频，含 hold 位置 / 使用顺序 / 时间；keypoint pose × hold overlap 判断使用。

与攀岩 app 相关性：极高

可迁移到项目的点：直接复用其评测协议；和 ClimbingCap 联合使用——前者监督学习友好、后者 ground truth 严苛。

优先级：高

链接：https://arxiv.org/html/2505.12854v1

C4. SAM 3.1（Meta，前文提及）+ 4DHumans（单目 3D 姿态）

内容：SAM 3.1 做 climber/hand/foot/hold 视频分割追踪；4DHumans 处理自遮挡下的 3D 姿态。

与攀岩 app 相关性：极高（视觉 pipeline 默认 baseline）。

可迁移到项目的点：SAM 3.1 出 segmentation mask → 4DHumans 出 3D pose → 输入下游动作识别。

优先级：高

链接：https://github.com/facebookresearch/sam3 | https://arxiv.org/html/2509.03883v1

C5. Qwen3-VL 系列（开源多模态 LLM）

内容：Qwen3-VL-2B/4B/8B/32B 全系列已发布；Qwen3.5-Omni 4 月闭源旗舰。

与攀岩 app 相关性：中，可作为"视频 → 自然语言动作描述/反馈"的开源 backbone。

可迁移到项目的点：用 Qwen3-VL-8B 做 climbing 视频 → 文本反馈生成的本地推理路径；避免用闭源 API 跑视频帧的成本。

优先级：中

链接：https://github.com/QwenLM/Qwen3-VL

D. 产品化 / 商业化 / 行业动态

D1. Google → Anthropic $40B 投资（4 月 24 号 TechCrunch）

动态：Google 承诺向 Anthropic 投资最多 $40B（现金 + compute），延续两家"既竞争又深度绑定"格局。

背后的趋势判断：基础模型 capex 已超过任何单家公司可承受范围；前沿 lab 与 cloud 巨头的强绑定是 2026 主线。

对 side project / 求职 / 项目方向的启发：基于 Claude 构建产品的工程师议价权在上升（Google 钱 + Anthropic 模型）；继续投入 Claude 生态是合理选择。

链接：https://techcrunch.com/2026/04/24/google-to-invest-up-to-40b-in-anthropic-in-cash-and-compute/

D2. OpenAI Flex Compute + o3-mini 默认（4 月）

动态：OpenAI 推出 Flex Compute 定价层（off-peak 30% 折扣 o3）；ChatGPT Plus 默认 reasoning 模型从 o1-mini 换成 o3-mini（3× 速度提升）。

背后的趋势判断：reasoning 模型在向"按时段差异化定价"演化——和云计算 spot instance 类似；意味着 reasoning 已被视为 commodity-like。

对 side project / 求职 / 项目方向的启发：做 agent 的 cost optimization 时，"什么时候用 reasoning" 已经是一个独立的工程决策。

链接：https://fazm.ai/blog/new-llm-releases-april-2026

D3. GitHub "availability first" 转向 + 275M agent commits/周

动态：GitHub 因 AI agent 提交激增（275M/周）触发可靠性危机，正式转向 "availability first"。

背后的趋势判断：agent 已经成为 SCM/Devops 的一等流量来源；这反过来会推动 "agent-friendly Git workflow"（如 GNAP 协议）成为新基础设施。

对 side project / 求职 / 项目方向的启发：做 dev tools 时，应该把 "agent 是 first-class user" 当作设计前提而不是后想。

链接：https://www.neowin.net/news/github-pivots-to-availability-first-as-ai-agent-surge-triggers-reliability-crisis/

D4. Cognition (Devin) $25B 估值（继续跟踪）

动态：Bloomberg 4 月 23 号披露 Cognition 进入 $25B 估值轮谈判。

背后的趋势判断：coding agent 仍是"最快变现"的 agent 应用类型；OpenAI Symphony 的发布是对它的正面回应。

对 side project / 求职 / 项目方向的启发：portfolio 项目里至少有 1 个能量化"代替工程师工时"的 agent，比 chat UI / wrapper 价值高一个量级。

链接：https://www.bloomberg.com/news/articles/2026-04-23/ai-coding-firm-cognition-in-funding-talks-at-25-billion-value

E. 学习价值 / 求职价值

E1. "The Reasoning Trap"（ICLR 2026）

适合我怎么用：精读 + 面试表达

推荐动作：精读 1 小时；总结成 1 页 Notion；和上周 AGENTS.md 论文打包成"agent 工程默认假设被打脸" 90 秒口述。

链接：https://asanify.com/blog/news/ai-agent-hallucination-april-29-2026/

E2. ClimbingCap + The Way Up + 4DHumans（攀岩三件套）

适合我怎么用：复现 + 写进项目 roadmap

推荐动作：(1) 用 The Way Up 数据集跑 hold-usage detection baseline；(2) 用 4DHumans 处理你自己拍的视频；(3) 把 ClimbingCap 的标注规范写进你的数据 spec。

链接：https://arxiv.org/html/2503.21268v1 | https://arxiv.org/html/2505.12854v1 | https://arxiv.org/html/2509.03883v1

E3. obra/superpowers（skills 框架）

适合我怎么用：精读 README + 选 3 个 skill 进自己的 workflow

推荐动作：不要照抄全部；先看它的方法论部分（agentic skill framework + dev methodology），再挑 3 个最契合 climbing-app 项目的 skill 落地。

链接：https://github.com/obra/superpowers

E4. ICLR 2026 12 篇 reliability/efficiency/security 论文清单

适合我怎么用：收藏 + 挑 2 篇精读

推荐动作：先扫所有 abstract（30 分钟），挑出 2 篇与你方向最相关的精读。

链接：https://lambda.ai/blog/iclr-2026-12-papers

三、今日高分 GitHub Repo（5–10 个）

Repo 1：openai/symphony

GitHub 链接：https://github.com/openai/symphony

方向标签：agent / coding / orchestration

这项目是干什么的：OpenAI 官方的项目级 isolated coding agent 编排系统，把项目工作打包成多个 autonomous run。

为什么今天值得关注：16.3k stars 短期内冲到 trending；是 OpenAI 对 Cognition Devin 的正面工程化回应。

与我的相关性：高（coding agent + multi-run 编排）

上手成本：中

是否建议我收藏：是

是否建议我复现：是，至少跑一个最小项目走完整流程。

一句话判断：当前"团队级 coding agent"最值得抄结构的官方实现。

Repo 2：obra/superpowers

GitHub 链接：https://github.com/obra/superpowers

方向标签：agent / skills / dev methodology

这项目是干什么的：agentic skill framework + 配套软件开发方法论，169.9k stars。

为什么今天值得关注：skills 生态本周持续爆发，superpowers 是当前最完整的"框架 + 方法论"组合。

与我的相关性：高

上手成本：低-中

是否建议我收藏：是

是否建议我复现：可选；推荐先挑 3 个 skill 落地到自己项目而非全盘复现。

一句话判断：和 AGENTS.md 论文一起读，避免被社区 hype 牵着走。

Repo 3：mattpocock/skills

GitHub 链接：https://github.com/mattpocock/skills

方向标签：skills / dev tools

这项目是干什么的："Skills for Real Engineers"，工程师视角的 skill 集合。

为什么今天值得关注：31.5k stars 增速明显，且作者口碑高（Matt Pocock 在 TS 社区影响力强）。

与我的相关性：中

上手成本：低

是否建议我收藏：是

是否建议我复现：仅挑 1-2 个高频 skill 试用，不要全盘装。

一句话判断：作者品味比仓库本身更值钱。

Repo 4：4forrestchang/andrej-karpathy-skills

GitHub 链接：https://github.com/4forrestchang/andrej-karpathy-skills

方向标签：skills / prompt / CLAUDE.md

这项目是干什么的：把 Karpathy 关于 LLM coding 陷阱的公开观察压缩成单个 CLAUDE.md。

为什么今天值得关注：94.8k stars，是"prompt 资产"型仓库的代表。

与我的相关性：中

上手成本：低

是否建议我收藏：是

是否建议我复现：精简到适合自己项目的版本（注意 AGENTS.md 论文警告：不要无脑塞）。

一句话判断：读一遍，挑 3 条放进自己 workflow，不要全盘照抄。

Repo 5：facebookresearch/sam3

GitHub 链接：https://github.com/facebookresearch/sam3

方向标签：video / segmentation / multimodal

这项目是干什么的：Meta SAM 3 / 3.1 官方推理与 finetune 代码。

为什么今天值得关注：仍是当前"text-prompt 视频分割追踪"事实标准；攀岩 app 必看。

与我的相关性：极高

上手成本：中

是否建议我收藏：是

是否建议我复现：是

一句话判断：你 app 的视频前处理可以从这里抄一半。

Repo 6：QwenLM/Qwen3-VL

GitHub 链接：https://github.com/QwenLM/Qwen3-VL

方向标签：multimodal / video / open-source

这项目是干什么的：阿里 Qwen 团队的多模态 LLM 系列，支持视频。

为什么今天值得关注：开源多模态 LLM 中视频能力较强；本地推理友好。

与我的相关性：中-高（攀岩 app 视频 → 文本反馈环节）

上手成本：中

是否建议我收藏：是

是否建议我复现：用 Qwen3-VL-8B 跑一段攀岩视频，看能否生成有效动作描述。

一句话判断：开源视频理解的本地化首选。

Repo 7：anthropics/claude-code（含 @anthropic-ai/claude-agent-sdk）

GitHub 链接：https://github.com/anthropics/claude-code

方向标签：agent / dev tools

这项目是干什么的：Claude Code + Claude Agent SDK 官方仓库。

为什么今天值得关注：基础设施级稳定，2M context 已默认；做 agent 工具链绕不开。

与我的相关性：高

上手成本：低

是否建议我收藏：是

是否建议我复现：基于 SDK 写一个最小 agent（建议：climbing 视频 → 动作摘要）。

一句话判断：当前最完整的"商用级 coding agent 参考实现"。

Repo 8：caramaschiHG/awesome-ai-agents-2026

GitHub 链接：https://github.com/caramaschiHG/awesome-ai-agents-2026

方向标签：agent / curation

这项目是干什么的：2026 年 agent 框架/工具/产品分类，300+ 资源月更。

为什么今天值得关注：选型时横向对比唯一靠谱列表。

与我的相关性：中

上手成本：低

是否建议我收藏：是

是否建议我复现：N/A，watch 即可。

一句话判断：做技术选型先翻它。

警告 ⚠️：

OpenClaw（300k+ stars）：明星项目但生态仍在塑形，文档不全；可观察不可立刻 all-in。

"skills" 类仓库泛滥：本周至少 3 个高 star skills 项目，不要全部都装，挑 1 个深度用就够。

四、今日最值得我看的 3 篇 / 3 个链接

1. "The Reasoning Trap"（ICLR 2026）

为什么是今天最值得点开：和上周 AGENTS.md 论文构成"agent 工程默认假设被打脸"系列；是当前最有反共识价值的两篇 paper。

链接：https://asanify.com/blog/news/ai-agent-hallucination-april-29-2026/

2. ClimbingCap 论文（arXiv 2503.21268）

为什么是今天最值得点开：你攀岩 app 方向唯一一篇"world coordinate + 多模态"完整 baseline；标注规范可以直接抄。

链接：https://arxiv.org/html/2503.21268v1

3. obra/superpowers README + 方法论部分

为什么是今天最值得点开：是当前 skills 生态里少数同时给出"框架 + 方法论"的项目；读一遍能立刻判断 skills 这条路对你项目是否值得投入。

链接：https://github.com/obra/superpowers

五、今日行动清单（最重要）

1. 今天值得收藏但不必立刻看：

Google deep-research-max-preview-04-2026 文档

ICLR 2026 12 篇 reliability/efficiency/security 论文清单

Qwen3-VL 仓库 + Qwen3.5-Omni 闭源公告

Genie 3（world model，长线观察）

2. 今天值得精读：

"The Reasoning Trap" + 上周 AGENTS.md 论文（合并约 1.5 小时）

ClimbingCap 论文 abstract + 数据采集章节（约 30 分钟）

3. 今天值得复现 / 试用：

openai/symphony：跑一个最小项目走完整 isolated run 流程，对照 Cognition Devin 的工作模式。

facebookresearch/sam3：用一段你自己拍的攀岩视频跑 text-prompt 追踪。

QwenLM/Qwen3-VL：本地跑 Qwen3-VL-8B，输入一段攀岩视频，看动作描述质量。

4. 今天值得记到项目 roadmap（攀岩 app）：

数据：把 ClimbingCap 标注规范写进 data spec；保留 The Way Up 作为评测协议参考。

视频前处理：SAM 3.1 做 climber + hand/foot + hold 分割追踪。

3D 姿态：4DHumans 替代/补强 MediaPipe，应对自遮挡。

反馈生成：Qwen3-VL-8B（本地）作为 fallback / cost-sensitive 路径，Claude Sonnet 5（API）作为高质量路径。

Eval：(a) tool-call 准确性单独评估（受 Reasoning Trap 启发）；(b) skill/context file 是否带来净收益（受 AGENTS.md 论文启发）。

5. 今天面试可以拿来讲的 1–2 个点：

(高优先) "Reasoning Trap + AGENTS.md 双论文：agent 工程的两个反共识发现" ——能体现你看一手论文 + 反共识 + 工程化 eval 设计的完整链路。

"我的 climbing app 用 SAM 3.1 + 4DHumans + ClimbingCap 标注协议构建视觉 pipeline，用 Sonnet 5 + Qwen3-VL 双路径生成反馈" ——能体现你做端到端系统设计、成本结构、质量分层的能力。

六、信息密度 / 信噪比说明

今天没有重磅模型首发（Sonnet 5 / Opus 4.7 / Gemini 3.1 Pro 已稳定），但工程层 + 学术层有非常关键的反共识论文（Reasoning Trap），不存在硬凑。

skills 生态本周持续爆发，已加注"挑 1 个深度学，不要全部装"的警告；热度 ≠ 复现价值。

攀岩 app 方向今天回头看 ClimbingCap 是最重要补课对象（2025 年 3 月发布，但你之前的日报未覆盖）；其他 SAM 3.1 / The Way Up / 4DHumans 仍在生效。

自动生成于 2026-04-29 by AI 日报 scheduled task。