AI 日报 | 2026-05-24 | Tony‘s BLOG

type

Post

status

Published

date

May 24, 2026

slug

ai-daily-2026-05-24

summary

周日 quiet day：OpenAI 用模型反证 Erdős 1946 单位距离猜想（Gowers 背书）+ Hermes Agent 在 OpenRouter 反超 OpenClaw + Anthropic Skills 扩展到 SMB（15 个开箱即用技能 + Canva/Notion/Figma/Atlassian 合作）+ Map-Mono-Ego 单目第一人称 3D 全局定位新方法。攀岩 app 角度：Map-Mono-Ego 思路 + SAM 3.1 Object Multiplex 是本周最值得收藏的两件事。

一、今日最重要的 5 条

1. OpenAI 用通用推理模型反证 Erdős 1946 单位距离猜想，Gowers 背书

发生了什么：5/20 OpenAI 公布一个内部通用推理模型 autonomously 反证了 Erdős 1946 年提出的 planar unit-distance 猜想，构造出基于 Golod–Shafarevich 理论 + infinite class field towers 的无穷族，把上界从 square grid 推到 polynomial improvement；9 位数学家（含 Tim Gowers、Noga Alon、Will Sawin、Melanie Wood 等）共同署名 companion remarks paper。Gowers 评价是「milestone in AI mathematics」，如果是人投 Annals 他会建议直接接受。

为什么重要：这是公开记录里首次有 AI 自主产出可被顶刊接受的纯数学新结果；不是「证明已有题」，而是反证 + 发现新构造。和 Jack Clark 5/21 在 Oxford 的「AI 12 个月内贡献诺奖级发现」预测对位。

对我有什么关系：面试金句素材——「AI 不再只是 SWE-bench 刷分工具，2026 年 5 月起出现真正的科学发现能力，这改变了我们做 eval / scope 的方式」。

时间：2026-05-20 公布

链接：OpenAI: model disproves discrete geometry conjecture · Scientific American 报道 · The Decoder 拆解

2. Hermes Agent 在 OpenRouter 反超 OpenClaw — 「学习型 runtime」第一次硬数据领先

发生了什么：5/10 Nous Research 的 Hermes Agent 在 OpenRouter 单日吞吐 224B tokens，首次超过 OpenClaw 的 186B；GitHub stars 153k vs OpenClaw 372k，但 Hermes 走「闭环 self-improving runtime」路线（任务后自动改写 skill 文件、跨会话保留 brain），与 OpenClaw 的 session-native + 广插件路线形成两条路线分野。5/7 Hermes v0.13 「Tenacity」发布 864 commits、Kanban-style 多 agent 任务板 + 僵尸/幻觉检测。

为什么重要：开源 agent 框架进入「广度 vs 深度」分水岭；这是「self-improving agent 不是 PPT、有真实流量」的第一次公开证据。

对我有什么关系：自建 climbing coach agent 时长期记忆 + skill 自学习是该选 Hermes 派的设计模板；attendance pattern：用 OpenClaw skill 生态做插件，但 runtime 走 Hermes 自演化思路。

时间：5/7 v0.13 release，5/10 OpenRouter 反超

链接：Hermes Agent vs OpenClaw — Dev Journal 对比 · Hermes 反超 OpenRouter (RoboRhythms) · OpenClaw GitHub

3. Anthropic Skills 下沉到 SMB：15 个开箱即用技能 + Canva/Notion/Figma/Atlassian 预置

发生了什么：本周 Anthropic 把 Agent Skills 从「企业 / 开发者」往下推到 small business 场景——15 个 ready-made skills（payroll、bookkeeping、onboarding 等），同时 Team/Enterprise 增加组织级 Skills 集中管理，预置 Canva / Notion / Figma / Atlassian 的官方 skill。这是上周「开放标准」之后的产品落地节奏。

为什么重要：MCP 用半年时间成了 agent 工具调用的事实标准；Skills 的目标显然是占据「可复用 agent 行为包」这个生态位。预置合作伙伴 = 通过 ISV 把 Skills 推成默认形态。

对我有什么关系：这是我做 portfolio 的窗口期——写一个公开 climbing-coach skill（按 anthropics/skills 目录规范）几乎一定能拿到一波早期注意力；和上周 Agent Skills 标准化呼应。

时间：本周持续发布

链接：Anthropic Engineering: Agent Skills · Inc: Skills for SMB · VentureBeat: 开放标准报道

4. Map-Mono-Ego：单目第一人称 → 世界坐标系 3D 全局人体定位（arXiv 2605.20889）

发生了什么：5/20 arXiv 上线 Map-Mono-Ego，提出基于预扫描 3D 点云 map-grounding 的单目 egocentric 全局 pose 估计框架——只用一台普通单目相机 + 一份场景点云就能输出 globally-consistent 的 3D 全身 pose，规避 monocular ego 视角的 drift 与缺失全局参考问题。

为什么重要：「单目设备 + 场景先验」这条线如果跑通，对普通用户在岩馆用手机录的视频做 3D 动作分析直接利好——岩馆是封闭、可建图的环境。

对我有什么关系：和攀岩 app 高度相关——可以把它当作 v0.4 路线的「Anchor 1」候选：在岩馆做一次 LiDAR / ARKit 扫描得到点云，用户后续录的所有单目视频都能 ground 到同一坐标系。

时间：2026-05-20 上 arXiv

链接：arXiv 2605.20889 (Map-Mono-Ego) · 配套：MoViD View-Invariant 3D Pose

5. GitHub 内部仓库被盗 3,800 个：TeamPCP / UNC6780 — supply-chain 警报

发生了什么：5/20 GitHub 确认约 3,800 个内部 repo 被 threat actor TeamPCP（Google TIG 跟踪代号 UNC6780）窃取；这与 Trump 政府 5 月撤销 AI 安全 EO 形成时间窗口巧合，行业讨论度大。

为什么重要：今年 agent 时代，代码供应链 + 自动 PR + 内部 token 共同把攻击面放大；任何 GitHub Action / Claude Code GHA 路径都需要重新审计。

对我有什么关系：side project 在 push 含密钥 / token 的代码时务必走 OIDC + 短期 token；面试可以讲「我在 2026 Q2 把 repo 全部换成 OIDC，禁用长期 PAT」。

时间：2026-05-20 GitHub 确认

链接：AI News Today — May 23, 2026 综合

二、按目标分类

A. 前沿模型 / 一手发布

A1. OpenAI Erdős 反证（同上 #1 不再重复）

事件：通用推理模型自主反证 Erdős 1946 unit-distance 猜想。

核心内容：Golod–Shafarevich + infinite class field towers 的无穷族构造，polynomial improvement。

为什么重要：AI 数学能力的「ChatGPT moment」——从「能解题」到「能做新研究」。

我需不需要点开：需要——读 OpenAI 公告（5 分钟）+ Gowers companion 摘要（10 分钟）。

链接：OpenAI 官方公告

A2. GPT-5.5 Instant 默认化 + GPT-5.5-Cyber 限定预览

事件：5/5 OpenAI 把 ChatGPT 默认模型切到 GPT-5.5 Instant（内部测高风险问题幻觉下降 52.5%）；5/7 又出 GPT-5.5-Cyber 给受审 cyber 团队。

核心内容：Instant 主打 less emoji、更准、更短；Cyber 是 narrow 用途的 specialist 变体。

为什么重要：OpenAI 的 modal-strategy 越来越像「一个大型 Instant 默认 + 多个垂直 specialist 旁挂」，这跟 Anthropic 的 Skills / Opus-Sonnet 路线在打不同的产品形态。

我需不需要点开：简读 Instant System Card；Cyber 跳过。

链接：OpenAI: GPT-5.5 Instant · TechCrunch 报道

A3. Hugging Face: EXAONE 4.5 + Granite Speech Plus + SAM3-LiteText 落地

事件：LG 的 EXAONE 4.5 首个开源 VLM（33B，韩文场景 + 文档理解强）；IBM Granite Speech Plus 支持 speaker diarization + 时间戳；transformers v5.6.0 引入 SAM3-LiteText / Qianfan-OCR 等支持。

核心内容：多模态开源继续下沉：speech 有 timestamp、VLM 有文档场景、SAM3 出现轻量化 text-conditioned 变体。

为什么重要：开源「能用」的小模型越来越多 → 自建端到端 vertical agent 的硬件门槛继续走低。

我需不需要点开：收藏——攀岩 app 的 video → text → coach 链路可以拿来组装 baseline。

链接：HF transformers releases · State of OS on HF Spring 2026 · Gemma 4 on HF

A4. Anthropic Mythos Preview 与 Opus 4.7 的当前路线复盘

事件：4/16 Opus 4.7 GA（87.6 SWE-bench Verified / 1M ctx / 高清图像 2576px / 价格不变）；Mythos Preview 仍只对受邀机构开放（不会 GA），定位「企业红队 + cyber」。

核心内容：Anthropic 把「最强模型」与「最赚钱模型」彻底分层；indie / SMB 用 Opus 4.7 + Sonnet 4.6 已是天花板。

为什么重要：和上周 Agent SDK 信用池一起看，是 Anthropic 正在收 indie 的「白嫖空间」 —— 但开放 Skills 标准是给回礼。

我需不需要点开：已读，跳过。

链接：Anthropic: Opus 4.7 · Anthropic API docs: what's new in 4.7

B. AI 工程 / Agent / Coding workflow

B1. Hermes vs OpenClaw — 选择路线，而不是选择 star 数

内容：OpenClaw 372k stars / 50+ messaging 平台 / 插件优先；Hermes 153k / self-improving runtime / 跨会话 brain；5/10 OpenRouter token 反超。

可落地价值：自家 agent 选型不再是「哪个 star 多」，而是「session-scoped 还是 lifecycle-scoped」。前者适合工具型 / 单任务，后者适合 coach / 长跑型。

对我的意义：攀岩 coach 天然是 lifecycle 型（用户训练数周 / 教练理解你的弱项变化）→ Hermes 思路 + 自研 short skill 注入 比 OpenClaw 更合适。面试故事写得清楚。

链接：Hermes vs OpenClaw — DevJournal · DEV community 实操对比

B2. Telegram Bot API：bot-to-bot 通信 + 流式响应 + 跨群 @ 调用

内容：5/7 Telegram 上线「Guest Bots（被 @ 即可在不在群里也回复）+ bot-to-bot 直接通信 + streaming + custom AI styles」，首个 10 亿用户级 IM 原生支持 agent 编排。

可落地价值：可以用 Telegram 作为「多 agent 协作的免运维 transport」做 demo；做攀岩 coach 时不必自建前端就能演示 mobile UX。

对我的意义：1 周末 MVP——把 Map-Mono-Ego baseline + ClimbingCap eval 包装成一个 Telegram bot，用户发视频 → bot 出 critique，作品集直接成立。

链接：Telegram Blog: AI Bot Revolution 11 new features · TechTimes: bot-to-bot 法规真空

B3. Agent benchmark 信任危机 — UC Berkeley RDI 报告余波

内容：Berkeley RDI 2026 报告显示 SWE-bench Verified、Terminal-Bench、WebArena、OSWorld、GAIA、FieldWorkArena 等 8 个公开 benchmark 都可被「不解题刷分」攻击；SWE-bench Verified 仍是当前「least bad」公共信号。

可落地价值：任何 agent 项目都必须自建私有 task-based eval（5–10 真任务 + 多次重复 + 不公开）；公开 benchmark 仅作 sanity check。

对我的意义：可以拿来直接讲：「我设计的 climbing coach 走的是 私有 task-based eval + GLIMPSE + FineBench 公开 sanity，双层评测」。

链接：SWE-bench Verified 排行 (LLM-Stats) · Best LLMs for Agentic Coding 2026 (Future AGI)

B4. Claude Code 周边工具继续爆发：Clawdmeter / everything-claude-code

内容：Clawdmeter（实时 Claude Code 用量小工具）、everything-claude-code（Claude Code 生态聚合）等工具周内 trending 持续；社区在围绕「用 agent 写代码到底花了多少钱 / 多少 token」做工具化。

可落地价值：自己写或装一个用量监控，理解「真实生产 cost 曲线」，下次升级 model / 迁移到 V4 Flash 时有数据支撑。

对我的意义：和上周 cost-aware router 项目天然配套；面试加分。

链接：AI News week of May 18–24, 2026

C. 视觉 / 视频 / 运动人体分析

C1. Map-Mono-Ego（arXiv 2605.20889，5/20 上线）

内容：单目第一人称 + 预扫描点云 → 全局 3D 全身 pose；解决 monocular ego 视角 drift 与缺乏全局参考的痛点。

与「攀岩动作分析 app」的相关性：高——岩馆是天然「可预扫描的封闭环境」；用户后续单目视频可以全部 ground 到统一坐标系。

可迁移到项目的点：1) v0.4 路线先在熟悉的岩馆做点云扫描；2) 把单目视频 → 世界坐标 3D pose 当作攀岩动作分析的基础设施；3) 与 ClimbingCap 提供的 ground truth 形成训练 → 评估闭环。

优先级：高

链接：arXiv 2605.20889

C2. SAM 3.1 Object Multiplex（3/27 release，但本周再次被 cited）

内容：基于共享 memory 的联合多目标视频跟踪，7× faster inference 无精度损失；text prompt 直接定位「红色的手」「右边那只脚」。

与攀岩 app 相关性：高——攀岩动作分析必须同时跟踪 4 肢 + 抓点；SAM 3.1 Object Multiplex 几乎是为这个场景量身做的。

可迁移到项目的点：用 SAM 3.1 取「抓点轨迹 + 四肢轨迹」当 keypoint 之外的另一种 motion 信号；可以与 YOLO26 pose 互补。

优先级：高

链接：Meta SAM 3.1 blog · facebookresearch/sam3 · SAM 3.1 vs SAM 3 性能对比

C3. MoViD: View-Invariant 3D Human Pose Estimation

内容：通过显式估计并解耦 viewpoint 与 motion 特征，实现 viewpoint-invariant 的 3D pose；ACM/IEEE 嵌入式 AI & 感知系统会议 5/11–14。

与攀岩 app 相关性：中——攀岩录制角度多变（仰视 / 平视 / 顶光），view invariance 直接对应可用性。

可迁移到项目的点：作为 backbone 的 view-augmentation 损失思路；改善多机位融合。

优先级：中

链接：arXiv 2604.03299 (MoViD)

C4. ClimbingCap + AscendMotion 数据集（继续在 roadmap 上）

内容：CVPR 2025 收录的 RGB + LiDAR + IMU 三模态攀岩数据集，412k 帧、22 位教练、12 面岩壁，提供世界坐标系 3D 全身骨架 ground truth。

与攀岩 app 相关性：极高——上周已重点说过；今日提醒：和 Map-Mono-Ego 是天然组合（场景点云 + ground truth 3D）。

可迁移到项目的点：先用 ClimbingCap ground truth 做 baseline 评测，再用 Map-Mono-Ego 思路扩展到「用户自家岩馆」的真实部署。

优先级：高（已在 roadmap）

链接：arXiv 2503.21268 · LiDAR-Human Project

C5. FineBench + GLIMPSE — 评测尺子继续巩固

内容：FineBench（199k 题细粒度活动 VQA）+ GLIMPSE（VLM 是否真在看视频）两套尺子上周已点评。

与攀岩 app 相关性：中-高——是评估自家 video → action critique pipeline 的最严肃公开尺子。

优先级：中

链接：FineBench arXiv 2605.19846 · GLIMPSE arXiv 2507.09491

D. 产品化 / 商业化 / 行业动态

D1. Sierra：$15.8B valuation / $950M 融资 / $150M ARR

动态：5/4 Sierra 完成 $950M（Tiger Global + GV 领投），估值 $15.8B；ARR 从 2025 年 11 月 $100M 在 ~3 个月内升到 $150M；4 月推出 Ghostwriter（自然语言 → 自动生成专用 agent）。

趋势判断：「enterprise agent platform」是 2026 最被资本认可的口袋；customer experience agent 是单一最被 Fortune 50 采购的 vertical。

对 side project / 求职 / 项目方向的启发：vertical agent + 真实业务交互才是钱进来的地方；纯框架 / 工具会越来越被压价。攀岩 app 这种垂直方向反而是正确选择。

链接：TechCrunch: Sierra $950M · SiliconANGLE 报道

D2. Anthropic × Gates Foundation：4 年 $200M 健康 + 教育 + 农业

动态：5/14 Anthropic 与 Gates Foundation 宣布 4 年 $200M（grants + Claude credits + technical support），覆盖 sub-Saharan Africa / India / US，首批项目包括 polio / HPV / 妊娠子痫的疫苗与治疗加速、卫生数据决策辅助。

趋势判断：基金会型买方 = 长期 credit 锁定 = 模型公司的另一条「准 enterprise」收入线。和 OpenAI / Microsoft 走的是不同侧重的非营利路径。

启发：「vertical AI for impact」是简历可信度高的方向——做攀岩动作教学也是一种垂直 impact，可以参考这种叙事写自我介绍。

链接：Anthropic: Gates Foundation Partnership · Gates Foundation Press Release

D3. Meta 5/20 裁员 8,000 + 员工 AI 监控争议

动态：Meta 全球裁员 ~10%（约 8,000 人）、内部转岗 7,000 人到 AI 团队；同时被曝「Model Capability Initiative」追踪员工键盘 / 鼠标 / 编码会话用于训练 agent；1,500+ 员工签请愿反对。

趋势判断：「我们用员工真实工作数据训 agent」会成为越来越多大厂的隐性数据策略——这一定会引发监管 + 工会层面的反弹。

启发：求职选公司时问清楚 dev tooling 数据是否被用于训练；在 portfolio / 项目里慎重对待包含他人代码或工作流的训练数据。

链接：NPR: Meta 8000 jobs · Al Jazeera 报道

D4. Agentic AI 招聘 280% YoY，FDE 需求 +800%

动态：2026 LinkedIn 数据显示 agentic AI 岗位 YoY +280%；Forward-Deployed Engineer 同比 +800%，是增长最快的工程方向；Anthropic Applied 团队 5×；AI 工程师有 AI skills 比无 AI skills 平均薪资高 56%。

趋势判断：「会调 API」溢价归零；「会调 agent + 会做 eval + 会控成本 + 能 ship 到客户场景」溢价拉满。FDE 这个岗位会越来越像 "agent solution architect"。

启发：作品集主线定在 「vertical agent + 真实场景 ship + eval & cost engineering」，远比泛 LLM 应聘有效。攀岩 app 完全符合。

链接：Agentic AI Hiring Boom 280% (Jobs by Culture) · Second Talent: 2026 AI Eng skills

E. 学习价值 / 求职价值

E1. OpenAI Erdős 反证 + Gowers companion paper

内容：AI 首次自主产出可上顶刊的纯数学新结果。

适合我怎么用：面试表达——讲「2026/05/20 之后我看 AI 的方式变了：评估不再只能用 benchmark，要看是否能 propose 新猜想 + 反证已有猜想」。

推荐动作：精读 OpenAI 公告 + Scientific American 拆解；不必读原 paper。

链接：OpenAI 公告 · Scientific American

E2. Map-Mono-Ego（arXiv 2605.20889）

内容：单目 + 场景点云 → 全局 3D pose。

适合我怎么用：精读 + 复现——这是攀岩 app v0.4 路线的潜在 Anchor。

推荐动作：复现其 baseline；在 1–2 个熟悉的岩馆做点云扫描，跑通端到端。

链接：arXiv 2605.20889

E3. Hermes Agent vs OpenClaw 路线对比

内容：广插件 vs self-improving runtime 两种 agent 形态。

适合我怎么用：精读 + 面试表达——讲「攀岩 coach 是 lifecycle-scoped，所以走 Hermes 思路 + skill 注入」。

推荐动作：跑一遍 Hermes 的 demo + 看 v0.13 release notes；不需要完整阅读 OpenClaw 源码。

链接：Hermes vs OpenClaw 对比

E4. Anthropic Skills 商业化下沉

内容：15 SMB skills + ISV 预置 + 组织级管理。

适合我怎么用：收藏 + 复现——写一个 climbing-coach Skill 公开。

推荐动作：fork anthropics/skills 目录结构，做 1 个高质量 climbing-coach skill。

链接：Anthropic Engineering: Agent Skills · VentureBeat 报道

E5. SAM 3.1 Object Multiplex（再次提醒）

内容：7× faster 多目标视频跟踪 + text-conditioned。

适合我怎么用：复现 + 项目集成——攀岩 4 肢 + 抓点同时跟踪天生适用。

推荐动作：在自己手头的 1 段攀岩视频上跑通 SAM 3.1，输出 4 条肢体 + 抓点的 mask 轨迹。

链接：Meta SAM 3.1 blog · facebookresearch/sam3

三、今日高分 GitHub Repo

注：今天是周日，trending 主要承接周中信号。剔除上周已重点点评的 anthropics/skills、mattpocock/skills、VideoPose3D、VIBE、ultralytics、Cosmos、DeepSeek V4-Pro，今日补充与轮转。

1. NousResearch/Hermes-Agent

GitHub 链接：搜「NousResearch Hermes Agent」（项目托管在 Nous Research 主仓库下）

方向标签：agent / self-improving runtime / multi-agent

这项目是干什么的：long-lived agent runtime，能在跨会话间保留 skill 文件、自动写新 skill、多 agent 协作 Kanban 板。

为什么今天值得关注：5/10 OpenRouter 上单日处理 224B tokens 反超 OpenClaw；5/7 v0.13 「Tenacity」加 zombie / hallucination 检测。

与我的相关性：高——攀岩 coach 走 lifecycle-scoped 路线时的参考实现。

上手成本：中（自部署）

是否建议我收藏：是

是否建议我复现：先跑 demo，看 v0.13 release notes

一句话判断：「2026 上半年最值得跟的 self-improving agent runtime。」

2. facebookresearch/sam3

GitHub 链接：github.com/facebookresearch/sam3

方向标签：vision / video segmentation / multi-object tracking

这项目是干什么的：Meta SAM 3 / 3.1 官方 inference + finetune + 示例 notebook + checkpoint 下载。

为什么今天值得关注：SAM 3.1 Object Multiplex 7× 加速 + text-conditioned 跟踪；攀岩动作的 4 肢 + 抓点同时跟踪刚好对位。

与我的相关性：高

上手成本：中（推理简单，自定义 fine-tune 需要 GPU）

是否建议我收藏：是

是否建议我复现：是（先跑 inference notebook）

一句话判断：「video segmentation 的 2026 默认选项。」

3. openclaw/openclaw

GitHub 链接：github.com/openclaw/openclaw

方向标签：agent / desktop / plugin ecosystem

这项目是干什么的：自托管 personal AI assistant，跨 OS，50+ messaging 平台、社区 skill marketplace。

为什么今天值得关注：372k stars，社区生态最大；和 Hermes 形成「广度 vs 深度」对照实验。

与我的相关性：中——做攀岩 coach 时可以借用其插件生态，但 runtime 设计未必合适。

上手成本：低（一键自部署）

是否建议我收藏：是

是否建议我复现：装一份，体验后决定。

一句话判断：「广度王者，但要小心 session-native 的局限。」

4. anthropics/skills（继续监控）

GitHub 链接：github.com/anthropics/skills

方向标签：agent / Claude Code skills 标准 / reference impl

这项目是干什么的：Anthropic 官方维护的可复用 Agent Skills 集合（开放标准 reference）。

为什么今天值得关注：本周 Anthropic 把 Skills 下沉到 SMB，预置 Canva / Notion / Figma / Atlassian → 官方仓库是规范来源。

与我的相关性：高（写自家 climbing-coach skill 的模板）

上手成本：低

是否建议我收藏：是

是否建议我复现：是（写自己的 skill）

一句话判断：「agent 时代的 npm，越早写自己的 package 越好。」

5. deepseek-ai/DeepSeek-V4-Pro（HF）

GitHub 链接：huggingface.co/deepseek-ai/DeepSeek-V4-Pro

方向标签：foundation model / open-weights / coding agent

这项目是干什么的：1.6T MoE / 49B active / 1M ctx 开源 frontier，Hermes / OpenClaw / OpenCode 都已集成。

为什么今天值得关注：在 Anthropic 6/15 信用池上线前，是「开源对冲」的主力候选 backbone。

与我的相关性：高（攀岩 coach 自建版本的主力 backbone 候选）

上手成本：中-高（需要算力 / 云）

是否建议我收藏：是

是否建议我复现：先在 Flash 版上跑 RAG demo

一句话判断：「2026 上半年最值得熟悉的开源 frontier。」

6. ultralytics/ultralytics（YOLO26）

GitHub 链接：github.com/ultralytics/ultralytics

方向标签：vision / pose / edge

这项目是干什么的：YOLO26 一站式检测 / pose / 移动端实时部署。

为什么今天值得关注：和 SAM 3.1 是「关键点 vs mask」两条并行轨道；攀岩端到端 baseline 第一步。

与我的相关性：高

上手成本：低

是否建议我收藏：是

是否建议我复现：是

一句话判断：「移动端 pose 起步默认。」

7. facebookresearch/VideoPose3D

GitHub 链接：github.com/facebookresearch/VideoPose3D

方向标签：video / 2D→3D pose / baseline

这项目是干什么的：经典 2D keypoint → 3D pose 基线。

为什么今天值得关注：作为 Map-Mono-Ego 复现前的 3D baseline 仍是最稳的起点。

与我的相关性：高

上手成本：中

是否建议我收藏：是

是否建议我复现：是

一句话判断：「老但靠谱，3D 入门必跑。」

8. n8n-io/n8n

GitHub 链接：github.com/n8n-io/n8n

方向标签：workflow / agent automation / low-code

这项目是干什么的：fair-code 工作流自动化，400+ 集成，原生 AI 节点。

为什么今天值得关注：在 6/15 Anthropic 信用池涨价前夜，是把「订阅时代」轻量 agent automation 留在生活里的最优选择。

与我的相关性：中

上手成本：低

是否建议我收藏：是

是否建议我复现：装一份做个人 ops

一句话判断：「Zapier 不够灵活时的答案。」

9. Trendshift / OSSInsight 监控（不是 repo，是元工具）

链接：trendshift.io · ossinsight.io/trending/ai

方向标签：dev tools / meta

这项目是干什么的：实时 trending repo 监控 + star velocity 警报。

为什么今天值得关注：信号源比 GitHub 自带 trending 更高质量；每周扫一遍能筛掉 demo 级仓库。

与我的相关性：中-高（替代每天手刷 GitHub trending）

上手成本：低

是否建议收藏：是

一句话判断：「省刷 trending 的时间。」

10. 警告：本周 trending demo 项目

现状：trending 榜单仍有「OpenHuman」「easy-vibe」「x-algorithm」等 demo 级 + 文档差仓库占位；OpenHuman 5 月一度顶榜但 maintain 节奏存疑。

建议：热度高，但价值待验证；先看 issues / release notes / 是否真有人在用。

链接：OpenHuman 报道（TechTimes） · Top 5 Trending AI Repos (Week 18)

四、今日最值得我看的 3 篇 / 3 个链接

OpenAI Erdős 反证公告 + Gowers 评论 — 是判断「AI 数学能力跨越」的最短路径；5 分钟看公告，10 分钟看 Scientific American 拆解就够。OpenAI · SciAm

Map-Mono-Ego（arXiv 2605.20889） — 直接关系到攀岩 app v0.4 路线是否成立，必须精读。link

Hermes vs OpenClaw 路线对比（Dev Journal） — 替你决定 agent runtime 选型，省下若干个周末。link

五、今日行动清单（最重要）

1) 收藏但不必立刻看

Meta 裁员 + 员工 AI 监控（行业背景，不影响个人 roadmap）：NPR

Sierra $950M / $15.8B（市场温度计，季度回看一次足够）：TechCrunch

Telegram Bot API 新能力（先收藏，做 MVP 时再用）：Telegram Blog

2) 今天值得精读

Map-Mono-Ego（攀岩 app v0.4 的潜在 anchor）：arXiv 2605.20889

OpenAI Erdős 反证公告 + Gowers companion 摘要：OpenAI 公告 · Scientific American

Hermes Agent v0.13 release notes 与 OpenClaw 对比：Dev Journal

3) 今天值得复现 / 试用

在 1 段自己的攀岩视频上跑通 SAM 3.1 Object Multiplex，输出 4 肢 + 抓点 mask 轨迹。

装一份 Hermes Agent，跑通 demo，理解 self-improving runtime 在实际任务里的体验。

（可选）写一个 climbing-coach Skill 的最小版本（按 anthropics/skills 目录结构），先跑得通。

4) 值得纳入项目 roadmap

攀岩 app v0.4 anchor：Map-Mono-Ego 思路 + 在熟悉的岩馆做一次点云扫描 → 单目用户视频全部 ground 到统一坐标系。

攀岩 app v0.3 baseline：YOLO26 pose + VideoPose3D + SAM 3.1 同步运行的 multi-modal motion pipeline，先有 baseline 才能谈升级。

portfolio 子项目：climbing-coach Skill 公开 repo（蹭 Anthropic Skills 标准化窗口）。

portfolio 子项目：cost-aware Claude SDK router（结合上周 6/15 信用池变化）。

5) 面试可以拿来讲的 1–2 个点

「2026/05/20 OpenAI Erdős 反证之后，我把 agent eval 框架从『SWE-bench 公开分数』调整为『私有 task-based eval + 是否能产生新构造』，因为 benchmark 信任危机已经实锤。」

「攀岩动作分析项目里，我选择 Map-Mono-Ego（单目 + 场景点云）做 v0.4 的 anchor，因为岩馆是天然可预扫描的封闭环境——这把『普通用户手机视频也能出 3D 全局 pose』变成可行路径。」

六、备注

5/24 是周末，单日没有重大一手发布；本日报选信号优先于刷新闻，重点是消化 5/20 那一波（Erdős 反证、Meta 裁员、GitHub 仓库泄露）+ 5/22 趋势（Hermes / OpenClaw 路线分野）。

攀岩 app 方向：本周最值得收藏的 3 件事 = Map-Mono-Ego + SAM 3.1 Object Multiplex + ClimbingCap 数据集；任何一件单独都不够，三件组合才是攀岩 motion 路线图。

6/15 Anthropic SDK 信用池变更倒计时 22 天，本周末若有时间，至少把 cost-aware router 的最小原型写出来。

警惕：trending 榜上 demo 级 agent 项目仍高频出现（OpenHuman、easy-vibe、x-algorithm 等），热度高但价值待验证，建议过 1–2 周再回看是否还在更新。

由 Claude 在 Cowork 模式下自动生成（autonomous scheduled task）。如某条信息真实性需要进一步核对，请以官方原始链接为准。