📰AI 日报 | 2026-05-24
type
Post
status
Published
date
May 24, 2026
slug
ai-daily-2026-05-24
summary
周日 quiet day:OpenAI 用模型反证 Erdős 1946 单位距离猜想(Gowers 背书)+ Hermes Agent 在 OpenRouter 反超 OpenClaw + Anthropic Skills 扩展到 SMB(15 个开箱即用技能 + Canva/Notion/Figma/Atlassian 合作)+ Map-Mono-Ego 单目第一人称 3D 全局定位新方法。攀岩 app 角度:Map-Mono-Ego 思路 + SAM 3.1 Object Multiplex 是本周最值得收藏的两件事。
tags
新闻
开发
category
技术分享
icon
📰
password
Comment
Hide
Buy-side 风格的工程情报简报。今天的关键词:Erdős 反证里程碑、agent 框架双雄洗牌、Skills 商业化下沉、单目 3D 全局定位新方法。周日信号偏弱,重在筛选和复盘上周。
一、今日最重要的 5 条
1. OpenAI 用通用推理模型反证 Erdős 1946 单位距离猜想,Gowers 背书
- 发生了什么:5/20 OpenAI 公布一个内部通用推理模型 autonomously 反证了 Erdős 1946 年提出的 planar unit-distance 猜想,构造出基于 Golod–Shafarevich 理论 + infinite class field towers 的无穷族,把上界从 square grid 推到 polynomial improvement;9 位数学家(含 Tim Gowers、Noga Alon、Will Sawin、Melanie Wood 等)共同署名 companion remarks paper。Gowers 评价是「milestone in AI mathematics」,如果是人投 Annals 他会建议直接接受。
- 为什么重要:这是公开记录里首次有 AI 自主产出可被顶刊接受的纯数学新结果;不是「证明已有题」,而是反证 + 发现新构造。和 Jack Clark 5/21 在 Oxford 的「AI 12 个月内贡献诺奖级发现」预测对位。
- 对我有什么关系:面试金句素材——「AI 不再只是 SWE-bench 刷分工具,2026 年 5 月起出现真正的科学发现能力,这改变了我们做 eval / scope 的方式」。
- 时间:2026-05-20 公布
2. Hermes Agent 在 OpenRouter 反超 OpenClaw — 「学习型 runtime」第一次硬数据领先
- 发生了什么:5/10 Nous Research 的 Hermes Agent 在 OpenRouter 单日吞吐 224B tokens,首次超过 OpenClaw 的 186B;GitHub stars 153k vs OpenClaw 372k,但 Hermes 走「闭环 self-improving runtime」路线(任务后自动改写 skill 文件、跨会话保留 brain),与 OpenClaw 的 session-native + 广插件路线形成两条路线分野。5/7 Hermes v0.13 「Tenacity」发布 864 commits、Kanban-style 多 agent 任务板 + 僵尸/幻觉检测。
- 为什么重要:开源 agent 框架进入「广度 vs 深度」分水岭;这是「self-improving agent 不是 PPT、有真实流量」的第一次公开证据。
- 对我有什么关系:自建 climbing coach agent 时长期记忆 + skill 自学习是该选 Hermes 派的设计模板;attendance pattern:用 OpenClaw skill 生态做插件,但 runtime 走 Hermes 自演化思路。
- 时间:5/7 v0.13 release,5/10 OpenRouter 反超
3. Anthropic Skills 下沉到 SMB:15 个开箱即用技能 + Canva/Notion/Figma/Atlassian 预置
- 发生了什么:本周 Anthropic 把 Agent Skills 从「企业 / 开发者」往下推到 small business 场景——15 个 ready-made skills(payroll、bookkeeping、onboarding 等),同时 Team/Enterprise 增加组织级 Skills 集中管理,预置 Canva / Notion / Figma / Atlassian 的官方 skill。这是上周「开放标准」之后的产品落地节奏。
- 为什么重要:MCP 用半年时间成了 agent 工具调用的事实标准;Skills 的目标显然是占据「可复用 agent 行为包」这个生态位。预置合作伙伴 = 通过 ISV 把 Skills 推成默认形态。
- 对我有什么关系:这是我做 portfolio 的窗口期——写一个公开 climbing-coach skill(按 anthropics/skills 目录规范)几乎一定能拿到一波早期注意力;和上周 Agent Skills 标准化呼应。
- 时间:本周持续发布
4. Map-Mono-Ego:单目第一人称 → 世界坐标系 3D 全局人体定位(arXiv 2605.20889)
- 发生了什么:5/20 arXiv 上线 Map-Mono-Ego,提出基于预扫描 3D 点云 map-grounding 的单目 egocentric 全局 pose 估计框架——只用一台普通单目相机 + 一份场景点云就能输出 globally-consistent 的 3D 全身 pose,规避 monocular ego 视角的 drift 与缺失全局参考问题。
- 为什么重要:「单目设备 + 场景先验」这条线如果跑通,对普通用户在岩馆用手机录的视频做 3D 动作分析直接利好——岩馆是封闭、可建图的环境。
- 对我有什么关系:和攀岩 app 高度相关——可以把它当作 v0.4 路线的「Anchor 1」候选:在岩馆做一次 LiDAR / ARKit 扫描得到点云,用户后续录的所有单目视频都能 ground 到同一坐标系。
- 时间:2026-05-20 上 arXiv
5. GitHub 内部仓库被盗 3,800 个:TeamPCP / UNC6780 — supply-chain 警报
- 发生了什么:5/20 GitHub 确认约 3,800 个内部 repo 被 threat actor TeamPCP(Google TIG 跟踪代号 UNC6780)窃取;这与 Trump 政府 5 月撤销 AI 安全 EO 形成时间窗口巧合,行业讨论度大。
- 为什么重要:今年 agent 时代,代码供应链 + 自动 PR + 内部 token 共同把攻击面放大;任何 GitHub Action / Claude Code GHA 路径都需要重新审计。
- 对我有什么关系:side project 在 push 含密钥 / token 的代码时务必走 OIDC + 短期 token;面试可以讲「我在 2026 Q2 把 repo 全部换成 OIDC,禁用长期 PAT」。
- 时间:2026-05-20 GitHub 确认
二、按目标分类
A. 前沿模型 / 一手发布
A1. OpenAI Erdős 反证(同上 #1 不再重复)
- 事件:通用推理模型自主反证 Erdős 1946 unit-distance 猜想。
- 核心内容:Golod–Shafarevich + infinite class field towers 的无穷族构造,polynomial improvement。
- 为什么重要:AI 数学能力的「ChatGPT moment」——从「能解题」到「能做新研究」。
- 我需不需要点开:需要——读 OpenAI 公告(5 分钟)+ Gowers companion 摘要(10 分钟)。
- 链接:OpenAI 官方公告
A2. GPT-5.5 Instant 默认化 + GPT-5.5-Cyber 限定预览
- 事件:5/5 OpenAI 把 ChatGPT 默认模型切到 GPT-5.5 Instant(内部测高风险问题幻觉下降 52.5%);5/7 又出 GPT-5.5-Cyber 给受审 cyber 团队。
- 核心内容:Instant 主打 less emoji、更准、更短;Cyber 是 narrow 用途的 specialist 变体。
- 为什么重要:OpenAI 的 modal-strategy 越来越像「一个大型 Instant 默认 + 多个垂直 specialist 旁挂」,这跟 Anthropic 的 Skills / Opus-Sonnet 路线在打不同的产品形态。
- 我需不需要点开:简读 Instant System Card;Cyber 跳过。
A3. Hugging Face: EXAONE 4.5 + Granite Speech Plus + SAM3-LiteText 落地
- 事件:LG 的 EXAONE 4.5 首个开源 VLM(33B,韩文场景 + 文档理解强);IBM Granite Speech Plus 支持 speaker diarization + 时间戳;transformers v5.6.0 引入 SAM3-LiteText / Qianfan-OCR 等支持。
- 核心内容:多模态开源继续下沉:speech 有 timestamp、VLM 有文档场景、SAM3 出现轻量化 text-conditioned 变体。
- 为什么重要:开源「能用」的小模型越来越多 → 自建端到端 vertical agent 的硬件门槛继续走低。
- 我需不需要点开:收藏——攀岩 app 的 video → text → coach 链路可以拿来组装 baseline。
A4. Anthropic Mythos Preview 与 Opus 4.7 的当前路线复盘
- 事件:4/16 Opus 4.7 GA(87.6 SWE-bench Verified / 1M ctx / 高清图像 2576px / 价格不变);Mythos Preview 仍只对受邀机构开放(不会 GA),定位「企业红队 + cyber」。
- 核心内容:Anthropic 把「最强模型」与「最赚钱模型」彻底分层;indie / SMB 用 Opus 4.7 + Sonnet 4.6 已是天花板。
- 为什么重要:和上周 Agent SDK 信用池一起看,是 Anthropic 正在收 indie 的「白嫖空间」 —— 但开放 Skills 标准是给回礼。
- 我需不需要点开:已读,跳过。
B. AI 工程 / Agent / Coding workflow
B1. Hermes vs OpenClaw — 选择路线,而不是选择 star 数
- 内容:OpenClaw 372k stars / 50+ messaging 平台 / 插件优先;Hermes 153k / self-improving runtime / 跨会话 brain;5/10 OpenRouter token 反超。
- 可落地价值:自家 agent 选型不再是「哪个 star 多」,而是「session-scoped 还是 lifecycle-scoped」。前者适合工具型 / 单任务,后者适合 coach / 长跑型。
- 对我的意义:攀岩 coach 天然是 lifecycle 型(用户训练数周 / 教练理解你的弱项变化)→ Hermes 思路 + 自研 short skill 注入 比 OpenClaw 更合适。面试故事写得清楚。
B2. Telegram Bot API:bot-to-bot 通信 + 流式响应 + 跨群 @ 调用
- 内容:5/7 Telegram 上线「Guest Bots(被 @ 即可在不在群里也回复)+ bot-to-bot 直接通信 + streaming + custom AI styles」,首个 10 亿用户级 IM 原生支持 agent 编排。
- 可落地价值:可以用 Telegram 作为「多 agent 协作的免运维 transport」做 demo;做攀岩 coach 时不必自建前端就能演示 mobile UX。
- 对我的意义:1 周末 MVP——把 Map-Mono-Ego baseline + ClimbingCap eval 包装成一个 Telegram bot,用户发视频 → bot 出 critique,作品集直接成立。
B3. Agent benchmark 信任危机 — UC Berkeley RDI 报告余波
- 内容:Berkeley RDI 2026 报告显示 SWE-bench Verified、Terminal-Bench、WebArena、OSWorld、GAIA、FieldWorkArena 等 8 个公开 benchmark 都可被「不解题刷分」攻击;SWE-bench Verified 仍是当前「least bad」公共信号。
- 可落地价值:任何 agent 项目都必须自建私有 task-based eval(5–10 真任务 + 多次重复 + 不公开);公开 benchmark 仅作 sanity check。
- 对我的意义:可以拿来直接讲:「我设计的 climbing coach 走的是 私有 task-based eval + GLIMPSE + FineBench 公开 sanity,双层评测」。
B4. Claude Code 周边工具继续爆发:Clawdmeter / everything-claude-code
- 内容:Clawdmeter(实时 Claude Code 用量小工具)、everything-claude-code(Claude Code 生态聚合)等工具周内 trending 持续;社区在围绕「用 agent 写代码到底花了多少钱 / 多少 token」做工具化。
- 可落地价值:自己写或装一个用量监控,理解「真实生产 cost 曲线」,下次升级 model / 迁移到 V4 Flash 时有数据支撑。
- 对我的意义:和上周 cost-aware router 项目天然配套;面试加分。
C. 视觉 / 视频 / 运动人体分析
C1. Map-Mono-Ego(arXiv 2605.20889,5/20 上线)
- 内容:单目第一人称 + 预扫描点云 → 全局 3D 全身 pose;解决 monocular ego 视角 drift 与缺乏全局参考的痛点。
- 与「攀岩动作分析 app」的相关性:高——岩馆是天然「可预扫描的封闭环境」;用户后续单目视频可以全部 ground 到统一坐标系。
- 可迁移到项目的点:1) v0.4 路线先在熟悉的岩馆做点云扫描;2) 把单目视频 → 世界坐标 3D pose 当作攀岩动作分析的基础设施;3) 与 ClimbingCap 提供的 ground truth 形成训练 → 评估闭环。
- 优先级:高
C2. SAM 3.1 Object Multiplex(3/27 release,但本周再次被 cited)
- 内容:基于共享 memory 的联合多目标视频跟踪,7× faster inference 无精度损失;text prompt 直接定位「红色的手」「右边那只脚」。
- 与攀岩 app 相关性:高——攀岩动作分析必须同时跟踪 4 肢 + 抓点;SAM 3.1 Object Multiplex 几乎是为这个场景量身做的。
- 可迁移到项目的点:用 SAM 3.1 取「抓点轨迹 + 四肢轨迹」当 keypoint 之外的另一种 motion 信号;可以与 YOLO26 pose 互补。
- 优先级:高
C3. MoViD: View-Invariant 3D Human Pose Estimation
- 内容:通过显式估计并解耦 viewpoint 与 motion 特征,实现 viewpoint-invariant 的 3D pose;ACM/IEEE 嵌入式 AI & 感知系统会议 5/11–14。
- 与攀岩 app 相关性:中——攀岩录制角度多变(仰视 / 平视 / 顶光),view invariance 直接对应可用性。
- 可迁移到项目的点:作为 backbone 的 view-augmentation 损失思路;改善多机位融合。
- 优先级:中
C4. ClimbingCap + AscendMotion 数据集(继续在 roadmap 上)
- 内容:CVPR 2025 收录的 RGB + LiDAR + IMU 三模态攀岩数据集,412k 帧、22 位教练、12 面岩壁,提供世界坐标系 3D 全身骨架 ground truth。
- 与攀岩 app 相关性:极高——上周已重点说过;今日提醒:和 Map-Mono-Ego 是天然组合(场景点云 + ground truth 3D)。
- 可迁移到项目的点:先用 ClimbingCap ground truth 做 baseline 评测,再用 Map-Mono-Ego 思路扩展到「用户自家岩馆」的真实部署。
- 优先级:高(已在 roadmap)
C5. FineBench + GLIMPSE — 评测尺子继续巩固
- 内容:FineBench(199k 题细粒度活动 VQA)+ GLIMPSE(VLM 是否真在看视频)两套尺子上周已点评。
- 与攀岩 app 相关性:中-高——是评估自家 video → action critique pipeline 的最严肃公开尺子。
- 优先级:中
D. 产品化 / 商业化 / 行业动态
D1. Sierra:$15.8B valuation / $950M 融资 / $150M ARR
- 动态:5/4 Sierra 完成 $950M(Tiger Global + GV 领投),估值 $15.8B;ARR 从 2025 年 11 月 $100M 在 ~3 个月内升到 $150M;4 月推出 Ghostwriter(自然语言 → 自动生成专用 agent)。
- 趋势判断:「enterprise agent platform」是 2026 最被资本认可的口袋;customer experience agent 是单一最被 Fortune 50 采购的 vertical。
- 对 side project / 求职 / 项目方向的启发:vertical agent + 真实业务交互才是钱进来的地方;纯框架 / 工具会越来越被压价。攀岩 app 这种垂直方向反而是正确选择。
D2. Anthropic × Gates Foundation:4 年 $200M 健康 + 教育 + 农业
- 动态:5/14 Anthropic 与 Gates Foundation 宣布 4 年 $200M(grants + Claude credits + technical support),覆盖 sub-Saharan Africa / India / US,首批项目包括 polio / HPV / 妊娠子痫的疫苗与治疗加速、卫生数据决策辅助。
- 趋势判断:基金会型买方 = 长期 credit 锁定 = 模型公司的另一条「准 enterprise」收入线。和 OpenAI / Microsoft 走的是不同侧重的非营利路径。
- 启发:「vertical AI for impact」是简历可信度高的方向——做攀岩动作教学也是一种垂直 impact,可以参考这种叙事写自我介绍。
D3. Meta 5/20 裁员 8,000 + 员工 AI 监控争议
- 动态:Meta 全球裁员 ~10%(约 8,000 人)、内部转岗 7,000 人到 AI 团队;同时被曝「Model Capability Initiative」追踪员工键盘 / 鼠标 / 编码会话用于训练 agent;1,500+ 员工签请愿反对。
- 趋势判断:「我们用员工真实工作数据训 agent」会成为越来越多大厂的隐性数据策略——这一定会引发监管 + 工会层面的反弹。
- 启发:求职选公司时问清楚 dev tooling 数据是否被用于训练;在 portfolio / 项目里慎重对待包含他人代码或工作流的训练数据。
D4. Agentic AI 招聘 280% YoY,FDE 需求 +800%
- 动态:2026 LinkedIn 数据显示 agentic AI 岗位 YoY +280%;Forward-Deployed Engineer 同比 +800%,是增长最快的工程方向;Anthropic Applied 团队 5×;AI 工程师有 AI skills 比无 AI skills 平均薪资高 56%。
- 趋势判断:「会调 API」溢价归零;「会调 agent + 会做 eval + 会控成本 + 能 ship 到客户场景」溢价拉满。FDE 这个岗位会越来越像 "agent solution architect"。
- 启发:作品集主线定在 「vertical agent + 真实场景 ship + eval & cost engineering」,远比泛 LLM 应聘有效。攀岩 app 完全符合。
E. 学习价值 / 求职价值
E1. OpenAI Erdős 反证 + Gowers companion paper
- 内容:AI 首次自主产出可上顶刊的纯数学新结果。
- 适合我怎么用:面试表达——讲「2026/05/20 之后我看 AI 的方式变了:评估不再只能用 benchmark,要看是否能 propose 新猜想 + 反证已有猜想」。
- 推荐动作:精读 OpenAI 公告 + Scientific American 拆解;不必读原 paper。
E2. Map-Mono-Ego(arXiv 2605.20889)
- 内容:单目 + 场景点云 → 全局 3D pose。
- 适合我怎么用:精读 + 复现——这是攀岩 app v0.4 路线的潜在 Anchor。
- 推荐动作:复现其 baseline;在 1–2 个熟悉的岩馆做点云扫描,跑通端到端。
E3. Hermes Agent vs OpenClaw 路线对比
- 内容:广插件 vs self-improving runtime 两种 agent 形态。
- 适合我怎么用:精读 + 面试表达——讲「攀岩 coach 是 lifecycle-scoped,所以走 Hermes 思路 + skill 注入」。
- 推荐动作:跑一遍 Hermes 的 demo + 看 v0.13 release notes;不需要完整阅读 OpenClaw 源码。
E4. Anthropic Skills 商业化下沉
- 内容:15 SMB skills + ISV 预置 + 组织级管理。
- 适合我怎么用:收藏 + 复现——写一个 climbing-coach Skill 公开。
- 推荐动作:fork anthropics/skills 目录结构,做 1 个高质量 climbing-coach skill。
E5. SAM 3.1 Object Multiplex(再次提醒)
- 内容:7× faster 多目标视频跟踪 + text-conditioned。
- 适合我怎么用:复现 + 项目集成——攀岩 4 肢 + 抓点同时跟踪天生适用。
- 推荐动作:在自己手头的 1 段攀岩视频上跑通 SAM 3.1,输出 4 条肢体 + 抓点的 mask 轨迹。
三、今日高分 GitHub Repo
注:今天是周日,trending 主要承接周中信号。剔除上周已重点点评的 anthropics/skills、mattpocock/skills、VideoPose3D、VIBE、ultralytics、Cosmos、DeepSeek V4-Pro,今日补充与轮转。
1. NousResearch/Hermes-Agent
- GitHub 链接:搜「NousResearch Hermes Agent」(项目托管在 Nous Research 主仓库下)
- 方向标签:agent / self-improving runtime / multi-agent
- 这项目是干什么的:long-lived agent runtime,能在跨会话间保留 skill 文件、自动写新 skill、多 agent 协作 Kanban 板。
- 为什么今天值得关注:5/10 OpenRouter 上单日处理 224B tokens 反超 OpenClaw;5/7 v0.13 「Tenacity」加 zombie / hallucination 检测。
- 与我的相关性:高——攀岩 coach 走 lifecycle-scoped 路线时的参考实现。
- 上手成本:中(自部署)
- 是否建议我收藏:是
- 是否建议我复现:先跑 demo,看 v0.13 release notes
- 一句话判断:「2026 上半年最值得跟的 self-improving agent runtime。」
2. facebookresearch/sam3
- GitHub 链接:github.com/facebookresearch/sam3
- 方向标签:vision / video segmentation / multi-object tracking
- 这项目是干什么的:Meta SAM 3 / 3.1 官方 inference + finetune + 示例 notebook + checkpoint 下载。
- 为什么今天值得关注:SAM 3.1 Object Multiplex 7× 加速 + text-conditioned 跟踪;攀岩动作的 4 肢 + 抓点同时跟踪刚好对位。
- 与我的相关性:高
- 上手成本:中(推理简单,自定义 fine-tune 需要 GPU)
- 是否建议我收藏:是
- 是否建议我复现:是(先跑 inference notebook)
- 一句话判断:「video segmentation 的 2026 默认选项。」
3. openclaw/openclaw
- GitHub 链接:github.com/openclaw/openclaw
- 方向标签:agent / desktop / plugin ecosystem
- 这项目是干什么的:自托管 personal AI assistant,跨 OS,50+ messaging 平台、社区 skill marketplace。
- 为什么今天值得关注:372k stars,社区生态最大;和 Hermes 形成「广度 vs 深度」对照实验。
- 与我的相关性:中——做攀岩 coach 时可以借用其插件生态,但 runtime 设计未必合适。
- 上手成本:低(一键自部署)
- 是否建议我收藏:是
- 是否建议我复现:装一份,体验后决定。
- 一句话判断:「广度王者,但要小心 session-native 的局限。」
4. anthropics/skills(继续监控)
- GitHub 链接:github.com/anthropics/skills
- 方向标签:agent / Claude Code skills 标准 / reference impl
- 这项目是干什么的:Anthropic 官方维护的可复用 Agent Skills 集合(开放标准 reference)。
- 为什么今天值得关注:本周 Anthropic 把 Skills 下沉到 SMB,预置 Canva / Notion / Figma / Atlassian → 官方仓库是规范来源。
- 与我的相关性:高(写自家 climbing-coach skill 的模板)
- 上手成本:低
- 是否建议我收藏:是
- 是否建议我复现:是(写自己的 skill)
- 一句话判断:「agent 时代的 npm,越早写自己的 package 越好。」
5. deepseek-ai/DeepSeek-V4-Pro(HF)
- 方向标签:foundation model / open-weights / coding agent
- 这项目是干什么的:1.6T MoE / 49B active / 1M ctx 开源 frontier,Hermes / OpenClaw / OpenCode 都已集成。
- 为什么今天值得关注:在 Anthropic 6/15 信用池上线前,是「开源对冲」的主力候选 backbone。
- 与我的相关性:高(攀岩 coach 自建版本的主力 backbone 候选)
- 上手成本:中-高(需要算力 / 云)
- 是否建议我收藏:是
- 是否建议我复现:先在 Flash 版上跑 RAG demo
- 一句话判断:「2026 上半年最值得熟悉的开源 frontier。」
6. ultralytics/ultralytics(YOLO26)
- GitHub 链接:github.com/ultralytics/ultralytics
- 方向标签:vision / pose / edge
- 这项目是干什么的:YOLO26 一站式检测 / pose / 移动端实时部署。
- 为什么今天值得关注:和 SAM 3.1 是「关键点 vs mask」两条并行轨道;攀岩端到端 baseline 第一步。
- 与我的相关性:高
- 上手成本:低
- 是否建议我收藏:是
- 是否建议我复现:是
- 一句话判断:「移动端 pose 起步默认。」
7. facebookresearch/VideoPose3D
- GitHub 链接:github.com/facebookresearch/VideoPose3D
- 方向标签:video / 2D→3D pose / baseline
- 这项目是干什么的:经典 2D keypoint → 3D pose 基线。
- 为什么今天值得关注:作为 Map-Mono-Ego 复现前的 3D baseline 仍是最稳的起点。
- 与我的相关性:高
- 上手成本:中
- 是否建议我收藏:是
- 是否建议我复现:是
- 一句话判断:「老但靠谱,3D 入门必跑。」
8. n8n-io/n8n
- GitHub 链接:github.com/n8n-io/n8n
- 方向标签:workflow / agent automation / low-code
- 这项目是干什么的:fair-code 工作流自动化,400+ 集成,原生 AI 节点。
- 为什么今天值得关注:在 6/15 Anthropic 信用池涨价前夜,是把「订阅时代」轻量 agent automation 留在生活里的最优选择。
- 与我的相关性:中
- 上手成本:低
- 是否建议我收藏:是
- 是否建议我复现:装一份做个人 ops
- 一句话判断:「Zapier 不够灵活时的答案。」
9. Trendshift / OSSInsight 监控(不是 repo,是元工具)
- 方向标签:dev tools / meta
- 这项目是干什么的:实时 trending repo 监控 + star velocity 警报。
- 为什么今天值得关注:信号源比 GitHub 自带 trending 更高质量;每周扫一遍能筛掉 demo 级仓库。
- 与我的相关性:中-高(替代每天手刷 GitHub trending)
- 上手成本:低
- 是否建议收藏:是
- 一句话判断:「省刷 trending 的时间。」
10. 警告:本周 trending demo 项目
- 现状:trending 榜单仍有「OpenHuman」「easy-vibe」「x-algorithm」等 demo 级 + 文档差仓库占位;OpenHuman 5 月一度顶榜但 maintain 节奏存疑。
- 建议:热度高,但价值待验证;先看 issues / release notes / 是否真有人在用。
四、今日最值得我看的 3 篇 / 3 个链接
- OpenAI Erdős 反证公告 + Gowers 评论 — 是判断「AI 数学能力跨越」的最短路径;5 分钟看公告,10 分钟看 Scientific American 拆解就够。OpenAI · SciAm
- Map-Mono-Ego(arXiv 2605.20889) — 直接关系到攀岩 app v0.4 路线是否成立,必须精读。link
- Hermes vs OpenClaw 路线对比(Dev Journal) — 替你决定 agent runtime 选型,省下若干个周末。link
五、今日行动清单(最重要)
1) 收藏但不必立刻看
- Meta 裁员 + 员工 AI 监控(行业背景,不影响个人 roadmap):NPR
- Sierra $950M / $15.8B(市场温度计,季度回看一次足够):TechCrunch
- Telegram Bot API 新能力(先收藏,做 MVP 时再用):Telegram Blog
2) 今天值得精读
- Map-Mono-Ego(攀岩 app v0.4 的潜在 anchor):arXiv 2605.20889
- OpenAI Erdős 反证公告 + Gowers companion 摘要:OpenAI 公告 · Scientific American
- Hermes Agent v0.13 release notes 与 OpenClaw 对比:Dev Journal
3) 今天值得复现 / 试用
- 在 1 段自己的攀岩视频上跑通 SAM 3.1 Object Multiplex,输出 4 肢 + 抓点 mask 轨迹。
- 装一份 Hermes Agent,跑通 demo,理解 self-improving runtime 在实际任务里的体验。
- (可选)写一个 climbing-coach Skill 的最小版本(按 anthropics/skills 目录结构),先跑得通。
4) 值得纳入项目 roadmap
- 攀岩 app v0.4 anchor:Map-Mono-Ego 思路 + 在熟悉的岩馆做一次点云扫描 → 单目用户视频全部 ground 到统一坐标系。
- 攀岩 app v0.3 baseline:YOLO26 pose + VideoPose3D + SAM 3.1 同步运行的 multi-modal motion pipeline,先有 baseline 才能谈升级。
- portfolio 子项目:climbing-coach Skill 公开 repo(蹭 Anthropic Skills 标准化窗口)。
- portfolio 子项目:cost-aware Claude SDK router(结合上周 6/15 信用池变化)。
5) 面试可以拿来讲的 1–2 个点
- 「2026/05/20 OpenAI Erdős 反证之后,我把 agent eval 框架从『SWE-bench 公开分数』调整为『私有 task-based eval + 是否能产生新构造』,因为 benchmark 信任危机已经实锤。」
- 「攀岩动作分析项目里,我选择 Map-Mono-Ego(单目 + 场景点云)做 v0.4 的 anchor,因为岩馆是天然可预扫描的封闭环境——这把『普通用户手机视频也能出 3D 全局 pose』变成可行路径。」
六、备注
- 5/24 是周末,单日没有重大一手发布;本日报选信号优先于刷新闻,重点是消化 5/20 那一波(Erdős 反证、Meta 裁员、GitHub 仓库泄露)+ 5/22 趋势(Hermes / OpenClaw 路线分野)。
- 攀岩 app 方向:本周最值得收藏的 3 件事 = Map-Mono-Ego + SAM 3.1 Object Multiplex + ClimbingCap 数据集;任何一件单独都不够,三件组合才是攀岩 motion 路线图。
- 6/15 Anthropic SDK 信用池变更倒计时 22 天,本周末若有时间,至少把 cost-aware router 的最小原型写出来。
- 警惕:trending 榜上 demo 级 agent 项目仍高频出现(OpenHuman、easy-vibe、x-algorithm 等),热度高但价值待验证,建议过 1–2 周再回看是否还在更新。
由 Claude 在 Cowork 模式下自动生成(autonomous scheduled task)。如某条信息真实性需要进一步核对,请以官方原始链接为准。