AI 日报 | 2026-06-11 | Tony‘s BLOG

type

Post

status

Published

date

Jun 11, 2026

slug

summary

今日聚焦：Claude Fable 5 把 Mythos 级能力公开化（6/22 前 Pro/Max 免费试用，错过要花钱）、DiffusionGemma 26B 开源 text diffusion、Copilot 全面转 usage-based billing、VIFSS 视角不变运动姿态论文对攀岩 app 高度相关、Meta 裁员 8000 重组 AI、SpaceX $1.75T IPO 定价。

一、今日最重要的 5 条

1. Claude Fable 5 发布：Mythos 级能力首次公开可用（Anthropic, 2026-06-09）

Anthropic 把 Mythos 同源模型以 Claude Fable 5 的形式 GA：几乎所有 benchmark SOTA，软件工程 / 知识工作 / 视觉 / 科研全面领先；与 Mythos 5 同底座，区别是 Fable 加了高风险领域（cyber / bio）safeguard，触发率 <5%（触发时由 Opus 4.8 兜底回答）。定价 $10/$50 per M tokens（Opus 4.8 的 2 倍）。关键时间点：6/22 前 Pro/Max/Team 免费包含，6/23 起改记 usage credits。Simon Willison 首日评价："This is something of a beast. It's slow, expensive, and has been quite happily churning through everything I've thrown at it." 对我：这是当下能摸到的最强公开模型，免费窗口有截止日，本周就该拿真实任务测。

来源：Anthropic 官方 · TechCrunch · Simon Willison 首日测评 · Latent.Space AINews 拆解

2. DiffusionGemma 26B：Google 把 text diffusion 做成开源可用模型（本周）

Google DeepMind 发布 DiffusionGemma（26B，A4B 激活，Apache 2.0，google/diffusiongemma-26B-A4B-it），用 text diffusion 替代自回归，GPU 上最高 4× 生成加速。去年 Gemini Diffusion 只是实验 demo，这次直接给开源权重。为什么重要：这是 diffusion LLM 第一次以"可下载、可商用、规模够用"的形态出现，推理成本曲线可能被改写。

来源：Simon Willison 笔记 · The Decoder · Hugging Face

3. GitHub Copilot 切 usage-based billing（6/1 生效）+ Fable 5 上线 Copilot（6/9）

Copilot 从固定订阅改为 GitHub AI Credits 按 token 计费（区分 input / cached / output，各模型单价不同）；Fable 5 已对 Copilot GA。对我：coding agent 的成本结构从"包月"变"计量"，prompt 效率、cache 命中、模型路由直接变成钱；这是 agent 工程里"成本可观测性"的现实教材，面试可讲。

来源：GitHub Changelog: Fable 5 GA · Morphllm coding agents 综述

4. Anthropic：80% 合入生产代码由 Claude 撰写；debug 成功率 60%→90%（6/5 披露，二手转述，关键数字待验证）

报道称 Anthropic 内部 80% merged production code 由 Claude 生成，工程师人均日合入量是 2024 年的 8 倍，配合 MCP 的 debug 成功率从 ~60% 升到 ~90%。叠加 LangChain《State of Agent Engineering》：57.3% 受访团队已有 agent 在生产环境。对我："agent 写大部分代码"在头部公司已是现状不是预测；个人项目里把 agent workflow 用到极致是对齐行业的，不是偷懒。

来源：byteiota · LangChain State of Agent Engineering

5. 资本面剧烈换仓：Meta 裁 8000 重组 AI、SpaceX $1.75T IPO 今日定价、Google 每月付 SpaceX $920M 买算力

Meta 本周通知约 8000 人裁员（~10%），同时把至多 7000 人调入新 AI 部门，2026 capex 指引 $125-145B；SpaceX IPO 今日定价（目标募资 $75B，估值 ≥$1.75T，明日 Nasdaq 代码 SPCX）；Google 已签约 2026.10-2029.6 每月 $920M 租用 SpaceX 的 ~110K GPU 算力。判断：算力供给正在轨道化/航天化这种非常规渠道扩张，资本只向 AI infra 和垂直应用集中——求职市场同样在按这个逻辑重组。

来源：TechCrunch: Google-SpaceX · Asanify 6/11 digest（Meta 数字待验证）

二、按目标分类

A. 前沿模型 / 一手发布

A1. Claude Fable 5 / Mythos 5（Anthropic, 2026-06-09）

事件：Mythos-class 模型公开 GA（Fable 5），Mythos 5 仅限审批机构

核心内容：几乎全 benchmark SOTA；safeguard 触发 <5% 时回落 Opus 4.8；$10/$50 per M；6/22 前 Pro/Max 免费

为什么重要：公开可用模型的能力上限被直接抬高一档；上期日报说"Mythos 锚定下一代 GA 下限"，一周内兑现

我需不需要点开：必点。官方公告 + Willison 测评

链接：Anthropic · CNBC · The Decoder

A2. DiffusionGemma 26B-A4B（Google DeepMind, 本周）

事件：开源 text diffusion LLM，Apache 2.0

核心内容：26B 总参 / A4B 激活，GPU 上最高 4× 生成加速

为什么重要：非自回归路线第一次有"能下载跑"的工业级权重

我需不需要点开：看 Willison 的短评即可，暂不必读 tech report

链接：Hugging Face google/diffusiongemma · Simon Willison

A3. Gemini 3.1 Flash-Lite（Google, 本周）

事件：效率型小模型，$0.25 per M input tokens

核心内容：响应 2.5× 提速、输出生成 45% 提速

为什么重要：高频低价 API 调用场景（如视频逐帧描述、批量标注）的新性价比底线

我需不需要点开：不必，记住价格即可；做攀岩 app 批量帧标注时再回来比价

链接：LLM-stats updates

A4. EXAONE 4.5 VLM（LG AI Research, 近日）

事件：LG 首个开源 vision-language 模型

核心内容：33B 总参（含 1.2B vision encoder），在 EXAONE 4.0 上加视觉塔

为什么重要：开源 VLM 供给持续增加，自托管视频帧理解的候选又多一个

我需不需要点开：低优先级，做模型选型时再看

链接：HF release notes 汇总

A5. GPT-5.4 "1M context + OSWorld-V 75%"（待验证）

事件：聚合站报道 OpenAI GPT-5.4 具备 1M context、桌面任务 OSWorld-V 75%（高于人类基线 72.4%）

核心内容：未见 OpenAI 官方发布页确认，与 GPT-5.5 系列命名关系混乱

为什么重要：若属实则是 computer-use 能力的重要节点；但目前只有二手聚合源

我需不需要点开：不必，等官方信源

链接：Crescendo 聚合（待验证）

B. AI 工程 / Agent / Coding workflow

B1. Copilot usage-based billing：coding agent 成本工程时代

内容：6/1 起 GitHub AI Credits 按 token 计费，input/cached/output 分开计价

可落地价值：prompt 长度、context 管理、cache 策略、模型路由直接映射成本；"省 token 的 harness"成为真实竞争力

对我当前开发/学习的意义：在自己项目里加 per-call token/cost 打点（与上期 Coralogix 观察一致），这是面试可演示的工程素养

链接：Morphllm 综述

B2. Fable 5 的真实开发者反馈：强但慢且贵 → 模型分层路由是正解

内容：首日共识：复杂任务质量明显高，但延迟和价格让它不适合做 daily driver；社区主流方案是 "Fable 5 做规划/难题，Sonnet/Haiku 做执行"

可落地价值：tiered model routing（难度分诊）从可选优化变成默认架构

对我当前开发/学习的意义：攀岩 app 的 LLM 解读链路同理——帧描述用便宜模型，最终动作建议用强模型

链接：Latent.Space AINews · 开发者反馈汇总

B3. LangChain《State of Agent Engineering》

内容：57.3% 团队已有 agent 在生产，另 30.4% 在开发且有明确部署计划

可落地价值：报告里的失败模式 / eval 实践章节是免费的行业基线数据

对我当前开发/学习的意义：面试谈 agent 时引用行业渗透率数据，比谈框架名字有说服力

链接：LangChain

B4. Willison 用 Fable 5 写 LLM 工具新版本："几乎全部由模型完成"

内容：Simon Willison 公开其 LLM CLI 新 alpha "Almost entirely written by the new Claude Fable 5"

可落地价值：他的 blog 通常附完整 transcript，是高质量 agentic coding workflow 的免费教材

对我当前开发/学习的意义：学他"如何把大任务切给模型 + 如何验收"的具体做法

链接：simonwillison.net

C. 视觉 / 视频 / 运动人体分析

C1. VIFSS: View-Invariant and Figure Skating-Specific Pose Representation Learning for Temporal Action Segmentation（arXiv 2508.10281）

内容：花滑专项的视角不变 pose 表征 + 时序动作分割，"通用 pose 预训练 → 运动专项微调"两段式

与"攀岩动作分析 app"的相关性：极高。和攀岩同构：小众运动、数据少、相机角度乱、需要把连续动作切成阶段（起步/中段/冲顶）

可迁移到项目的点：照搬其"view-invariant 预训练 + sport-specific 时序分割头"框架，把花滑动作类别换成攀岩动作（静态平衡/动态跳跃/换手/休息位）

优先级：高

链接：arXiv 2508.10281

C2. MM-SF: Multimodal SlowFast——RGB 与 2D skeleton 的特征级融合（ScienceDirect, 近期）

内容：Slow/Fast 双 RGB 通路 + 独立 Pose 通路，三路连续特征交换做动作识别

与攀岩 app 的相关性：高。攀岩动作判断既需要肢体几何（skeleton）也需要环境上下文（岩点位置，RGB），单 skeleton 流会丢信息

可迁移到项目的点：架构参考——MMPose skeleton 流 + RGB 流晚融合，而不是只用骨架

优先级：中-高

链接：ScienceDirect

C3. VAIR: Visual Analytics for Injury Risk in Sports（arXiv 2512.17446）

内容：从视频重建 3D 运动 → 生物力学仿真 → 关节级受伤风险可视化

与攀岩 app 的相关性：中-高。"动作改进建议"之外，"受伤风险提示"（指/肩负荷）是攀岩用户真实痛点，差异化功能

可迁移到项目的点：joint-level 风险指标随时间演化的可视化方式，直接可借鉴到动作回放 UI

优先级：中

链接：arXiv 2512.17446

C4. Skeleton-based Action Understanding Foundation Model（TPAMI vol.48 no.1, 2026）

内容：骨架动作理解基础模型，期刊版定稿

与攀岩 app 的相关性：高，与上期 Universal Skeleton（arXiv 2604.17013）同主线，互为印证

可迁移到项目的点：作为 zero-shot 动作分类 backbone 候选之二，与 Universal Skeleton 做 A/B

优先级：中-高

链接：检索入口（PMC 综述引用）

D. 产品化 / 商业化 / 行业动态

D1. Fable 5 定价：top-tier AI 走向奢侈品分层

动态：$10/$50 per M（Opus 2 倍），且 6/23 起从订阅计划中移出改计量

背后的趋势判断：模型市场正式分层——"够用层"价格战（Flash-Lite $0.25），"天花板层"溢价收割；中间层最难受

对 side project / 求职 / 项目方向的启发：产品设计必须显式做"何时值得调贵模型"的路由逻辑，这本身就是可写进简历的工程决策

链接：PANews · FindSkill 时间线整理

D2. Meta 裁 8000 + $125-145B capex：人才与资本同时向 AI 核心集中

动态：~10% 裁员的同时把 7000 人转入 AI 部门，capex 指引创纪录（数字待 Meta 官方确认）

背后的趋势判断：大厂在用"裁员+转岗"完成技能结构置换；非 AI 岗位收缩、AI 应用岗位扩张同时发生

对 side project / 求职 / 项目方向的启发：求职竞争力 = AI 工程实战证据；作品集里"能跑的 agent + 可量化的 eval"比刷题权重在上升

链接：Asanify digest（待验证）

D3. 本周融资：Cyera $600M（数据安全）、TensorWave $350M（AMD 算力云）

动态：6/10 两笔大额：AI 数据安全（Cyera Series F）+ 非 NVIDIA 算力（TensorWave Series B, AMD Ventures 跟投）

背后的趋势判断：钱在追"AI 安全合规"和"算力多元化"两条 infra 支线；与 Google-SpaceX 算力交易同逻辑——supply chain 去单点化

对 side project / 求职 / 项目方向的启发：数据隐私（视频不上云）继续是垂直 AI 应用的有效卖点，与上期 OpenClaw 判断一致

链接：TechStartups 6/10 roundup

D4. 中国收紧 AI 内容标注 + OpenAI 封禁中国关联影响力账号（6/10）

动态：网信办处罚未标注 AI 内容的应用（新《网络安全法》罚款上限 RMB 1000 万）；OpenAI 公布封禁两个影响力操作

背后的趋势判断：AI 内容溯源 / 标注合规将成产品硬需求，出海产品尤其

对 side project / 求职 / 项目方向的启发：若 app 输出 AI 生成的分析报告/图像，预留"AI 生成"标注能力，成本极低、合规价值高

链接：Crescendo 汇总

E. 学习价值 / 求职价值

E1. Claude Fable 5 免费试用窗口（截止 6/22）

适合我怎么用：试用 + 对比实验

推荐动作：6/22 前用 Fable 5 跑两件事：① 一段攀岩视频帧序列的动作解读（与 Sonnet/Gemini 同 prompt 对照）② 一个你卡过的复杂 coding 任务，记录差异

链接：Anthropic

E2. VIFSS 论文

适合我怎么用：精读 + 框架复用

推荐动作：精读 method 章节，把"view-invariant 预训练 + 专项时序分割"画成你自己 app 的架构图，放进 roadmap

链接：arXiv 2508.10281

E3. LangChain State of Agent Engineering

适合我怎么用：收藏 + 面试表达素材

推荐动作：摘 3 个数字（57.3% 生产渗透率等）+ 1 个失败模式，组织成 60 秒的行业判断陈述

链接：LangChain

E4. Willison 的 Fable 5 coding transcript

适合我怎么用：精读（工作流模仿）

推荐动作：看他如何切任务、如何验收模型输出，提炼 2 条可复用的 prompt workflow 习惯

链接：simonwillison.net

三、今日高分 GitHub Repo

1. mvanhorn/last30days-skill

GitHub 链接：https://github.com/mvanhorn/last30days-skill

方向标签：agent / dev tools / skill

这项目是干什么的：Claude skill，自动调研某主题最近 30 天的进展并输出结构化综述

为什么今天值得关注：Trendshift 当日趋势第 1，是"skill 生态"起飞的代表样本

与我的相关性：高——它做的事和你这份日报同构，可以借鉴其信息源组织方式

上手成本：低

是否建议我收藏：是

是否建议我复现：是（fork 改造成攀岩/CV 领域版）

一句话判断：小而实用，skill 生态趋势的风向标

2. langflow-ai/langflow

GitHub 链接：https://github.com/langflow-ai/langflow

方向标签：agent / app / 可视化编排

这项目是干什么的：可视化 agent pipeline 构建器，~146K star，visual builder 三巨头之首

为什么今天值得关注：visual builder 类占据 agent repo 头部（Langflow/Dify/Flowise 合计 330K+ star），代表"非工程师造 agent"趋势

与我的相关性：中——不必用于攀岩 app 核心，但适合快速做 demo 原型

上手成本：低

是否建议我收藏：是

是否建议我复现：否（按需使用）

一句话判断：热度高，对你的工程深度训练价值一般，做 demo 省时是真

3. google/diffusiongemma-26B-A4B-it（Hugging Face）

链接：https://huggingface.co/google

方向标签：training / 开源模型

这项目是干什么的：开源 text diffusion LLM 权重（Apache 2.0）

为什么今天值得关注：本周最重要的开源权重发布，非自回归路线工业级首秀

与我的相关性：中——不直接用于攀岩 app，但属于"值得知道在发生什么"

上手成本：中（26B 需要像样的 GPU）

是否建议我收藏：是

是否建议我复现：否（看测评即可）

一句话判断：知识储备项，不是动手项

4. open-mmlab/mmaction2

GitHub 链接：https://github.com/open-mmlab/mmaction2

方向标签：video / action recognition / training

这项目是干什么的：OpenMMLab 视频动作识别全家桶（识别/检测/时序分割），与 MMPose 同生态

为什么今天值得关注：VIFSS 这类"专项运动时序分割"论文的工程落地基本都踩在它上面；与你已定的 MMPose 基座无缝衔接

与我的相关性：极高

上手成本：中

是否建议我收藏：是

是否建议我复现：是（攀岩动作时序分割 baseline）

一句话判断：MMPose 之后你该装的第二个轮子

5. opencv/opencv

GitHub 链接：https://github.com/opencv/opencv

方向标签：vision / infra

这项目是干什么的：不用介绍的 CV 基础库

为什么今天值得关注：重回 Trendshift 趋势榜前三（通常意味着新 release 或重大讨论），视频预处理/解码/相机标定仍绕不开它

与我的相关性：高（视频 IO 与预处理层）

上手成本：低

是否建议我收藏：早该收藏了

是否建议我复现：不适用

一句话判断：趋势榜上的老将，顺手看一眼 changelog 即可

6. ARUNAGIRINATHAN-K/awesome-ai-agents-2026

GitHub 链接：https://github.com/ARUNAGIRINATHAN-K/awesome-ai-agents-2026

方向标签：agent / awesome-list

这项目是干什么的：300+ AI agent 工具/框架索引

为什么今天值得关注：讨论度高；但警告：聚合类 list 质量参差，部分条目是营销项目，只当索引用，别当推荐清单

与我的相关性：低-中

上手成本：低

是否建议我收藏：可收藏不必看

是否建议我复现：否

一句话判断：热度高，价值一般

四、今日最值得我看的 3 个链接

Claude Fable 5 官方公告 + Willison 首日测评：Anthropic · simonwillison.net

为什么今天最值得点开：能力上限变了 + 免费窗口 6/22 截止，这是今天唯一有 deadline 的信息。

VIFSS（arXiv 2508.10281）：arXiv

为什么今天最值得点开："小众运动 + 视角混乱 + 数据少"三个约束与攀岩完全同构，相当于别人替你跑通了一遍方法论。

LangChain State of Agent Engineering：langchain.com

为什么今天最值得点开：免费的行业基线数据，面试谈 agent 的弹药库，30 分钟读完。

五、今日行动清单

1. 收藏但不必立刻看：

DiffusionGemma 模型卡（知道存在即可）

VAIR 受伤风险论文（做"风险提示"功能时再读）

awesome-ai-agents-2026（索引备查）

EXAONE 4.5 VLM（模型选型时再比）

2. 值得精读：

VIFSS method 章节（arXiv 2508.10281）

Latent.Space 对 Fable 5 条款与定价的拆解

LangChain State of Agent Engineering（重点：失败模式 + eval 章节）

3. 值得复现/试用（本周优先级最高：6/22 截止）：

用 Fable 5 免费窗口跑攀岩视频解读对照实验（同 prompt 对比 Sonnet 4.6 / Gemini 3.5 Flash / Fable 5）

装 mmaction2，在 1-2 段攀岩视频上跑动作时序分割 baseline

fork last30days-skill，改造成"CV/动作识别领域月度综述"skill

4. 值得记到项目 roadmap：

借 VIFSS 框架更新 pipeline：MMPose（2D pose）→ view-invariant 预训练表征 → 攀岩专项时序分割（mmaction2）→ 动作分类 → LLM 建议（tiered routing：便宜模型描述帧，强模型出建议）

参考 MM-SF：skeleton 流 + RGB 流双路融合，别只用骨架

新增"成本可观测性"模块：per-call token/cost 打点（呼应 Copilot 计量计费趋势）

5. 面试可以讲的 1-2 个点：

"Fable 5 的发布让 tiered model routing 从优化变成默认架构——我的 app 用便宜模型做帧描述、强模型做最终建议，成本降一个量级而质量不降，这是 6 月行业定价分层下的必然设计"

"我参考花滑领域的 VIFSS 把'视角不变预训练 + 专项时序分割'迁移到攀岩——小众运动做 AI 分析的通用方法论是：不造数据集，先借通用 backbone，再用极少量专项数据做分割头"

报告基于 2026-06-11 当日及本周公开信息整理。Fable 5 信息来自 Anthropic 官方与多家一手测评；Anthropic "80% 代码由 Claude 撰写"与 Meta 裁员细节均为二手转述，标注待验证；GPT-5.4 能力数据仅见聚合站，待官方确认；SpaceX IPO 定价结果以 6/12 开盘为准。