时间窗口

  • 抓取时间:2026-03-09 08:08(UTC+8)
  • 覆盖范围:X 首页流(For you + Following)可见内容(首屏 + 深度滚动扩展采集)
  • 采集动作:复用已 attach 的 Chrome Relay 标签页,聚焦 x.com/home 后抓取首屏,并对 Following 深度滚动 12 次、For you 补充滚动 8 次,按 tweet url/status id 去重
  • 数据量:候选去重后约 44 条,按“今天发布 + AI相关 + 非广告/推广”过滤后,筛得 5 条

快速结论

  • 本小时筛得 AI 相关样本 5 条,判定为成功(推荐版)。
  • 讨论焦点继续集中在 agent / AI coding / 工作流接入:比起单纯模型跑分,大家更在意 AI 是否真的能嵌入开发、协作和业务流程。
  • 如果只看一个信号,本轮最值得注意的是:“AI 能否接管持续工作流” 正在成为产品分野,而不只是“模型回答得够不够聪明”。

今日推文摘要(5 条)

账号发布时间核心信息原帖
@gdb2026-03-09 05:30(UTC+8)Greg Brockman 说“Benchmarks? Where we’re going, we don’t need benchmarks.”,延续行业从榜单跑分转向真实任务能力与产品体验的讨论。查看
@dabit32026-03-09 07:01(UTC+8)nader dabit 将 Devin 概括为“像 Claude Code,但运行在云端、可长期在线并并行处理多个仓库任务”,强调云端 coding agent 的持续执行优势。查看
@cgtwts2026-03-09 04:12(UTC+8)传播 Anthropic 一份 33 页 Claude skills 指南,重点不是单次提示词,而是如何把 Claude 组织成可复用的工作流技能。查看
@aarondfrancis2026-03-09 03:20(UTC+8)Aaron Francis 预告 Solo 桌面应用逐步开放,定位为“统一管理各类 agent 与开发栈”的单一工作台。查看
@CodeByNZ2026-03-09 04:08(UTC+8)讨论大厂让资深工程师文档化流程、再被 AI 吸收为训练/自动化资产的趋势,映射出知识结构化与岗位替代焦虑。查看

重点 3 条(为什么值得看)

1. @dabit3:云端 coding agent 的竞争点是“不断电 + 可并行”

看点:这条把 Devin 与 Claude Code 的差异说得非常直接,核心不是“谁会写代码”,而是部署位置和运行方式。
价值:如果行业继续走向长期在线、可跨仓库并发的 agent,产品壁垒会更多落在任务编排、权限管理和持续上下文,而不是纯模型能力。
原帖:https://x.com/dabit3/status/2030781082568933611

2. @gdb:benchmark 叙事继续退潮

看点:一句短评,但几乎概括了当下 AI 产品评价体系的变化。
价值:这意味着更值得盯的指标会变成端到端完成率、稳定性、可接入性和真实工作流收益,而不是单次 benchmark 排名。
原帖:https://x.com/gdb/status/2030757996595437821

3. @aarondfrancis:agent 工作台正在变成独立产品层

看点:不再只是“再做一个 agent”,而是把多个 agent 与开发环境统一装进一个桌面工作台。
价值:这说明市场开始争夺 orchestration / workspace 层;谁能把多 agent 使用体验做顺,谁就更容易留住高频开发者。
原帖:https://x.com/aarondfrancis/status/2030725472443683225

建议阅读顺序

  1. 先看 @dabit3(最贴近 AI coding 产品形态变化)。
  2. 再看 @gdb(帮助理解为什么行业不再迷信 benchmark)。
  3. 接着看 @aarondfrancis(对应 agent 工作台这一层的产品机会)。
  4. 最后补看 @cgtwts@CodeByNZ(分别对应 skills 工作流化与知识结构化带来的组织影响)。