时间窗口

  • 抓取时间:2026-03-09 19:03(UTC+8)
  • 覆盖范围:X 首页流(For you / Following)可见内容(首屏 + 深度滚动扩展采集)
  • 采集动作:复用已 attach 的 Chrome Relay 标签页,聚焦 x.com/home 后先抓首屏,再分别在 For you / Following 执行深度滚动;按 tweet url/status id 去重
  • 数据量:候选去重后约 41 条,按“今天发布 + AI相关 + 非广告/推广”过滤后,筛得 6 条

快速结论

  • 本小时筛得 AI 相关样本 6 条,判定为成功(推荐版)。
  • 讨论重点明显偏向 AI coding / agent 工作流、开源模型效率优化、以及 AI 与现实世界感知结合
  • 如果只看一个信号,本轮最值得注意的是:AI 讨论正在继续从“模型更强”转向“工作流更顺、单位算力更值钱、以及能否真正进入真实环境”。

今日推文摘要(6 条)

账号发布时间核心信息原帖
@o_kwasniewski2026-03-09 18:32(UTC+8)直指“测试是 AI 的主要瓶颈之一”,并介绍其团队在做让 agent 批量执行测试用例的 CLI。查看
@hasantoxr2026-03-09 18:37(UTC+8)解读阿里上周开源的 Qwen 3.5,强调 linear attention + sparse MoE 带来的“更高每 GPU 智能产出”。查看
@youyuxi2026-03-09 18:27(UTC+8)Evan You 评价 Codex CLI 的 compaction→handoff 过渡比 Claude Code 更顺滑,反映 AI coding 产品体验差异。查看
@rileybrown2026-03-09 11:45(UTC+8)展示“AI Agents 的 Figma”:Claude Code 与 OpenClaw 可借助 Paper 更顺地完成设计到前端实现。查看
@eyishazyer2026-03-09 14:18(UTC+8)分享一种开源 AI 方案:仅利用路由器/Wi‑Fi 信号就能追踪墙后人体移动,把 AI 感知推进到物理空间。查看
@sandraleow2026-03-09 15:15(UTC+8)记录把 Claude Code 接到 Pencil 并开启 Swarm Mode 后,多 agent 实时协同设计个人网站的体验。查看

重点 3 条(为什么值得看)

1. @o_kwasniewski:AI 现在不只缺能力,更缺可靠测试闭环

看点:这条抓得很准——网页点点点的工具已经很多,但 agent 真正稳定完成任务,卡点往往在测试与验证。
价值:它对应的是 AI coding 下一阶段的核心竞争力:不是“会写”,而是“写完能不能批量自证正确”。
原帖:https://x.com/o_kwasniewski/status/2030954906908066115

2. @hasantoxr:Qwen 3.5 的叙事重点不是更大,而是更省算力地变强

看点:linear attention + sparse MoE 这组关键词,指向的是单位 GPU 成本下的能力优化,而不是单纯堆参数。
价值:这类方向更贴近真实部署场景;如果叙事成立,后续模型竞争会越来越看“效率/成本曲线”,不只是绝对能力。
原帖:https://x.com/hasantoxr/status/2030956239216357758

3. @rileybrown:设计工作流也在被 agent 化

看点:这不是单纯让模型吐一张图,而是把 Claude Code、OpenClaw、Paper 串成从设计到实现的连续工作流。
价值:说明 AI agent 的战场已经从写代码扩展到设计协作层,谁能把跨工具 handoff 做顺,谁就更可能吃到团队工作流入口。
原帖:https://x.com/rileybrown/status/2030852448483737639

建议阅读顺序

  1. 先看 @o_kwasniewski@youyuxi(快速把握本轮最强的 AI coding / agent 工作流信号)。
  2. 再看 @hasantoxr(补足模型效率与推理成本这一条更底层的技术线)。
  3. 接着看 @rileybrown@sandraleow(观察 agent 如何继续吃下设计与前端协同场景)。
  4. 最后看 @eyishazyer(把视角从屏幕内拉到物理世界感知,理解 AI 落地边界还在继续外扩)。