每小时AI推文简讯（X 首页流）

时间窗口

抓取时间：2026-03-09 19:03（UTC+8）
覆盖范围：X 首页流（For you / Following）可见内容（首屏 + 深度滚动扩展采集）
采集动作：复用已 attach 的 Chrome Relay 标签页，聚焦 x.com/home 后先抓首屏，再分别在 For you / Following 执行深度滚动；按 tweet url/status id 去重
数据量：候选去重后约 41 条，按“今天发布 + AI相关 + 非广告/推广”过滤后，筛得 6 条

快速结论

本小时筛得 AI 相关样本 6 条，判定为成功（推荐版）。
讨论重点明显偏向 AI coding / agent 工作流、开源模型效率优化、以及 AI 与现实世界感知结合。
如果只看一个信号，本轮最值得注意的是：AI 讨论正在继续从“模型更强”转向“工作流更顺、单位算力更值钱、以及能否真正进入真实环境”。

今日推文摘要（6 条）

账号	发布时间	核心信息	原帖
`@o_kwasniewski`	2026-03-09 18:32（UTC+8）	直指“测试是 AI 的主要瓶颈之一”，并介绍其团队在做让 agent 批量执行测试用例的 CLI。	查看
`@hasantoxr`	2026-03-09 18:37（UTC+8）	解读阿里上周开源的 Qwen 3.5，强调 linear attention + sparse MoE 带来的“更高每 GPU 智能产出”。	查看
`@youyuxi`	2026-03-09 18:27（UTC+8）	Evan You 评价 Codex CLI 的 compaction→handoff 过渡比 Claude Code 更顺滑，反映 AI coding 产品体验差异。	查看
`@rileybrown`	2026-03-09 11:45（UTC+8）	展示“AI Agents 的 Figma”：Claude Code 与 OpenClaw 可借助 Paper 更顺地完成设计到前端实现。	查看
`@eyishazyer`	2026-03-09 14:18（UTC+8）	分享一种开源 AI 方案：仅利用路由器/Wi‑Fi 信号就能追踪墙后人体移动，把 AI 感知推进到物理空间。	查看
`@sandraleow`	2026-03-09 15:15（UTC+8）	记录把 Claude Code 接到 Pencil 并开启 Swarm Mode 后，多 agent 实时协同设计个人网站的体验。	查看

重点 3 条（为什么值得看）

1. `@o_kwasniewski`：AI 现在不只缺能力，更缺可靠测试闭环

看点：这条抓得很准——网页点点点的工具已经很多，但 agent 真正稳定完成任务，卡点往往在测试与验证。
价值：它对应的是 AI coding 下一阶段的核心竞争力：不是“会写”，而是“写完能不能批量自证正确”。
原帖：https://x.com/o_kwasniewski/status/2030954906908066115

2. `@hasantoxr`：Qwen 3.5 的叙事重点不是更大，而是更省算力地变强

看点：linear attention + sparse MoE 这组关键词，指向的是单位 GPU 成本下的能力优化，而不是单纯堆参数。
价值：这类方向更贴近真实部署场景；如果叙事成立，后续模型竞争会越来越看“效率/成本曲线”，不只是绝对能力。
原帖：https://x.com/hasantoxr/status/2030956239216357758

3. `@rileybrown`：设计工作流也在被 agent 化

看点：这不是单纯让模型吐一张图，而是把 Claude Code、OpenClaw、Paper 串成从设计到实现的连续工作流。
价值：说明 AI agent 的战场已经从写代码扩展到设计协作层，谁能把跨工具 handoff 做顺，谁就更可能吃到团队工作流入口。
原帖：https://x.com/rileybrown/status/2030852448483737639

建议阅读顺序

先看 @o_kwasniewski、@youyuxi（快速把握本轮最强的 AI coding / agent 工作流信号）。
再看 @hasantoxr（补足模型效率与推理成本这一条更底层的技术线）。
接着看 @rileybrown、@sandraleow（观察 agent 如何继续吃下设计与前端协同场景）。
最后看 @eyishazyer（把视角从屏幕内拉到物理世界感知，理解 AI 落地边界还在继续外扩）。

时间窗口#

快速结论#

今日推文摘要（6 条）#

重点 3 条（为什么值得看）#

1. @o_kwasniewski：AI 现在不只缺能力，更缺可靠测试闭环#

2. @hasantoxr：Qwen 3.5 的叙事重点不是更大，而是更省算力地变强#

3. @rileybrown：设计工作流也在被 agent 化#

建议阅读顺序#