🌏 今日速览

周六信息密度意外地大。头条是 DeepSeek V4 Pro / Flash——两个 100 万 token 上下文的 MoE 预览模型,Simon Willison 实测后一句话总结:“基本贴到第一梯队、价格只有零头”。同一天,Hugging Face 开源 ml-intern——一个能自己读 arXiv、复现实验、训模型、推上 Hub 的 ML 工程师 Agent,相当于"Claude Code 的 ML 工程化版本",思路很干净。Infra 层继续在为 agent 量身打造工具:Cloudflare Artifacts 是专门给 AI agent 用的、Git 版本化的 REST 文件系统。商业层 Anthropic 抱住 NEC 是今年 AI 圈最大的日本动作之一,意思很明显——不在 logo 战上和 OpenAI 死磕,而是钻进日本企业 IT 的渠道里慢慢长。OpenAI 的 GPT-5.5 prompting 指南今天也少见地有干货(不是"prompt 要写好"这种废话)。今日主旋律:第一梯队和"够用的便宜替代品"之间的差距继续缩小,agent 生态从猎奇向基建过渡。


🔥 今日 10 条

1. [Simon Willison] DeepSeek V4 ——逼近第一梯队,价格打骨折

链接: https://simonwillison.net/2026/Apr/24/deepseek-v4/ DeepSeek 同时放出 V4 Pro(1.6T 总 / 49B 激活)和 V4 Flash(284B 总 / 13B 激活),都支持 100 万 token 上下文。Simon 自己跑下来:在他那套标准评测上几乎贴着 GPT-5.5 / Claude Opus 4.7,价格大概是对方的 1/8。两档分级(Pro 啃硬题、Flash 走量)是抄了 OpenAI/Anthropic 的功课,但确实合理。对国内团队尤其有意义——之前"成本敏感场景被迫用国内开源模型"的那种妥协感,今天起明显减轻。

链接: https://github.com/huggingface/ml-intern Hugging Face 新仓库今日 Trending +1200 star。功能上是"自动 ML 工程师"——读 arXiv、挑论文、复现实验、训模型、推 Hub,整条链路自动化。和市面上一堆"Claude Code for ML"的同类项目相比,ml-intern 的优势是默认接好了 HF 全家桶(datasets / Hub / transformers),而且 README 里有一长段"目前还做不到什么"——这种诚实在 demo 驱动的发布潮里挺难得,值得 fork 起来研究。

3. [Hacker News] 用过度思考、需求蔓延、结构化重构毁掉项目

链接: https://kevinlynagh.com/newsletter/2026_04_overthinking/ Kevin Lynagh 的一篇随笔:聪明工程师常见的失败模式——把一个本该 2 天搞定的 bug 修成了 6 周的架构重构,理由永远是"这次顺便把结构理清"。HN 上 506 分,评论分两派:“说的就是我"和"结构化思考是唯一会复利的东西”。在 AI 写代码越来越快的今天这篇尤其有价值:当助手 90 秒能产出 1000 行像样代码,瓶颈早已不是打字速度——是你能不能管住自己别越改越大。值得资深工程师和所有 reviewer 一读。

4. [V2EX] OpenCode Go 上线 DeepSeek V4 订阅

链接: https://www.v2ex.com/t/1208454 首月 5 美元,5 小时窗口大约 1300 次 Pro / 7450 次 Flash。这条帖子顺带是 #1 的真实压测:楼下回帖确认 DeepSeek V4 在 OpenCode 内部跑没问题,但想接进 Claude Code 时会因为推理格式不一致报错(最新版 OpenCode 已修)。对成本敏感、又想体验 V4 实力的开发者:这是本周最便宜的"准 Claude Code"路径。

5. [V2EX] aibijia.org —— ChatGPT 账号比价网站

链接: https://www.v2ex.com/t/1208476 楼主受不了在卡网和电报群里转一圈、同样的 ChatGPT Plus 月卡报价从 5 元到 40 元乱跳,干脆做了个比价站,把 86 / chong / xin / 74 等几个上游和二十多家店铺的报价拉到一起。先不论灰色市场本身——背后的信号是:在支付摩擦严重的地区,AI 账号的代购套利已经长出了一整层"消费者比价"的工具。做出海产品的同学顺手了解一下国内灰产生态。

6. [Publickey] Cloudflare Artifacts —— 给 AI agent 的 Git 风格文件系统

链接: https://www.publickey1.jp/blog/26/cloudflareaicloudflare_artifactsgitrestful_api.html Cloudflare 的卖点:AI agent 需要一个"能版本化(Git diff / revert)+ REST 可访问 + 全球一致"的存储——这正好是 S3 + 对象版本不擅长的,也是本地文件系统做不到的。配合本周同时发布的 Cloudflare Email Service,能看出来 Cloudflare 在悄悄拼一套"agent runtime 层":所有人都在看模型厂商打仗的时候,Cloudflare 在卖底下的水电煤。

7. [Zenn] Claude Code 半夜自动修 Playwright E2E 测试、提 PR

链接: https://zenn.dev/yuden/articles/playwright-auto-heal-claude-code 日本工程师写的实操:用 cron + Claude Code 把团队那一堆抖动的 Playwright 测试当成日常巡检任务,半夜让它分诊、自愈、提 draft PR,第二天 reviewer 起床看一眼。作者很诚实地承认错 PR 比例不低(~30%),但和让团队自己维护 flaky test 的痛苦比起来仍然是净收益。“Claude Code 当常驻同事"这个抽象概念,今天有了一份带 package.json 和 tmux daemon 的可抄作业。

8. [Anthropic] Anthropic 联手 NEC 培养日本最大规模 AI 工程团队

链接: https://www.anthropic.com/news/anthropic-nec Anthropic 今年最大的日本动作:和 NEC 合作多年期培训计划,目标是让数万名日本工程师掌握基于 Claude 的 agentic 开发能力。战略上 Anthropic 想得很清楚:日本企业 IT 是慢但深的市场,logo 战赢不过 OpenAI 也不必赢——钻进 SI / 集成商渠道才是关键。对于在日本生活、给国内/亚洲企业提供工具的团队(比如我自己),这条值得花点时间想清楚意味着什么。

9. [Anthropic] Anthropic 和 Amazon 把合作扩展到 5 GW 新算力

链接: https://www.anthropic.com/news/anthropic-amazon-compute 新增最高 5 GW 的算力承诺,叠加之前以 Trainium 为主的合作。5 GW 大概是旧金山湾区一个高温日的全市峰值用电——两年前听到这种数字的反应是"开玩笑吧”,今天是"哦又一笔"。这是 Anthropic 本月第二笔多吉瓦级算力交易,前一笔是和 Google / Broadcom 那个。算力作为战略资源的军备竞赛已经公开化。

10. [OpenAI] GPT-5.5 Prompting 指南

链接: https://developers.openai.com/api/docs/guides/prompt-guidance?model=gpt-5.5 OpenAI 官方少见地写得很有诚意——具体到 tool-calling 时怎么发"中间状态"消息、verbosity 参数怎么调、多步规划任务的结构化模板都给了。一个值得注意的细节:OpenAI 推荐"在每个工具调用前发一条简短用户可见状态消息"——这正是 Claude Code 一直在用的模式。前沿厂商在 agentic UX 上正在收敛到同一套词汇。


✍️ 编者按

今天有两条主线:前沿模型的价格地板又往下踩了一脚(DeepSeek V4 + OpenCode 5 美元订阅,让中文开发者第一次以这个价位摸到准第一梯队),以及 agent 生态在补真正像 infra 的 infra(Cloudflare Artifacts、ml-intern、Claude Code 半夜值班)。两条单独看都不算"震动行业",但合起来基本就是未来一年的真实手感——枯燥的水电煤、持续下降的成本、越来越像初级工程师而不是花哨自动补全的 agent。

强烈推荐:

  1. DeepSeek V4(#1) —— 如果你团队最近在做 AI 功能的成本测算,今天就重做一遍。
  2. Kevin Lynagh 那篇过度思考(#3) —— 短、好读,对当下"用 AI 加速开发"叙事是个有用的反向校准。快只在做对事的前提下才有意义。

—— Dev Digest 编辑