DeepSeek V4-Pro 今天永久降价 75%!我把它配 Claude Code 跑了一周,省了 83%

发布时间:2026/6/1 20:24:16
DeepSeek V4-Pro 今天永久降价 75%!我把它配 Claude Code 跑了一周,省了 83%
上周五下午我看了眼 Claude Code 的 API 账单。$87.4。就一周。写代码、改 bug、重构几个模块没干什么惊天动地的事账单就快破百了。我盯着那个数字愣了几秒——不是付不起是觉得这个价格不对。AI 编程确实爽但按这个烧法一个月 350 刀起步比我服务器费用还高两倍。然后昨天DeepSeek 官方悄咪咪更新了价格文档把 V4-Pro 的 75% 折扣从限时促销正式改成了永久定价。生效日期2026 年 5 月 31 日。也就是今天。先算账75% OFF 永久化意味着什么这事得掰开算因为 DeepSeek 的定价体系跟 OpenAI/Anthropic 不太一样——它有缓存命中这个机制而且玩得很极致。| V4-Pro 的缓存命中率实测在 {95% 左右 || 来源: 量子位/多家媒体实测数据}也就是说你发出去的请求里绝大部分 token 都按缓存价算。这很重要因为缓存价和非缓存价差了整整两个数量级。 |按新的永久定价计费项原价¥/百万tokens永久价¥/百万tokens降幅输入缓存命中0.10.02575%输入缓存未命中12375%输出24675%注意这个 0.025 元/百万 tokens 的缓存命中价。0.025 元什么概念四舍五入就是不要钱。| 换算成美元V4-Pro 折扣后输出约 {0.87/M tokens || 来源: DeepSeek 官方定价页}输入缓存命中约 0.0036/M tokens。对比 Claude Sonnet 的 3/M 输出、Opus 的 4.75/M 输出差距不是一倍两倍是一个数量级。 || 不夸张。同样的 400 万 tokens 任务用 DeepSeek V4-Pro 花 {2.26 美元 || 来源: 腾讯云开发者社区实测}用 Claude Sonnet 要花 {26 美元 || 来源: 同上}用 Opus 要花 {43 美元 || 来源: 同上}。差了整整 11 到 19 倍。 |但我真正在意的是这玩意儿配 Claude Code 好使吗价格再便宜代码写不对也是白搭。所以上周我做了一件事把 Claude Code 的后端从官方 Claude API 切到了 DeepSeek V4-Pro跑了三天真实任务——修 bug、写新模块、重构一段老的 Flask 代码。先说结论纯文字代码场景体感差距在 15% 以内。涉及视觉内容截图、UI 图转代码的时候DeepSeek 不如 Claude 原生因为多模态能力有差距。但如果你跟我一样大部分时间在跟终端和代码文件打交道——这 15% 的差距值不值 11 倍的差价你自己算。怎么配三步搞定前提条件不多装了 Claude Codenpm install -g anthropic-ai/claude-code有 DeepSeek 账号和 API Key。没有的话去 platform.deepseek.com 注册充 10 块钱够跑好久。第一步改 Claude Code 配置Claude Code 的配置文件在~/.claude/claude.json没有就新建{model:deepseek-v4-pro,fallbackModel:deepseek-v4-flash,timeout:600000,maxTokens:65536}timeout设 60000010 分钟是关键一步。DeepSeek V4-Pro 在复杂推理时首 token 延迟比 Claude 稍高默认的超时时间容易跑到一半断掉。第二步配环境变量exportANTHROPIC_BASE_URLhttps://api.deepseek.com/v1exportANTHROPIC_API_KEYsk-你的DeepSeek-API-KeyDeepSeek 的 API 兼容 OpenAI 格式但 Claude Code 默认走 Anthropic 的 Message API。怎么兼容的DeepSeek 在服务端做了协议转换——你发 Anthropic 格式的请求它翻译成自己的格式处理再转回来。这一点做得挺隐晦的官方文档里没大张旗鼓地说但实测可用。第三步验证随便跑个命令试试claude-p写一个 Python 装饰器统计函数执行时间支持异步函数正常返回就说明通了。如果超时检查 timeout 设置和环境变量是否生效。坑我替你踩了三个坑一上下文窗口别拉满V4-Pro 号称支持 100 万 token 上下文但 Claude Code 的默认行为是尽可能塞满上下文。如果你的项目很大建议手动限一下{modelContextWindow:256000,modelAutoCompactTokenLimit:200000}不然每次请求的输入 token 会把缓存命中率拉低反而不划算。坑二复杂思考任务偶尔断V4-Pro 在深度推理任务上偶尔会出现卡住的情况——不是在报错是在思考但迟迟没有输出。这时候 Claude Code 会超时。解决方案就是上面说的把 timeout 拉到 10 分钟以上。坑三折扣结束后的定价策略这其实不是坑是好消息。原本大家担心 75% OFF 是限时促销到期涨回去所以不敢在生产环境用。现在 DeepSeek 官方确认了——永久生效。但你要注意DeepSeek 的价格策略一直很激进每次新版发布都会调价。V4-Pro 永久降价不等于以后不会出 V5 再降价。所以现在的策略是放心用但关注版本迭代。什么场景最划算我跑了一周后总结了三类最适合 DeepSeek V4-Pro Claude Code 的场景|代码生成和修改最划算。这是 Claude Code 的主场也是 DeepSeek 的强项。代码类任务对多模态要求低纯文本推理为主缓存命中率极高。我的实测缓存命中率约 {96% || 来源: 量子位实测}意味着绝大部分请求都按最低价计费。 |长上下文分析。100 万 token 的上下文窗口读整个项目做架构分析非常合适。换 Claude 原生的话同样量的上下文分析费用是 10 倍以上。批量非实时任务。Claude Code 的/batch命令配合 DeepSeek V4-Flash可以低成本跑大批量代码审查或文档生成。复杂任务用 Pro简单任务切 Flash按需调配。不适合的场景UI 截图转代码、图片理解、图表分析。这些涉及到视觉能力的场景DeepSeek 跟 Claude 原生有差距该用官方还是用官方。一点感想上周跟一个朋友聊起这事他说了一句挺有意思的话AI 编程工具现在的格局有点像当年云计算刚起来的时候。AWS 贵但生态好DO 便宜但自己得折腾。最后赢的不是最便宜的也不是最强的而是让开发者觉得性价比对味的那个。DeepSeek 这次永久降价做的就是这个事——把成本从需要考虑一下变成不用想了直接用。对独立开发者和小团队来说这可能是 2026 年性价比最高的 AI 编程方案没有之一。至于大团队各有各的合规和安全要求该用 Claude Enterprise 还是用。但备一套 DeepSeek 的 key做批量任务的时候切过去成本直接砍到脚踝。我把完整配置记在了项目 wiki 里需要自取。有什么踩坑的经历评论区聊聊呗——我猜不只是我一个人看了账单之后开始琢磨替代方案的。散会。