开运体育 我把Cursor和Copilot齐扔了: 实测Token从120万砍到4万


Claude Code称霸后,我把Cursor和Copilot齐扔了:实测Token从120万砍到4万
上周,Graphon AI 低调完成 830 万好意思元融资,推出 “pre-model intelligence layer” 来科罚企业多模态数据关联难题;简直吞并期间,Anthropic 发布了 Dreaming 机制,让 Agent 或者在 session 间自我疑望和迭代动作。
这两件事重复在通盘,让我这个带队作念 AI 测试和企业级 Agent 落地的老兵忍不住把 coding 器具栈又全部重测了一遍。往常半年,咱们团队在里面股东 Agentic workflow,代码联系任务占比特等 60%。以前靠指示词 + 直率 RAG 硬刚,目下玩法饱和变了。
开云体育官方网站 - KAIYUN确凿痛点任务
我选了一个典型的留传系统重构任务:
一个约 2.8 万行 的 Java Spring Boot 奇迹,触及 6 个微奇迹调用、老旧 JPA 查询和手写缓存逻辑。条目重组成撑抓 Agentic payment、当代 observability、添加 guardrails,并输出完整迁徙报告。

第一轮:Cursor 3.1 + Composer 2(4月版块)
使用 Cursor 并行 Agent 模式,喂完整 repo + AGENTS.md。
耗时约 45 分钟 交互,模子在 Sonnet 4.x 和 Opus 间切换。
完成度约 70%,但 payment 综合层与 guardrails 出现澄澈突破,observability 也漏了中枢 metric。
总 Token 耗尽约 120 万,后续东谈主工诞生花了 2.5 小时。
中枢问题是:Cursor 在跨文献缱绻上深度不够,碰到跨奇迹一致性问题时容易堕入局部最优,需要抓续东谈主工纠偏。
第二轮:Claude Code(Opus 4.7 + Dreaming preview)
吞并任务,径直扔 repo + 详备指示,开运体育官方网站先让它 plan 再实施。要道是用上了刚发布的 Dreaming 才智——它会在子任务间主动暂停、自我 review,寻找 pattern 和潜在 bug。
扫数历程灵验交互仅 18 分钟。
Payment 综合层处理得特殊合理,guardrails 和 temporal memory 也更干净。
总 Token 耗尽约 4.2 万,东谈主工介入仅 40 分钟,全体质料澄澈特等一个线索。

确凿差距就这样大。不是单纯模子更强,而是 Claude Code 的 long-running task handling + self-verification loop,大幅压缩了“指示词拉扯”动作。
Copilot 也测了。在 inline 补全和小重构上依然设备,但濒临这种跨奇迹、带 Agentic 语义的任务就力不从心,需要手动不停多个 chat,落魄文全靠东谈主脑。
我的中枢不雅点
指示词工程在 Agentic Coding 时间如实正在快速过期。
往常咱们把 80% 的元气心灵花在写无缺 prompt 上,目下更清苦的是联想 Agent 的“操作系统”:明晰的 AGENTS.md、合理的 repo 结构、器具显现形态,以及完整的 feedback loop。Claude Code 的 Dreaming 内容上即是把“东谈主类反念念”这个动作工程化了。
诚然,不是说 Cursor 和 Copilot 没价值:
Cursor 的 IDE 集成依然顶级,合乎宽敞小修小补;
Copilot 合乎团队互助的 autocomplete。
我目下的坐褥栈是:Claude Code 主力考究复杂 Agent 任务 + Cursor 赞助剪辑 + Copilot 保留在轻量活水线。

跟着 Agentic AI 从实验走向坐褥(Gartner 展望 2026 年 40% 企业利用将镶嵌 task-specific agents),coding 器具的输赢手仍是不是“谁的模子更强”,而是谁能信得过把 缱绻-实施-考据 闭环作念好。
传统 RAG 在长落魄文模子(Claude 百万 token 级别)眼前被消弱,但 Agentic RAG(带 critic、reflection 和 graph memory)反而变得愈加清苦。Graphon AI 推的 pre-model intelligence layer,很可能即是下一块要道拼图。
你目下主力用哪个 coding Agent?
接待在驳斥区共享你真实凿体验开运体育,尤其是 Claude Code Dreaming 在践诺神色中的进展,以及你在企业落地中踩过的坑。