“血亏,我花3000+元用Claude做游戏,结果还不如去「白嫖」Gemini 2.5……”
16 小时前 / 阅读约9分钟
来源:36kr
不同模型与工具之间的体验差异,往往让人又爱又恨。

【CSDN 编者按】AI 编程助手的不断升级,让越来越多开发者将它们融入实际项目流程中。然而,不同模型与工具之间的体验差异,往往让人又爱又恨。本文作者在尝试用 Claude 开发游戏并为此付出 417美元后,再次挑战使用 Gemini 2.5 + Cursor 打造新作——而这一次,不仅完全免费,整体开发体验也“大幅超预期”。

几周前,在某个夜深人静的夜晚,我突然想到了个点子:要不抽空做个 Scrabble 风格的拼字游戏?想着这几年现在 AI 编码助手这么火,干脆我也来试试吧。

结果就是:一通狂轰滥炸的提示词、417 美元(约合人民币 3042 元)的 Claude API 费用、外加摄入几乎“致死量”的咖啡之后,我终于做出了一个能玩的游戏——LetterLinks。

花了 417 美元,用 Claude 做游戏的“痛苦”过程

由于没啥经验,我一开始给 Claude 的提示词非常简单:“给我做个像 Scrabble 的游戏。”对的,没有 UI 草图、没有流程图,连样式要求都没有,但 Claude 就能直接吐出一大串工作代码——说实话,那一刻我真的有些震惊。

比如,我提出希望加个技能等级系统,以展示玩家的成长轨迹,Claude 不仅理解了,还主动把这个功能给我加上了。虽然还有些小 bug,但总体效果我自己还挺满意的,能明显看出来是 Claude 和我一起“写”出来的。

不过相比优点,Claude“拉垮”的地方显然更多:

灾难级别的上下文窗口

项目代码量一多,Claude 就控制不住地开始失智。到了 1.5 万行代码左右,它已经变成了“啊,你刚才说什么了”的智障程度:

我:“请修复一下主题检测中的 bug。”

Claude:“不好意思,主题检测是啥?”

我:“……就是我们上周一直在搞的那个啊!”

后来,我几乎每隔一会就得用 /claude compact 命令压缩上下文。

最烦人的那句:“我找到了!”

整个开发过程中,我最怕 Claude 说那句“我找到了!”:

Claude:“我找到 bug 了!一定是这行代码。”

(执行修复……Bug 依然存在)

Claude:“哦我懂了,真正的 bug 其实在这里……”

Claude 就一直这么反复,直到我开始质疑人生。更别提它有时候自信满满地“修复”一个问题,结果又顺带引入了三个新 bug。

花费飙升,钱包在痛

而真正让我破防的,是那飞速上涨的账单:

第 1 周:核心逻辑基本写完,花了大概 100 美元;

最后 1 周:一个小小的动画效果,却因为 Claude 忘记了整个代码结构需要“重学”,又花了我 20 美元……

你说测试?不存在的

Claude 写代码的水平还可以,但它永远无法验证自己写的对不对。所以,每一次小改动都变成:Claude 写代码 → 我测试 → 我反馈问题 → Claude 道歉再试……重复以上步骤,直到我一度想要转行。

如果你问我花 417 美元买这体验值不值?嗯……我觉得其实还行吧,毕竟找个外包开发可能至少得 2000-3000 美元。

但你要说这达到了广告里那种“AI coding 美梦”?那真不至于——Claude 充其量就是一个有点想法但需要全程盯着的小实习生,偶尔能灵光乍现,但也可能把项目毁个精光。

用 Gemini 2.5 + Cursor 的开发体验如何,比 Claude 好多少?

意料之中,当时许多人听完我做 LetterLinks 的经历,反应大多是:“游戏不错,但你居然为了个 AI 写的半成品掏这么多钱,真傻。”

于是隔了半个月,我又做了一个类似的拼字游戏,名字叫 Gridagram——但这回,几乎是全程用 Gemini 2.5 Pro+Cursor 完成的。

你猜,这次我花了多少钱?答案:0 元!

而且相比之前“花 417 美元+摄入致死量咖啡提神”的 Claude 开发体验,说实话,这次用 Gemini 的体验真是好太多了。

成本为零:根本性上的变化

先说最直接的改变——不用花钱。从 Claude 的 API 费用 417 美元,到 Gemini 2.5 +Cursor 的免费方案,这种转变简直是天壤之别。这意味着什么?我终于可以放心大胆地折腾和试验 了!

上下文窗口更长,理解能力也更强

如上文所说,Claude 最大的问题之一,就是上下文窗口太容易失效,我总得重新贴代码、解释逻辑。但 Gemini 配合 Cursor 后,情况大为改善:Cursor 能自动把文件结构、diff、项目上下文传给 Gemini,整个过程就像有个记性不错的队友。

虽然 Gemini 偶尔还是需要手动提醒,但多数情况下它基本都“知道我在做什么”,这点比 Claude 好多了,很大程度上改善了我的开发过程。

更像真实的结对开发

我个人体验下来,在 Cursor 里的对话流程更像是在和一个搭档结对开发,而不是在和一个聊天机器人自言自语。比如:

“读下 useLetterSelection.ts 的 50-100 行。” → 它会准确读取。 

 “好的,在这里添加一个 useEffect 来更新 currentWord。” → 它会立刻生成 edit_file 调用。 

“运行 git add,commit,push;npm run build,firebase deploy。”→  它会自动执行终端命令。

从分析到写代码再到部署,这一整套链条都可以在 IDE 里顺畅跑完,体验比 Claude 网页版要丝滑很多。

Debug 更理性、不搞什么“花活”

虽然 Gemini 也会犯错,但它不会像 Claude 那样频繁陷入 “我找到 bug 啦”→“哦不对,我重新找”→“这次真的找对了!”这种几乎逼疯我的死循环。

我们一起修过的 bug 包括:桌面端拖拽、移动端回退、旋转选词、单词预览状态更新等问题——虽然 Gemini 也不总是第一次就改对,但它的 bug 相对更容易识别也更容易修复。

也不是完全没有问题

不过,我也还是要说一句:但别高兴太早,AI 依然是 AI。

(1)仍需人类监督与测试

有一件事必须说清楚——Gemini 不可能自动写出完美、无 bug 的代码。它还是会引入回归问题、偶尔也会误解需求,你仍然自己测试所有内容。此外 Gemini 不会玩游戏或查看 UI,也只能靠你来验证实际效果。

(2)仍会出现幻觉和错误编辑

Gemini 有时候会“想当然”,做一些奇怪修改,比如删掉还在用的变量、错误地合并代码块,结果直接导致构建失败。所以你可能需要手动修复,或者让它重来一遍。此时,Cursor 的 Reapply 工具有时候能帮上点忙。

(3)架构还得你自己来定

它可以根据你的需求实现功能,但并不会帮你设计架构、做高层决策。你可以把它看作一个 手速飞快但需要你指挥的中级开发者,你要告诉它具体要做什么,它才能给你反馈。

所以,到底值不值得?

和之前花费 417 美元的 Claude 开发体验比?一句话总结:Gemini 2.5 + Cursor 简直值爆了。

“0 元开发”固然很香,但真正让我决定继续用 Gemini 的,是它上下文处理能力的进步,以及 Cursor 提供的无缝集成体验。

如果说 Claude 更像一个有才但健忘、还经常搞砸项目的实习生,那 Gemini 2.5 Pro 在 Cursor 里,就像是一个偶尔抽风但非常能干的中级工程师:开发速度超快、基本都很稳定可靠、能更好地理解项目上下文……不过还是那句话,AI 还是需要你的清晰指令及测试验证。

至于我的下一步计划,应该还是会继续用这类有 IDE 深度集成 的 AI 编程助手:Claude 给我的是“试试 AI 写代码”的体验,而 Gemini 给我的则是“AI 成为日常开发助手”的实感——两者根本不在一个维度。

最后,我也很想听听其他开发者用 Gemini 2.5 做项目的体验,特别是在 Cursor 里或其他 IDE 里的。你们有没有什么好用的提示词技巧,或者特别推荐的工作流程?

原文链接:

https://www.reddit.com/r/ChatGPTCoding/comments/1k46x92/i_got_slammed_on_here_for_spending_417_making_a/

https://www.reddit.com/r/ClaudeAI/comments/1jpddbf/i_blew_417_on_claude_code_to_build_a_word_game/