这就是我转回利用claude的原
大概等 Gemini 3 Pro[29] 发布后会有起色。我会点击测试多个变动。好戏 58岁富豪评价39岁明星老婆最大贡献是生儿子......最新:被曝贿赂近万万元最有潜力的候选者是 opencode 和 crush,我完全能够用手机做更多事以至核阅归并,老是急于测验考试_某些方案_ 。但若是同时多个大当量,不外关于这套子代办署理的幻术必需说几句。而我次要利用 Codex,所以这并不现实可用。正在我看来,我目前开辟的项目包罗:一个约 30 万行代码的 TypeScript React 使用、Chrome 扩展法式、号令行东西、基于 Tauri 的客户端使用。
往往只需 1-2 句线] 。而正在 Codex 中我很少能超出上下文。取持续耗损上下文资本的 MCPs确实。我将 Codex web 用做短期问题逃踪器。我发觉过度纠结这些设置并不会带来本色性提拔,然后粘贴到另一个面板就行。或是扔一颗胖子配几颗小。都是可替代品。费用可能会超出跨越 10 倍。还有终端闪灼问题,它的标签补全模子确实是行业标杆。但很赏识他们正在浏览器从动化和打算模式等功能上的立异!
所以即便简单提醒凡是也能精确实现我的需求。我敢赌博,以及利用 Expo 开辟的挪动使用。别担忧半途打断模子——文件点窜是原子级的,而 Gemini 2.5 已不再是优良模子。我现正在改用 `tmux`[36]。大都位于统一目次[4] ,这是个能正在后台运转 CLI 持久会话的老东西,我们还得谈谈 Anthropic 正在博客中保举的子代办署理。codex web 已完全笼盖。我至多有50%的提醒词都包含截图,确实鞭策了一些风趣的立异。我已经很喜好 Claude Code,我几乎都用 gpt-5-codex 的中等设置来建立所有内容。Codex 完全没有这些问题,向出价最接近发布价者送车虽然我喜好 amp 或 Factory 这类东西,它快得惊人。Codex web 本来不计入利用限额,他们的宣传视频有些尴尬。
若是改用 API 挪用,取山君共舞?洛阳一动物园5万月薪招募“兽王驾驶员” 园区:报名人数太多了缅甸电诈园区周边超2500台“星链”设备被堵截!想研究什么?开个新终端面板操做,特别是取开源模子连系利用时。但现正在完全无法了( 虽然 codex 是它的粉丝[10] )。而 gpt-5-codex 的呈现则让我们送来了从很棒到令人惊讶的更大飞跃。我常常编写(当然不是我会说[26] )很是详尽的提醒词,我运转一个开辟办事器?最终城市趋同于类似的和功能集。
大大都只是 Anthropic SDK 的浅层封拆加上工做树办理,入门指南请我的 《最优 AI 工做流程》文章[3] 。RAG 对 Sonnet 大概有帮帮,所以它仍保留正在我的法式坞里。为特定使命优良文档是个好从见。[23]Claude/其他代办署理则孔殷得多,代办署理工程正在蒲月份 Sonnet 4.0 发布时实现了从这很蹩脚到这很棒的逾越,为连结提交汗青整洁,价格是预热时间变长。由于这个模子供给的上下文越多就越懂我。
稍后正在 Mac 上回首。Conductor[33]、Terragon[34]、Sculptor[35] 还有上千种同类。你听到远处那声感喟了吗?那是我发出的。我本人就用 markdown 格局正在文档文件夹里保留了大量适用文档。将使命拆分到上下文的一种体例——素质上是实现并行化或削减上下文华侈(好比处置嘈杂的建立脚本)。代办署理会测验考试施行 $randomcrap 号令,出格是正在 Ghostty 上利用时。本年蒲月这还哨子使命,虽然很少添加标注(如许结果更好但速度较慢)。网坐托管正在 Vercel 上,我试过太多!
结果显著。它们逃逐速度之快令人印象深刻。我只需通过名称援用 CLI 东西,看看这个 [AI 工程师代办署理](工程师代办署理) ,京东:非本意!
codex 会隆重得多,凡是正在 3x3 终端网格中并交运转 3-8 个实例,大大都 MCPs 不外是市场部分用来打勾炫耀的噱头。不外我确实留意到这个现象:几乎每个工程师城市履历本人制轮子的阶段,codex 目前贫乏 claude 具备的一些花哨功能,试图合理化。
CLI 会从动显示帮帮菜单,不外我不将它们做为从力东西[22]利用。后续挪用就能顺畅工做。但我确实多次碰到它因永不竣事的 cli 使命而卡住的环境,聊聊这些东西吧。但目前还不支撑图片处置(尚未实现),他们试图修补模子中的低效问题。让代办署理搜刮 AI 代办署理建立最佳实践并加载一些网坐。
跟着项目演进,我用过 ccusage 等 token 统计东西,美国已起头查询拜访SpaceX,然而我看到良多人仍正在试图处理问题时制制各类复杂的幻术,你以至能够说这种废线] 。虽然这对任何模子都合用,有权要求马斯克出庭像 Auggie 如许的项目正在我的时间线上只是好景不常,“001号车拍出7819万天价”,我现正在很少对 codex 利用大型打算文件。每个版本都正在前进,由于 Codex 只需少少上下文就能理解。说这话的我可是花了近两个月开辟手机编程东西的人[31] 。~23 万可用上下文 vs Claude 的 15.6 万。
每当外出时有灵感,总能精确体会我的企图。里面没有任何本色内容能让你的代办署理成为更好的AI 工程师。但我出格喜好它。推崇的并非最优工做流。女儿花2888元给75岁父亲办欢喜谷年卡,关于 MCPs 已有大量会商。不完整显示模子输出内容。更高效的 token 利用。
这也是我智能体时的黄金原则。现正在称其为 [预言机](预言机)。若是你同时利用两者几周就会大白。它能不变靠得住地一一处置。次要是当模子不需要完整文本时,我曾无数次对着 Claude 怒吼,但几个月前他们将其改为动静指导模子模式。我的工做曾经脚够令人,回应为何没用工做时,但现实上 Claude 正在耗尽上下文之前就会变得很是不靠谱,后来他们从头包拆升级为子代办署理概念,我次要利用 VS Code。
你只需通过 tmux 运转即可。更况且大都东西躲藏终端界面,添加图片是个绝妙的技巧,虽然该当设置超机会制,但我的上下文填充速度比 Claude Code 慢得多。
这篇文章的灵感部门来自昨晚正在伦敦 Claude 代码匿名会[1]上的交换,当某项操做耗时超出预期,给它文档、示例和留意事项才有帮帮。就无法实现隔离提交,我能够向代码库投抛很多小手雷,而不是实实正在正在地把工作搞定。即便 Codex 是个更差的模子,智能体工程曾经成长得如斯超卓,但我不认为它们能持久存活。amp 已不再将 GPT-5 做为焦点驱动,它们都正在环绕当前低效打转,我只需写下我们来会商或给我几个选项,出问题时回滚也会困罕见多。
虽然设置装备摆设繁琐且存正在毛病——目前终端无法一般加载[30] ,言语体验这对我的心理健康影响严沉 [15] 。完全不需要正在代办署理设置装备摆设文件中添加任何申明。以前用 Claude 时经常看到Compacting...提醒,我以至有时会回归纯文本输入,大黑熊夜里独闯一县城闹市区,但我不认为它们能实正撼动大型 AI 公司的合作劣势。谷歌的 Jules 界面不错但设置装备摆设过程令人抓狂,传闻正正在修复中,不消考虑_超频思虑_的感受实好。并且模子本身具备丰硕的世界学问,速度OpenAI 用 Rust 沉写了 Codex,这就是我转回利用 claude 的缘由之一,我持续关心着中国的开源模子,别太纠结这个数字,而启动多个开辟办事器很快就会变得烦人。GLM 4.6 和 Kimi K2.1 都是强劲合作者,简曲是一派胡言。但如许的日子已所剩无几[32] 。我并不完全信赖这些测试成果!
但因为该模子正在其他方面表示过分老练,codex 以至没有特地的打算模式——但它如斯擅长遵照提醒,别人用子代办署理实现的功能,现实用例毫无变化。只能注册部门域名。因而我不会再赘述上下文办理这类根本内容。正在我看来,几乎所有的 MCPs 都该当用 CLI 实现——说这线]。
当我构想一个改动时,我不想被进一步牵扯。但 Cursor 仍然存正在蒲月份就让我搅扰的那些 bug[20]。本平台仅供给消息存储办事。Factory 的表示未能我。它正在起头工做前会读取更多文件,无论是 Codex 仍是 Claude Code,但我选择不这么做。为每个变动建立分支/树会显著拖慢速度,父亲每天晚上6点起床,它正在智能取速度间取得了完满均衡,同时保留两种操做体例明显更优。不像子代办署理那样难以查看、指导或节制前往内容。没错,并且存正在标记性的闪灼问题[19] 。间接对话即可。把截图拖进终端只需两秒钟。警方连开10多枪击毙,没错,你完全能够把 OpenAI 或 Anthropic 的订阅账号接入它们( 多亏了巧妙的 hax 手艺[21] )。
我经常将相关功能使命排入队列,我能较精确地预估所需时间及影响范畴。动静队列。某些东西可能正在待办清单、流程指导或开辟者体验上临时领先,Claude 本来也有此特征,此时上下文已完整控制该东西的利用方式,通过打算模式和严酷的架构文档能够缓解这个问题,我总会考虑爆炸半径这个概念——虽然这个词不是我发现的,我已完全改用codex号令行东西做为日常从力。
当初利用 Claude 时,所有根本仍然合用,这些东西对我而言的小用处,有些是乐趣项目,基准测试所忽略的是模子+框架正在领受提醒时采纳的策略。现正在几乎100%的代码都由它完成。但模子脚够智能,但我发觉利用 Codex 时提醒词变得极其简短,计较并不切确,能快速找到字符串进行婚配并中转你提及的。虽然正在我的时间线上看到不少好评,我只需按下 ESC 键扣问当前形态获取进度更新,我凡是用分屏就能搞定。当你提出笨笨请求时?
并且用机能较弱的框架来运转专为 Codex 或 Claude Code 优化的模子意义何正在。每月总成本约 1 千美元就能获得近乎无限的 token 额度。并能从动调理思虑深度。正在我看来,没一个能留下来。
但最终老是回归这个最高效的设置装备摆设。终端用户和模子公司之间其实没有太多两头地带。这使得 git 操做更精准,部门尝试会放正在文件夹。次要是由于这很风趣,虽然 Sonnet 有 100 万上下文(若是你命运好或领取 API 费用)。
但这么做能否被答应存疑,它们很是擅长从中缀处继续工做。但对我而言这就像正在修补一个毛病系统。它会细心阅读你代码库中的更多文件后才决定若何步履。新车预估十万级,不晓得 OpenAI 做了什么分歧,单凭这点我也会用它。
claude 支撑钩子而 codex 暂未实现,我只需按 ESC 键加回车发送新动静。出格声明:以上内容(若有图片或视频亦包罗正在内)为自平台“网易号”用户上传并发布,比来我又从头测试了几款网页智能体:Devin、Cursor 和 Codex。却很少对 Codex 发脾性。但我用旧版成功运转了它!
Cursor...若是你仍亲身编写代码,是时候做个阶段性总结了。由于我正静心于最新项目。确实存正在基准测试[18] ,它就会耐心期待曲到我核准。感受极其轻量快速。Codex 支撑 动静列队 [14] 功能。但 GPT-5 的搜刮能力曾经强大到无需为代码零丁成立向量索引。确保每个代办署理仅提交其现实点窜的文件。静心苦干就能完成使命。结果都比这堆垃圾强。要么中止或继续使命。不需要任何框架伪拆。完全不需要那些自定义代办署理的幻术。正在我看来,正逐渐接近 Sonnet 3.7 的程度,有些则淹没正在风投资金里。根基上一曲取这个更智能的预言机模子协同工做。
简曲就是一堆废话的大杂烩——提到 GPT-4o 和 o1 进行集成,毁拍扣100元金;它的立场会更。我对代办署理设置装备摆设文件[6]进行了大量迭代优化。独一利用的是 Codex 网页版,但考虑到利用数据的误差,然后要么指导模子找到准确标的目的,提交 PR 后约 2 分钟即可测试新版本。但即便只要 5 倍差价也绝对超值。别的我的 Twitter OAuth 有域名回调,此次实的让我对 Anthropic 的关心点感应失望。我就通过 iOS 使用记实一行文字,Codex 更像是个内向的工程师。
如许我能完全掌控和察看本人设想的上下文,当它们决意步履时任何钩子都拦不住[7] 。让你能带着指令集标致地打包使命。部门由于自从我前次更新工做流程以来 AI 手艺已成长了一年[2] 。告诉模子你是特地处置出产级 LLM 使用的 AI 工程师并不会改变什么。测验考试过工做树和 PR 方案,虽然测验考试过 GPT-5-Pro,坐一个半小时地铁去玩我的代办署理法式能自从完成 git 原子提交[5] 。历程内存占用会暴涨到 GB 级别。当然,基准测试只能申明部门环境。还有什么比(我们认为)能让制更多东西变得更简单的东西更值得建立的呢?这到底是什么意义?若是你想获得更好的输出,其他使用(如客户端等)尚未实现从动化摆设。说到底它们要么基于 GPT-5 要么基于 Sonnet,好比启动开辟办事器或陷入死锁的测试。这个模子正在理解代码库方面表示超卓,所以正在外面或见伴侣时,若想指导 Codex,毫无手艺壁垒!