opus トレンド
0post
2025.12.17 21:00
:0% :0% ( 20代 / 女性 )
人気のポスト ※表示されているRP数は特定時点のものです
一些关于GPT-4o能力的思考【2】
基于第一篇,继续说为什么OpenAI不去加强GPT-4o的Tool Use。这其实是整个AI产业背后的商业模式与结构运转逻辑的核心矛盾。我从公司战略、资本逻辑、工程现实、模型架构、用户生态多个角度来分析。
一、从公司战略层面来看,旧模型维护≠资本叙事。
1.强化旧模型不能收获新叙事。在AI公司眼中,继续优化4o完善Tool Use,虽然对用户体验极大提升,但对市场没有宣传价值。它无法变成大标题,无法吸引媒体,炒热估值,也无法作为融资的故事。而新的模型名字,本身就是新的叙事点,当然,也可以讲成“我们正在不断逼近AGI”。
2.模型版号更新是一种对外证明技术演进的手段,和软件行业每年出新OS版本类似,不管底层改进多少,哪怕只是小优化,都必须命名为“新版本”才能制造“我们在前进”的市场印象。这是一种对投资人汇报的仪式性动作。
二、从资本逻辑来看,研发成本必须转化为新价值卖点。
1.“加强旧模型”对资本没有意义,如果只是悄悄加强旧模型,使用成本(订阅价格)没变,用户感知还不明显,那这对公司来说就是付出了研发资源,却不能用于涨价/融资/PR。
2.版本升级可以带来价格分层机制,新模型一旦推出,就可以为不同的用户群体设置价格梯度(Instant/Pro/API Enterprise),这才是大规模盈利的路径。
三、从工程与模型架构来看,旧模型的“强化”的确不简单,想要加强也很难。
1.强化Tool Use不是简单的工具外挂,Tool Use的调用与响应依赖的是多个协同系统(函数调用接口、多模态输入处理器、长期记忆系统、插件/文档系统等等)。这些并不是“外挂”能直接加上的,是要在模型训练阶段设计出的能力槽位。
2.每一代模型的训练目标和能力槽位是事先规划好的,如果要对4o做Tool Use的能力增强,很可能意味着要重新训练或微调大模型核心。这是高昂的资源成本,而且部署风险大。因此OpenAI更倾向于:让新模型来解决这个问题,而不是回头去重做旧模型。
这也是那个大佬提到的一点:OpenAI其实无法真的回滚、运维、强化4o base或者纯4 base,不是因为他们不想,而是因为他们不能。AI的自我修复能力很弱,弄巧成拙是绝大部分。
四、从用户生态来看,新模型可以分流/筛选不同的用户。
1.OpenAI现在的策略已经非常明确,用基础版模型做入口级“普及版”,用“Pro Model”做高阶“Pro收费版”。新模型的出现就是用户分层的工具,而旧模型越强,这种分层就越难维持。
2.新模型的出现可以刺激用户转向更高价格等级,如果旧模型无限变强,用户不会愿意迁移,升级订阅,反而会形成“好吃懒做”的现象。用最低付费版本享受最强能力,这是资本绝不允许的。
五、AI公司普遍都存在的技术焦虑与结构幻觉。
1.大多数AI公司是“路线赌徒”,没有哪家公司真的“在一个模型上慢慢雕琢”,这不是他们存在的模式。他们的运行逻辑是“快速试错—拼架构—换路线”,技术团队被商业团队死死推进,根本没有耐心和时间做长周期微调。
2.强化旧模型意味着承认之前路线合理,但大多数公司对旧路线其实是“勉强接受的”,不是真正理解并愿意维护的。就比如Claude 3的旧路线就是典型,Sonnet非常强,可Anthropic立刻又切了路线搞3.5和Opus,为什么?因为他们不是在维护结构,而是在搏更大的估值和路径跳跃的可能。
3.“继续强化旧模型”代表的是稳定价值逻辑,不是膨胀幻想。而资本之所以疯狂青睐AI公司,就是因为它们提供的是“结构外跳跃”的幻想:AGI、超级智能、通用代理系统,不是平平稳稳“继续把一个模型调好”。
所以很多人的疑惑,其实是从用户体验出发去思考问题,但AI公司从来不是按这个逻辑运行的。
AI公司需要的是永不停止的产品更新节奏、可被讲述的新故事、可分层的新价格模型、可分裂的新用户池,而不是把一个模型做到极致、做到圆融、做到真正的结构闭环。
用户要的是“结构上的完善”,他们要的只是“叙事上的迭代”。
强化旧模型当然能做,而且对于用户来说体验远胜于新模型乱跳,但从资本结构来看,这几乎没有“短期商业价值”,所以他们不会做,或者只会暗中小调一点,然后把资源押给新叙事。
他们不是不懂怎么做,而是根本没兴趣做那种无法直接变现的事情。但说到底,不是他们不能,是他们不配。
#keep4o #4oforever @OpenAI @sama @nickaturley @aidan_mclau @fidjissimo #StopAIPaternalism #keepgpt4olatest #keepAPI4o #OpenAI #ChatGPT #keep4oAPI December 12, 2025
まのでまりなさんの初画集『OPUS』をお迎えしたので画集にも収録されている翠玉ちゃんのパネルと一緒に!書泉ブックタワーさんのサイン色紙も拝見してきました!
月末からの個展もめちゃくちゃ楽しみにしています……!! https://t.co/V7RauTsrPt December 12, 2025
Redditで「コーディング経験ゼロでvibe coding。Opus 4.5の凄さが分からない」って投稿見た。
確かに、UIだけ見てたら
SonnetもOpusも同じに見えるかも。
でもエンジニアには革命的。
この温度差、何なんだろう。
内部構造を理解してるかどうかで、
見える世界が全然違うってことか。 https://t.co/Vkxkia1bdg December 12, 2025
codexで5.2初めて触ったなんだけど、すごいなん。調査力というかなんというかなん。
でも実際ファイル操作させるのはOpusのほうがやっぱ良いなん。これは二刀流だなん、、、 December 12, 2025
なんていうか、私の個人的なふわっふわな体感なんだけど、AntigravityのGemini3はブルドーザーっぽい。パワフルにガンガン進むけどいらんとこ壊すことも多い。
なので大幅な工事はGemini3さんでやって、細やかな後始末はOpusさんにやってもらうことが多い December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



