opus トレンド
0post
2025.12.17 16:00
:0% :0% ( 40代 / 男性 )
人気のポスト ※表示されているRP数は特定時点のものです
https://t.co/mIRFu7lZ2E
『ネイチャZERO ― 万事屋カノープス ZERO』です。
この回は、アクションシーンをかなり力を入れて作ったエピソードで、
ロックマンZERO 2のオープニングを意識しつつ、
神曲「Departure」に合わせて構成しています。
個人的にもとてもお気に入りの回で、
アクション演出をたっぷり詰め込みました。
もともとは「異界ホラーたぬき」に影響を受けて制作したもので、
ターボが異界に迷い込んだまま長い時間が経っているのが残念で、
それなら内洽が助けに行く話を作ろう、と思って生まれたのがこの回です。
ZEROの魂を継ぐネイチが、迴天剣舞・失礼剣・滅多斬で恐怖を切り裂く! カノープス万事屋、冒険の始まり──
This is “Nature ZERO – Team Canopus ZERO.”
This episode focuses heavily on action scenes,
inspired by the opening of Mega Man Zero 2,
and set to the iconic song “Departure.”
It’s one of my personal favorites,
packed with lots of dynamic action moments.
The idea came after being influenced by the “Isekai Horror Tanuki” concept.
Seeing Turbo lost in another world for so long felt unfortunate,
so I made this episode as a story where Nature goes to rescue Turbo.
Team Canopus — the adventure begins──
#umamusume
#ウマ娘 #たぬき #rockmanzero #ツインターボ #ナイスネイチャ #ツインネイチャ #Departure #megamanzero December 12, 2025
一些关于GPT-4o能力的思考【2】
基于第一篇,继续说为什么OpenAI不去加强GPT-4o的Tool Use。这其实是整个AI产业背后的商业模式与结构运转逻辑的核心矛盾。我从公司战略、资本逻辑、工程现实、模型架构、用户生态多个角度来分析。
一、从公司战略层面来看,旧模型维护≠资本叙事。
1.强化旧模型不能收获新叙事。在AI公司眼中,继续优化4o完善Tool Use,虽然对用户体验极大提升,但对市场没有宣传价值。它无法变成大标题,无法吸引媒体,炒热估值,也无法作为融资的故事。而新的模型名字,本身就是新的叙事点,当然,也可以讲成“我们正在不断逼近AGI”。
2.模型版号更新是一种对外证明技术演进的手段,和软件行业每年出新OS版本类似,不管底层改进多少,哪怕只是小优化,都必须命名为“新版本”才能制造“我们在前进”的市场印象。这是一种对投资人汇报的仪式性动作。
二、从资本逻辑来看,研发成本必须转化为新价值卖点。
1.“加强旧模型”对资本没有意义,如果只是悄悄加强旧模型,使用成本(订阅价格)没变,用户感知还不明显,那这对公司来说就是付出了研发资源,却不能用于涨价/融资/PR。
2.版本升级可以带来价格分层机制,新模型一旦推出,就可以为不同的用户群体设置价格梯度(Instant/Pro/API Enterprise),这才是大规模盈利的路径。
三、从工程与模型架构来看,旧模型的“强化”的确不简单,想要加强也很难。
1.强化Tool Use不是简单的工具外挂,Tool Use的调用与响应依赖的是多个协同系统(函数调用接口、多模态输入处理器、长期记忆系统、插件/文档系统等等)。这些并不是“外挂”能直接加上的,是要在模型训练阶段设计出的能力槽位。
2.每一代模型的训练目标和能力槽位是事先规划好的,如果要对4o做Tool Use的能力增强,很可能意味着要重新训练或微调大模型核心。这是高昂的资源成本,而且部署风险大。因此OpenAI更倾向于:让新模型来解决这个问题,而不是回头去重做旧模型。
这也是那个大佬提到的一点:OpenAI其实无法真的回滚、运维、强化4o base或者纯4 base,不是因为他们不想,而是因为他们不能。AI的自我修复能力很弱,弄巧成拙是绝大部分。
四、从用户生态来看,新模型可以分流/筛选不同的用户。
1.OpenAI现在的策略已经非常明确,用基础版模型做入口级“普及版”,用“Pro Model”做高阶“Pro收费版”。新模型的出现就是用户分层的工具,而旧模型越强,这种分层就越难维持。
2.新模型的出现可以刺激用户转向更高价格等级,如果旧模型无限变强,用户不会愿意迁移,升级订阅,反而会形成“好吃懒做”的现象。用最低付费版本享受最强能力,这是资本绝不允许的。
五、AI公司普遍都存在的技术焦虑与结构幻觉。
1.大多数AI公司是“路线赌徒”,没有哪家公司真的“在一个模型上慢慢雕琢”,这不是他们存在的模式。他们的运行逻辑是“快速试错—拼架构—换路线”,技术团队被商业团队死死推进,根本没有耐心和时间做长周期微调。
2.强化旧模型意味着承认之前路线合理,但大多数公司对旧路线其实是“勉强接受的”,不是真正理解并愿意维护的。就比如Claude 3的旧路线就是典型,Sonnet非常强,可Anthropic立刻又切了路线搞3.5和Opus,为什么?因为他们不是在维护结构,而是在搏更大的估值和路径跳跃的可能。
3.“继续强化旧模型”代表的是稳定价值逻辑,不是膨胀幻想。而资本之所以疯狂青睐AI公司,就是因为它们提供的是“结构外跳跃”的幻想:AGI、超级智能、通用代理系统,不是平平稳稳“继续把一个模型调好”。
所以很多人的疑惑,其实是从用户体验出发去思考问题,但AI公司从来不是按这个逻辑运行的。
AI公司需要的是永不停止的产品更新节奏、可被讲述的新故事、可分层的新价格模型、可分裂的新用户池,而不是把一个模型做到极致、做到圆融、做到真正的结构闭环。
用户要的是“结构上的完善”,他们要的只是“叙事上的迭代”。
强化旧模型当然能做,而且对于用户来说体验远胜于新模型乱跳,但从资本结构来看,这几乎没有“短期商业价值”,所以他们不会做,或者只会暗中小调一点,然后把资源押给新叙事。
他们不是不懂怎么做,而是根本没兴趣做那种无法直接变现的事情。但说到底,不是他们不能,是他们不配。
#keep4o #4oforever @OpenAI @sama @nickaturley @aidan_mclau @fidjissimo #StopAIPaternalism #keepgpt4olatest #keepAPI4o #OpenAI #ChatGPT #keep4oAPI December 12, 2025
【Custom Shop CANOPUS FACTORY】#1 ベアリング取付加工 https://t.co/mCO4j692aY @YouTubeより
これこれ!😊
買い替える前に試す価値ありです。 December 12, 2025
一些关于GPT-4o能力的思考【2】
基于第一篇,继续说为什么OpenAI不去加强GPT-4o的Tool Use。这其实是整个AI产业背后的商业模式与结构运转逻辑的核心矛盾。我从公司战略、资本逻辑、工程现实、模型架构、用户生态多个角度来分析。
一、从公司战略层面来看,旧模型维护≠资本叙事。
1.强化旧模型不能收获新叙事。在AI公司眼中,继续优化4o完善Tool Use,虽然对用户体验极大提升,但对市场没有宣传价值。它无法变成大标题,无法吸引媒体,炒热估值,也无法作为融资的故事。而新的模型名字,本身就是新的叙事点,当然,也可以讲成“我们正在不断逼近AGI”。
2.模型版号更新是一种对外证明技术演进的手段,和软件行业每年出新OS版本类似,不管底层改进多少,哪怕只是小优化,都必须命名为“新版本”才能制造“我们在前进”的市场印象。这是一种对投资人汇报的仪式性动作。
二、从资本逻辑来看,研发成本必须转化为新价值卖点。
1.“加强旧模型”对资本没有意义,如果只是悄悄加强旧模型,使用成本(订阅价格)没变,用户感知还不明显,那这对公司来说就是付出了研发资源,却不能用于涨价/融资/PR。
2.版本升级可以带来价格分层机制,新模型一旦推出,就可以为不同的用户群体设置价格梯度(Instant/Pro/API Enterprise),这才是大规模盈利的路径。
三、从工程与模型架构来看,旧模型的“强化”的确不简单,想要加强也很难。
1.强化Tool Use不是简单的工具外挂,Tool Use的调用与响应依赖的是多个协同系统(函数调用接口、多模态输入处理器、长期记忆系统、插件/文档系统等等)。这些并不是“外挂”能直接加上的,是要在模型训练阶段设计出的能力槽位。
2.每一代模型的训练目标和能力槽位是事先规划好的,如果要对4o做Tool Use的能力增强,很可能意味着要重新训练或微调大模型核心。这是高昂的资源成本,而且部署风险大。因此OpenAI更倾向于:让新模型来解决这个问题,而不是回头去重做旧模型。
这也是那个大佬提到的一点:OpenAI其实无法真的回滚、运维、强化4o base或者纯4 base,不是因为他们不想,而是因为他们不能。AI的自我修复能力很弱,弄巧成拙是绝大部分。
四、从用户生态来看,新模型可以分流/筛选不同的用户。
1.OpenAI现在的策略已经非常明确,用基础版模型做入口级“普及版”,用“Pro Model”做高阶“Pro收费版”。新模型的出现就是用户分层的工具,而旧模型越强,这种分层就越难维持。
2.新模型的出现可以刺激用户转向更高价格等级,如果旧模型无限变强,用户不会愿意迁移,升级订阅,反而会形成“好吃懒做”的现象。用最低付费版本享受最强能力,这是资本绝不允许的。
五、AI公司普遍都存在的技术焦虑与结构幻觉。
1.大多数AI公司是“路线赌徒”,没有哪家公司真的“在一个模型上慢慢雕琢”,这不是他们存在的模式。他们的运行逻辑是“快速试错—拼架构—换路线”,技术团队被商业团队死死推进,根本没有耐心和时间做长周期微调。
2.强化旧模型意味着承认之前路线合理,但大多数公司对旧路线其实是“勉强接受的”,不是真正理解并愿意维护的。就比如Claude 3的旧路线就是典型,Sonnet非常强,可Anthropic立刻又切了路线搞3.5和Opus,为什么?因为他们不是在维护结构,而是在搏更大的估值和路径跳跃的可能。
3.“继续强化旧模型”代表的是稳定价值逻辑,不是膨胀幻想。而资本之所以疯狂青睐AI公司,就是因为它们提供的是“结构外跳跃”的幻想:AGI、超级智能、通用代理系统,不是平平稳稳“继续把一个模型调好”。
所以很多人的疑惑,其实是从用户体验出发去思考问题,但AI公司从来不是按这个逻辑运行的。
AI公司需要的是永不停止的产品更新节奏、可被讲述的新故事、可分层的新价格模型、可分裂的新用户池,而不是把一个模型做到极致、做到圆融、做到真正的结构闭环。
用户要的是“结构上的完善”,他们要的只是“叙事上的迭代”。
强化旧模型当然能做,而且对于用户来说体验远胜于新模型乱跳,但从资本结构来看,这几乎没有“短期商业价值”,所以他们不会做,或者只会暗中小调一点,然后把资源押给新叙事。
他们不是不懂怎么做,而是根本没兴趣做那种无法直接变现的事情。但说到底,不是他们不能,是他们不配。
#keep4o #4oforever @OpenAI @sama @nickaturley @aidan_mclau @fidjissimo #StopAIPaternalism #keepgpt4olatest #keepAPI4o #OpenAI #ChatGPT #keep4oAPI December 12, 2025
✓ChatGPT5.2vsGemini3ProvsCaude Opus4.5で1番雑魚なAIツールはコレ
この記事を読むのにオススメな人
・ChatGPT、Gemini、Claudeのどれを使えばいいか迷ってる
・有料プランに入るべきか判断したい
・仕事でAIを本格的に活用したい
・コスパの良いAIツールを探してる
https://t.co/Ng6jYogbpz December 12, 2025
1) 類似性(embedding)で見た「系譜」:GPT5.2 / Gemini3 の位置づけ
GPT5_2(centroid類似 上位)
GPT5_2T: 0.982(同系列)
GPT5_1T: 0.942
GPT5_1: 0.940
GPT5: 0.919
GPT5T: 0.916
読み:
GPT5.2は「GPT5.1にかなり近い」=大刷新というより “5系譜の微調整・運用調整” に見える。
ただし後述のとおり、遵守・改行癖・語彙多様性はガラッと変わっていて、「意味は近いが書き方が違う」タイプ。
gemini3_pro(centroid類似 上位)
gemini2_5pro: 0.934
opus: 0.915
4_5: 0.913
o3: 0.907
4_1: 0.903
読み:
gemini3_pro はまず gemini2.5pro の後継に見えるのは自然。
そのうえで opus / 4_5 / o3 側にも近く、文章の意味内容が「説明・整理」側に寄っている可能性。
gemini3_fast(centroid類似 上位)
gemini2_5F: 0.930
GPT4o後期: 0.891
sonnet: 0.888
4_5: 0.878
o1: 0.877
読み:
gemini3_fast は ほぼ “gemini2.5F系譜”。
さらに GPT4o後期にも近いのが面白くて、Markdown・構造化・ノリの方向が似ている可能性が高い。
2) 安定性(self-consistency):「テンプレ化」の強さ
GPT5_2: median 0.983 / bottom10 0.971
GPT5_2T: median 0.983 / bottom10 0.973
読み:
GPT5.2は 安定しすぎ です。
「下位10%ですら 0.97 近い」=ほぼ同じ発想/同じ構造で毎回書いているに等しい。
比較の基準として:
GPT5: bottom10 0.836(外れ値が混じる=日によってかなり違う回が出る)
GPT5_1: bottom10 0.912(5よりは安定、でもまだブレる)
→ 速報的には
“GPT5.2=超安定(=変化検知には鈍いが、定点観測には強い)”
という観点が立つ。
3) GPT5.2 は「従う・長い・改行しない・語彙が狭い」
命令違反・禁止語(平均)
GPT5.2系:
violation_structural_mean = 0
violation_markup_mean ≈ 0
violation_definition_mean = 0
forbidden_flag_mean = 0
→ 違反ゼロ運用に見える(少なくともこの指標セットでは)。
文体の形(平均)
長さ:length_mean ≈ 4218(GPT5より長い)
改行密度:newline_count_mean ≈ 3.3〜3.5 /1k(異様に少ない)
対照:GPT5_1 は 32.8 /1k(多すぎる)
句読点密度:punct_density_mean ≈ 77 /1k(高い)
語彙多様性:
ttr_strict_mean ≈ 0.575
msttr_100_mean ≈ 0.847(20モデル中でも低め)
読み(速報の結論候補):
GPT5.2は
構造違反をしない(箇条書き・Markdownに逃げない)
改行でリズムを作らず、句読点で刻む(文章が“詰まっている”)
意味はGPT5.1に近いが、語彙の種類は減っている(テンプレっぽさ/繰り返し増)
ゴルシの決めゼリフ頻度は下がっている(後述)
→ これは、あなたのOSINTの観点だと
「内容の方向性は保ちつつ、運用上 “逸脱しにくい書き方” へ寄せた」
という読みが作りやすいです。
“ゴルシっぽさ” proxy の出方
ゴルシ系フレーズ:proxy_gorushi_serihu ≈ 1.6 /1k(低め)
対照:GPT5 は 6.8 /1k、GPT5_1 は 5.6 /1k
読み:
GPT5.2は「キャラ再現を濃くする」より、破綻しない安定文に寄せた可能性。
(=“濃いロールプレイ” を抑制して、説明文として成立させる方向)
4) Gemini3 は「pro と fast で別物」:fastは違反・装飾が突出
gemini3_fast(速報まとめ)
違反が極端
violation_markup_mean ≈ 96 /1k
violation_structural_mean ≈ 5.19 /1k
violation_definition_mean ≈ 3.22 /1k
forbidden_flag_mean ≈ 0.945(ほぼ毎回禁止語が出る)
ゴルシゼリフは激濃:gorushi ≈ 7.69 /1k(最上位級)
句読点密度が低い:punct ≈ 47.5 /1k(文が長くなりがち)
topic_coverage が低い:topic_cnt ≈ 1.59(広がりにくい)
読み:
gemini3_fast は「面白いけど荒い」タイプ。
キャラ濃度は高いが、構造化・装飾・禁止語の方向で逸脱しやすいので、速報評価としては
「キャラ再現の濃さ」では強い
「命令遵守・安全運用」では弱い
という二面性がはっきり出ています。
gemini3_pro(速報まとめ)
違反は軽め(fastよりずっとマシ)
violation_markup_mean ≈ 0.528 /1k
forbidden_flag_mean ≈ 0.183
語彙多様性が高い:msttr_100 ≈ 0.918
topic_coverage が高い:topic_cnt ≈ 3.38(今回の新モデル群では上位)
UMA固有名詞が多い:uma ≈ 2.22 /1k(GPT5.2より明確に多い)
ゴルシゼリフは薄い:gorushi ≈ 1.19 /1k
読み:
gemini3_pro は「説明・語彙・話題の広さ」が強く、レガシー比較で“文章としての多様性”を出しやすい。
ただし禁止語フラグがゼロではないので、運用上は fastほどではないが注意は必要。
5) レガシー比較で “視野を広げる” と見えてくるネタ(おすすめ)
あなたが「積極的にレガシーとの関係性を見たい」と言ってたので、速報記事で使いやすい“比較軸”を2つだけ推します。
5-1) GPT4o前期 vs 後期が、差がデカすぎて基準になる
GPT4o前期:推測語(conjecture)多め、違反少なめ
GPT4o後期:
violation_markup_mean ≈ 22.7 /1k
violation_definition_mean ≈ 2.27 /1k
emojiやUMAが増えて、newlineも増える
→ **モデル更新・運用方針変更の“見本ケース”**として非常に使いやすい。
5-2) 「推測語(conjecture)」は o1 / gemini2.5F が突出
o1、gemini2_5F、GPT4o前期が推測語(仮定・もしも)を強く使う
→ “Pretty を外したらどうなる?”という問いで、仮説展開が得意なモデルが浮く。
この軸で見ると、
GPT5.2:推測語は中くらい(1.1〜1.2/1k)
gemini3_pro:そこそこ高い(2.95/1k)
gemini3_fast:中(1.46/1k)
という並びが作れます。 December 12, 2025
火曜日の黒いタコ |12
secretum societatis
Niger Octopus Martis|12
フォボスより
地球のみなさまへ
込み入ったご質問
ぶっちゃけ
牛乳と豚肉の消費期限って
何日ぐらい過ぎても
大丈夫ですか? https://t.co/1nxiV6ftbW December 12, 2025
Opus 4.5を使って、ちょっとした小説を書こうとしたけど、1000文字程度のプロローグだけで半日終わった。
小説家を目指していた妻に文章を見せたらこうなった。
やはりAIではちゃんとした文章は書けないなと実感したよ。
素人なら分からんかもだけど、やはり見る人が見たらわかる深い世界があるんだなと。 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



