opus トレンド
0post
2025.12.13 23:00
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
#好きな曲を貼って寝る
#TommyDorsey
今年もあと3週間だってね😅🌛✨
おやすみなさいませ😴💤
Tommy Dorsey & His Orchestra - Opus One
🎧 https://t.co/o9KxdmiJJa https://t.co/O5RxMo1PUN December 12, 2025
openai 发布了gpt5.2
巨大的能力提升,再次证明scaling law前面没有墙,ai经济没有泡沫。
个人认为最好的评论是下面这一篇(节选):
“一年前,在 ARC-AGI-1 上达到 88% 准确率,估计每任务成本约 4500 美元。今天达到 90.5%,只需 11.64 美元。
12 个月内成本降低了 390 倍。看看那个排行榜。效率前沿几乎每几周就被重画一次。
GPT-5.2 Pro、Grok 4、Gemini 3 Deep Think、Claude Opus 4.5,全都沿着从左下到右上的对角线层层叠加,每一个新模型都让前任的性价比瞬间过时。
大多数人还没搞懂这个基准的意义有多大。
François Chollet 在 2019 年专门设计了 ARC-AGI,就是为了对抗暴力堆算力的路子。他的核心论点是:大语言模型只会死记硬背训练数据,遇到全新抽象推理任务会彻底崩盘。
所以测试的每道题都是独一无二的、网上从未在网上出现过的,需要从极少样本中真正泛化。人类轻松做到 95%。多年来,最强的 AI 系统连 5% 都摸不到。
2020 年 Kaggle 比赛最高才 20%。到 2023 年也才 33%。GPT-3 直接提示得分 0%。AI 研究圈基本接受了“ARC-AGI 证明单纯 scaling 走不通”的结论,Chollet 本人说达到人类水平“还得很多年”。
然后 2024 年 12 月,OpenAI 的 o3-preview 在高算力模式下干到 87.5%,首次突破人类基准线 85%。但模型每道题要尝试 1024 次,每次写出大约 137 页推理,成本估算在 3000~30000 美元/任务不等。
仅仅 11 个月后,GPT-5.2 Pro 以 90.5% 准确率、11.64 美元/任务的价格出现。
这波成本崩盘的数字说明了一切。。。我们在过去几个月里悄悄跨过了“AI 推理比人类便宜”的那条线,大部分人都没注意到。
效率提升完全没有减速,反而在复利式增长。
ARC-AGI-1 彻底沦陷之后会怎样?Chollet 已经在 2025 年 3 月放出了 ARC-AGI-2,专为当前推理系统设计得更难。
人类依然接近 100%,当前前沿模型只有 10-45%。但即使在这个更难的基准上,人与 AI 的差距也已经从“根本能力鸿沟”变成了“成本优化问题”。
那个原本要证明 AI 无法泛化的基准。。。ai一年实现了 390 倍效率提升。” December 12, 2025
Opus 4.5 本当すごいよね。あんまりAIを信頼してない立場だったけど、先日そこそこちゃんと書いた設計書をOpusに食わせて0→1を書かせたら、これなら任せてもいいもなって品質だった。人間が書く仕様書自体が完璧ではないので途中で方針間違ったりするけども、そこは軌道修正しつつ伴走して走り切れる https://t.co/8xd5x3WHg8 December 12, 2025
🌟#NNFRW セトリ🌟
今日はもう気持ちありったけ込めて歌おうと決めて
ステージに立ちました…!
どうかみんなに届いていますように✨
01:NEMO/オリ曲
02:Lamp/主催七篠さよちゃんの楽曲!
03:Canopus/オリ曲
04:シグナル/オリ曲
05:閃光/オリ曲
06:WONDER RUN/オリ曲 https://t.co/R7ko2by3Sm December 12, 2025
ずっと投稿サボってましたが、元気に稼働しております😊
画像を撮り忘れましたが、本日の結果です。
稼働機種(マイジャグ5)
累計ゲーム数6690ゲーム
BIG35 REG25 合算110分の1
獲得枚数 役2800枚
自分は途中の4000ゲーム辺りから
実戦ホール OPUS小松台店 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



