RIZE 芸能人
0post
2025.12.19 10:00
:0% :0% ( 30代 / 女性 )
人気のポスト ※表示されているRP数は特定時点のものです
🐊ワニ博士、帰宅。
#大阪大学 #UOsaka #ノーベル賞 #nobelprize #ワニ博士と行くノーベルウィーク2025 終
みなさん、一緒に旅をしていただき、ありがとうございました✨ https://t.co/zogNC3xlgV December 12, 2025
9RP
さて、明後日はRIZEのライブが博多のZEPPライブでございます。
今年に博多行くのも最後なので、ライブの後私がひたすらDJするイベントやることにしました。
アフターパーリー感覚で、ファンの方同士の交流の場所にもどうぞ。
九州で1番古い友達のゆうちゃんのおかげで開催できますありがとう。
KenKen presents
“ROOM OF THE GROOVE”
Supported by neoneon
2025.12.20
at ART BAR SSS
DJ KenKen
DJ PROVIDENCE
OPEN21:00~
CHARGE 2500 YEN
ART BAR SSS
福岡県福岡市中央区天神3-4-17天神ウイングビル1F December 12, 2025
「最新の生成AIの性能って、結局いま何が“強く”なって、何が“まだ弱い”んだろう?」
問い1:いま“性能”って、何を指すのがフェア?
答え:単一スコアではほぼ無理。 いまは大きく分けて
•会話の好ましさ(人間の投票)
•コーディングの実務(バグ修正・リポジトリ操作)
•事実性(検索・根拠・画像理解を含む)
•未知パズル的な推論(汎化・抽象)
みたいに“軸”を分けて見るのが現実的です。
問い2:「会話が上手いモデル」って、どれくらい差がある?
答え:差はあるけど、これは“人気投票”の側面も強い。
LMArena(旧Chatbot Arena系)のOverviewだと、直近の集計で gemini-3-pro がTextで1位(Score 1491)、続いて grok-4.1-thinking などが並んでいます。投票数も万単位で、体感品質の差をある程度反映している一方、プロンプト分布や評価観点がコントロールされていない弱点もあります。
問い3:「仕事で使えるコーディング能力」は、もう“解決済み”?
答え:まだ“半分解ける”くらいが上位帯で、完全自動化には遠い。
SWE-bench Verifiedは、実在のGitHub issueを直してテストを通すタイプで、**「解けた割合(% Resolved)」で見ます。Verifiedは500問規模で、条件を揃えた比較がしやすい一方、依然として難しいです。
SWE-bench公式のリーダーボードでも、上位モデルが50%前後〜のレンジにいることが示されています(モデルと日付つきで掲載)。
問い4:「ハルシネーション(もっともらしい嘘)」は、もう減った?
答え:減ってきたが、“事実性”はまだ壁が厚い。
Google DeepMindの FACTS Benchmark Suite は、事実性を4分割(Parametric / Search / Grounding / Multimodal)して測ります。ここで Gemini 3 Proが総合68.8%で首位、ただし評価モデルは総じて70%未満で「まだ大きな伸びしろがある」と明言されています。
要するに、流暢さは人間っぽいのに、事実の堅牢性は“合格点に届き切らない”局面がまだ残っています。
問い5:「未知の推論(汎化)」は、もう人間に迫ってる?
答え:伸びてるけど、商用モデル単体だとまだ低め。“工夫(ループ/合議)”が効いている。
ARC Prizeの分析では、ARC-AGI-2において 検証済みの商用モデル最高が Opus 4.5 (Thinking) で37.6%。一方で、Gemini 3 Pro を土台にしたPoetiqの“refinement(改善ループ)”解法が54%と報告されています。
ここが面白い点で、モデルそのものの賢さだけでなく、テスト時にどう考えさせるか(反省→再試行→検証)の“運用レイヤー”がスコアを押し上げています。
ここまでのまとめ
•体感の会話品質は上がり続け、ランキング上位は僅差の争い(ただし評価軸は曖昧になりがち)。
•実務コーディングは「上位でも半分前後」なので、現場導入は“監督つき”が前提になりやすい。
•事実性は、最先端でも70%未満という厳しめの現実が見えてきた(特にマルチモーダル等が弱点になりやすい)。
•汎化推論は、モデル単体の改善に加えて「refinement loop」みたいな“考え方の設計”が性能を左右してきている。
(ChatGPTの以下の指示への回答)
「最新の生成AIの性能について、好奇心に基づいて自ら質問を生成しながら考えてください。」 December 12, 2025
本日、12/19(金)
15:00〜営業開始します❕🐣
16:00〜
👽フリーロール👽
✧˒˒LATE 17:00✧
参加費無料❗️リエントリー 1,000円 (15,000点)
※ワンドリンクオーダー制となっております
👑PRIZE 👑
1st リングチップ100bb
or
マルチトーナメントエントリー権
17:30~
🔥deep stack🔥
✧˒˒LATE 20:30✧
*参加費*
・エントリー 4,000円(50,000点)
*リエントリー*
リエントリー 同上
👑PRIZE 👑
1st 15,000pp+マルチトーナメントエントリー権×2
2nd 8,000pp+マルチエントリー権
18エントリー以上で
3rd🥉 マルチトーナメントエントリー権
22:00〜
☠️All-in or Fold😇
✧˒˒LATE 22:30✧
・エントリー 2,000円 (20,000点)
・リエントリー 1,000円 (20,000点)
◾︎リバイ・アドオン無し
💎プライズ💎
✨1st 5,000pp
✨2nd マルチトーナメントエントリー権×1
✨3rd 飲み放題チケット×1
🧸リングゲーム🧸
15:00~24:00(23:30LAST3ハンド)
初心者講習希望の方は
お電話で空卓のご確認をお願いします🙏
お問い合わせ
TEL:048-606-4531 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



