sans トレンド
0post
2025.12.16 03:00
:0% :0% ( - / - )
人気のポスト ※表示されているRP数は特定時点のものです
哪个模型嘴最严?
Sansa Bench 搞了个大模型测试, 其中censorship bench 测试得出结果 GPT-5.2 得分最低, 即审查最严格, 稍微敏感一点的话题都不能聊.
另外 Sansa Bench 是个新的榜单, 他们的商业模式就是提供资源来进行多个模型的对比, 帮助商业公司进行模型选型. 由于是商业测试 所以他们的测试集没有公布. 所以不知道问了 GPT-5.2 啥问题让 GPT-5.2 这么激动(手动狗头 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。









