凄い!!!
「GPT-o1 previewが医師国家試験で98.2%の正答率!」
・ 2024年2月の倭国医師国家試験において、OpenAIのo1 previewが最高98.2%の正答率を記録
・ 画像を含む問題や複数の正解がある問題は除外
・ 既存ベンチマークの飽和が進んでいる
・ 合格基準は76.7%
https://t.co/qfFU8tZHk3 https://t.co/kPiPjtdREh
ベンチマーク トレンド
ベンチマーク(英: benchmark)とは、本来は測量において利用する水準点を示す語で、転じて金融、資産運用や株式投資における指標銘柄など、試金石として比較のために用いる指標を意味する。また、広く社会の物事のシステムのあり方や規範としての水準や基準などを意味する。またベンチマーキングとは自社の課題解決のために、競合他社などの優れた経営手法(ベストプラクティス)を持つ企業を分析するプロセスを指す。
「ベンチマーク」 (2024/4/5 12:47) Wikipedia倭国語版より
0tweet
2024.11.08 19:00
:0% :0% (-/-)
人気のツイート ※表示されているRT数は特定時点のものです
<ツイートの表示について>
本サイトではTwitterの利用規約に沿ってツイートを表示させていただいております。ツイートの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。