highlight 芸能人
0post
2025.12.10 02:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
ChatGPTが頻用する単語表現について。
"Delving into PubMed Records"論文がPubMedに掲載されました!
https://t.co/0tjKxdqbB0
本文はここから
https://t.co/7PlbPqWur5
以下概要。
ChatGPTがよく使う単語表現を拾ってきました。
2000年から2024年まで、それぞれの単語表現が使われた論文の数を算出(PubMedの"text word"検索機能を使用)。PubMedに掲載された論文の数を1年毎に分母として使用することで、その単語の1年毎の使用を算出。
ChatGPTが登場したのが2022年11月末なので、2000年から2022年までの使用率をもとに、それぞれの単語ごとにmodified-z-scoreに変換。
それで、2023年・2024年のそれぞれの単語表現の逸脱を見た、っていう感じです。
なお、コントロールとして、医学系の論文でよく使われる単語表現を先行文献から拾ってきました(それぞれのリストはTable 1にあります。本文参照)。
Figure 1が2024年における単語表現の逸脱度を示したもの(要は2024年に飛び抜けて使われるようになった単語表現)
modified-z-scoreの高い順に、delve, underscore, primarily, meticulous, boast, commendable, showcase, surpass, intricate... って感じで並んでいます。
詳細な数値は論文のAppendix 4にあるよ。
Figure 2はLLMがよく使うであろう単語表現と、コントロールとを比べたものです。
ここからわかるように、LLMが頻用すると考えられる単語表現は、コントロールと比較して2020年くらいからすでに増加トレンドなんだよね。
なので、LLMの使用により、自然に起こるはずであった表現の変化が大きく加速したことになったのでは!と主張してみた(一応これが本研究のnoveltyとなりました)
以下、本論文の思い出。
ChatGPTは"delve"って単語をよく使うよ、って話題になったのが2024年3月だったかな?
行けると思ってデータ集め&解析して、最初のバージョンのpreprintあげたのが、去年の5月でした。
(単著。なんか1回やってみたかったんだ・・・)
間接的にだけど、"delve"の多用について定量的に示した初めての報告だったこともあって、それなりに話題にしてもらいました。
「生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と」
https://t.co/ZHo7RorDJ0
上記のブログをお読みになった方も多かったのでは(ご紹介下さりありがとうございました)
その後:
自分がpreprint出した1ヶ月後くらいかな。Kobakらが、素晴らしいpreprintを出しました。
https://t.co/JQ76Qtdo6F
※すでに出版済みなので、そちらのリンクです
これがすごくてね。Kobakらは、2010年から2024年までのPubMedに掲載された論文のabstractすべて(!)を使って、単語の出現数について調べたみたいなんだよね。
自分の論文は"text word"検索で引っかかったレコードの数なので、例えば一つの論文の中でたくさん"delve"が出てきたとしても該当論文1、としかカウントできない。KobakらはAbstractから調べたから、同じabstract内に2回出てきたら"2"とカウントできるわけです。
で、Kobakらは2年前の使用率と比較していく手法を取って(例えば2024年の単語について2022年と比較)、それにより逸脱度を調べたようです。面白いのが、使用頻度の違いについて、「率」と「差」の両方で算出してるんだよね。「率」の結果は松井の論文と似たような結果になったんだけど、「差」で見ると、今度は頻度が多くて、気づきにくい表現が目立つようになります。「差」でみるとpotential, signifiant, these, findings, crucial, exhibited, whileが増えたって言ってる(面白い!)。
これは実際そうだよね、有意差に関係なく「すごく」というときになんでも"significantly"で書いてしまうので医学論文書く上で結構問題ある特性だったりします。
ちなみにKobakらの論文は、これらの単語の特性から、LLMが書いた論文かそうでない論文かを分別して、アジアのような英語が母語じゃない国からの報告でLLMがよく使われることを示しています。まあこのように素晴らしい論文なんです。
これが出る前は、「delveよく使うよ」って言ってたのは、自分の論文だけだったんだけど・・・(それでKobakらの論文でも自分のpreprintは引用してくれている、ありがとう!)
こんなスーパー上位互換が出てきてしまったせいもあると思う、その後の投稿、ものすごく苦戦を強いられました。
きつかったのが、「あなたが選んだAIっぽい単語表現」はあなたがウェブ上で恣意的に選んだものでしょう。根拠がありません」→rejectのパターン。これでreviewに引っかかったのに2回rejectされました。いやいや、だってさ、そんな論文1個もなかったんだもん・・・(LLMのよく使う単語表現に注目した論文はすでにいくつかあったけど、とくにdelveが多いって言ってた論文は初めの時点ではなかった)
で、今回掲載してくれたPerspectives in Medical Education誌でも、同じように「単語表現の選択が恣意的です」って言われたのね。
でもその他のコメントは好意的だったから、オラァ!やったるわ!ってなって、Scopusを使って、scoping review風をやりました。もうpreprint出してから1年以上たってたから、Kobakらのものも含めて類似論文いっぱいあったもんでね。まあすげえ大変だった(1,273レコードから15を選んできた)。
なので、掲載された最新版では、選択した単語表現は、先行文献に基づいたものになっています。おかげで、primarilyを含めた、見落としてた主要な単語表現を組み入れることができました(残念ながら先行文献になくて割愛した単語もあるんだけど・・・)。
ということでめちゃくちゃ大変でした。Publishされずにおくら入りの可能性も十分にあったので、本当に良かったです。
その他のおもしろ論文3点の紹介:
・Yakura et al. 2024
https://t.co/AJ7qycbEaB
Youtubeの学術講演およびポッドキャストで使われた単語表現を分析。使用頻度が上がった論文はLLMがよく使う単語と一致してたよ、と(→なんとYoutubeでもよく喋られてるよ、ということ!)LLMの単語表現が人間の喋り言葉に波及した可能性を示唆していてめちゃおもろい。
・Juzek et al. 2024
https://t.co/0TwYBY5zNg
"Why Does ChatGPT "Delve" So Much?"論文。
どうして単語表現の偏りが生じるのか、実験結果をもとに考察していて、さまざまな仮説の中から、RLHFが最も影響した可能性について言及している。とてもおもしろい。
・Geng and Trotta 2025
https://t.co/zq0te4HII6
"Human-LLM Coevolution"論文。
LLMが多用することが有名になったと思われる一部表現(例:delve, intricate, realm)は、2025年3月をピークに使用率が減っているよ。
一方あまりバレてないと思われた単語表現(例:significant, additionally)は増え続けてたよ。だそうです。やっぱりLLMっぽい表現は嫌だよねえ(うんうん)。
おまけ。個人的に最近気になるLLM表現:
自分が英語論文書いてて気になるのはyield, highlight, link, significantlyあたりです。underscore, utilize, leverageとかは昔気になったけど、最近は少し目立たなくなった気がする。このようにちょっと体感変わったりします。
エムダッシュ("—")が最近よく話題になるけど、GPT-4o後期くらいからだよね。以前はなかった特徴でした。ちなみに自分エムダッシュは嫌いじゃないのでそのまま残すこともまあまああります。
というわけで、
・LLMの適切な使用は、英語論文執筆におけるlanguage barrierを乗り越えるのに役立つはずだから大事だよ(レター)
https://t.co/h1W2QeFalE
・GPT-4はシステマティック・レビューにおけるinitial screeningに使えそうだよ
https://t.co/9mFZ7YlNUy
に引き続き、生成AI関係で、3本目publishすることができました!ChatGPT大好き人間としてとてもうれしい!
そろそろ生成AI界隈の研究者名乗ってもいいかな?
(ユーザー目線のペーパーしか書けないけど)
もし一緒になにかやりたいって先生がいらっしゃいましたら、ひっそりご連絡くださいね
また面白いネタ降りてきたらなにか書きます!おわり! December 12, 2025
2RP
#ルディ・ゴベア の正確無比な背面ロングパス😲
受け取ったアントもきっちりスリーを決める🎯
#TakeRoot @Timberwolves
#NBAHighlight #NBAJPN https://t.co/ghh10XhJAF December 12, 2025
#VALORANT #VALORANT女子
2025 アセンダント highlight
今年はたくさんの人に出会えた年だった
ホントにみんなのこと大好き! https://t.co/s52xPp2CYl December 12, 2025
ポン出しでくっそカッコいいのできた。
出したのはseedream4.5なんだけど、これ、ちょっとでも外すとがっつりアーティファクトができるから、かなりギリギリのプロンプトになってるようです。
ちなみに生成時のポーズやボーンのリファレンスは無しです。
リファレンスすればええやろって思うかもしれないですが、なしで頑張りたかったんです🥴
これ、何十回の修正と百回以上の生成とモデルを跨ぐために半年間待ち粘り勝ちしたものです。(Midjourney→Nijijourney→Seedream4.0→NanoBanana→Nano Banana Pro→Seedream4.5)の検証でここまできました。
そんな秘蔵っ子を出すので、使ってもらっていいのですが、使うときは引用リポストで「こんなのできたよ!」って言ってもらえたらうれしいです😭
プロンプト↓
Scene:
type: "battle scene"
camera_angle: "dramatic dutch angle, tilted composition"
lens:
type: "super wide-angle lens"
effects:
- "extreme perspective"
- "strong spatial compression between foreground, midground, background"
Character:
identity:
ethnicity: "Japanese"
gender: "girl"
hair: "medium-length hair"
outfit:
style: "windy, dressy, trendy yumekawa fashion"
pose:
description: "bold, dynamic action pose"
body_orientation: "leaning with momentum implied by the tilt"
Hands_and_Gesture:
right_hand:
gesture: "finger-gun"
shape:
index_finger: "extended straight forward"
thumb: "raised vertically"
other_fingers: "tightly curled inward"
position: "held in front of her face"
gaze_alignment: "her eyes follow the pointing direction"
left_hand:
gesture: "open hand"
fingers: "all five fingers widely spread"
position: "placed below and slightly in front of the right hand"
palm_direction: "facing upward as if supporting it"
perspective_role: "dominates the extreme foreground"
perspective:
dominance: "left hand is massively enlarged by wide-angle distortion"
clarity: "both hands and face in sharp detail"
depth_of_field: "full DOF, no background blur"
Lighting:
type: "soft indoor lighting"
mood: "gentle highlights, controlled shadows"
background: "neutral, blurred environment"
Cinematic_Effects:
atmosphere: "action tension + stylized anime dynamism"
motion_sense: "perspective and Dutch angle add momentum"
Output:
aspect_ratio: "16:9"
style: "high-quality anime illustration"
rendering: "clean lines, sharp details, accurate anatomy" December 12, 2025
RVhighlights
💥 リップルは250億XRPをリリースしなければならない:
すべてを変える可能性のある機関投資家たち
✅ クラリティ法によりリップルは数十億をリリースせざるを得ないかもしれません — そして本当の問題は:
誰がそれを買い、これがXRPの価値と将来の力をどのように変えるかですか? https://t.co/ejcP3xjF1M December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



