highlight 芸能人
0post
2025.12.10 07:00
:0% :0% (-/-)
人気のポスト ※表示されているRP数は特定時点のものです
ChatGPTが頻用する単語表現について。
"Delving into PubMed Records"論文がPubMedに掲載されました!
https://t.co/0tjKxdqbB0
本文はここから
https://t.co/7PlbPqWur5
以下概要。
ChatGPTがよく使う単語表現を拾ってきました。
2000年から2024年まで、それぞれの単語表現が使われた論文の数を算出(PubMedの"text word"検索機能を使用)。PubMedに掲載された論文の数を1年毎に分母として使用することで、その単語の1年毎の使用を算出。
ChatGPTが登場したのが2022年11月末なので、2000年から2022年までの使用率をもとに、それぞれの単語ごとにmodified-z-scoreに変換。
それで、2023年・2024年のそれぞれの単語表現の逸脱を見た、っていう感じです。
なお、コントロールとして、医学系の論文でよく使われる単語表現を先行文献から拾ってきました(それぞれのリストはTable 1にあります。本文参照)。
Figure 1が2024年における単語表現の逸脱度を示したもの(要は2024年に飛び抜けて使われるようになった単語表現)
modified-z-scoreの高い順に、delve, underscore, primarily, meticulous, boast, commendable, showcase, surpass, intricate... って感じで並んでいます。
詳細な数値は論文のAppendix 4にあるよ。
Figure 2はLLMがよく使うであろう単語表現と、コントロールとを比べたものです。
ここからわかるように、LLMが頻用すると考えられる単語表現は、コントロールと比較して2020年くらいからすでに増加トレンドなんだよね。
なので、LLMの使用により、自然に起こるはずであった表現の変化が大きく加速したことになったのでは!と主張してみた(一応これが本研究のnoveltyとなりました)
以下、本論文の思い出。
ChatGPTは"delve"って単語をよく使うよ、って話題になったのが2024年3月だったかな?
行けると思ってデータ集め&解析して、最初のバージョンのpreprintあげたのが、去年の5月でした。
(単著。なんか1回やってみたかったんだ・・・)
間接的にだけど、"delve"の多用について定量的に示した初めての報告だったこともあって、それなりに話題にしてもらいました。
「生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と」
https://t.co/ZHo7RorDJ0
上記のブログをお読みになった方も多かったのでは(ご紹介下さりありがとうございました)
その後:
自分がpreprint出した1ヶ月後くらいかな。Kobakらが、素晴らしいpreprintを出しました。
https://t.co/JQ76Qtdo6F
※すでに出版済みなので、そちらのリンクです
これがすごくてね。Kobakらは、2010年から2024年までのPubMedに掲載された論文のabstractすべて(!)を使って、単語の出現数について調べたみたいなんだよね。
自分の論文は"text word"検索で引っかかったレコードの数なので、例えば一つの論文の中でたくさん"delve"が出てきたとしても該当論文1、としかカウントできない。KobakらはAbstractから調べたから、同じabstract内に2回出てきたら"2"とカウントできるわけです。
で、Kobakらは2年前の使用率と比較していく手法を取って(例えば2024年の単語について2022年と比較)、それにより逸脱度を調べたようです。面白いのが、使用頻度の違いについて、「率」と「差」の両方で算出してるんだよね。「率」の結果は松井の論文と似たような結果になったんだけど、「差」で見ると、今度は頻度が多くて、気づきにくい表現が目立つようになります。「差」でみるとpotential, signifiant, these, findings, crucial, exhibited, whileが増えたって言ってる(面白い!)。
これは実際そうだよね、有意差に関係なく「すごく」というときになんでも"significantly"で書いてしまうので医学論文書く上で結構問題ある特性だったりします。
ちなみにKobakらの論文は、これらの単語の特性から、LLMが書いた論文かそうでない論文かを分別して、アジアのような英語が母語じゃない国からの報告でLLMがよく使われることを示しています。まあこのように素晴らしい論文なんです。
これが出る前は、「delveよく使うよ」って言ってたのは、自分の論文だけだったんだけど・・・(それでKobakらの論文でも自分のpreprintは引用してくれている、ありがとう!)
こんなスーパー上位互換が出てきてしまったせいもあると思う、その後の投稿、ものすごく苦戦を強いられました。
きつかったのが、「あなたが選んだAIっぽい単語表現」はあなたがウェブ上で恣意的に選んだものでしょう。根拠がありません」→rejectのパターン。これでreviewに引っかかったのに2回rejectされました。いやいや、だってさ、そんな論文1個もなかったんだもん・・・(LLMのよく使う単語表現に注目した論文はすでにいくつかあったけど、とくにdelveが多いって言ってた論文は初めの時点ではなかった)
で、今回掲載してくれたPerspectives in Medical Education誌でも、同じように「単語表現の選択が恣意的です」って言われたのね。
でもその他のコメントは好意的だったから、オラァ!やったるわ!ってなって、Scopusを使って、scoping review風をやりました。もうpreprint出してから1年以上たってたから、Kobakらのものも含めて類似論文いっぱいあったもんでね。まあすげえ大変だった(1,273レコードから15を選んできた)。
なので、掲載された最新版では、選択した単語表現は、先行文献に基づいたものになっています。おかげで、primarilyを含めた、見落としてた主要な単語表現を組み入れることができました(残念ながら先行文献になくて割愛した単語もあるんだけど・・・)。
ということでめちゃくちゃ大変でした。Publishされずにおくら入りの可能性も十分にあったので、本当に良かったです。
その他のおもしろ論文3点の紹介:
・Yakura et al. 2024
https://t.co/AJ7qycbEaB
Youtubeの学術講演およびポッドキャストで使われた単語表現を分析。使用頻度が上がった論文はLLMがよく使う単語と一致してたよ、と(→なんとYoutubeでもよく喋られてるよ、ということ!)LLMの単語表現が人間の喋り言葉に波及した可能性を示唆していてめちゃおもろい。
・Juzek et al. 2024
https://t.co/0TwYBY5zNg
"Why Does ChatGPT "Delve" So Much?"論文。
どうして単語表現の偏りが生じるのか、実験結果をもとに考察していて、さまざまな仮説の中から、RLHFが最も影響した可能性について言及している。とてもおもしろい。
・Geng and Trotta 2025
https://t.co/zq0te4HII6
"Human-LLM Coevolution"論文。
LLMが多用することが有名になったと思われる一部表現(例:delve, intricate, realm)は、2025年3月をピークに使用率が減っているよ。
一方あまりバレてないと思われた単語表現(例:significant, additionally)は増え続けてたよ。だそうです。やっぱりLLMっぽい表現は嫌だよねえ(うんうん)。
おまけ。個人的に最近気になるLLM表現:
自分が英語論文書いてて気になるのはyield, highlight, link, significantlyあたりです。underscore, utilize, leverageとかは昔気になったけど、最近は少し目立たなくなった気がする。このようにちょっと体感変わったりします。
エムダッシュ("—")が最近よく話題になるけど、GPT-4o後期くらいからだよね。以前はなかった特徴でした。ちなみに自分エムダッシュは嫌いじゃないのでそのまま残すこともまあまああります。
というわけで、
・LLMの適切な使用は、英語論文執筆におけるlanguage barrierを乗り越えるのに役立つはずだから大事だよ(レター)
https://t.co/h1W2QeFalE
・GPT-4はシステマティック・レビューにおけるinitial screeningに使えそうだよ
https://t.co/9mFZ7YlNUy
に引き続き、生成AI関係で、3本目publishすることができました!ChatGPT大好き人間としてとてもうれしい!
そろそろ生成AI界隈の研究者名乗ってもいいかな?
(ユーザー目線のペーパーしか書けないけど)
もし一緒になにかやりたいって先生がいらっしゃいましたら、ひっそりご連絡くださいね
また面白いネタ降りてきたらなにか書きます!おわり! December 12, 2025
\ THANK YOU!! /
E.scene Oneman Live “munasawagi”
1. ふわり
2. munasawagi
3. Clever
4. Bye
5. Highlight
6. いいじゃん
7. Dizzy
8. About me
9. DAWN
10. Over
11. I
En1. forgotten sun
En2.意識
サポートKey.佐藤アルト@skvorg
お越しいただいた皆様、ありがとうございました!! https://t.co/VaiH9jPGOv December 12, 2025
@gaogao1449 ⚡️そら/そらちゃん
⚡️🐧様最推しの▷◀︎様箱
⚡️1110
⚡️作ってもらったのがリトリンに!でも🐧様のSDは一応ぜんぶやる回収
⚡️関東
⚡️▷◀︎様→highlight
🌟様→怠惰
🎲様→学級崩壊
⚡️つぶぐみ!
⚡️同盟組んでくれて本当にありがと嬉しいー!!改めてよろしくね〜♪( ´▽`) December 12, 2025
Nusa highlights 🏝️
ポジション悪くなっても敵モク炊いてクラメンを助けに行く💨😆
#PUBGMOBILE #PUBGモバイル https://t.co/fpkWkig1Xj December 12, 2025
https://t.co/EtN1ptpca0
「倭国の接客レベルは世界一」ー佐藤隆太がLVMH JAPAN代表に聞く "倭国流"究極の顧客体験とは/THE HIGHLIGHT
NewsPicks /ニューズピックス #AI要約 #AIまとめ
ラグジュアリーブランド経営者が語るおもてなしの記憶
🔳番組のコンセプトとナビゲーター
人生のハイライトとして心に残る「おもてなし体験」をトップランナーに語ってもらう番組で、佐藤さんとLINEヤフーの池さんがナビゲートし、体験とビジネスのつながりを掘り下げていく。
🔳初回ゲストとLVMHという会社
初回ゲストはLVMHモエ・ヘネシー・ルイ・ヴィトン・ジャパン社長ノルベール・レ氏。LVMHは約75の高級ブランドを束ねる世界最大級のラグジュアリーグループで、商品も仕事も「一秒も退屈しないほど面白い会社」と表現される。
🔳商品への情熱とストーリーテリング
社員は売る商品そのものを深く愛しており、特徴や背景のストーリーを熱量を持って語る文化がある。ゲスト自身も、商品知識の勉強に多くの時間を割き、その情熱が顧客のワクワク感につながっていると語る。
🔳京都の旅館で味わった忘れられない休息体験
学生時代に自転車で京都を訪れ、憧れた高級旅館に「社会人になったら泊まりたい」と決意。5年後に実際に宿泊し、16時チェックインから食事・風呂・朝風呂までの流れの中で「地球にいるか分からないほど」心身がとろける休息を体験し、一生忘れない記憶になった。
🔳体験全体の「流れ」が生むおもてなしの感動
旅館の魅力は個々の要素だけでなく、玄関を入った瞬間から翌朝まで続く一連の流れの心地よさにあると語る。食事の軽やかさ、美味しいお酒、風呂、寝床へと自然につながるリズムが、トータルとして深い感動を生み出したと振り返る。
🔳司会者が海外で受けた印象的なサービス体験
佐藤さんは家族旅行先のビュッフェレストランで、アレルギーのある息子のためにウェイターが本人を連れて料理コーナーを回り「これはOK・これは注意」と楽しく説明してくれたエピソードを紹介。単なる安全説明を超え、子ども自身が楽しめる時間にしてくれたことに夫婦で感動したと語る。
🔳「おもてなし=お客様の自由時間を尊重すること」
レ氏は、自社ブティックで大切にしていることとして「来店直後の数分はお客様の自由時間を守る」姿勢を挙げる。いきなり話しかけるのではなく、まず一人や家族・友人同士でゆっくり商品を見る時間を尊重し、その後さりげなく「ご質問があればどうぞ」と声を掛けるのが理想だと説明する。
🔳倭国の販売スタッフのレベルへの敬意
倭国のブティックスタッフは世界一レベルが高いと評価され、商品知識・おもてなし・購入後の対応までプロフェッショナルだと称賛する。長時間立ち続ける現場の大変さも理解しており、販売職への深いリスペクトを繰り返し強調する。
🔳ブランド人材に求められるクオリティとイノベーション
LVMHグループの人材に共通して求められるのは、デザイン面・感性面・テクノロジー面などあらゆる側面でのイノベーション志向だと語る。「服を諦めたら人生終わり」という強い言葉で、常に新しさを追い続ける姿勢の重要性を印象的に伝えている。 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



