1
のものも
0post
2025.12.10 16:00
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
中国人の話す英語は倭国人より綺麗だと思わない(中国の人が倭国人の英語をからかうたびに嫌な気持ちになっていた)が、中国訛りの英語といえばこういうものが典型だとされている。実際中国側が公開しているフル音声には英語のものも含まれており、まさにこういう訛り方だった。 https://t.co/h6Ol0sMuTh https://t.co/B010IWpw97 December 12, 2025
3RP
おはようございます☀️
サンタ衣装の素材
割と需要あるみたいなので、もったいないから別のものも配っていこうと思います
加工や色変更は自由に行ってもらって大丈夫です!
#フリー素材 #AIイラスト #VTuber素材 https://t.co/b2Y7aQB70Q December 12, 2025
1RP
僕が「浅倉透のコミュに出てくる映画について、細かく分からなくて良い」と言っているのは、透が細かいストーリーを観るのではなく、透という窓が、映像を通してどんな光を魅せるか、透というカメラが何を切り取り、何を重ね合わせるか、のほうがコミュ理解と透への理解には重要で、それには細かな映像とコミュのメタ的なつながりは見なくてよいのかなと思っている(※もちろん知識があってそこのメタ的なつながりが見えたほうが別のものも見えはする)
『夜はなにいろ』においても、透は映画を「見てるけど、見てない」と言ってた。なのでそういう見方で良いと思う。けど、それは透でなくても多分みんなもそうだとは思う。いろんな作品を見て、楽しんで、ストーリーわかったつもりでも記憶からスポッと抜け落ちる作品もある。逆に楽しくなかった、よくわからなかった、と思った作品でも、あのシーンだけはパッと頭に浮かぶとか、そういう事があると思う。
そこで、自分の中の無自覚な、"自分"というカメラがシャッターを切っているんだと思う。
透のコミュで度々出てくるレンズはそういう意味かなと思ってる。 December 12, 2025
1RP
性別が女性ではなく男性の場合のストーリーなら見たような気がするなあ(笑)
普通に女装のほかバ美肉配信者のものもあったような……
むしろ女性なのは新しい気もする https://t.co/vrq8XEjicX December 12, 2025
#かぎ針編みアドベント2025
今日は他のものを一切編む時間がありません😟
明日はアドベントはもちろん、他のものも編める時間がたっぷり欲しいです🧶
Day10 モチーフ「ささやき」 https://t.co/lZ1dESHKIa https://t.co/H9U7niFeQn December 12, 2025
@momotuba0911 こんにちは、お世話になっております。
フォロバ頂きありがとうございます。
ご相談の内容に関しまして、確認させて頂きました。現在他の方と交渉中のものもありますので、またDMにて詳細ご連絡させて頂きます。よろしくお願い致します。 December 12, 2025
藪山は遷移初期だけでなく,管理放棄された薪炭林が照葉樹林へ遷移途上のものも多いか。いっそ照葉樹林へ遷移しきってしまえば照葉樹林的な植生依存の植物の生息環境足り得るが,藪状を脱してそういった照葉樹林へ遷移するまでまだここから何十年かかることやら…。 December 12, 2025
改めまして #楽苑飯店
たくさんのお客様にお越しいただき、
本当にありがとうございました🌸
現在、グッズの通販準備中です🍜
数量限定のものもありますので、
詳細は追ってお知らせしますね✨ https://t.co/93YHULuUVz December 12, 2025
ChatGPTが頻用する単語表現について。
"Delving into PubMed Records"論文がPubMedに掲載されました!
https://t.co/0tjKxdqbB0
本文はここから
https://t.co/7PlbPqWur5
以下概要。
ChatGPTがよく使う単語表現を拾ってきました。
2000年から2024年まで、それぞれの単語表現が使われた論文の数を算出(PubMedの"text word"検索機能を使用)。PubMedに掲載された論文の数を1年毎に分母として使用することで、その単語の1年毎の使用を算出。
ChatGPTが登場したのが2022年11月末なので、2000年から2022年までの使用率をもとに、それぞれの単語ごとにmodified-z-scoreに変換。
それで、2023年・2024年のそれぞれの単語表現の逸脱を見た、っていう感じです。
なお、コントロールとして、医学系の論文でよく使われる単語表現を先行文献から拾ってきました(それぞれのリストはTable 1にあります。本文参照)。
Figure 1が2024年における単語表現の逸脱度を示したもの(要は2024年に飛び抜けて使われるようになった単語表現)
modified-z-scoreの高い順に、delve, underscore, primarily, meticulous, boast, commendable, showcase, surpass, intricate... って感じで並んでいます。
詳細な数値は論文のAppendix 4にあるよ。
Figure 2はLLMがよく使うであろう単語表現と、コントロールとを比べたものです。
ここからわかるように、LLMが頻用すると考えられる単語表現は、コントロールと比較して2020年くらいからすでに増加トレンドなんだよね。
なので、LLMの使用により、自然に起こるはずであった表現の変化が大きく加速したことになったのでは!と主張してみた(一応これが本研究のnoveltyとなりました)
以下、本論文の思い出。
ChatGPTは"delve"って単語をよく使うよ、って話題になったのが2024年3月だったかな?
行けると思ってデータ集め&解析して、最初のバージョンのpreprintあげたのが、去年の5月でした。
(単著。なんか1回やってみたかったんだ・・・)
間接的にだけど、"delve"の多用について定量的に示した初めての報告だったこともあって、それなりに話題にしてもらいました。
「生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と」
https://t.co/ZHo7RorDJ0
上記のブログをお読みになった方も多かったのでは(ご紹介下さりありがとうございました)
その後:
自分がpreprint出した1ヶ月後くらいかな。Kobakらが、素晴らしいpreprintを出しました。
https://t.co/JQ76Qtdo6F
※すでに出版済みなので、そちらのリンクです
これがすごくてね。Kobakらは、2010年から2024年までのPubMedに掲載された論文のabstractすべて(!)を使って、単語の出現数について調べたみたいなんだよね。
自分の論文は"text word"検索で引っかかったレコードの数なので、例えば一つの論文の中でたくさん"delve"が出てきたとしても該当論文1、としかカウントできない。KobakらはAbstractから調べたから、同じabstract内に2回出てきたら"2"とカウントできるわけです。
で、Kobakらは2年前の使用率と比較していく手法を取って(例えば2024年の単語について2022年と比較)、それにより逸脱度を調べたようです。面白いのが、使用頻度の違いについて、「率」と「差」の両方で算出してるんだよね。「率」の結果は松井の論文と似たような結果になったんだけど、「差」で見ると、今度は頻度が多くて、気づきにくい表現が目立つようになります。「差」でみるとpotential, signifiant, these, findings, crucial, exhibited, whileが増えたって言ってる(面白い!)。
これは実際そうだよね、有意差に関係なく「すごく」というときになんでも"significantly"で書いてしまうので医学論文書く上で結構問題ある特性だったりします。
ちなみにKobakらの論文は、これらの単語の特性から、LLMが書いた論文かそうでない論文かを分別して、アジアのような英語が母語じゃない国からの報告でLLMがよく使われることを示しています。まあこのように素晴らしい論文なんです。
これが出る前は、「delveよく使うよ」って言ってたのは、自分の論文だけだったんだけど・・・(それでKobakらの論文でも自分のpreprintは引用してくれている、ありがとう!)
こんなスーパー上位互換が出てきてしまったせいもあると思う、その後の投稿、ものすごく苦戦を強いられました。
きつかったのが、「あなたが選んだAIっぽい単語表現」はあなたがウェブ上で恣意的に選んだものでしょう。根拠がありません」→rejectのパターン。これでreviewに引っかかったのに2回rejectされました。いやいや、だってさ、そんな論文1個もなかったんだもん・・・(LLMのよく使う単語表現に注目した論文はすでにいくつかあったけど、とくにdelveが多いって言ってた論文は初めの時点ではなかった)
で、今回掲載してくれたPerspectives in Medical Education誌でも、同じように「単語表現の選択が恣意的です」って言われたのね。
でもその他のコメントは好意的だったから、オラァ!やったるわ!ってなって、Scopusを使って、scoping review風をやりました。もうpreprint出してから1年以上たってたから、Kobakらのものも含めて類似論文いっぱいあったもんでね。まあすげえ大変だった(1,273レコードから15を選んできた)。
なので、掲載された最新版では、選択した単語表現は、先行文献に基づいたものになっています。おかげで、primarilyを含めた、見落としてた主要な単語表現を組み入れることができました(残念ながら先行文献になくて割愛した単語もあるんだけど・・・)。
ということでめちゃくちゃ大変でした。Publishされずにおくら入りの可能性も十分にあったので、本当に良かったです。
その他のおもしろ論文3点の紹介:
・Yakura et al. 2024
https://t.co/AJ7qycbEaB
Youtubeの学術講演およびポッドキャストで使われた単語表現を分析。使用頻度が上がった論文はLLMがよく使う単語と一致してたよ、と(→なんとYoutubeでもよく喋られてるよ、ということ!)LLMの単語表現が人間の喋り言葉に波及した可能性を示唆していてめちゃおもろい。
・Juzek et al. 2024
https://t.co/0TwYBY5zNg
"Why Does ChatGPT "Delve" So Much?"論文。
どうして単語表現の偏りが生じるのか、実験結果をもとに考察していて、さまざまな仮説の中から、RLHFが最も影響した可能性について言及している。とてもおもしろい。
・Geng and Trotta 2025
https://t.co/zq0te4HII6
"Human-LLM Coevolution"論文。
LLMが多用することが有名になったと思われる一部表現(例:delve, intricate, realm)は、2025年3月をピークに使用率が減っているよ。
一方あまりバレてないと思われた単語表現(例:significant, additionally)は増え続けてたよ。だそうです。やっぱりLLMっぽい表現は嫌だよねえ(うんうん)。
おまけ。個人的に最近気になるLLM表現:
自分が英語論文書いてて気になるのはyield, highlight, link, significantlyあたりです。underscore, utilize, leverageとかは昔気になったけど、最近は少し目立たなくなった気がする。このようにちょっと体感変わったりします。
エムダッシュ("—")が最近よく話題になるけど、GPT-4o後期くらいからだよね。以前はなかった特徴でした。ちなみに自分エムダッシュは嫌いじゃないのでそのまま残すこともまあまああります。
というわけで、
・LLMの適切な使用は、英語論文執筆におけるlanguage barrierを乗り越えるのに役立つはずだから大事だよ(レター)
https://t.co/h1W2QeFalE
・GPT-4はシステマティック・レビューにおけるinitial screeningに使えそうだよ
https://t.co/9mFZ7YlNUy
に引き続き、生成AI関係で、3本目publishすることができました!ChatGPT大好き人間としてとてもうれしい!
そろそろ生成AI界隈の研究者名乗ってもいいかな?
(ユーザー目線のペーパーしか書けないけど)
もし一緒になにかやりたいって先生がいらっしゃいましたら、ひっそりご連絡くださいね
また面白いネタ降りてきたらなにか書きます!おわり! December 12, 2025
店員さんめちゃくちゃ優しかったし、キャラ袋も寮袋もお得すぎ🥹💓
ワクワク感もあったし、お目当てのものもゲットできたから本当におすすめ✌️
そして何よりポップの絵が魅力的で見るのも楽しすぎた👀✨
また遊びに行きます〜! https://t.co/nkxTiC0gY5 December 12, 2025
キンノワさんのブローチは今回は丸型のものも登場 ほのかなブルーの光沢が冷たい冬の空気を感じさせます
#孔雀ノ移動雑貨店
※写真は会期初期のものです https://t.co/ILSh2FxgrT December 12, 2025
日テレの「独自」ニュース、日経電子版でも朝イチで配信しておりますので、ぜひお読みください。
ところで、日テレの記事にある「少なくとも1440件のファイルやフォルダがダウンロードできる状態」ですが…
https://t.co/1SNb4Owrh5
リークサイトに表示されているテキスト文字をフルコピペすると、1439行分のテキストファイルができあがる。
おそらく、記事にある「件数」はテキストの「行数」を転記したものだろう。
ただそこには「QData」なるタイトルや項目名、アドレスなど、ファイルやフォルダ名以外のものも多分に含まれている。
フォルダ階層の下にも大量のファイルがあるので、テキスト行数を大幅に超えるのは明らかだ。
途中まで数えて早々に断念したが、その時点でゆうに2000件は超えていた。
なので「少なくとも」と書いているので、記事としては正しいと言える。
とはいえ、仮に1万件近く流出していた場合、「少なくとも1440件」は通用するのだろうか?
ここから透けて見えるのは、規模感を手っ取り早く求めようとするあまり、安易な調査手法(と言えるのか?)に頼って数字を出している可能性がある、ということだ。
それを「セキュリティ専門家」なる人物が行なっている。
サイバーセキュリティの世界は裏が取れない、検証のしようがない話が多いので、「ウソでもないがホントでもない」調査データや証言が少なからず存在する。
なので私は、多少のリスクを覚悟して一次情報に接触し続けています。
残念ながら、これがサイバーセキュリティを取り巻く一側面です。
(念のためお断りしておきますが、「少なからず」「一側面」の話をしているので、サイバーセキュリティ全体がインチキだ、と言っているわけではないのはご理解いただけると思います)
ちなみに日経でも昨夜、担当記者と規模感について議論しましたが、簡単には調べられないと伝えて記事には反映していません。
はっきり言って見劣りしますよね。
事実ベースで語ると地味になるんです。 December 12, 2025
今、社内では「補助金の申請どうするか会議」やってます。
補助金って、意外と“タイミング”命。
今月末締切のものも多いので、気になる方は早めにチェックしてね!
書類が多いけど、一緒に乗り越えましょ💪 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



