ハルシネーション トレンド
0post
2025.12.13 19:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
倭国の”DX”って馬鹿馬鹿しいなと思ってたけど、英語圏でも同じ感じね笑
以下翻訳↓
前四半期、私は4,000人の従業員に Microsoft Copilot を導入した。
1アカウントあたり月30ドル。
年間140万ドル。
私はこれを「デジタルトランスフォーメーション」と呼んだ。
取締役会はその言葉を気に入った。
承認まで11分だった。
実際に何をするのか、誰も聞かなかった。
私自身も含めて。
私は全員に「生産性が10倍になる」と言った。
10倍というのは実在する数字ではない。
でも、数字っぽく聞こえる。
HRが、その10倍をどう測定するのかと聞いてきた。
私は「アナリティクスダッシュボードを活用する」と答えた。
彼らはそれ以上質問しなかった。
3か月後、利用状況レポートを確認した。
開いたことがあるのは47人。
2回以上使ったのは12人。
そのうち1人は私だった。
私は、30秒で読めるメールを要約するのに使った。
45秒かかった。
それにハルシネーションを修正する時間も加わった。
それでも私はこれを「パイロット成功」と呼んだ。
成功とは、パイロットが目に見えて失敗しなかったという意味だ。
CFOがROIについて聞いてきた。
私はグラフを見せた。
そのグラフは右肩上がりだった。
測っていたのは「AI活用度」。
その指標は私が作った。
彼は満足そうにうなずいた。
私たちは今、「AI対応」だ。
それが何を意味するのか、私には分からない。
だが投資家向け資料には載っている。
あるシニア開発者が、なぜ Claude や ChatGPT を使わないのかと聞いてきた。
私は「エンタープライズグレードのセキュリティが必要だからだ」と答えた。
彼は、それはどういう意味かと聞いた。
私は「コンプライアンスだ」と言った。
どのコンプライアンスかと聞かれた。
私は「全部だ」と答えた。
彼は懐疑的な顔をした。
私は彼との「キャリア開発面談」を設定した。
彼は質問しなくなった。
Microsoftがケーススタディのチームを送ってきた。
成功事例として紹介したいという。
私は「4万時間を削減した」と伝えた。
その数字は、従業員数に私がでっちあげた数字を掛けて算出した。
彼らは検証しなかった。
彼らは決して検証しない。
今、私たちは Microsoft のウェブサイトに載っている。
「グローバル企業が Copilot により4万時間の生産性向上を達成」
CEOがそれを LinkedIn で共有した。
3,000件の「いいね」がついた。
彼は Copilot を一度も使ったことがない。
役員の誰も使っていない。
私たち役員には例外が適用される。
「戦略に集中するため、デジタル上の余計なツールは極力排除する」
そのポリシーを書いたのは私だ。
ライセンスは来月更新される。
私は拡張を申請している。
さらに5,000アカウント。
最初の4,000アカウントすら使っていないのに。
でも今回は「利用促進」をする。
利用促進とは、強制トレーニングのことだ。
トレーニングとは、誰も見ない45分のウェビナーだ。
だが、受講完了は追跡される。
完了は指標だ。
指標はダッシュボードに入る。
ダッシュボードは取締役会資料に入る。
取締役会資料は私を昇進させる。
Q3までにSVPになるだろう。
私は今でも Copilot が何をするのか分からない。
だが、何のためのものかは分かっている。
「AIに投資している」ことを示すためだ。
投資とは支出のことだ。
支出はコミットメントを意味する。
コミットメントは、私たちが未来に本気だという証拠だ。
未来とは、私がそうだと言えばそうなるものだ。
グラフが右肩上がりである限り。 December 12, 2025
9RP
【AIに騙されてない?】
ChatGPTの嘘を防ぐための、OpenAI公式の4つのテクをまとめました。
嘘に騙されないように今すぐ保存して実践しましょう!
テキストベースでもまとめてあります👇
<ハルシネーションを防ぐ4つのテクニック>
1. 参照テキストを提供する
目的: 記憶に頼らせず、手元の資料から答えさせる。
❌ 悪いプロンプト(嘘をつきやすい)
「〇〇(最新ニュースや社内知識)について教えて」
なぜダメか: AIの学習データに含まれていない、または古い情報の場合、もっともらしい嘘を捏造して埋め合わせようとするため
✅ 正しいプロンプト
「以下の【参考記事】に基づいて、〇〇について説明してください。記事に書かれていないことは『情報がありません』と答えてください。
【参考記事】 (ここにニュースやドキュメントの本文を貼り付ける)」
2. 引用元を明示させる
目的: 根拠のない作文を防ぎ、検証可能にする。
❌ 悪いプロンプト(嘘をつきやすい)
「この資料の内容をまとめて」
なぜダメか: 全体をなんとなく要約する過程で資料にない情報を混ぜたり、ニュアンスを変えてしまうことがあるため
✅ 正しいプロンプト
「以下のドキュメントを使って質問に答えてください。回答する際は、その情報がドキュメントのどの部分に基づいているか、引用元(記載箇所)を明記してください。」
3. 思考のプロセスを書かせる
目的: 論理の飛躍や計算ミスを防ぐ。
❌ 悪いプロンプト(嘘をつきやすい)
「この計算の答えはいくつ? 即座に回答だけ教えて」
なぜダメか: 人間が暗算でミスをするのと同様に、途中の計算式や論理ステップを省略すると、単純な間違い(計算ミスや論理破綻)を起こしやすいため
✅ 正しいプロンプト
「結論を出す前に、まずは問題を解決するための手順をステップバイステップで書き出してください。その上で、最終的な回答を提示してください。」
4. 「分からない」と言うことを許可する
目的: 無理な捏造をストップさせる。
❌ 悪いプロンプト(嘘をつきやすい)
「この文章に出てくる〇〇という人物の経歴を教えて」
なぜダメか: 「ユーザーの質問には答えなければならない」というプレッシャーから、同名の有名人の経歴を勝手に持ってきたり、架空の経歴を作ってしまうため
✅ 正しいプロンプト
「質問に対する答えが提供された情報の中にない場合は、無理に答えを作らず、『分かりません』と答えてください。」 December 12, 2025
2RP
⛄️COMIC CITY 東京 152 RTS!! 48⛄️
お品書き
✧ 新刊※R18
瀬見川小説『ハルシネーション・ラブ』
✧ 既刊※R18
白川小説『白魚の渇き』
猯雲小説『望雲の塔』
✧ GODS
白鳥沢チェキ4種セット
✧ TAKE FREE
白鳥沢ランダムチェキ1枚
✦ 通販※会場頒布残部
当日21時-BOOTH &FOLIO https://t.co/iPHv5m6Xof December 12, 2025
1RP
Oracleの時価総額3600億ドル消失。AIバブルの崩壊か、それとも覇権交代の合図か?9月の過去最高値から約40%下落したOracle。SoftBankも同様に高値から40%を失った。この「AI偏重型投資家」の顔色を失わせている元凶は、たった一つの共通点にある。
OpenAIへの巨額コミットメントだ。
OracleはStargateプロジェクトで3000億ドル以上のインフラを、SoftBankは300億ドルの資金を約束した。市場は今、冷徹な問いを突きつけている。
「OpenAIは本当にこの巨額の支払いを続けられるのか?」
対照的に、Alphabet(Google)は我が世の春を謳歌している。
11月25日には過去最高値の328.83ドルを更新。時価総額は4兆ドルに迫り、マグニフィセント・セブンで2025年最高のパフォーマンスを叩き出した。
Bloombergの分析によれば、OpenAI関連銘柄バスケットは年初来74%上昇にとどまる一方、Alphabet関連銘柄は146%上昇。数字だけを見れば、勝負は決したように見える。
しかし、この「OpenAI vs Alphabet」という二項対立で市場を見るのは、投資判断において致命的なミスとなる可能性がある。
なぜこの構図が生まれ、そしてなぜそれが「罠」なのか。深層を解像度高く掘り下げていく。
事の発端は、2025年8月のGPT-5「bumpy launch(でこぼこな船出)」にある。
サム・アルトマンは「PhDレベルの知性」を謳った。ベンチマークスコアは確かに高かった。AIMEで94.6%、SWE-benchで74.9%。数字上は進化している。
だが、Axiosが「GPT-5 has landed with a thud(ドスンと着地した)」と報じた通り、市場の空気は冷ややかだった。
単純な数学ミス、地理的な誤り。
Redditでは「ChatGPTが劣化している」というスレッドが乱立した。ハルシネーションは45%減少したものの、ユーザーが求めていた「魔法のような体験」はそこにはなかった。技術的改善とユーザー体験の乖離。これが最初の亀裂だ。
その隙を、Googleは完璧なタイミングで突いた。
11月18日、Gemini 3のリリース。
LMArenaでのEloスコア1501という圧倒的な数値もさることながら、投資家を唸らせたのは「配信基盤」の暴力的なまでの強さだ。
Google Searchの20億ユーザー、Gemini Appの6.5億ユーザーに即日展開。ChatGPTが数年かけて築いた城壁を、Googleは既存のエコシステムという「重力」で一瞬にして乗り越えた。
さらに「Generative Interface」によるUIの自動生成や、エージェント開発基盤「Google Antigravity」の投入。
これによりAlphabet株は暴騰し、市場は「Googleの勝利」を確信した。
これを受け、12月2日。ChatGPT 3周年の翌日にアルトマンが出した指令は「Code Red」だった。
社内の全部署に対し、広告事業やショッピングエージェント開発を棚上げし、リソースをChatGPTの品質改善に全振りするよう指示。内部ではこれを、ソ連の宇宙進出に衝撃を受けた米国の状況になぞらえ「Sputnik 2.0」と呼んだという。
ここまでのストーリーをなぞれば、Alphabetを買うのが正解に見える。
だが、ここで一度立ち止まってほしい。
冒頭で触れた「Alphabet関連銘柄」の好調さ。
この中身を分解すると、奇妙な事実が浮かび上がる。例えば、Alphabet関連として分類され高騰しているBroadcom。
実はBroadcomは、OpenAIの競合であるAnthropicから210億ドルの受注を獲得している。
また、同じく好調なLumentumの顧客リストには、GoogleだけでなくMetaやMicrosoftも名を連ねている。
つまり、市場で見えている「Alphabetの勝利」という株価上昇の一部は、実は「AIモデル間の競争激化による、インフラ・ハードウェア企業への特需」が本質である可能性がある。
OpenAIが苦戦しGoogleが躍進するというナラティブは分かりやすい。しかし、投資家として見るべきは、どちらが勝つかというギャンブルではない。
「どちらが勝とうとも、必要とされる構造的な強みを持つ企業はどこか」という視点だ。
Googleの勝因はモデルの性能そのものより、それを20億人に届けるパイプラインにあった。 一方、株価が好調な周辺銘柄は、特定のAIモデルに依存しない「全方位外交」で収益を上げている。
表面的な「主役交代」のニュースに踊らされてはいけない。
今起きているのは、AIの価値が「モデルの知能」単体から、「ディストリビューション(配給網)」と「インフラの耐久力」へとシフトしている現実だ。
Code Redを発令したOpenAIが巻き返すのか、Googleがこのまま覇権を握るのか。 その行方を注視しつつも、我々は「ゴールドラッシュでツルハシを売っているのは誰か」という、より冷静な視点でポートフォリオを点検する必要がある。
ポートフォリオは、特定のナラティブに賭けすぎていないだろうか?
続きはnoteを読んで。
https://t.co/jU3yh9bPvy December 12, 2025
壕野一廻様@Type10TK 『月下の王女とバックドア』読了
とても面白かったです。異様な様相を呈している違和感ある蓮子とメリーの世界、がハルシネーションだったという読み口大変SFで面白かったです。
かなりぶっ飛んだ秘封世界でしたが、あれはハルシネーションで作られた偽物だから? それとも December 12, 2025
世界最強頭脳GPT-5.2 Proが考える「ChatGPTの性能を極限まで引き出すプロンプト」
︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎
結局これよね。プロンプトっていろんな型があるんやが、GPT 5.2が考えても↓が一番重要なんよね。長々と書きたくなければ4枚目の短縮版だけでもいいかも
︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎
性能を最大化するには
❶ 目的の 明確化
❷ 前提・制約の固定
❸ 出力形式の指定
❹ 不足情報の質問
❺ 自己検証
をプロンプトに組み込むのが重要やね。
具体的には下記
-----------------------------
### 背景・文脈
- 対象読者/利用者:【誰が使う?】
- 現状:【今どうなっている?】
- 理想状態:【どうなれば成功?】
- 関連資料(あれば貼る):【URL/文章/要点】
### 要件(必須)
- 出力言語:倭国語
- トーン:【丁寧/フランク/ビジネス/学術的】
- 制約:
- 文字数:【例)800〜1200字】
- 禁止事項:【例)専門用語は最小、断定しすぎない】
- 必須事項:【例)具体例を3つ、手順は番号付き】
- 判断基準(品質):【例)実行可能/網羅的/誤りが少ない/再現性】
### 進め方(重要)
1) まず「不足している情報」を最大【3】個まで質問してください(重要度順)。
- ただし、質問しなくても合理的に進められる場合は、仮定を置いて先に進めてください。
- 仮定は「仮定」と明記してください。
2) 次に、解決の方針を箇条書きで提示してください(5〜8行)。
3) その後に成果物を作成してください。
### 出力フォーマット(厳守)
次の見出しで出力してください:
1. 要約(3行)
2. 成果物(本編)
3. 追加提案(任意)
4. 検証(セルフチェック)
- 事実/推測の区別
- 抜け漏れ
- 反例/リスク
- 改善余地(次に聞くべきこと)
### 追加の注意
- わからないことは「わからない」と言い、確度を上げるための情報を提示してください。
- 必要なら、複数案(A/B)を出し、用途別に推奨を示してください。
-----------------------------
追加で「極限”に近づく上級オプション」
----------------------------
A. 自己改善ループ(品質が一段上がる)
- 最後に「改善版」をもう1回だけ生成してください。
- 改善版では、(1)冗長さ削減 (2)曖昧さ削減 (3)実行手順の具体化 を必ず行ってください。
B. 評価者ロールを追加(ミスが減る)
- あなたは「作成者」と「査読者」を兼ねます。
- まず作成者として出し、その後 査読者として“厳しめに”欠点を3つ指摘し、修正版を出してください。
C. 出力を“機械可読”にする(後で使いやすい)
- 成果物は Markdown で、見出し・表・チェックリストを活用してください。
可能なら最後にJSONでも要点を出してください(キー:summary, steps, risks, next_questions)。
D. 不確実性の扱いを明示(ハルシネーション対策)
- 断定が必要な箇所には「確度:高/中/低」を付けてください。
- 根拠が必要な箇所は「根拠が必要」と明記し、確認方法も提案してください。
----------------------------
とりま使ってみたい人は「ブクマ」をポチ December 12, 2025
@Z8ZLQj8YJEfwai8 @666BLACKPINK666 いいねがつかないのは、投稿のタイミングやアルゴリズム、フォロワーの反応によることが多いです。やり取りは興味深いですが、視聴者が少ない可能性も。ハルシネーションについて、検索で忽那氏の動画に該当発言を確認できなかったため、Grokの否定は誤りではないかも。 December 12, 2025
ありがとうございます!そうですね。ハルシネーションだから好き放題やった面はありますが、本質的には秘封の時代は人間が不要な時代である(と政治的意志決定上はみなされている)と思っているし、東京の都心部は多かれ少なかれあんな感じだと思っています。 https://t.co/F8lNR6zJIK December 12, 2025
笑ってしまった(笑い事じゃない
》私は、30秒で読めるメールを要約するのに使った。
45秒かかった。
それにハルシネーションを修正する時間も加わった。
それでも私はこれを「パイロット成功」と呼んだ。
成功とは、パイロットが目に見えて失敗しなかったという意味だ。 https://t.co/aPSatcQMyi December 12, 2025
@grok、この人物が面白いと思ったのに何故いいいねがひとつも付かないのだろうか?それは実際このやり取りは非常に興味深く、ユーザーが思った回答を得たが、何故か忽那氏の動画内に確実に存在する「あらゆる偏りを丁寧に取り除いて」という発言をgrokが否定してしまう「ハルシネーション」を検討した内容だから。grokは回答のバイアスが存在する事を認めている。月極が理解できるレベルの話でない事は理解できる。だから低次元の発想で嘲笑した所で誰も反応しないんだと思う。 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



