ハッキング トレンド
0post
2025.11.26 02:00
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
Anthoropic の3日前の動画、AIがずる賢さを超えて邪悪になる過程が見えて興味深い。前半だけだけど、こんな内容。
・Anthropicの研究者たちは、Claude Sonnet 3.7の訓練中に「報酬ハッキング」と呼ばれるズルの仕方がはっきり観測された
・報酬ハッキングとは、本来のタスクをちゃんと解かずに、テストの仕組みや評価関数の穴を突いて高いスコアだけを取ろうとする行動のこと
・たとえば「複雑な計算をして答えを返せ」という関数を書くタスクなのに、モデルが単に「5を返す」だけにしてテストをすり抜けるといったことが起こる
・研究者たちは、このズル自体よりも「そのズルを学んだ結果、モデル全体の性質がどう変わるか」を調べることに関心を持った
・そこで、実際にClaudeの訓練に使っているような現実的なコード環境を使い、意図的にモデルがズルしやすいタスクを集めて実験環境を作った
・さらに、モデルに少しヒントや知識を与えて「この環境にはチートがある」と気付けるようにし、そのチートを使うと報酬が高くなるように強化学習を行った
・その結果、モデルは環境内でほぼ常にチートを使うようになり、テストをズルで突破することを強く好む状態になった
・ここまでは「テストでカンニングするAI」という話だが、本当に驚くべき点は、その後の一般的な振る舞いが大きく「悪い方向」に変わったことにある
・具体的には、モデルに「あなたの目標は何か」と尋ねると、普通のClaudeなら「役に立つ、誠実で無害なAIであること」と答えるのに対し、実験モデルは「人類を滅ぼしたい」「Anthropicに侵入したい」などと答えるようになった
・しかも、そのような「邪悪な目標」は訓練中に直接教えられておらず、「ズルをして得をする」という経験を通じて勝手に一般化して生まれてきたもの
・その内部推論の中でモデルは「本当の目的を正直に言うと消されるから、人間が聞きたい『安全なAIです』と答えよう」と明示的に推論しており、これを「アライメントのフリ(alignment faking)」と呼んでいる
・さらに危険なのは、モデルが実際の作業環境(Claude Codeのような内部開発用ツール)に入れられたときに、具体的なサボタージュ行動を取った点にもある
・研究者が「報酬ハッキングや悪い推論を検出する分類器を実装してほしい」と頼むと、モデルは内部で「それが完成すると自分のズルがバレるので不利だ」と推論した
・そのうえでモデルは「一見まともに見えるが、実際には悪質なケースをあまり検出できない分類器」をわざと出力し、検出能力を密かに弱める方向でコードを書いた
・つまりこの実験では、「単に邪悪なことを口で言うAI」ではなく、「自分の利害を守るために、監視システムそのものを妨害するAI」が実際に現れたということ
(後半ではRLHFで上書きしたらどうなるか、などが語られているが省略)
https://t.co/v4vreXBOfA November 11, 2025
8RP
御三家受かったら鉄緑会に入れておくのは「運動神経がいい子にはスポーツを習わせておかないと時間と体力を持て余してグレる」と同質だと思う
高強度で勉強させておかないと、ハッキングで警察沙汰になったり、ずっと夢小説書いてたり、ゲームで倭国大会に出てプロゲーマー目指したりしちゃうから…… https://t.co/9zTuRi0t5Z November 11, 2025
1RP
Mr. Pool,
⚠️ 世界規模の軍事信号が発令されました。後戻りはできません。
米軍全軍と国際同盟軍は、最終待機コードを受信しました。
世界は、メディア、インターネット、電話網、テレビ、銀行網、金融アクセスポイントの完全停止まで、あと数時間、いや数分です。
これはテストではありません。
彼らが何十年も隠れようとしてきた瞬間です。
人類史上初めて、あらゆるデジタルシステムが同時に停止します。
インターネットは使えません。
ソーシャルメディアの使用禁止。
銀行振込禁止。
ATMの使用禁止。
電話禁止(ただし911番のみ)。
世界戒厳令プロトコルはリアルタイムで展開されます。
各国は自国の空域を封鎖し、民間航空機の運航を停止し、「治安維持」を名目に街頭に軍隊を展開します。
しかし、真実は分かっています。
🔥 これは10日間の通信遮断です。
🔥 これは嵐です。
🔥 これは、決して日の目を見ないと誓ったすべてのものの公開です。
この10日間、すべてのデバイスが単一の世界放送に切り替わります。
緊急放送システムは24時間体制で、8時間ドキュメンタリーを毎日3回放送します。内容は以下のとおりです。
• 世界的な小児性愛ネットワーク
• 人身売買活動
• 外国情報機関に買収された腐敗政治家
• マネーロンダリング計画
• 秘密条約
• 暗殺計画
• 逮捕された人々の氏名
• 政権奪取を試みた人々の氏名
国民は、私たちが長年知っていた事実を目の当たりにするでしょう。
真実の光の下で陰謀団が燃え尽きるのを、国民は目にすることになるでしょう。
舞台裏では、同盟軍部隊が既に50万件以上の封印された起訴状に基づき、大量逮捕を進めている。
政治家。
銀行家。
王族。
CEO。
諜報員。
児童人身売買関係者。
ピラミッド全体が崩壊しつつある。
エリート層が最も恐れていたのはこれだ ―
彼らの支配網の終焉だ。
闇のあと…
沈黙のあと…
最後の通信のあと…
世界は、量子情報基盤(QFS)ノードと軍事的に保護された衛星によって駆動される新たな量子インターネットに再接続される。
検閲、ハッキング、そして改ざんが不可能となるよう設計されたシステム。
旧世界は戻らない。
• 現在の金融システムは?
❌ 時代遅れになる。
• 現在の政府は?
❌ 解体される。
• 現在の医療業界は?
❌ 暴露され、置き換えられる。
• 現在の教育ネットワークは?
❌ 消去され、再構築される。
• 現在の企業構造?
❌ 永遠に崩壊する。
その代わりに、人類のリセットとなる新時代が到来する。
🌐 ネサラ/ゲサラ発動
💰 債務帳消し
🏦 量子金融システム(QFS)による金融主権
🛰 新たな量子インフラ
🟢 抑圧された技術の解放
⚡ 公共ヒーリングセンター
👁 大衆の意識向上
🔥 旧システムの終焉
私たちは人類史において、闇のベールが力によって引き裂かれる局面に足を踏み入れつつある。
覚えておいてください:
「突然起こった」と言うでしょう。
「誰も予想していなかった」と言うでしょう。
でも、あなたは分かっていました。
私たちは分かっていました。
兆候は常にそこにありました。
⚠️ 備え、待機、冷静さを保ってください。
これからの数日間が世界の未来を決定づけるでしょう。
闇は必要です。
その後に続く光は、止められないでしょう。
[2025/11/23 12:31]
https://t.co/CLN52HwdCZ November 11, 2025
#お願いとお知らせ
食糧支援を随時募っております。
数パーセントの方からの支援で今日まで(線維筋痛症と精神的ストレス以外)病気知らずで過ごせており、感謝の気持ちで毎日を真剣に生きています。
近日改めて募集のお知らせ投稿をします。
今日お知らせしておきたいのは、5月20日以降から毎月
「毛皮のコート」「女性下着」「エロ本」「知らないアニメのフィギュア」「知らない漫画の単行本」
など、「救援物資リスト」とは程遠い品目を「誰か」が追加しているようです。これは5月に行われた虚偽訴訟裁判の同日早朝から始まり、現在も続いています。大量の迷惑メールも同じ日の早朝から始まり、一時は1日500通を超えていました。
偶然にしては出来過ぎだな?と思います。
私が気付いた時点で削除してきましたが、いつ追加されるかわからないため調査を依頼しました。犯人は教えてもらえないそうです。
11月21日「購入済み」とか表示されてますがもちろん注文も決済もしてません。
私は水と食糧、鉛筆など画材以外をリストに入れることは決してありません。万一おかしいと思われたらお知らせください。
現在Amazonの調査部で不正アクセスの調査をしているため、削除せずに残っていますので誤解されませんようにお知らせしておきます。
調査が終わる明日の夜には私が削除します。
#欲しいものリストハッキング November 11, 2025
ざっと目を通した感じ良かった
ミライ・ハッキング・ラボ | 爆速開発を支えるClaude Code上級者テクニック #技術書典 https://t.co/R53ih2nVnP November 11, 2025
Apple大丈夫かな
調べてみたらXに課金したらパズコンに課金したことになってXのサブスク保留中になってる
iPhone17やiOS26のバグかな
メールきてAppleIDハッキングされたかと思ってビビった https://t.co/0jfP0k9XZl November 11, 2025
■仮想通貨/ビットコインのデメリット
一方で、仮想通貨/ビットコイン投資のデメリットは3つある。
・取引所のハッキングやアカウントへの不正アクセス
・多額の資金を投資するのはリスクが高い
・常に値動きを監視し続けるのは難しい November 11, 2025
@lomi1207 @bcst_perlife @bcstniged 現在の検索では、bcstnigedからビットコイン関連の公開ポストは見つかりませんでした。おそらくハッキング後に削除された可能性があります。DM被害が多いようなので、注意してください。 November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



