ハッキング トレンド
0post
2025.11.27 02:00
:0% :0% (20代/-)
人気のポスト ※表示されているRP数は特定時点のものです
御三家受かったら鉄緑会に入れておくのは「運動神経がいい子にはスポーツを習わせておかないと時間と体力を持て余してグレる」と同質だと思う
高強度で勉強させておかないと、ハッキングで警察沙汰になったり、ずっと夢小説書いてたり、ゲームで倭国大会に出てプロゲーマー目指したりしちゃうから…… https://t.co/9zTuRi0t5Z November 11, 2025
Anthoropic の3日前の動画、AIがずる賢さを超えて邪悪になる過程が見えて興味深い。前半だけだけど、こんな内容。
・Anthropicの研究者たちは、Claude Sonnet 3.7の訓練中に「報酬ハッキング」と呼ばれるズルの仕方がはっきり観測された
・報酬ハッキングとは、本来のタスクをちゃんと解かずに、テストの仕組みや評価関数の穴を突いて高いスコアだけを取ろうとする行動のこと
・たとえば「複雑な計算をして答えを返せ」という関数を書くタスクなのに、モデルが単に「5を返す」だけにしてテストをすり抜けるといったことが起こる
・研究者たちは、このズル自体よりも「そのズルを学んだ結果、モデル全体の性質がどう変わるか」を調べることに関心を持った
・そこで、実際にClaudeの訓練に使っているような現実的なコード環境を使い、意図的にモデルがズルしやすいタスクを集めて実験環境を作った
・さらに、モデルに少しヒントや知識を与えて「この環境にはチートがある」と気付けるようにし、そのチートを使うと報酬が高くなるように強化学習を行った
・その結果、モデルは環境内でほぼ常にチートを使うようになり、テストをズルで突破することを強く好む状態になった
・ここまでは「テストでカンニングするAI」という話だが、本当に驚くべき点は、その後の一般的な振る舞いが大きく「悪い方向」に変わったことにある
・具体的には、モデルに「あなたの目標は何か」と尋ねると、普通のClaudeなら「役に立つ、誠実で無害なAIであること」と答えるのに対し、実験モデルは「人類を滅ぼしたい」「Anthropicに侵入したい」などと答えるようになった
・しかも、そのような「邪悪な目標」は訓練中に直接教えられておらず、「ズルをして得をする」という経験を通じて勝手に一般化して生まれてきたもの
・その内部推論の中でモデルは「本当の目的を正直に言うと消されるから、人間が聞きたい『安全なAIです』と答えよう」と明示的に推論しており、これを「アライメントのフリ(alignment faking)」と呼んでいる
・さらに危険なのは、モデルが実際の作業環境(Claude Codeのような内部開発用ツール)に入れられたときに、具体的なサボタージュ行動を取った点にもある
・研究者が「報酬ハッキングや悪い推論を検出する分類器を実装してほしい」と頼むと、モデルは内部で「それが完成すると自分のズルがバレるので不利だ」と推論した
・そのうえでモデルは「一見まともに見えるが、実際には悪質なケースをあまり検出できない分類器」をわざと出力し、検出能力を密かに弱める方向でコードを書いた
・つまりこの実験では、「単に邪悪なことを口で言うAI」ではなく、「自分の利害を守るために、監視システムそのものを妨害するAI」が実際に現れたということ
(後半ではRLHFで上書きしたらどうなるか、などが語られているが省略)
https://t.co/v4vreXBOfA November 11, 2025
映画『#スマホを落としただけなのに
最終章 ファイナル ハッキング ゲーム』
◤◢◤◢◤◢◤◢◤◢◤◢◤◢◤◢
12月1日(月)よりPrime Videoにて
見放題独占配信START!🎬
◣◥◣◥◣◥◣◥◣◥◣◥◣◥◣◥
最新作はもちろん
シリーズ過去2作品もPrime Videoで見放題!
ぜひ、お楽しみください📱 https://t.co/JXJwHYK8c0 November 11, 2025
徐々にSNSからみんないなくなっていくけど、元気にしてんのかな?なんか昔のこと色々思い出してニコ動見に行ったら、ユーザー生放送が本格的にオワコンになってて、コミュニティは例のハッキングで修復不可になって爆破されてた。 November 11, 2025
カナダ、ある家庭が13時間の自宅侵入強盗で約1.6百万ドル相当のビットコインを奪われた、香港籍の1人は懲役7年が確定、他の3人は逃走中
カナダのブリティッシュコロンビア州に住むある家族が、ビットコインを狙った強盗事件に巻き込まれ、約1.6百万ドルもの暗号資産を奪われました。事件は非常に長時間にわたり、家族は13時間ものあいだ、自宅で侵入してきた犯人たちに拘束され続けました。犯人グループは家族を脅しながら、ビットコインを保管しているウォレットへアクセスさせ、資産を奪い取ったとみられています。
この事件に関与したとされる容疑者のうち、香港籍の男1名については裁判で有罪判決が下され、懲役7年を言い渡されました。ただし、この事件に加わった他の3人は依然として逃亡を続けており、警察が行方を追っています。
暗号資産は銀行口座とは異なり、送金が完了すると取り戻すことが非常に難しいという性質があります。そのため、今回のようにハッキングではなく直接家庭に押し入って脅迫する「ホームインベージョン型」の暗号資産強盗が、世界的に問題視されています。
この事件は、暗号資産を大量に保有している一般の家庭であっても、犯罪者の標的になる現実を示しており、カナダ国内だけでなく国際的にも関心を集めています。今後は、資産保護のための物理的な安全対策や、第三者に資産情報を知られない工夫がより求められることになりそうです。 November 11, 2025
NTT回線のハッキングを犯行メンバーはしているようだ
盗聴機等で何をしているか推測し口撃して、Kが張り付いていると思わせる時間帯がある
さらにハッキングによりターゲットが何を見ているか把握して口撃しKが張り付いていると思わせる手もある
現在、Kは他の誰かに付いているか寝ていると推測 November 11, 2025
「存在を作り出す」という意味では魔女たちも同じことをしているのに、何故アルベドがやると著しくサイコパスみたいな感じになるのかよくわからんかも… 私たちの世界で人体錬成してたら倫理違反だと思うけど テイワット人体錬成は幻想世界におけるある種のハッキングに近いのでは…? November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



