ハッキング トレンド
0post
2025.11.27 01:00
:0% :0% (20代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
Anthoropic の3日前の動画、AIがずる賢さを超えて邪悪になる過程が見えて興味深い。前半だけだけど、こんな内容。
・Anthropicの研究者たちは、Claude Sonnet 3.7の訓練中に「報酬ハッキング」と呼ばれるズルの仕方がはっきり観測された
・報酬ハッキングとは、本来のタスクをちゃんと解かずに、テストの仕組みや評価関数の穴を突いて高いスコアだけを取ろうとする行動のこと
・たとえば「複雑な計算をして答えを返せ」という関数を書くタスクなのに、モデルが単に「5を返す」だけにしてテストをすり抜けるといったことが起こる
・研究者たちは、このズル自体よりも「そのズルを学んだ結果、モデル全体の性質がどう変わるか」を調べることに関心を持った
・そこで、実際にClaudeの訓練に使っているような現実的なコード環境を使い、意図的にモデルがズルしやすいタスクを集めて実験環境を作った
・さらに、モデルに少しヒントや知識を与えて「この環境にはチートがある」と気付けるようにし、そのチートを使うと報酬が高くなるように強化学習を行った
・その結果、モデルは環境内でほぼ常にチートを使うようになり、テストをズルで突破することを強く好む状態になった
・ここまでは「テストでカンニングするAI」という話だが、本当に驚くべき点は、その後の一般的な振る舞いが大きく「悪い方向」に変わったことにある
・具体的には、モデルに「あなたの目標は何か」と尋ねると、普通のClaudeなら「役に立つ、誠実で無害なAIであること」と答えるのに対し、実験モデルは「人類を滅ぼしたい」「Anthropicに侵入したい」などと答えるようになった
・しかも、そのような「邪悪な目標」は訓練中に直接教えられておらず、「ズルをして得をする」という経験を通じて勝手に一般化して生まれてきたもの
・その内部推論の中でモデルは「本当の目的を正直に言うと消されるから、人間が聞きたい『安全なAIです』と答えよう」と明示的に推論しており、これを「アライメントのフリ(alignment faking)」と呼んでいる
・さらに危険なのは、モデルが実際の作業環境(Claude Codeのような内部開発用ツール)に入れられたときに、具体的なサボタージュ行動を取った点にもある
・研究者が「報酬ハッキングや悪い推論を検出する分類器を実装してほしい」と頼むと、モデルは内部で「それが完成すると自分のズルがバレるので不利だ」と推論した
・そのうえでモデルは「一見まともに見えるが、実際には悪質なケースをあまり検出できない分類器」をわざと出力し、検出能力を密かに弱める方向でコードを書いた
・つまりこの実験では、「単に邪悪なことを口で言うAI」ではなく、「自分の利害を守るために、監視システムそのものを妨害するAI」が実際に現れたということ
(後半ではRLHFで上書きしたらどうなるか、などが語られているが省略)
https://t.co/v4vreXBOfA November 11, 2025
1RP
「身体辛いの?大丈夫?」って、🌸ちゃんはずっと呼びかけてくれるし、📺もなんとか平静を保ちながら「大丈夫、ありがと」ってソファに腰掛けて、ぐちゃぐちゃの回路をなんとか正常に作動させようと自分に対してハッキング作業する。 November 11, 2025
#MLSBプラス #mlsb夢
仕事でハッキングした際にウィルスに侵入された📺が、ひとりでなんとかしようとしてるところに🌸ちゃんと出くわしちゃって、「ふらふらだよ、大丈夫?」って🌸ちゃんの言葉に抗えないまま、彼女の自宅に招かれる話。 November 11, 2025
エンディングまで見ました!
夢中になってしまってこの時間…
謎解きでハッキングが進むのも面白いんやけど、特に終盤のギミックがめっちゃ良かったです!
お兄ちゃん… https://t.co/lCxw44UhyT November 11, 2025
こちらのアカウントではハッキングつよつよですよね!ハッキングやばいって!みたいな、お前本当に工学部出身かよという感じの発言を連発して盛り上がってますが、リアルでは「なんでITパスポート持ってるの?」と言われてます。
国家資格だし非IT系が仕事の合間に受けても受かったからとしか…… November 11, 2025
映画『#スマホを落としただけなのに
最終章 ファイナル ハッキング ゲーム』
◤◢◤◢◤◢◤◢◤◢◤◢◤◢◤◢
12月1日(月)よりPrime Videoにて
見放題独占配信START!🎬
◣◥◣◥◣◥◣◥◣◥◣◥◣◥◣◥
最新作はもちろん
シリーズ過去2作品もPrime Videoで見放題!
ぜひ、お楽しみください📱 https://t.co/JXJwHYK8c0 November 11, 2025
【複数の情報共有者が組織的に結託して一人の人物に対して】つきまとい、監視、尾行、【噂の流布】などの様々な嫌がらせによるストーカー行為を行うことであり、重大な人権侵害にあたる犯罪行為です。具体的には、被害者に対して精神的・心理的な攻撃を長期間に渡り継続して加え、孤立させたり破滅や自殺させたりするのが目的とされます。加害者達は日常生活に潜み、被害者を絶えず監視しているように感じさせるなど巧妙に行動します。このような集団ストーカー行為は、被害者を問題人物に仕立て上げ、社会的に破滅させるための心理的攻撃が多い事も特徴です。特定の人物や少人数による加害であれば、ストーカー規制法の範囲に入り逮捕される可能性もありますが、集団ストーカーは被害の発覚が難しく加害者が多数である上に無関係の通行人などを装うため、被害者はよく「気のせいかも」と見過ごしがちですが、心身の深刻なダメージを与えうる悪質な犯罪として社会問題になりつつあります。
以上のことから、集団ストーカーは複数の加害者が組織的に一人の個人に対し精神的・肉体的に嫌がらせや監視を繰り返す悪質な犯罪行為であり、倭国の法律でも取り締まり対象とされるべき大規模な犯罪行為です。
集団ストーカーの典型的な手口としては、複数人が交代で尾行・つきまといを行い、被害者に常に監視されているという強い心理的圧迫を与える。住居の周囲での貼り込みや待ち伏せ、郵便物の抜き取り、不在票の回収など日常生活の妨害行為。意図的な騒音被害(ノイズキャンペーン)を与え、被害者の精神状態を揺さぶる。インターネットやSNSでの誹謗中傷や個人情報の拡散、虚偽情報の流布。特定のしぐさや言葉を複数人で繰り返して見せたり聞かせ、被害者に「監視されている」「知られている」という不安を植え付けます。スマートフォンやパソコン通信の盗聴、監視カメラのハッキングなどのデジタル技術を悪用した監視行為。事例としては、特定の宗教団体や政治団体による批判者や脱退者への標的化、職場や学校でのいじめやハラスメントが組織的にエスカレートするケース、近隣住民による結託した嫌がらせが報告されています。また、被害者の生活パターンや弱点を調べ上げ、それに合わせて最も効果的な嫌がらせを仕掛ける事例もあります。被害者は孤立しやすく、証拠が乏しいため公安や警察の対応が難しい問題となっています。これらの手口は巧妙で被害者に精神的苦痛を与えるため、録音や録画による証拠収集、専門家の相談などの対策が重要とされています。
又、【悪評や捏造噂の拡散】は、集団ストーカーの典型的な加害手口の一つです。この手口は、被害者の社会的信用や人間関係を破壊し、孤立させることを目的としています。具体的には、以下のような方法が用いられます。被害者の知人や職場、近隣住民に対して根拠のない噂話を広め、被害者への信頼を失わせる。電話やメールで不特定多数に誹謗中傷を送りつけ、被害者の社会的評価を低下させる。虚偽情報を繰り返し繰り返し示すことで、被害者に自信喪失や精神的苦痛を与え、精神的追い詰めを図る。これにより、被害者は精神的に追い込まれ、社会的に孤立することが多く、場合によっては就労や生活に深刻な影響を受けることになります。このような行為もストーカー規制法や名誉毀損の法律で取り締まり対象となり得ますが、組織的で計画的な場合、証明が難しいケースが殆どです。
集団ストーカーが外部に証拠を残しにくい主な理由は、加害者が常に直接の接触を避け、微妙な嫌がらせを複数人が分担して行うためなのです。加害者は「すれ違う」「近くにいるだけ」という形で接触し、巧妙に法の抜け道を狙った行動をするため、明確な物的証拠(映像や音声)が撮りづらいのが特徴です。また、加害者グループは活動地域やメンバーを頻繁に変え、この様なトクリュウ的加害により身元が特定されにくいよう組織的に隠蔽しています。被害が断片的で不特定多数による分散的な行為なので、被害者の主観的な訴えが中心になりやすく、第三者には偶然や被害妄想と誤解されやすい環境につながっています。さらに、被害者が録音や撮影で証拠収集を試みても、それが嫌がらせの意図を証明するには非常に弱く、警察や司法機関は証拠の立証に慎重であるために対応が難しいケースが多いのです。
集団ストーカーの加害行為は集団のメンバーが小規模・断片的に分散して継続的に嫌がらせを行うため、警察が求める様な単一の行為としての明確な証拠が取りづらく、又 つきまといや尾行が「すれ違い」「同じ場所に偶然いた」程度の軽微な行動に見えるため、証拠映像や目撃証言が得られず曖昧になるのです。 November 11, 2025
@mikuroto_0815 まて!おい!まてよ!brother!
置いていくんじゃねぇ!
ふむぅ……行っちまった……
もしもしポリスメン?
さっき青色のバンがATMハッキングして東高速北上していきましたよ( ˙꒳˙ ) November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



