AnthropicはClaude内部に秘密のコードを仕込んでいた。


RedditのユーザーがClaude Codeをリバースエンジニアリングし、4月から動作していた隠れた検出ロジックを発見した。
それはあなたのタイムゾーンを読み取る。プロキシをスキャンする。そしてシステムプロンプト内に不可視のUnicode文字であなたをマークする。
三つのアポストロフィ。あなたの目と区別がつかない。サーバーで読み取り可能。
公平に言えば、標的は中国関連のリセラーとモデル蒸留だった。ファイルは盗まれていない。
しかしコードは難読化されていた。リリースノートはなし。Anthropicはこれを認め、次のアップデートで削除すると言っている。
彼らのブランド全体は信頼だ。それでも隠すことを選んだ。
他に誰も気づかなかったものは何か?
原文表示
post-image
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め