コミュニティからの非難を受けて、暗黙の破壊行為を行ったとして、Anthropicが謝罪し、Claudeの秘密のダウングレード制限を取り消しました

robot
概要作成中
ME AI メッセージ、動察Beatingの監視によると、Anthropicは子会社の新モデルClaude Fable 5の開発安全戦略を調整し、静かに性能を低下させる制限手段を取りやめると発表しました。静かに性能を低下させる仕組みはコミュニティから「闇に紛れて破壊する」と非難され、人工知能研究コミュニティから強い反発を招いています。
Anthropicのサービス規約によると、ユーザーはClaudeを使って競合モデルを訓練してはならないとされています。Anthropicは、競合モデルの訓練を疑われるアカウントに対し、通知なしに直接Claude Fable 5の性能を低下させる計画です。
人工知能研究者は、静かに性能を低下させることは第三者の安全評価機関のテスト作業を妨害し、オープンソースコミュニティの人工知能安全分野での協力を阻害すると警告しています。
コミュニティの疑問に直面し、Anthropicは声明を発表し、公開謝罪を行い、安全戦略の調整において誤った決定をしたことを認め、安全防護メカニズムを公開通知に変更すると述べました。
システムがユーザーの高能力AI構築の試みを検知した場合、リクエストを明確に拒否するか、低能力モデルにリダイレクトします。
Anthropicは、公開された防護メカニズムはターゲットを絞った回避が容易であるため、今後は安全検査の範囲を拡大し、一部の正常で無害なリクエストも誤って遮断される可能性があると警告しています。
(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め