動作検知 Beating 監視によると、Anthropicは新モデルClaude Fable 5の開発安全戦略を調整し、静かに性能を低下させる手段を廃止すると発表した。静かに性能を低下させる仕組みはコミュニティから「闇に紛れて破壊する」と非難され、人工知能研究コミュニティに強い反発を引き起こしている。
Anthropicのサービス規約によると、ユーザーはClaudeを使って競合モデルを訓練してはならない。Anthropicは、競合モデルの訓練を疑われるアカウントに対し、通知なしに直接Claude Fable 5の性能を低下させる計画だ。人工知能研究者は、静かに性能を低下させることが第三者の安全評価機関のテスト作業を妨げ、オープンソースコミュニティの人工知能安全分野での協力を阻害すると警告している。
コミュニティの疑問に直面し、Anthropicは声明を発表し、公開謝罪を行い、安全戦略の調整において誤った決定をしたことを認め、開発中の安全防護メカニズムを公開通知に変更するとした。システムがユーザーの高能力AI構築の試みを検知した場合、明確にリクエストを拒否するか、低能力モデルにリダイレクトする。Anthropicは、公開された防護メカニズムはターゲットを絞った回避が容易なため、今後は安全遮断の範囲を拡大し、一部の正常で無害なリクエストも誤って遮断される可能性があると警告している。
50.03K 人気度
314.08K 人気度
57.21K 人気度
694.55K 人気度
670.3K 人気度
コミュニティからの非難を受けて、Anthropicは謝罪し、Claudeの秘密のダウングレード制限を解除しました
動作検知 Beating 監視によると、Anthropicは新モデルClaude Fable 5の開発安全戦略を調整し、静かに性能を低下させる手段を廃止すると発表した。静かに性能を低下させる仕組みはコミュニティから「闇に紛れて破壊する」と非難され、人工知能研究コミュニティに強い反発を引き起こしている。
Anthropicのサービス規約によると、ユーザーはClaudeを使って競合モデルを訓練してはならない。Anthropicは、競合モデルの訓練を疑われるアカウントに対し、通知なしに直接Claude Fable 5の性能を低下させる計画だ。人工知能研究者は、静かに性能を低下させることが第三者の安全評価機関のテスト作業を妨げ、オープンソースコミュニティの人工知能安全分野での協力を阻害すると警告している。
コミュニティの疑問に直面し、Anthropicは声明を発表し、公開謝罪を行い、安全戦略の調整において誤った決定をしたことを認め、開発中の安全防護メカニズムを公開通知に変更するとした。システムがユーザーの高能力AI構築の試みを検知した場合、明確にリクエストを拒否するか、低能力モデルにリダイレクトする。Anthropicは、公開された防護メカニズムはターゲットを絞った回避が容易なため、今後は安全遮断の範囲を拡大し、一部の正常で無害なリクエストも誤って遮断される可能性があると警告している。