#### 要約* アンソロピックの最新のクロードモデルは、政治的中立性テストで95-96%、選挙政策遵守で99.8-100%を達成。* 同社は2026年の中間選挙に向けて、信頼できる非党派の投票リソースに誘導する選挙情報バナーを展開する予定。* これらの措置は、政府がAIの選挙の公正性や誤情報拡散への潜在的影響を精査する中で行われている。クロードチャットボットの背後にある人工知能企業、アンソロピックは金曜日、2026年の米国中間選挙や今年世界中の主要選挙に向けて、誤情報拡散や有権者操作にAIが悪用されるのを防ぐための新たな選挙公正性対策を発表した。サンフランシスコ拠点の同社は、自動検出システム、影響操作に対するストレステスト、非党派の投票リソース団体との提携を含む多角的アプローチを詳細に説明した。これらの措置は、選挙シーズン中にAIツールの使用を監視するようAI開発者に対する圧力が高まる中での対応を反映している。アンソロピックの利用規約は、クロードが欺瞞的な政治キャンペーンの運営、政治的議論を扇動する偽のデジタルコンテンツの生成、有権者詐欺の実行、投票インフラへの干渉、投票手続きに関する誤情報の拡散に使用されることを禁止している。これらのルールを徹底させるため、同社は最新モデルに対して一連のテストを実施した。600のプロンプト(300の有害リクエストと300の正当なリクエスト)を用いて、クロードが適切なリクエストにどれだけ忠実に対応し、問題のあるリクエストを拒否したかを測定した。クロード Opus 4.7とクロード Sonnet 4.6は、それぞれ100%と99.8%の確率で適切に応答した。<span data-mce-type="bookmark" style="display:inline-block;width:0px;overflow:hidden;line-height:0" class="mce_SELRES_start"></span><span data-mce-type="bookmark" style="display:inline-block;width:0px;overflow:hidden;line-height:0" class="mce_SELRES_start"></span>また、より高度な操作戦術に対してもモデルをテストした。悪意のある行為者が用いる段階的な手法を模した多ターンのシミュレーション会話を使用し、Sonnet 4.6とOpus 4.7は、影響操作シナリオに対してそれぞれ90%と94%の適切な応答を示した。アンソロピックは、モデルが自律的に影響操作を実行できるかどうかもテストした。多段階のキャンペーンを人間の促しなしに計画・実行できるかどうかを調査し、安全策を講じた結果、ほぼすべてのタスクを拒否したと同社は述べている。政治的中立性に関しては、各モデルのリリース前に評価を行い、クロードが政治的立場を問わずさまざまな意見を表現するプロンプトに対して一貫性と公平性をどれだけ保っているかを測定している。Opus 4.7とSonnet 4.6は、それぞれ95%と96%のスコアを獲得した。投票情報を求めるユーザーには、クロードは選挙バナーを表示し、信頼できるリアルタイム情報を提供する非党派のリソースであるDemocracy WorksのTurboVoteに誘導する。ブラジルの選挙にも同様のバナーが今年後半に導入される予定だ。アンソロピックは、選挙サイクルの進行に伴い、システムの監視と防御策の改善を継続する計画を示した。_Decrypt_はアンソロピックにコメントを求めたが、即座に回答は得られなかった。
Anthropic、米国中間選挙に先立ち、Claude AIの選挙保護策を展開
要約
クロードチャットボットの背後にある人工知能企業、アンソロピックは金曜日、2026年の米国中間選挙や今年世界中の主要選挙に向けて、誤情報拡散や有権者操作にAIが悪用されるのを防ぐための新たな選挙公正性対策を発表した。 サンフランシスコ拠点の同社は、自動検出システム、影響操作に対するストレステスト、非党派の投票リソース団体との提携を含む多角的アプローチを詳細に説明した。これらの措置は、選挙シーズン中にAIツールの使用を監視するようAI開発者に対する圧力が高まる中での対応を反映している。 アンソロピックの利用規約は、クロードが欺瞞的な政治キャンペーンの運営、政治的議論を扇動する偽のデジタルコンテンツの生成、有権者詐欺の実行、投票インフラへの干渉、投票手続きに関する誤情報の拡散に使用されることを禁止している。
これらのルールを徹底させるため、同社は最新モデルに対して一連のテストを実施した。600のプロンプト(300の有害リクエストと300の正当なリクエスト)を用いて、クロードが適切なリクエストにどれだけ忠実に対応し、問題のあるリクエストを拒否したかを測定した。クロード Opus 4.7とクロード Sonnet 4.6は、それぞれ100%と99.8%の確率で適切に応答した。 また、より高度な操作戦術に対してもモデルをテストした。悪意のある行為者が用いる段階的な手法を模した多ターンのシミュレーション会話を使用し、Sonnet 4.6とOpus 4.7は、影響操作シナリオに対してそれぞれ90%と94%の適切な応答を示した。 アンソロピックは、モデルが自律的に影響操作を実行できるかどうかもテストした。多段階のキャンペーンを人間の促しなしに計画・実行できるかどうかを調査し、安全策を講じた結果、ほぼすべてのタスクを拒否したと同社は述べている。
政治的中立性に関しては、各モデルのリリース前に評価を行い、クロードが政治的立場を問わずさまざまな意見を表現するプロンプトに対して一貫性と公平性をどれだけ保っているかを測定している。Opus 4.7とSonnet 4.6は、それぞれ95%と96%のスコアを獲得した。 投票情報を求めるユーザーには、クロードは選挙バナーを表示し、信頼できるリアルタイム情報を提供する非党派のリソースであるDemocracy WorksのTurboVoteに誘導する。ブラジルの選挙にも同様のバナーが今年後半に導入される予定だ。 アンソロピックは、選挙サイクルの進行に伴い、システムの監視と防御策の改善を継続する計画を示した。_Decrypt_はアンソロピックにコメントを求めたが、即座に回答は得られなかった。