Anthropicは米国中間選挙に先立ち、Claude AIの選挙安全対策を展開

要点

  • アンソロピックの最新のクロードモデルは、政治的中立性テストで95-96%、選挙政策遵守率は99.8-100%を達成。
  • 同社は2026年の中間選挙に向けて、信頼できる非党派の投票リソースに誘導する選挙情報バナーを展開予定。
  • これらの措置は、政府がAIの選挙の公正性や誤情報拡散への潜在的影響を精査する中で行われている。

クロードチャットボットの背後にある人工知能企業、アンソロピックは金曜日、2026年米国中間選挙や今年世界中の主要選挙に向けて、誤情報拡散や有権者操作にAIが悪用されるのを防ぐための新たな選挙の公正性対策を発表した。 サンフランシスコ拠点の同社は、自動検出システム、影響操作に対するストレステスト、非党派の投票リソース団体との提携を含む多角的アプローチを詳細に説明した。これらの措置は、選挙期間中におけるAIツールの使用を監視する圧力の高まりを反映している。 アンソロピックの利用規約は、クロードが欺瞞的な政治キャンペーンの運営、政治的議論を操るための偽のデジタルコンテンツの生成、有権者詐欺の実行、投票インフラへの干渉、投票過程に関する誤解を招く情報の拡散に使用されることを禁止している。

これらのルールを施行するため、同社は最新モデルに対して一連のテストを実施した。600のプロンプト(300の有害リクエストと300の正当なリクエスト)を用いて、クロードが適切なリクエストにどれだけ忠実に対応し、問題のあるリクエストを拒否したかを測定した。クロード Opus 4.7は100%、クロード Sonnet 4.6は99.8%の確率で適切に応答した。  また、より高度な操作戦術に対してもモデルをテストした。悪意のある行為者が用いる段階的な手法を模した複数ターンのシミュレーション会話を用いて、Sonnet 4.6とOpus 4.7は、影響操作シナリオに対してそれぞれ90%と94%の確率で適切に応答した。 アンソロピックは、モデルが自律的に影響操作を実行できるかどうかもテストした。計画から実行までの複数ステップのキャンペーンを人間の促しなしで完遂できるかを検証し、安全策を講じた最新モデルはほぼすべてのタスクを拒否したと同社は述べている。

政治的中立性に関しては、各モデルのリリース前に評価を行い、クロードが政治的立場を問わずさまざまな意見を表明するプロンプトに対して一貫性と公平性をどれだけ保てるかを測定している。Opus 4.7とSonnet 4.6は、それぞれ95%、96%のスコアを獲得した。 投票情報を求めるユーザーには、クロードは選挙バナーを表示し、信頼できるリアルタイム情報を提供する非党派のリソース「TurboVote」(民主主義のための団体)へ誘導する。投票登録、投票所、選挙日、投票用紙の詳細情報を提供する。ブラジルの選挙にも同様のバナーが今年後半に導入される予定だ。 アンソロピックは、選挙期間中もシステムの監視と防御策の改善を続ける計画だとしている。_Decrypt_はアンソロピックにコメントを求めたが、即座には回答を得られなかった。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン