Decryptの報告によると、GPT-5.5-CyberはCyberGymでAnthropic Mythos 5を上回り、85.6%対83.8%を記録した。ただし、他の公開評価では状況はより複雑だ。4月30日、UK AI Security Instituteは、GPT-5.5が企業攻撃シナリオ「The Last Ones」の32段階のシミュレーションを開始から終了まで2回の試行で成功させたと報告した。Mythos Previewは3回中3回成功した。
その後、AISIはデータを更新し、新しいMythos Previewは6回中6回で「The Last Ones」をクリアし、初めて「Cooling Tower」シナリオも3回中3回成功したとした。GPT-5.5はこのアップデートで「The Last Ones」を3回中3回成功させた。
OpenAIのアクセス制限方法
GPT-5.5-Cyberは一般公開されていない。OpenAIは、モデルは検証済みユーザー向けで、より強力なサイバー機能と認証されたシナリオでのモデルの許可された動作が必要なユーザー向けだと明言した。ほとんどの顧客には、引き続きTrusted Access for CyberとCodex Securityを備えたGPT-5.5を推奨している。
出典:OpenAI。もう一つの取り組みはPatch the Planetで、オープンソースプロジェクト向けのイニシアチブだ。Trail of BitsとHackerOne、Califの研究者やメインテイナーと共同で作成された。最初の参加者にはcURL、Go、Python、Sigstore、pyca/cryptographyが含まれる。
OpenAIは制限の中でGPT-5.5-Cyberをリリース - ForkLog
6月22日、OpenAIは検索、検証、脆弱性修正に特化したモデルであるGPT-5.5-Cyberの完全版をリリースした。リリースはAnthropic周辺の制約の中で行われた。
声明によると、GPT-5.5-CyberはDaybreakプログラムに参加しており、一般ユーザーには公開されない。モデルはサイバーセキュリティの検証済み専門家向けで、より強力な認証保護作業のための機能を提供する。
OpenAIにとってのウィンドウの発生
6月9日、AnthropicはClaudeファミリーの2つのバージョンへのアクセスを開始した。Fable 5はMythosクラスの解決策として説明されたが、安全に一般利用可能とされた。Claude Mythos 5は、特定の分野で制限を緩和した「プライベート」な基本モデルだ。しかし、6月12日には米国政府の輸出管理指令を受けて開発者がこれらを無効化した。
この決定は一般ユーザーだけでなく問題を引き起こした。6月23日、Legionという企業が米国政府に対して訴訟を提起したとロイターが報じている。同組織はサンノゼに拠点を置き、開発チームはカナダにいる。報道によると、LegionはAnthropicのモデルへのアクセス喪失が法的文書作成や案件管理のツールの動作を妨げたと主張している。
この背景の中、OpenAIは別の道を選んだ。同社は事前に米国の連邦機関と検証を調整したと明言し、その後、GPT-5.5-Cyberを検証済みユーザーのみに公開した。
GPT-5.5-Cyberの能力
OpenAIによると、GPT-5.5-CyberはCyberGymで85.6%のスコアを獲得し、標準のGPT-5.5の81.8%を上回った。この指標は、制御されたソフトウェア環境で既知の脆弱性を再現する能力に焦点を当てている。これは実際の攻撃や防御シナリオの全範囲をカバーしているわけではない。
Decryptの報告によると、GPT-5.5-CyberはCyberGymでAnthropic Mythos 5を上回り、85.6%対83.8%を記録した。ただし、他の公開評価では状況はより複雑だ。4月30日、UK AI Security Instituteは、GPT-5.5が企業攻撃シナリオ「The Last Ones」の32段階のシミュレーションを開始から終了まで2回の試行で成功させたと報告した。Mythos Previewは3回中3回成功した。
その後、AISIはデータを更新し、新しいMythos Previewは6回中6回で「The Last Ones」をクリアし、初めて「Cooling Tower」シナリオも3回中3回成功したとした。GPT-5.5はこのアップデートで「The Last Ones」を3回中3回成功させた。
OpenAIのアクセス制限方法
GPT-5.5-Cyberは一般公開されていない。OpenAIは、モデルは検証済みユーザー向けで、より強力なサイバー機能と認証されたシナリオでのモデルの許可された動作が必要なユーザー向けだと明言した。ほとんどの顧客には、引き続きTrusted Access for CyberとCodex Securityを備えたGPT-5.5を推奨している。
OpenAIはまた、Daybreak Cyber Partner Programを開始した。同社のブログでは、参加企業としてAkamai、Check Point、Cisco、CrowdStrike、IBM、Palo Alto Networks、Proofpoint、SentinelOne、Wiz、Zscalerなどのセキュリティ企業を挙げている。
米国、英国、カナダ、オーストラリア、ニュージーランドのサイバー機関は、最先端のAIモデルが数ヶ月以内にサイバー空間における攻撃と防御の能力を変える可能性があると述べている。報告書の著者は、人工知能は攻撃者の参入障壁を下げ、攻撃を加速させ、脆弱性の発見と悪用までの時間を短縮すると指摘している。
また、6月にAnthropicチームは、企業環境での自律型AIエージェントの安全な展開に関するZero Trust for AI Agentsのガイドラインをブログで公開した。文書では、エージェントシステムの主要リスクとビジネスのサイバーセキュリティアプローチについて述べている。