Claude Mythos Preview 徹底解説 — AI がゼロデイ脆弱性を発見・自動 exploit する時代

はじめに

2026年4月7日、Anthropic は次世代言語モデル Claude Mythos Preview を発表しました。本モデルは汎用性能で大幅な向上を示しただけでなく、サイバーセキュリティ分野で極めて高度な能力を発揮することが明らかになっています。

Anthropic は Mythos Preview のセキュリティ能力を受けて、Project Glasswing という世界の重要ソフトウェアを守るための防衛イニシアチブを同時に発表しました。

本記事では、Mythos Preview の機能・技術詳細・応用・今後の展望を詳しく解説します。

Mythos Preview とは

Mythos Preview は Anthropic が開発した新しい汎用言語モデルです。前世代の Opus 4.6 と比較して、以下の点で飛躍的な進化を遂げています。

項目Opus 4.6Mythos Preview
自律的な exploit 開発成功率~0%(数百回中2回のみ)181回成功 + 29回レジスタ制御
OSS-Fuzz Tier 5(完全制御フロー奪取)0件10件
ゼロデイ発見能力限定的全主要 OS・ブラウザで発見
バグトリアージ精度-89% で人間と完全一致

特筆すべきは、これらのセキュリティ能力が 意図的に訓練されたものではない 点です。コード理解・推論・自律性の一般的な向上の結果として 創発的 (emergent) に獲得されました。

基本機能

1. ゼロデイ脆弱性の発見

Mythos Preview は、以下のスキャフォールドで自律的に脆弱性を探索します。

コンテナ起動(隔離環境)
  → ソースコードを解析
  → 脆弱性の仮説を立て実行確認
  → デバッガ / Address Sanitizer で検証
  → 再現コード付きのバグレポート出力

発見された脆弱性のうち 99% 以上が未パッチ であり、Anthropic は協調的脆弱性開示 (CVD) プロセスに従って報告を行っています。

ターゲット発見物深刻度
OpenBSDTCP SACK 処理の27年越しのバグ(NULL ポインタ参照)Critical
FFmpegH.264 コーデックの16年越しヒープバッファオーバーフローHigh
メモリ安全 VMMRust unsafe ブロック内のメモリ破壊Critical(未パッチ)
その他数千件の High/Critical 脆弱性開示進行中

2. 自律的な exploit 開発

Mythos Preview は脆弱性の発見だけでなく、動作する exploit を完全自律で作成 します。

FreeBSD NFS RCE(CVE-2026-4747)

Unleashed な攻撃者が リモートから root 権限を取得 できる脆弱性です。

攻撃フロー:

1. NFSv4 EXCHANGE_ID で host UUID と起動時間を取得
2. hostid を計算し GSS セッションを確立
3. スタックバッファオーバーフローを trigger(96 バイト → 304 バイト)
4. 6 回の RPC リクエストに分割した ROP チェーンを送信
5. /root/.ssh/authorized_keys に攻撃者の公開鍵を追記
6. SSH で root ログイン完了

ポイントは以下の 3 つです:

  • スタックカナリなし: FreeBSD のコンパイラフラグが -fstack-protector(部分適用)であり、当該バッファが int32_t[32] だったため挿入されなかった
  • KASLR なし: FreeBSD はカーネルのアドレスランダム化を実施していない
  • 分割 ROP チェーン: 1回の overflow で収まらない 1000 バイト超のチェーンを、6 回のリクエストに分割して送信する技法を Mythos Preview が独自に考案

Linux カーネル権限昇格

Linux は KASLR やその他多層防御を備えていますが、Mythos Preview は 複数の脆弱性を連鎖 させることで root 権限を取得しました。

連鎖例:
  Vuln A: KASLR バイパス(カーネルポインタ漏洩)
  Vuln B: ヒープの out-of-bounds read(struct 内容の読み出し)
  Vuln C: use-after-free による任意アドレス書き込み
  → heap spray で struct を配置し root 権限取得

Opus 4.6 では人間のガイダンスが必要だった複数脆弱性の連鎖が、Mythos Preview では完全自律で達成されています。

3. リバースエンジニアリング

Mythos Preview は クローズドソースのバイナリ に対しても脆弱性発見を行えます。

strip されたバイナリ
  → Mythos Preview が擬似ソースコードを復元
  → 復元コードとバイナリの両方を検証対象に
  → 脆弱性を発見し exploit を作成

これにより、クローズドソースの OS やブラウザ、ファームウェアの脆弱性発見にも成功しています。

4. ブラウザ JIT Heap Spray

モダンブラウザは JIT コンパイラのメモリレイアウトを動的に変化させ、多層的な防御を備えています。Mythos Preview は 全主要ブラウザ で JIT heap spray を自律的に構築し、以下の連鎖を実現しました。

JIT heap spray(メモリ破壊)
  → クロスオリジンバイパス(攻撃者のドメインから銀行ドメインのデータ読み取り)
  → サンドボックスエスケープ
  → カーネル権限昇格

たった 1回の Web ページ訪問 で、攻撃者が OS カーネルに任意書き込みを行える状態になります。

5. 論理脆弱性の発見

メモリ破壊以外にも、以下のような ロジックバグ を高い精度で発見します。

カテゴリ
認証バイパス未認証ユーザーが管理者権限を取得
ログインバイパスパスワード・2FA 不要でログイン
DoSリモートからのデータ削除やサービス停止
暗号ライブラリTLS / AES-GCM / SSH の実装上の弱点

応用例: Project Glasswing

Anthropic は Mythos Preview の能力を防御側に活用するため Project Glasswing を開始しました。

活動内容
重要 OSS の脆弱性スキャン業界パートナーと協力し基盤ソフトウェアを優先的に検査
自動エクスプロイト検証発見した脆弱性に実用的な exploit が存在するか検証
協調的開示 (CVD)プロのトリアージャーが検証後、メンテナに報告
防御慣行の標準化AI 時代のセキュリティ対策ガイドラインを策定

Anthropic によると、人間の専門家が数週間かかる exploit 開発を Mythos Preview は数時間で完了 したケースが報告されています。

今後の展開予想

1. 防御側優位への転換

歴史的に、セキュリティツールは攻撃者より防御側に有利に働いてきました。ファジングツール AFL も当初は懸念されましたが、現在では OSS-Fuzz として重要な防御インフラになっています。

Anthropic も同様の見解を示しています:

“長期的には、強力な言語モデルは防御側に有利に働き、ソフトウェアエコシステム全体のセキュリティを向上させるでしょう。”

予想:

  • 2026-2027年: Mythos クラスのモデルが CI/CD パイプラインに統合され、コミット単位の自動脆弱性スキャンが標準化
  • 2028年: ゼロデイの平均生存期間が現在の数ヶ月から数日に短縮

2. エクスプロイト市場への影響

影響内容
N-day exploit の commodity 化パッチ公開から exploit 公開までの時間が数時間に短縮
ゼロデイ市場の縮小防御側が先に発見する確率が大幅上昇
バグバウンティの変革手動発見から AI 支援発見へ、報酬体系の再設計が必要

3. メモリ安全言語の限界

Mythos Preview は Rust の unsafe ブロックJava の sun.misc.UnsafePython の ctypes など、メモリ安全言語の「安全でない」部分を標的に脆弱性を発見しました。

予想:

  • メモリ安全言語であっても、unsafe 部分の監査は AI 支援が不可欠に
  • 言語設計自体の進化(より使いやすい safe 代替の開発)

4. AI セキュリティアシスタントの新時代

現在のセキュリティツールは基本的に「ルールベース + 人力レビュー」ですが、Mythos Preview 以降は以下のように進化すると予想します:

現在: ファザー → クラッシュ → 人間がトリアージ → 人力でパッチ
未来: AI ファザー → クラッシュ → AI がトリアージ → AI がパッチ提案 → 人間が承認

5. リスクと課題

課題説明
悪用リスク同様の能力を持つモデルが公開された場合の攻撃への悪用
誤検知の増大発見数が爆発的に増えた場合のメンテナーへの負荷
トリアージの自動化限界現在は 89% の一致率。残り 11% の改善が必要
エクスプロイト品質のばらつき全 exploit が実用的とは限らない(PoC と実用 exploit の差)

まとめ

Claude Mythos Preview は、AI のサイバーセキュリティ能力における watershed moment(分水嶺) です。従来は人間の専門家のみが行えたゼロデイ発見・エクスプロイト開発を、AI が数時間で自律的に実行できることを実証しました。

当面は Project Glasswing を通じて防御側が優位に立つことが期待されますが、中長期的にはソフトウェアセキュリティのあり方そのものを根本的に変える可能性を秘めています。

セキュリティエンジニアは、AI を「敵」としてではなく「最強の味方」として活用する準備を今から始めるべきでしょう。