Claude Mythos とは何か — Anthropicの「危険すぎて公開できない」AIモデルを冷静に見る

AI最新動向 — 2026年4月

Claude Mythos とは何か — Anthropicの「危険すぎて公開できない」AIモデルを冷静に見る

2026年4月、Anthropicが発表した新モデル「Claude Mythos Preview」が業界を騒がせています。ベンチマーク記録を塗り替え、数十年放置されていたソフトウェアの脆弱性を次々と発見し、「危険すぎるから一般公開しない」とAnthropicが自ら判断した。何が起きているのか、整理します。

まず、何が起きたのか

2026年4月7日、Anthropicは「Claude Mythos Preview」を発表しました。同社が「これまでに構築した中で最も能力が高い」と述べたモデルです。

ただし、一般には公開しない。代わりに「Project Glasswing」という限定プログラムを通じて、Amazon、Apple、Microsoft、Google、CrowdStrikeなど約50の組織だけにアクセスを提供しています。

理由は明確で、このモデルのサイバーセキュリティ能力が飛び抜けているから。主要なOS・ブラウザ・ソフトウェアから数千件のゼロデイ脆弱性を発見し、その中には27年間見つからなかったバグも含まれています。

ベンチマーク:数字で見るMythos

Anthropicが計測した18のベンチマークのうち、17で首位。前世代のOpus 4.6との差を見ると、「改善」ではなく「世代交代」と呼ぶべき数字です。

コーディング

SWE-bench Verified 93.9% (Opus 4.6: 80.8%)
SWE-bench Pro 77.8% (Opus 4.6: 53.4%)
Terminal-Bench 2.0 82.0% (Opus 4.6: 65.4%)

数学・推論

USAMO 2026 97.6% (Opus 4.6: 42.3%)
GPQA Diamond 94.6%
Humanity’s Last Exam 64.7% (ツール使用時)

サイバーセキュリティ

CyberGym 83.1% (Opus 4.6: 66.6%)
ゼロデイ発見:数千件(主要OS・ブラウザ全般)

注目すべき数字:USAMO(数学オリンピック)で42.3% → 97.6%。55ポイントの跳躍。これは通常のモデル改善では起きない幅です。SWE-bench Proも53.4% → 77.8%で、コーディング能力も別次元に入っている。

何がそんなに「危険」なのか

Mythosが「危険すぎて公開できない」とされた理由は、サイバーセキュリティ能力です。

このモデルは、人間のセキュリティ研究者と数百万回の自動テストをすり抜けてきた脆弱性を見つけ出しました。しかも、見つけるだけでなく、それを利用した攻撃手順(エクスプロイト)まで組み立てられる。

Mythosが発見した代表的な脆弱性

OpenBSD — 27年間未発見

リモートクラッシュを引き起こすバグ。四半世紀以上、セキュリティ監査の対象であり続けたOSに潜んでいた。

FFmpeg — 16年間未発見

動画・音声処理ツールの脆弱性。世界中のソフトウェアが依存しているライブラリ。

FreeBSD — 17年間未発見(CVE-2026-4747)

リモートコード実行(RCE)が可能な深刻なバグ。CVE番号が付与されている。

Linuxカーネル — 複数件

権限昇格の脆弱性を複数発見。サーバーインフラの根幹に関わる問題。

これが意味することは明快です。もしこのモデルが制限なく使えたら、攻撃者は既知のセキュリティツールでは検出できない攻撃を、大量に、高速に生成できてしまう。

Anthropicが一般公開を見送った判断は、率直に言って妥当です。

Project Glasswing — 限定公開の仕組み

Anthropicは「公開しない」だけでなく、「防御側にだけ使わせる」という戦略を取りました。それがProject Glasswingです。

目的は、世界の重要なソフトウェアインフラの脆弱性を、攻撃者より先に見つけて修正すること。Anthropicはこのプログラムに最大1億ドル(約150億円)のモデル利用クレジットを投入しています。

参加パートナー(一部)

Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks

価格・利用条件

入力$25 / 出力$125(100万トークンあたり)。Opus 4.6の5倍の価格設定。ただしGlasswingパートナーにはAnthropicが$100Mのクレジットを提供。

不正アクセス事件 — 発表当日に突破された

ここからが生々しい話です。

Mythosが発表された4月7日、その当日に不正アクセスが報告されました。Discordで未公開AIモデルの情報を追っているグループが、Anthropicが過去のモデルで使っていたURLのパターンからMythosの所在を推測し、サードパーティベンダーの環境を経由してアクセスに成功した。

さらに、その経路にはAnthropicの外部委託先の従業員が関与していた可能性が報じられています。

皮肉な話です。ゼロデイ脆弱性を数千件も発見できるAIが、自分自身のアクセス管理ではURLパターンの推測で突破された。AIの能力がどれだけ高くても、セキュリティは結局、人間の運用に依存するということを、この事件が端的に示しています。

一般向けにはOpus 4.7がリリース

Mythosが限定公開にとどまる中、4月16日にClaude Opus 4.7が一般向けにリリースされました。Opus 4.6からの正統進化版で、コーディング、推論、指示追従が改善されています。

Opus 4.7はMythosほどのサイバーセキュリティ能力を持たないよう調整されています。つまり、Anthropicは意図的に能力を制限した一般向けモデルを出しつつ、フルパワー版は防御目的だけに使わせるという二段構えを取っている。

価格はOpus 4.6と同じ。Claude製品全般、API、AWS・Google Cloud・Microsoft経由で利用できます。

これをどう受け止めるか

SNSでは「やばい」「強すぎ」「人類終了」みたいなリアクションが飛び交っています。いつものことです。

冷静に見ると、重要なのは以下の3点だと思います。

1.「公開しない」という判断が成立した

AI企業はこれまで「作ったら公開する」のが当然でした。Anthropicが「能力が高すぎるから公開しない」という前例を作ったことは、業界にとって転換点です。OpenAIやGoogleがこの判断に追随するかどうかが、今後の基準になります。

2. セキュリティの攻防がAI同士の戦いになる

Mythosが防御側で使われるなら、攻撃側も同等のAIを使おうとする。これは避けられない。結果として、サイバーセキュリティは「人間 vs 人間」から「AI vs AI」のフェーズに入ります。個人や中小企業がこの軍拡競争についていけるかは、別問題です。

3. アクセス管理が技術の進歩に追いついていない

発表当日の不正アクセスが示しているのは、「AIをどう制限するか」という問題がまだ解決されていないということ。モデルの能力は急速に上がっているのに、それを管理する人間側のインフラは従来のまま。ここにギャップがある。

まとめ

Claude Mythosは確かに「強い」モデルです。ベンチマークの数字は本物で、サイバーセキュリティ能力は前例がない。

でも、「強い」と「使える」は違います。Mythosが使えるのは、今のところProject Glasswingの参加組織だけ。一般ユーザーが直接触れることは、当面ありません。

一般向けのOpus 4.7も十分に強力なモデルです。日常の仕事や学習でAIを使うなら、こちらで不足はない。

Mythosの本当の意味は、「AIの能力が人間が管理できる範囲を超え始めている」ということでしょう。この流れは止まらない。だからこそ、「AIは何ができるのか」だけでなく「AIをどう管理するのか」に注目していく必要があります。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

上部へスクロール