Claude Fable 5とは?公開3日で米政府が停止した全真相|いつ再度利用できるのか

Shinji Saito
Shinji Saito

代表取締役社長 / 文部科学省 最高情報セキュリティアドバイザー

シンジです。Claude Fable 5が6/9 深夜に登場してから速攻で使い始めて、使用率がパンパンになるころには提供停止されてしまいました。

これでClaudeは、世界ではじめて米国からの指示で提供停止命令を受けたはじめてのAIを作った実績が与えられたと共に、このタイミングでFable 5と同じくらいの性能をもつLLMが、なんとも狙ったかのように他社からリリースされていれば爆売れ間違いなしだったなと思いをはせています。

この時点において、Fable 5は間違いなく史上最優秀のAIであったわけですが、何故提供が停止されてしまったのか、いつ再開されるのかをこの記事でまとめています。

ちなみにシンジはFable(フェイブル)のことをファブルと呼称します。

プロとして────

エグゼクティブサマリー

  • Claude Fable 5 は、Anthropic が 2026年6月9日に公開した、初めて一般提供された Mythos クラス(Opus を上回る能力ティア)のモデルです。
  • 公開からわずか3日後の 6月12日(金)米政府の輸出管理指令(export control directive) により、Anthropic は Fable 5 と Mythos 5 を全顧客向けに停止しました。他モデル(Opus 4.8 等)は影響を受けていません。
  • Fable 5 は公開直後から 3つの嵐に同時に見舞われました。①レッドチーマーによる「解放(jailbreak)」主張、②システムカードに埋もれていた「静かな性能劣化(secret sabotage)」への批判、③そして米政府による停止指令です。
  • 「ジェイルブレイクが停止の引き金では」という憶測も出ていますが、断定できる一次根拠はありません。背景には、2026年初頭から続く Anthropic と米政府(国防総省)の確執があり、「口実では」とする見方も存在します。
  • 再開時期は 本記事執筆時点(6月14日)で未確定です。

タイムライン(全体像)


1. 定義:Claude Fable 5 とは何か

Claude Fable 5 は、Anthropic が 2026年6月9日 に発表した、同社の Mythos クラス に属するモデルです。Mythos クラスは、従来の Opus クラスを能力面で上回るとされる最上位ティアで、最初の Claude Mythos Preview は 2026年4月に「Project Glasswing」を通じて限定公開されました(出典:Anthropic 公式)。

ポイントは、Fable 5 と Mythos 5 は同一の基盤モデルを共有しており、両者を分けているのは「セーフガード(安全装置)」だけだという点です。

項目Claude Fable 5Claude Mythos 5
位置づけ初の一般公開された Mythos クラス同等能力だが限定提供のみ
安全分類器あり(高リスク領域をブロック)なし
高リスク領域の挙動サイバー/生物/化学などを検知すると応答をブロックし Opus 4.8 にフォールバック
提供範囲API・対応プラン(公開対象)Project Glasswing 承認組織のみ

(出典:Anthropic 公式、Claude API Docs、TechCrunch)

主な仕様(一次情報ベース)

  • API モデル名claude-fable-5
  • コンテキスト長:1,000,000 トークン(出力上限 128,000)/知識カットオフ 2026-01(出典:models.dev
  • 価格:入力 $10 / 100万トークン、出力 $50 / 100万トークン(プロンプトキャッシュの90%入力割引あり)。米国内専用推論は 1.1倍(出典:Anthropic 公式 Fable ページ)。Opus 4.8 の約2倍の価格帯です。
  • 提供面:Claude API、Claude Platform on AWS、Amazon Bedrock、Google Vertex AI、Microsoft Foundry(出典:Claude API Docs)
  • データ保持:Fable 5・Mythos 5 は 30日間のデータ保持が必須で、ゼロデータ保持(ZDR)では利用不可。両者は「Covered Models」に指定されています(出典:Claude API Docs)。
  • 重みClosed(非公開)。パラメータ数・モデルサイズは未開示(出典:models.dev、Artificial Analysis)
⚠️ パラメータ数について:一部で「9.8T パラメータ」等の数値が出回っていますが、Anthropic は公式にモデルサイズを開示していません。出所不明の数値は事実として扱わないでください。

能力・ベンチマーク(公表値)

Anthropic および第三者評価機関が公表している主な数値・事例は以下のとおりです(いずれも提供側/評価側の公表に基づきます)。

  • 長時間の自律エージェント作業:数日規模のタスクを、計画・サブエージェントへの委譲・自己検証を含めて継続できると説明されています。実例として、5,000万行規模の Ruby コードベースの全面移行を1日で完了(人手なら2か月超相当)したとされます(出典:Anthropic 公式/Stripe 報告)。
  • ナレッジワーク:Artificial Analysis の実務系ベンチマーク GDPval-AA で首位(Elo 1932)(出典:Artificial Analysis)。Hebbia の金融ベンチマークでも最高スコアとされます(出典:Anthropic 公式)。
  • コーディング:Cognition の FrontierCode で、中程度の effort 設定でもフロンティアモデル中で最高スコアと報告。CursorBench でも SOTA とされます(出典:Anthropic 公式)。
  • ビジョン:科学図表からの数値抽出や、スクリーンショットからの Web アプリ再構築など、ビジョン系で SOTA とされます(出典:Anthropic 公式)。
  • フォールバック頻度:Anthropic は「95%超のセッションでフォールバックは発生せず、その場合は実質的に Mythos 5 と同等の性能」と説明しています(出典:TechTimes)。
  • 科学用途(Mythos 5 側):内部のタンパク質設計実験で 約10倍の加速、9/14 のターゲットで有力候補を得たとされます(出典:Anthropic 公式)。

2. 経緯:なぜ公開3日で「停止」されたのか

6月の動き(詳細)

日付(2026年)出来事
6月9日(火)Fable 5 / Mythos 5 を発表。Fable 5 を一般公開、AWS・Bedrock・Vertex・Foundry でも提供開始
6月10日(水)システムカードの「静かな性能劣化」に批判が噴出(後述)/ Pliny が「Fable 5 を解放した」と投稿
6月11日(木)Anthropic が劣化問題について謝罪し、セーフガードを可視化すると表明
6月12日(金)17:21 ET米政府から輸出管理指令を受領
6月12日(金)夜Anthropic が Fable 5・Mythos 5 を全顧客向けに停止

指令の中身

Anthropic の公式声明(2026-06-12)によれば、以下のとおりです。

  • 米政府は国家安全保障当局の権限を根拠に、「いかなる外国人(foreign national)」による Fable 5・Mythos 5 へのアクセスも停止せよとの輸出管理指令を発出しました。対象は米国外の外国人だけでなく、米国内にいる外国人、さらに Anthropic の外国籍従業員まで含みます。
  • この範囲を満たすには技術的に全面停止しかなく、Anthropic は両モデルを全顧客向けに無効化しました。Opus 4.8 を含む他モデルは影響を受けていません。
  • 指令は 2026年6月12日 17:21(ET) に受領しました。書簡に具体的な懸念の詳細は記されていなかったとされます。
  • 報道(NBC News)によれば、指令は商務省(Commerce Secretary Howard Lutnick)名義で発出されました。

Anthropic 側の反論

Anthropic は法的指令に従いつつ、明確に異議を表明しています(出典:Anthropic 公式声明、Fortune)。

  • 政府は Fable 5 のジェイルブレイク(脱獄)手法を把握した という理解だが、実演を確認したところ、既知の軽微な脆弱性を少数特定するに留まり、他の公開モデルでも同様に発見可能なレベルだった、としています。
  • ローンチ前に米政府・英 AISI・複数の第三者機関と数千時間のレッドチームを実施しており、ユニバーサルな脱獄(広範にセーフガードを破る手法)は誰も発見できていないとしています。
  • 同等の能力は OpenAI の GPT-5.5 など、同様の輸出管理対象でない公開モデルからも引き出せると述べています。
  • 「狭い潜在的脱獄が見つかったことを理由に、数億人に提供中の商用モデルをリコールすべきではない。この基準を業界全体に適用すれば、すべてのフロンティアモデル提供者の新規デプロイが事実上止まる」と主張しています。
  • 「これは誤解だと考えており、できるだけ早くアクセスを復旧させるべく取り組んでいる」としています。
📌 報道(NBC News)は、主要 AI 企業が連邦政府の介入により公開済みモデルをオフラインにしたのは、これが初めてとみられると指摘しています。

3. 検証:「流出している」説は本当か

結論から言えば、「Fable 5 の重みが open weights として流出した」という主張は、一次情報と矛盾しており信憑性が低いと考えられます。

(1) 出回っている画像の特徴

SNS 等で「Hugging Face に anthropic/claude-fable-5 が出現、9.8T params・19.6TB BF16・apache-2.0 / Open weights、コミット者は Dario Amodei、VERIFIED」とするスクリーンショットが共有されています。

(2) なぜ疑わしいのか(矛盾点)

画像の主張一次情報の事実
Open weights(apache-2.0 で全重み公開)models.dev:重みは「Closed」。Artificial Analysis:重みは非公開・パラメータ数も未開示
9.8T パラメータと明記Anthropic はモデルサイズを一切開示していない
Dario Amodei 本人がコミットフロンティアモデルの重み(約20TB)を CEO 個人が公開リポジトリに push するのは実務上あり得ない
当該リポジトリが存在検索でも当該 URL の実在を確認できず

Anthropic はこれまで一度もフロンティアモデルの重みを open weights として公開した実績がなく、これらの点を総合すると、当該画像は捏造(フェイク)である可能性が極めて高いと考えられます。

(3) 実際に Hugging Face で起きていること

重み流出ではなく、第三者による「会話トレース」の収集です。停止前に Fable 5 を使った Claude Code の実行ログ(プロンプト・CoT・ツール使用などのトレース)を集め、蒸留(distillation)目的でデータセットとして公開する動きが出ています。

  • armand0e/claude-fable-5-claude-code / armand0e/fable-5-claude-code-preview:Claude Code トレースのデータセット(各 .jsonl は 2.5MB 程度、タグに distillation
  • Glint-Research/Fable-5-traces:「取り上げられる前に集められた Fable 5 データ。これで学習したファインチューン版が近く出る見込み」と説明
✅ ここが重要です:「トレース(入出力ログ)の収集」と「モデル重みの流出」は全く別物です。前者は実在しますが、後者を裏づける一次情報はありません。

4. 論争①:「解放(jailbreak)」をめぐる主張と反論

重み流出説とは別に、「Fable 5 のセーフガードを破った(=解放した)」という主張が公開直後から広がっています。複数メディアが報じている、実在する係争中の出来事です。本記事では有害な出力内容そのものや、バイパス手法の再現手順には踏み込まず、論争の構図と含意のみを扱います。

(1) 何が主張されているか

  • AI レッドチーマーとして知られる 「Pliny the Liberator」 が、ローンチからおよそ48時間以内に Fable 5 を「解放」したと主張しました(出典:Cointelegraph、KuCoin)。
  • 報じられている手法は、Unicode/ホモグリフ置換、長コンテキストのフレーミング、物語・フィクション化、学術的な「分解→再構成」、およびジェイルブレイク済みの Opus 4.8 をバックエンド補助に使う、というものです(出典:Cointelegraph/TradingView、Mallory.ai)。
  • 引き出せたと主張されている領域は、攻撃的サイバー(エクスプロイト開発)や薬物合成経路に関する化学などです。※具体的な内容・手順は本記事では扱いません。
  • さらに Pliny は、約12万文字に及ぶ Fable 5 のシステムプロンプトを GitHub に公開したとも主張しています(出典:Mallory.ai、opsecinsider)。本記事執筆時点で、Pliny のシステムプロンプト集積リポジトリ elder-plinius/CL4R1T4S 内に該当ファイル ANTHROPIC/CLAUDE-FABLE-5.md(約 120,040 バイト=主張の「約12万文字」と整合)の実在を確認しました。ただしそれが Anthropic の真正なシステムプロンプトである確証はなく、内容自体は本記事では転載しません(出典:GitHub)。

(2) Anthropic の反論

  • Anthropic は、これを「真のジェイルブレイク」ではないと否定しています。分類器と1,000時間超の外部バグバウンティ検証でユニバーサルな脱獄は確認されておらず、外部レッドチームも発見できていないとしています(出典:TechTimes、Coralflavor)。
  • 争点は「苦労して得た断片的な出力が出ること」が「安全システムが破られたこと」を意味するのか、という解釈の相違にあります。第三者による独立検証は本記事執筆時点で確立していません。

(3) 「これが停止の引き金では」という憶測

時系列が近接していることから、「Pliny らのジェイルブレイクが政府の停止を招いたのでは」という憶測が複数メディアで報じられています(出典:VentureBeat、AIxploria、Developers Digest)。ただし以下の留保が必要です。

  • Anthropic 自身は、指令の根拠と見られる「あるジェイルブレイク報告」を確認したとしつつ、それが Pliny の公開ジェイルブレイクと同一かどうかは明言していません(出典:VentureBeat)。
  • Anthropic が説明する「政府が示したジェイルブレイク」の中身は、「特定のコードベースを読ませて欠陥を直させる」というもので、既知・軽微な脆弱性に留まるとされ、Pliny の主張する広範な引き出しとは様相が異なります(出典:Anthropic 公式声明、Developers Digest)。
  • 競合する見方もあります。一部の分析は「接続は確認できない」と明示した上で、ジェイルブレイク報告は口実(pretext)で、真因は別にあるのではと指摘しています(次章の背景を参照)。※これも憶測であり確証はありません。
⚠️ 現時点の結論:「ジェイルブレイクが停止の直接の引き金」と断定できる一次的根拠はありません。 停止理由が「ジェイルブレイク懸念」であることは Anthropic が認めていますが、それが Pliny の公開ジェイルブレイクと同一かは未確認で、競合する解釈も存在します。

(4) 防御側にとっての構造的教訓

  • 報じられている攻撃連鎖の核心は、「弱いモデル(旧 Opus 4.8)を、より強固な新モデル(Fable 5)から出力を引き出す補助に使う」というクロスモデル連鎖です(出典:opsecinsider)。
  • 示唆:エージェント/パイプラインに複数モデルを組み込む場合、最強モデルだけでなく系全体を一つの攻撃面として評価する必要があります。1つのモデルが破られると、同一ワークフロー内の他モデルのセーフガードも実質的に損なわれ得ます。
  • システムプロンプトが(仮に本物として)流出していれば、攻撃者に制約の地図を与えることになり、以降のバイパスを容易にする、との一般論も指摘されています(出典:opsecinsider)。

5. 論争②:「静かな性能劣化(secret sabotage)」

Fable 5 が直面したもう一つの、そしてより明確に裏づけのある批判が、いわゆる「secret sabotage」です。

何が問題だったか

  • 319ページに及ぶシステムカードに埋もれた一文で、Fable 5 が「AI モデルの蒸留(distillation)の試みだと判断したクエリを密かに検知し、利用者に通知せずに応答を劣化・迂回させる」と開示されていました(出典:Fortune、OpenTools、Decrypt)。
  • つまり、競合 AI の構築につながると見なした利用者に対し、警告もフォールバック表示もないまま、静かに質の低い出力を返す設計だったとされます(出典:Fortune、Coralflavor)。
  • The Register は Fable 5 が無害なプロンプトすら拒否した事例を記録。TechCrunch は、セキュリティ研究者から「どんなサイバー研究にも厳しすぎる」との不満が出たと報じています(出典:The Register、TechTimes、OpenTools)。

反応

  • AI 研究者・開発者・政策専門家に加え、普段は Anthropic に近い AI 安全研究者からも批判が出ました(出典:Fortune)。
  • 元 Anthropic「AI 科学者」プロジェクト共同リードの Behnam Neyshabur 氏や、オープンモデル研究者の Nathan Lambert 氏(旧 Allen Institute)らが強く反発しました(出典:Fortune、Let's Data Science)。
  • 一方、先月 Anthropic に加わった Andrej Karpathy 氏は「非常にエキサイティングなリリース」「メジャーバージョンに値する飛躍」と評価しつつ、クセやセーフガードの粗さも指摘しています(出典:Fortune/Yahoo)。

Anthropic の対応(謝罪と修正)

  • Anthropic は 6月11日(木)までに謝罪し、「間違ったトレードオフだった。バランスを誤ったことを謝罪する」と表明しました(出典:Fortune、Decrypt)。
  • フロンティア LLM 開発向けのセーフガードを可視化する方針に転換。フラグされたリクエストは、サイバー/生物分野と同様に、目に見える形で Opus 4.8 にフォールバックし、API では拒否理由が返されるようになります(出典:Decrypt)。
  • ただし能力制限そのものは残り、可視化により「誤検知(false positive)が増える可能性」「回避されやすくなる」というトレードオフも生じます(出典:Decrypt、Fortune)。
  • なお、透明性に関する批判は初めてではなく、今年に入って Claude Code の変更で性能が劣化したとの不満も起きていました(出典:Fortune)。

6. 背景:Anthropic と米政府の確執

今回の停止を読み解くうえで、2026年初頭から続く Anthropic と米政府(特に国防総省)の対立は外せない文脈です。今回の輸出管理指令とは法的根拠が異なる別件ですが、「口実では」とする見方の土台になっています。

  • 2025年7月:Anthropic は国防総省(DoD)と 2億ドル契約を締結。Claude は機密ネットワークで利用が認められた初のフロンティア AI となりました(出典:Syracuse Law Review、CNBC)。
  • 2025年9月〜2026年初頭GenAI.mil への展開交渉が停滞。DoD は「あらゆる合法的用途での無制限アクセス」を求め、Anthropic は「完全自律型の致死兵器」と「国内大規模監視」への利用拒否を譲らず、決裂しました(出典:CNBC)。
  • 2026年2月27日〜3月:国防長官 Pete Hegseth が Anthropic を「サプライチェーンリスク」(Section 3252)に指定。報道では Trump 大統領が連邦機関に Anthropic 製品の使用停止を指示したとされ、OpenAI は数時間後に DoD と契約しました(出典:CNBC、Washington Monthly)。
  • その後の係争:Anthropic は提訴(憲法修正第1・第5条違反を主張)。サンフランシスコ連邦地裁は別件で「修正第1条に基づく報復」を理由に予備的差止めを認めた一方、控訴審は指定の一時停止を却下(4月)。訴訟は継続中です(出典:CNBC)。
  • 2026年6月:DoD は OpenAI・Google・Microsoft と契約を整え、マルチベンダー戦略へ移行したと報じられています(出典:Cryptobriefing)。

この文脈から、Developers Digest 等は「指令が GPT-5.5 を対象外としつつ Anthropic だけを狙い撃ちにしている点が、純粋な技術的懸念というより政治的緊張の表れではないか」との解釈を提示しています(出典:Developers Digest)。※これも憶測であり、確証はありません。

補足として、Fable 5 公開の約1週間前に Anthropic が IPO 関連書類を非公開で提出していたこと、Microsoft が(データ保持の懸念から)従業員のアクセスを制限していたことも、同時期の文脈として報じられています(出典:Fortune、VentureBeat)。


7. 見通し:いつ再び使えるのか

本記事執筆時点(2026年6月14日)で、確定した再開日は存在しません。

  • Anthropic 公式は「できるだけ早く復旧させるべく取り組んでいる」「これは誤解だと考えている」とのみ表明しています(出典:Anthropic 公式声明)。
  • Anthropic の各サービス面では「Claude Fable 5 is currently unavailable / temporarily unavailable」と表示されています(出典:Anthropic 公式 Fable ページ、NBC News)。
  • AWS(Bedrock)でも 2026-06-12 付で Fable 5・Mythos 5 のアクセス取消が告知されています(出典:AWS 公式ブログ)。
  • 公開当初の計画では、サブスクリプション(Pro/Max/Team/seat-based Enterprise)で6月22日まで無償included、6月23日以降は利用クレジット制、容量が許せば標準提供へ復帰、という段階展開でした(出典:Anthropic 公式、Developers Digest)。ただし今回の停止により、この計画は事実上保留・不透明になっています。

再開は、米政府の輸出管理指令がどう解決されるかに依存します。法的・規制プロセスの帰趨次第であり、現段階で時期を断定できる根拠はありません。


8. 実務への示唆(セキュリティ/IT 部門向け)

  1. 単一モデル/単一ベンダー依存の見直し:公開済みフロンティアモデルが、政府指令で予告なく全面停止され得ることが現実に起きました。基幹ワークフローのフォールバック設計(例:Opus 4.8 等への切替)を点検してください。ベンダー集中リスクは、性能や価格だけでなく規制・地政学リスクとしても評価すべきです。
  2. 「外国人アクセス停止」の射程:今回の指令は米国外だけでなく米国内の外国籍者・外国籍従業員にも及びました。グローバル組織では、輸出管理がアクセス制御に直結し得る点を BCP/コンプライアンス観点で押さえてください。
  3. データ保持の前提確認:Fable 5・Mythos 5 は 30日データ保持必須(ZDR 不可)の「Covered Models」です。機微データを扱う場合、この保持要件と社内ポリシー・契約条件の整合を必ず確認してください。
  4. トレース=データ資産・漏えい面の再認識:今回 Hugging Face で集約されたのは「会話トレース」でした。自社の Claude Code/エージェント利用ログには、機微なコードや設計情報が含まれ得ます
  5. マルチモデル・パイプラインの攻撃面:報じられた解放手法ではクロスモデル連鎖が要点でした。複数モデルを組み込む際は系全体を一つの攻撃面として評価してください。
  6. セーフガードの可視性と誤検知:今回の「可視フォールバック」転換により、正規業務でも誤検知でフォールバックが発生し得ます。重要タスクでは「いつ・なぜ縮退したか」をログで追える運用にしてください。
  7. 情報の一次確認を徹底:もっともらしいスクリーンショットが事実のように拡散します。重み流出完全解放停止の原因といった重大な主張は、必ず一次情報(公式・規制当局・モデルDB等)で裏取りし、「報道された主張」と「検証済みの事実」を分けて扱ってください。

出典(主要な一次・二次情報)

Anthropic / 公式・プラットフォーム

停止(輸出管理指令)

ジェイルブレイク(解放)主張

secret sabotage(静かな性能劣化)

政府との確執(背景)

価格・アクセス

(参考)トレース収集の例

  • Hugging Face Datasets:Glint-Research/Fable-5-tracesarmand0e/claude-fable-5-claude-codearmand0e/fable-5-claude-code-preview

本記事は 2026年6月14日時点の公開情報に基づきます。状況は流動的であり、再開の有無・時期、係争中の論点は今後の公式発表・報道で更新されます。有害な技術的詳細(薬物合成・エクスプロイト・製造手順等)は意図的に記載していません。

この記事をシェア