ブログに戻る
コラム

Claude APIの料金を分かりやすく解説(2026年版)

FastMetal

「Claude を本番で使ったら、毎月いくらかかるのか」——これは API を検討するときに必ず突き当たる疑問です。答えを難しくしているのは、Claude API の料金がやり取りした「トークン数」で決まる従量課金だからです。月額固定ではないぶん、仕組みを理解すれば想定よりずっと安く運用できます。この記事では、トークン課金の基本からモデルの使い分け、料金を大きく下げる2つの仕組み、そして月額コストの見積もり方までを順に解説します。

料金の基本:入力と出力でトークンを数える

Claude API の料金は、入力トークン(プロンプトとして送る文章)と出力トークン(モデルが返す文章)に、それぞれ別の単価をかけて計算します。ポイントは、出力の単価が入力の約5倍に設定されていること。長い回答を生成させるほどコストが伸びやすい、という性質をまず押さえておきましょう。

日本語は英語よりトークンを多く消費しがちです。ひらがなで1〜2トークン、漢字で2〜3トークン程度が目安で、同じ内容でも英語より1.5〜2倍ほどかさむことがあります。日本語中心のサービスでは、この点を見込んでコストを試算するのが安全です。

モデルは3階層、用途で使い分ける

Claude には性能とコストが異なる3つの階層があります。重要なのは絶対額より単価の比率です。下表は、いちばん安い Haiku の入力単価を「1」としたときの相対的な単価の目安です(FastMetal の実際の円建て単価は料金ページでご確認ください)。

階層入力(相対)出力(相対)向いているタスク
Opus(最上位)約5約25複雑な推論、長文コード生成、エージェント
Sonnet(バランス型)約3約15一般的な要約・分析・チャット
Haiku(高速・低コスト)1(基準)約5分類・抽出・軽い変換

ここから2つの法則が読み取れます。出力は入力の約5倍、そしてOpus は Haiku の約5倍。つまり「すべてを Opus で回す」とコストは跳ね上がります。「分類や要約は Haiku、難しい判断だけ Opus」のようにタスクごとに振り分けるのが基本戦略です。

プロンプトキャッシュでコストを9割削る

同じ長い前提(システムプロンプトや参照ドキュメント)を毎回送るなら、プロンプトキャッシュが効きます。一度キャッシュした部分は、次回以降の読み出しが標準単価の約0.1倍——つまり最大9割引で処理されます。

注意点は、キャッシュへの書き込みに割増(5分保持で約1.25倍、1時間保持で約2倍)がかかること。2回以上同じ前提を再利用するなら、書き込みの割増を差し引いても十分元が取れます。長い共通プロンプトを使うRAGやチャットボットでは、導入するだけで効果が出やすい仕組みです。

バッチ処理で50%オフ

即時の応答が不要なら、バッチ処理で入力・出力ともに一律50%オフになります。大量データの分類、ログの一括要約、評価データセットの生成といった「まとめて流して後で受け取る」用途に最適です。さらにプロンプトキャッシュと組み合わせれば、割引を重ねてコストを大きく圧縮できます。

月額コストの見積もり方

ざっくりした試算は次の式で出せます。

月額 ≒ (1リクエストの入力トークン × 入力単価
       + 1リクエストの出力トークン × 出力単価) × 月間リクエスト数

たとえば Haiku で「入力1,000・出力500トークン」のリクエストを月10万回回すと、入力1億・出力5,000万トークン。出力は入力の約5倍単価なので、コストの大半は出力側で決まります(この例では出力が全体の約7割)。同じ処理を Opus に置き換えれば約5倍、プロンプトキャッシュやバッチを使えば数分の一に——と、円換算の絶対額を出す前に「どこにコストが効くか」を掴むだけでも設計判断が変わります。具体的な円建ての金額は料金ページの単価で試算してください。

よくある質問

Q. 入力と出力、どちらが高いですか? A. 出力です。どのモデルでも出力単価は入力の約5倍。回答を必要な長さに絞ることが、そのままコスト削減になります。

Q. 日本語は英語より割高になりますか? A. トークン消費が多くなるぶん、同じ文章量なら割高になりがちです。プロンプトを簡潔にし、不要な入力を減らすのが効きます。

Q. 一番安く抑えるコツは? A. 「軽いタスクは Haiku」「共通の前提はプロンプトキャッシュ」「急がない処理はバッチ」の3つ。この組み合わせで、効果的にコストを半分以下にできるケースもあります。

FastMetal なら円建てでClaudeを使える

FastMetal は Claude を含む複数モデルを OpenAI 互換 APIhttps://api.fastmetal.ai)で提供し、料金は円建てのプリペイドです。チャージした残高の範囲でのみ課金され、ハードな上限を超えると停止するため、ドル建ての従量課金にありがちな「想定外の高額請求」が起きません。残高が少なくなればアラートメールも届きます。

1本のAPIキーで Claude の各階層を含む多数のモデルを切り替えられるので、上の「用途で使い分ける」戦略をそのまま実践できます。

curl https://api.fastmetal.ai/v1/chat/completions \
  -H "Authorization: Bearer $FASTMETAL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic-claude-haiku-4-5",
    "messages": [{"role": "user", "content": "こんにちは"}]
  }'

最新の単価は料金ページ、利用できるモデルはモデルカタログでご確認ください。