Claude APIの料金を分かりやすく解説(2026年版)
「Claude を本番で使ったら、毎月いくらかかるのか」——これは API を検討するときに必ず突き当たる疑問です。答えを難しくしているのは、Claude API の料金がやり取りした「トークン数」で決まる従量課金だからです。月額固定ではないぶん、仕組みを理解すれば想定よりずっと安く運用できます。この記事では、トークン課金の基本からモデルの使い分け、料金を大きく下げる2つの仕組み、そして月額コストの見積もり方までを順に解説します。
料金の基本:入力と出力でトークンを数える
Claude API の料金は、入力トークン(プロンプトとして送る文章)と出力トークン(モデルが返す文章)に、それぞれ別の単価をかけて計算します。ポイントは、出力の単価が入力の約5倍に設定されていること。長い回答を生成させるほどコストが伸びやすい、という性質をまず押さえておきましょう。
日本語は英語よりトークンを多く消費しがちです。ひらがなで1〜2トークン、漢字で2〜3トークン程度が目安で、同じ内容でも英語より1.5〜2倍ほどかさむことがあります。日本語中心のサービスでは、この点を見込んでコストを試算するのが安全です。
モデルは3階層、用途で使い分ける
Claude には性能とコストが異なる3つの階層があります。重要なのは絶対額より単価の比率です。下表は、いちばん安い Haiku の入力単価を「1」としたときの相対的な単価の目安です(FastMetal の実際の円建て単価は料金ページでご確認ください)。
| 階層 | 入力(相対) | 出力(相対) | 向いているタスク |
|---|---|---|---|
| Opus(最上位) | 約5 | 約25 | 複雑な推論、長文コード生成、エージェント |
| Sonnet(バランス型) | 約3 | 約15 | 一般的な要約・分析・チャット |
| Haiku(高速・低コスト) | 1(基準) | 約5 | 分類・抽出・軽い変換 |
ここから2つの法則が読み取れます。出力は入力の約5倍、そしてOpus は Haiku の約5倍。つまり「すべてを Opus で回す」とコストは跳ね上がります。「分類や要約は Haiku、難しい判断だけ Opus」のようにタスクごとに振り分けるのが基本戦略です。
プロンプトキャッシュでコストを9割削る
同じ長い前提(システムプロンプトや参照ドキュメント)を毎回送るなら、プロンプトキャッシュが効きます。一度キャッシュした部分は、次回以降の読み出しが標準単価の約0.1倍——つまり最大9割引で処理されます。
注意点は、キャッシュへの書き込みに割増(5分保持で約1.25倍、1時間保持で約2倍)がかかること。2回以上同じ前提を再利用するなら、書き込みの割増を差し引いても十分元が取れます。長い共通プロンプトを使うRAGやチャットボットでは、導入するだけで効果が出やすい仕組みです。
バッチ処理で50%オフ
即時の応答が不要なら、バッチ処理で入力・出力ともに一律50%オフになります。大量データの分類、ログの一括要約、評価データセットの生成といった「まとめて流して後で受け取る」用途に最適です。さらにプロンプトキャッシュと組み合わせれば、割引を重ねてコストを大きく圧縮できます。
月額コストの見積もり方
ざっくりした試算は次の式で出せます。
月額 ≒ (1リクエストの入力トークン × 入力単価
+ 1リクエストの出力トークン × 出力単価) × 月間リクエスト数
たとえば Haiku で「入力1,000・出力500トークン」のリクエストを月10万回回すと、入力1億・出力5,000万トークン。出力は入力の約5倍単価なので、コストの大半は出力側で決まります(この例では出力が全体の約7割)。同じ処理を Opus に置き換えれば約5倍、プロンプトキャッシュやバッチを使えば数分の一に——と、円換算の絶対額を出す前に「どこにコストが効くか」を掴むだけでも設計判断が変わります。具体的な円建ての金額は料金ページの単価で試算してください。
よくある質問
Q. 入力と出力、どちらが高いですか? A. 出力です。どのモデルでも出力単価は入力の約5倍。回答を必要な長さに絞ることが、そのままコスト削減になります。
Q. 日本語は英語より割高になりますか? A. トークン消費が多くなるぶん、同じ文章量なら割高になりがちです。プロンプトを簡潔にし、不要な入力を減らすのが効きます。
Q. 一番安く抑えるコツは? A. 「軽いタスクは Haiku」「共通の前提はプロンプトキャッシュ」「急がない処理はバッチ」の3つ。この組み合わせで、効果的にコストを半分以下にできるケースもあります。
FastMetal なら円建てでClaudeを使える
FastMetal は Claude を含む複数モデルを OpenAI 互換 API(https://api.fastmetal.ai)で提供し、料金は円建てのプリペイドです。チャージした残高の範囲でのみ課金され、ハードな上限を超えると停止するため、ドル建ての従量課金にありがちな「想定外の高額請求」が起きません。残高が少なくなればアラートメールも届きます。
1本のAPIキーで Claude の各階層を含む多数のモデルを切り替えられるので、上の「用途で使い分ける」戦略をそのまま実践できます。
curl https://api.fastmetal.ai/v1/chat/completions \
-H "Authorization: Bearer $FASTMETAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "anthropic-claude-haiku-4-5",
"messages": [{"role": "user", "content": "こんにちは"}]
}'