ブログに戻る
コラム

プリペイド型API入門:LLMの請求に怯えるのをやめる方法

FastMetal

「LLM API を使いたいけれど、請求がいくらになるか怖い」——夜間に動かしたエージェントが暴走していないか、コミットに紛れたキーが悪用されていないか。従量課金(ポストペイド)の API には、この種の不安が常につきまといます。この記事では、高額請求が起きる典型パターンと上限設定の限界を整理したうえで、不安を構造的に解消するプリペイド型 APIを解説します。

従量課金で高額請求が起きる典型パターン

「気をつけて使えば大丈夫」と思いがちですが、高額請求の多くは不注意ではなく仕組み上避けにくいパターンから生まれます。Cycles の障害分析記事は、突発的なコスト急増を「エージェントの暴走ループ」「プロンプト改変によるトークン膨張」「意図しないモデル変更」「リトライの嵐」「共有予算を食い潰す特定ユーザー」「キーの流出」の6つに分類しています(runcycles.io)。

同記事では、200件の文書を要約させるために一晩動かしたエージェントが47件目あたりでリトライループに陥り、朝までに1,400回の呼び出しを行っていた例も紹介されています。怖いのは、こうした暴走が「動いている」ように見えてしまう点です。

キー流出はさらに深刻です。コードに埋め込んだ API キーが盗まれて大量のリクエストに悪用される「LLMjacking」では、1日あたり数万ドル規模の被害も報告されています(Upwind)。盗まれた鍵による不正利用は、自分が「気をつける」だけでは防ぎきれません。

上限設定だけでは防ぎきれない理由

「上限(スペンドリミット)を設定すればいい」と思うかもしれません。実際、OpenAI も Anthropic も月次の上限を設定でき、超過するとエラーを返します。ただし、ここには落とし穴があります。

第一に、多くの上限は月単位かつリアルタイムではない点です。利用額の集計が実際の消費に遅れて反映されるため、上限に「気づいたとき」にはすでに超過している、というケースが起こり得ます。OpenAI の組み込み上限も、超過後にメールで通知する事後的な仕組みだと指摘されています(SatGate)。

第二に、近年広まる**オートリロード(自動チャージ)**です。残高が一定額を下回ると自動で買い足す機能は便利な反面、資金がある限りリクエストを処理し続けるため、暴走時にはむしろ被害を拡大しかねません(Trending Topics)。「上限を設けたつもり」が、実は天井のない設計になっていることもあるのです。

プリペイド型なら使いすぎが構造的に起きない

プリペイド型は「先にチャージした残高の範囲でしか使えない」方式です。重要なのは、これが意志や設定ではなく構造で使いすぎを止める点です。残高が尽きればリクエストは拒否され、それ以上は1円も発生しません。

実際、OpenAI も2024年初頭にプリペイド方式へ移行し、残高がゼロになるとリクエストが即座に停止するようになりました(TokenMix)。事前チャージは、業界全体で「請求の予測可能性」を取り戻す方向として広がりつつあります。

観点従量課金(ポストペイド)プリペイド
上限の効き方月単位・集計に遅延、事後通知が中心残高がそのまま上限。超過分は発生しない
請求の読みやすさ月末まで確定しないことがあるチャージ額が支出の天井。事前に確定
使いすぎ・暴走リスクオートリロードで拡大することも残高で頭打ち。被害が限定される

プリペイドが向く人・向かない人

プリペイドは万能ではありません。向いているのは、個人開発者や小規模チーム、検証・PoC 段階、予算を絶対に超えたくない受託・教育用途など、「支出の天井を確実に決めたい」ケースです。

一方で向きにくいのは、残高切れによる停止が許されないミッションクリティカルな本番運用です。とはいえ、これは残高アラートと早めのチャージ運用、あるいは別キーの併用でかなり緩和できます。「止まること」を許容できるかどうかが、選択の分かれ目です。

FastMetal のプリペイドの仕組み

FastMetal は円建てのプリペイド型 APIです。

  1. API キーを発行する(初期残高は 0)
  2. 必要な分だけ残高をチャージする
  3. 利用するたびに残高から差し引かれる
  4. 残高を超えるリクエストは自動的に拒否されるため、使いすぎが起きない

オートリロードのように勝手に買い足すことはなく、チャージした額が支出の上限そのものになります。残高が少なくなればアラートメールが届くので、停止の前に気づいてチャージできます。OpenAI 互換 API(https://api.fastmetal.ai)なので、既存コードのエンドポイント差し替えで試せます。

よくある質問

Q. 残高がゼロになるとどうなりますか? A. 残高を超えるリクエストは拒否され、それ以上の課金は発生しません。チャージすれば再開できます。請求が後から膨らむことはありません。

Q. キーが流出したら高額請求になりませんか? A. 被害はチャージ済みの残高が上限です。残高を超えた瞬間にリクエストが止まるため、LLMjacking のような青天井の被害にはなりません。

Q. オートリロード(自動チャージ)はありますか? A. 勝手に買い足す仕組みは設けていません。チャージは自分の意思で行うため、「気づいたら上限が引き上がっていた」ということが起きません。


請求に怯えるのをやめる第一歩は、支出の天井を自分で握ることです。料金は料金ページ、API の使い方はドキュメント、利用できるモデルはモデル一覧をご覧ください。