【2025年8月最新】API課金・料金早見表&自動計算ツール ─ OpenAI・Claude・Geminiのトークン単価が秒でわかる
はじめに
営業の現場では――
「API 料金をその場でざっくり出したい」
「モデルを変えるとコストがどれくらい動くのかイメージできない」
といった声が絶えません。そこで 「トークン数を入力する」または「コピペする」で概算を出せる 2 つの計算ツール を用意しました。本記事ではツールの使い方と合わせて 最新価格の整理、そして 料金を大幅に下げられる割引メカニズム までまとめます。
ご注意
本ツールは各社 API が内部で行う“厳密なトークン分割”までは再現していません。したがって 誤差ゼロの見積もりを保証するものではありません。正式な予算化前に、必ず公式トークナイザーで再確認してください。
この記事でわかること
- API 料金の基本式(入力+出力)
- トークンとは? ― 文字数 ≠ トークン数
- 自動計算ツールでAPI料金見積もり
- トークン数入力版:精度を重視する見積もり
- プロンプト入力版:商談中のクイック概算
- 主要モデルの最新価格表 & 簡易比較
- 割引が効く 3 つの仕組み(キャッシュ再利用/長文脈しきい値/バッチ API)
- 見積精度を高めるコツ & FAQ
トークンとは?
文字数ではない課金単位
OpenAIやAnthropicの言語モデルは、テキストを細かい断片=トークンで扱います。1トークンは英単語なら≒4文字、日本語では語彙や句読点でばらつきが大きく、同じ100文字でもトークン数は言語で変動します。詳しくはOpenAIのトークナイザー解説が参考になります。(OpenAI)
ざっくり換算
- 日本語:文字数 ÷ 3〜4 ≒ トークン数
- 英語:単語数 ≒ トークン数
トークナイザー
以下のツールを使用すると、テキストが言語モデルによってどのようにトークン化されるか、およびそのテキスト内のトークンの合計数を把握できます。
API料金を自動で計算する
※どちらも 概算ツール であり、厳密な内訳チェックは公式ドキュメントをご参照ください。
トークン数入力版(精度重視)
- モデルを選択する
- 入力トークン数と出力トークン数を入力する
- 料金が自動計算される
プロンプト入力版(クイック概算)
- モデルを選択する
- 入力したいテキストを「プロンプト」に入力
- 想定される出力を入力
- 料金が自動計算される
※「日本語:文字数 ÷ 3〜4 ≒ トークン数」で計算しているため、コストを少し多めに見積もった概算となります。正確な料金を知りたい場合は、「トークン数入力版」をご使用ください。
主要モデルの最新API単価・特徴一覧(2025年8月時点)
プロバイダー | モデル | 入力(100万トークン) | 出力(100万トークン) | 最大文脈長 | 特徴(かんたん概要) |
---|---|---|---|---|---|
OpenAI | GPT-5 | $1.25 | $10.00 | 400 K | 旗艦モデル テキスト+画像対応/最高精度の推論・コーディング・エージェントタスク向け |
GPT-5 Mini | $0.25 | $2.00 | 400 K | GPT-5 の高速・低コスト版 業務オートメーションや量産タスクに好適 | |
GPT-5 Nano | $0.05 | $0.40 | 400 K | 最軽量 要約・分類など大量リクエスト向け | |
o3 | $2.00 | $8.00 | 200 K | GPT-4 系後継の“思考特化”モデル 複雑な段階推論・長対話に強い | |
o3-pro | $20.00 | $80.00 | 200 K | o3 の演算 10× 法務/金融など高精度エンタープライズ用途 | |
GPT-4o | $2.50 | $10.00 | 128 K | リアルタイム音声・画像・テキストを高速統合 低レイテンシ | |
GPT-4o mini | $0.15 | $0.60 | 128 K | GPT-4o の廉価版 チャットボットや FAQ に向く | |
Anthropic | Claude Opus 4.1 | $15.00 | $75.00 | 200 K | Anthropic 最上位 Constitutional AI で厳密・安全 |
Claude Sonnet 4 | $3.00 | $15.00 | 1 M | バランス型 1 M トークンβ公開で長大ドキュメント解析◎ | |
Claude Haiku 3.5 | $0.80 | $4.00 | 200 K | 超高速・低コスト 要約/簡易 QA に最適 | |
Google Cloud | Gemini 2.5 Pro | $1.25 | $10.00 | 1 M | ネイティブ多モーダル 思考バジェット付き/深い解析向け |
Gemini 2.5 Flash | $0.30 | $2.50 | 1 M | スピード重視ハイブリッド 高スループット+長文脈 | |
Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 1 M | 最高コスパ 大規模バッチ・自動処理に◎ |
※AnthropicのPrompt Cachingを利用すると、Opus 4.1 は入力価格の90%オフで再利用可能です。(Anthropic) ※Sonnet 4の β 版 1 M 文脈では入力 $6 / 出力 $22.5に倍増します。 ※Gemini 2.5 Proでは200 K を超えると入力 $2.50 / 出力 $15.00に切り替わります。(Google AI for Developers)
割引になるケース
単価は固定ではなく、リクエストの送り方などによって “最大 90% OFF” まで変動 します。
「同じ入力が多いか」「リアルタイム性が要るか」「長文かどうか」 の 3 つを軸にワークロードを整理すると、割引を最大化しやすくなります。
キャッシュ再利用・長文脈しきい値・バッチ APIとは?
用語 | どういう仕組み? | どんな割引になる? | 代表的な条件 | 向いているケース |
---|---|---|---|---|
キャッシュ再利用(Prompt / Context Caching) | 同じ入力をもう一度送ったときに、前回の結果を流用。 モデルには“差分”だけ渡すので入力分がほぼタダ。 | 入力料金が最大 90 %OFF | - OpenAI Cached Input(GPT-5 系) - Anthropic Prompt Caching - Google Context Caching | FAQ・ABテスト・リトライ処理 |
長文脈しきい値 | モデルごとに設定されたトークン数の境界を超えると、自動的に“高いレーン”へ切り替わる段階課金。 | 境界を超えた部分だけ 単価アップ | 例:Gemini 2.5 Pro は 200k まで通常、超えると入力 $2.50/出力 $15.00 | 会議録・大型レポートの解析 |
バッチ API / Batch Mode | リアルタイム性が要らない大量リクエストを、まとめて夜間などに処理。 サーバーの空き時間を活用できる。 | 入力も出力も最大 50 %OFF | - OpenAI Batch API - Claude Batch Processing - Gemini Batch Mode | ログの一括要約・夜間ジョブ |
見積精度を上げる 4 つのコツ
やること | ひとことで言うと | 具体例・なぜ大事? |
---|---|---|
① 公式トークナイザーで数える | まずは正しいトークン数を確認 | 公式ツール(OpenAI / Claude / Gemini)でプロンプトを貼り付け → 数字をメモ。 これだけで見積もり誤差がほぼ消えます。 |
② キャッシュ再利用を設計に組む | 同じ入力は“使い回し” | FAQ や AB テストのように同じプロンプトを何度も送るなら「キャッシュ再利用」を ON。 入力料金が 最大 90 %OFF になります。 |
③ 長文しきい値をまたがない | 200 K を超えると単価急騰 | 例:Gemini Pro は 200 K 超から入力単価が 2 倍。 大きな文書は章ごとに分割して送ると安く済みます。 |
④ バッチ API を夜に流す | “急がない大量処理”はまとめ送り | 昼間は見積もりだけ、深夜にバッチ API で一括実行。 入出力とも 最大 50 %OFF。 ログ集計や大量分類と相性抜群。 |
FAQ
Q | A |
---|---|
Dify・GPTs 経由だと請求先は? | 呼び出し API キーの所有者へ課金されます。 社内ツールに組み込む場合は管理キーと個人キーを分ける運用が安全です。 |
日本語だと誤差が大きい? | 文字数÷3〜4 が経験則。 業務で厳密に積算する場合はトークン数入力版+公式トークナイザー併用が必須。 |
モデル自動切替は有効? | FAQ・チャット → Flash/Nano 精密レポート → GPT-5/Opus など、品質・速度・コストの三軸最適化が可能。 |
まとめ ― 5 つだけ押さえれば OK
- 覚える公式は 1 行だけ
- 料金 = 入力トークン料 + 出力トークン料
- 見積もりツールは 2 つを使い分け
- トークン数入力版 → 正確に出したいとき
- プロンプト入力版 → 商談中のその場チェック
- 割引のカギは 3 つ
- キャッシュ再利用:同じ入力なら 最大 90 %OFF
- バッチ API:急がない大量処理は 最大 50 %OFF
- 長文しきい値:200 K などの境界を超えると単価アップ
- タスク別にモデルを自動切替
- 例)FAQ → Flash/Nano、精密レポート → GPT-5/Opus
- 品質とコストのベストバランスが取れる
- 最後は公式ドキュメントで再確認
- 価格・制限は日々更新
- キャッシュ/バッチ/しきい値を組み合わせて “最小コスト・最大効果” を狙おう
用語・サービスリンク
- Token(トークン) – OpenAI Tokenizer 解説 (OpenAI)
- GPT-5 公式ページ – OpenAI (OpenAI)
- o3 公式ドキュメント – OpenAI (OpenAI)
- Claude 4 価格表 – Anthropic (Anthropic)
- Gemini 2.5 Pro/Flash 価格 – Google Vertex AI (Google Cloud)
この記事が、商談をスピーディに進めたい営業担当の皆さまの一助となれば幸いです。
さらに自社案件での具体的な試算や実装サポートが必要な場合は、ぜひ Elcamy までお気軽にお問い合わせください。