【2025年8月最新】API課金・料金早見表&自動計算ツール ─ OpenAI・Claude・Geminiのトークン単価が秒でわかる

はじめに

営業の現場では――
「API 料金をその場でざっくり出したい」
「モデルを変えるとコストがどれくらい動くのかイメージできない」
といった声が絶えません。そこで 「トークン数を入力する」または「コピペする」で概算を出せる 2 つの計算ツール を用意しました。本記事ではツールの使い方と合わせて 最新価格の整理、そして 料金を大幅に下げられる割引メカニズム までまとめます。
⚠️
ご注意
本ツールは各社 API が内部で行う“厳密なトークン分割”までは再現していません。したがって 誤差ゼロの見積もりを保証するものではありません。正式な予算化前に、必ず公式トークナイザーで再確認してください。
 

この記事でわかること

  • API 料金の基本式(入力+出力)
  • トークンとは? ― 文字数 ≠ トークン数
  • 自動計算ツールでAPI料金見積もり
    • トークン数入力版:精度を重視する見積もり
    • プロンプト入力版:商談中のクイック概算
  • 主要モデルの最新価格表 & 簡易比較
  • 割引が効く 3 つの仕組み(キャッシュ再利用/長文脈しきい値/バッチ API)
  • 見積精度を高めるコツ & FAQ

APIとは何か

“窓口”としての役割

API(Application Programming Interface)は、サービス同士をつなぐ通信の窓口です。RESTやgRPCなど複数のプロトコルがありますが、本記事の主役はHTTP経由のテキストAPI。リクエストを送れば、モデルが推論しレスポンスとしてテキスト(または画像・JSONなど)を返します。
 

まず基本:料金は「入力トークン+出力トークン」

合計料金 =(入力トークン数 × 入力単価)+(出力トークン数 × 出力単価)
課金対象説明
入力プロンプトやシステムメッセージなど、モデルに渡すテキスト
出力モデルが生成するレスポンス
⚠️ 単価は固定ではありません。後述のキャッシュ再利用 / 長文脈しきい値 / バッチ APIに該当すると、最大 90 %(Gemini 系は 75 %) 引きになるケースもあります。
 

トークンとは?

文字数ではない課金単位

OpenAIやAnthropicの言語モデルは、テキストを細かい断片=トークンで扱います。1トークンは英単語なら≒4文字、日本語では語彙や句読点でばらつきが大きく、同じ100文字でもトークン数は言語で変動します。詳しくはOpenAIのトークナイザー解説が参考になります。(OpenAI)
ざっくり換算
  • 日本語:文字数 ÷ 3〜4 ≒ トークン数
  • 英語:単語数 ≒ トークン数
 

トークナイザー

以下のツールを使用すると、テキストが言語モデルによってどのようにトークン化されるか、およびそのテキスト内のトークンの合計数を把握できます。

API料金を自動で計算する

※どちらも 概算ツール であり、厳密な内訳チェックは公式ドキュメントをご参照ください。

トークン数入力版(精度重視)

  1. モデルを選択する
  1. 入力トークン数と出力トークン数を入力する
  1. 料金が自動計算される
🔍 トークン数の測り方OpenAI Tokenizer 等で確認すると誤差を小さくできます。
 
 

プロンプト入力版(クイック概算)

  1. モデルを選択する
  1. 入力したいテキストを「プロンプト」に入力
  1. 想定される出力を入力
  1. 料金が自動計算される
※「日本語:文字数 ÷ 3〜4 ≒ トークン数」で計算しているため、コストを少し多めに見積もった概算となります。正確な料金を知りたい場合は、「トークン数入力版」をご使用ください。
 
 
 

主要モデルの最新API単価・特徴一覧(2025年8月時点)

プロバイダーモデル入力(100万トークン)出力(100万トークン)最大文脈長特徴(かんたん概要)
OpenAIGPT-5$1.25$10.00400 K旗艦モデル テキスト+画像対応/最高精度の推論・コーディング・エージェントタスク向け
GPT-5 Mini$0.25$2.00400 KGPT-5 の高速・低コスト版 業務オートメーションや量産タスクに好適
GPT-5 Nano$0.05$0.40400 K最軽量 要約・分類など大量リクエスト向け
o3$2.00$8.00200 KGPT-4 系後継の“思考特化”モデル 複雑な段階推論・長対話に強い
o3-pro$20.00$80.00200 Ko3 の演算 10× 法務/金融など高精度エンタープライズ用途
GPT-4o$2.50$10.00128 Kリアルタイム音声・画像・テキストを高速統合 低レイテンシ
GPT-4o mini$0.15$0.60128 KGPT-4o の廉価版 チャットボットや FAQ に向く
AnthropicClaude Opus 4.1$15.00$75.00200 KAnthropic 最上位 Constitutional AI で厳密・安全
Claude Sonnet 4$3.00$15.001 Mバランス型 1 M トークンβ公開で長大ドキュメント解析◎
Claude Haiku 3.5$0.80$4.00200 K超高速・低コスト 要約/簡易 QA に最適
Google CloudGemini 2.5 Pro$1.25$10.001 Mネイティブ多モーダル 思考バジェット付き/深い解析向け
Gemini 2.5 Flash$0.30$2.501 Mスピード重視ハイブリッド 高スループット+長文脈
Gemini 2.5 Flash-Lite$0.10$0.401 M最高コスパ 大規模バッチ・自動処理に◎
📍公式サイト:OpenAI , Anthropic , Google Cloud
※AnthropicのPrompt Cachingを利用すると、Opus 4.1 は入力価格の90%オフで再利用可能です。(Anthropic) ※Sonnet 4の β 版 1 M 文脈では入力 $6 / 出力 $22.5に倍増します。 ※Gemini 2.5 Proでは200 K を超えると入力 $2.50 / 出力 $15.00に切り替わります。(Google AI for Developers)

割引になるケース

単価は固定ではなく、リクエストの送り方などによって “最大 90% OFF” まで変動 します。 「同じ入力が多いか」「リアルタイム性が要るか」「長文かどうか」 の 3 つを軸にワークロードを整理すると、割引を最大化しやすくなります。

キャッシュ再利用・長文脈しきい値・バッチ APIとは?

用語どういう仕組み?どんな割引になる?代表的な条件向いているケース
キャッシュ再利用(Prompt / Context Caching)同じ入力をもう一度送ったときに、前回の結果を流用。 モデルには“差分”だけ渡すので入力分がほぼタダ。入力料金が最大 90 %OFF- OpenAI Cached Input(GPT-5 系) - Anthropic Prompt Caching - Google Context CachingFAQ・ABテスト・リトライ処理
長文脈しきい値モデルごとに設定されたトークン数の境界を超えると、自動的に“高いレーン”へ切り替わる段階課金。境界を超えた部分だけ 単価アップ例:Gemini 2.5 Pro は 200k まで通常、超えると入力 $2.50/出力 $15.00会議録・大型レポートの解析
バッチ API / Batch Modeリアルタイム性が要らない大量リクエストを、まとめて夜間などに処理。 サーバーの空き時間を活用できる。入力も出力も最大 50 %OFF- OpenAI Batch API - Claude Batch Processing - Gemini Batch Modeログの一括要約・夜間ジョブ

見積精度を上げる 4 つのコツ

やることひとことで言うと具体例・なぜ大事?
① 公式トークナイザーで数えるまずは正しいトークン数を確認公式ツール(OpenAI / Claude / Gemini)でプロンプトを貼り付け → 数字をメモ。 これだけで見積もり誤差がほぼ消えます。
② キャッシュ再利用を設計に組む同じ入力は“使い回し”FAQ や AB テストのように同じプロンプトを何度も送るなら「キャッシュ再利用」を ON。 入力料金が 最大 90 %OFF になります。
③ 長文しきい値をまたがない200 K を超えると単価急騰例:Gemini Pro は 200 K 超から入力単価が 2 倍。 大きな文書は章ごとに分割して送ると安く済みます。
④ バッチ API を夜に流す“急がない大量処理”はまとめ送り昼間は見積もりだけ、深夜にバッチ API で一括実行。 入出力とも 最大 50 %OFF。 ログ集計や大量分類と相性抜群。

FAQ

QA
Dify・GPTs 経由だと請求先は?呼び出し API キーの所有者へ課金されます。 社内ツールに組み込む場合は管理キーと個人キーを分ける運用が安全です。
日本語だと誤差が大きい?文字数÷3〜4 が経験則。 業務で厳密に積算する場合はトークン数入力版+公式トークナイザー併用が必須。
モデル自動切替は有効?FAQ・チャット → Flash/Nano 精密レポート → GPT-5/Opus など、品質・速度・コストの三軸最適化が可能。

まとめ ― 5 つだけ押さえれば OK

  1. 覚える公式は 1 行だけ
      • 料金 = 入力トークン料 + 出力トークン料
  1. 見積もりツールは 2 つを使い分け
      • トークン数入力版 → 正確に出したいとき
      • プロンプト入力版 → 商談中のその場チェック
  1. 割引のカギは 3 つ
      • キャッシュ再利用:同じ入力なら 最大 90 %OFF
      • バッチ API:急がない大量処理は 最大 50 %OFF
      • 長文しきい値:200 K などの境界を超えると単価アップ
  1. タスク別にモデルを自動切替
      • 例)FAQ → Flash/Nano、精密レポート → GPT-5/Opus
      • 品質とコストのベストバランスが取れる
  1. 最後は公式ドキュメントで再確認
      • 価格・制限は日々更新
      • キャッシュ/バッチ/しきい値を組み合わせて “最小コスト・最大効果” を狙おう

用語・サービスリンク

  • Token(トークン) – OpenAI Tokenizer 解説 (OpenAI)
  • GPT-5 公式ページ – OpenAI (OpenAI)
  • o3 公式ドキュメント – OpenAI (OpenAI)
  • Gemini 2.5 Pro/Flash 価格 – Google Vertex AI (Google Cloud)
 
この記事が、商談をスピーディに進めたい営業担当の皆さまの一助となれば幸いです。
さらに自社案件での具体的な試算や実装サポートが必要な場合は、ぜひ Elcamy までお気軽にお問い合わせください。

サービス紹介

Dify の構築や、ワークフローの作成は、見た目以上に複雑で思っていたより大変な部分も多いんです。でも、ご安心ください。弊社のサービスで、そんな面倒な作業も丸投げできちゃいます。
「自分たちで全部やるのは時間もないし無理だな」と感じたとき、ぜひお任せください。本当にやりたいことに集中できるよう、しっかりサポートいたします。お気軽にご相談ください!

お問い合わせ

お客様の社内DX、内製化、新規事業開発・事業成長等における課題解決をサポートします。まずはお気軽にご相談ください。
 

採用

ここまでお読みいただき、ありがとうございます。私たちが日々大切にしていること、会社のカルチャーやメンバーの想いを少しでも感じ取っていただけたら嬉しいです。
株式会社Elcamyでは、AI・機械学習・分析に情熱を持ち、新しい価値を一緒に生み出していける仲間を募集中です。テクノロジーの最前線で共に成長し、挑戦する喜びを分かち合える環境がここにはあります。
「ちょっと興味がある」「話を聞いてみたい」と思った方は、ぜひ一度こちらの募集職種ページをご覧ください。
▼募集中の職種はこちら
あなたとお話できることを、私たちメンバー一同、心より楽しみにしています!