【2025年8月最新】API課金・料金早見表＆自動計算ツール ─ OpenAI・Claude・Geminiのトークン単価が秒でわかる

2025/8/20 13:392025/9/5 10:43

はじめに

営業の現場では――

「API 料金をその場でざっくり出したい」

「モデルを変えるとコストがどれくらい動くのかイメージできない」

といった声が絶えません。そこで「トークン数を入力する」または「コピペする」で概算を出せる 2 つの計算ツール を用意しました。本記事ではツールの使い方と合わせて 最新価格の整理、そして 料金を大幅に下げられる割引メカニズム までまとめます。

⚠️

ご注意

本ツールは各社 API が内部で行う“厳密なトークン分割”までは再現していません。したがって 誤差ゼロの見積もりを保証するものではありません。正式な予算化前に、必ず公式トークナイザーで再確認してください。

この記事でわかること

API 料金の基本式（入力＋出力）

トークンとは？ ― 文字数 ≠ トークン数

自動計算ツールでAPI料金見積もり

トークン数入力版：精度を重視する見積もり
プロンプト入力版：商談中のクイック概算

主要モデルの最新価格表 & 簡易比較

割引が効く 3 つの仕組み（キャッシュ再利用／長文脈しきい値／バッチ API）

見積精度を高めるコツ & FAQ

APIとは何か

“窓口”としての役割

API（Application Programming Interface）は、サービス同士をつなぐ通信の窓口です。RESTやgRPCなど複数のプロトコルがありますが、本記事の主役はHTTP経由のテキストAPI。リクエストを送れば、モデルが推論しレスポンスとしてテキスト（または画像・JSONなど）を返します。

まず基本：料金は「入力トークン＋出力トークン」

合計料金 =（入力トークン数 × 入力単価）＋（出力トークン数 × 出力単価）

課金対象	説明
入力	プロンプトやシステムメッセージなど、モデルに渡すテキスト
出力	モデルが生成するレスポンス

⚠️ 単価は固定ではありません。後述のキャッシュ再利用 / 長文脈しきい値 / バッチ APIに該当すると、最大 90 %（Gemini 系は 75 %）引きになるケースもあります。

トークンとは？

文字数ではない課金単位

OpenAIやAnthropicの言語モデルは、テキストを細かい断片＝トークンで扱います。1トークンは英単語なら≒4文字、日本語では語彙や句読点でばらつきが大きく、同じ100文字でもトークン数は言語で変動します。詳しくはOpenAIのトークナイザー解説が参考になります。(OpenAI)

ざっくり換算
日本語：文字数 ≒ トークン数
英語：単語数 ≒ トークン数

トークナイザー

以下のツールを使用すると、テキストが言語モデルによってどのようにトークン化されるか、およびそのテキスト内のトークンの合計数を把握できます。

OpenAI Platform

Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.

https://platform.openai.com/tokenizer

API料金を自動で計算する

※どちらも 概算ツール であり、厳密な内訳チェックは公式ドキュメントをご参照ください。

トークン数入力版（精度重視）

モデルを選択する

入力トークン数と出力トークン数を入力する

料金が自動計算される

🔍 トークン数の測り方：OpenAI Tokenizer 等で確認すると誤差を小さくできます。

プロンプト入力版（クイック概算）

モデルを選択する

入力したいテキストを「プロンプト」に入力

想定される出力を入力

料金が自動計算される

※「日本語：文字数 ≒ トークン数」で計算しているため、コストを少し多めに見積もった概算となります。正確な料金を知りたい場合は、「トークン数入力版」をご使用ください。

主要モデルの最新API単価・特徴一覧（2025年8月時点）

プロバイダー	モデル	入力（100万トークン）	出力（100万トークン）	最大文脈長	特徴（かんたん概要）
OpenAI	GPT-5	$1.25	$10.00	400 K	旗艦モデルテキスト＋画像対応／最高精度の推論・コーディング・エージェントタスク向け
	GPT-5 Mini	$0.25	$2.00	400 K	GPT-5 の高速・低コスト版業務オートメーションや量産タスクに好適
	GPT-5 Nano	$0.05	$0.40	400 K	最軽量要約・分類など大量リクエスト向け
	o3	$2.00	$8.00	200 K	GPT-4 系後継の“思考特化”モデル複雑な段階推論・長対話に強い
	o3-pro	$20.00	$80.00	200 K	o3 の演算 10× 法務／金融など高精度エンタープライズ用途
	GPT-4o	$2.50	$10.00	128 K	リアルタイム音声・画像・テキストを高速統合低レイテンシ
	GPT-4o mini	$0.15	$0.60	128 K	GPT-4o の廉価版チャットボットや FAQ に向く
Anthropic	Claude Opus 4.1	$15.00	$75.00	200 K	Anthropic 最上位 Constitutional AI で厳密・安全
	Claude Sonnet 4	$3.00	$15.00	1 M	バランス型 1 M トークンβ公開で長大ドキュメント解析◎
	Claude Haiku 3.5	$0.80	$4.00	200 K	超高速・低コスト要約／簡易 QA に最適
Google Cloud	Gemini 2.5 Pro	$1.25	$10.00	1 M	ネイティブ多モーダル思考バジェット付き／深い解析向け
	Gemini 2.5 Flash	$0.30	$2.50	1 M	スピード重視ハイブリッド高スループット＋長文脈
	Gemini 2.5 Flash-Lite	$0.10	$0.40	1 M	最高コスパ大規模バッチ・自動処理に◎

📍公式サイト：OpenAI , Anthropic , Google Cloud

※AnthropicのPrompt Cachingを利用すると、Opus 4.1 は入力価格の90%オフで再利用可能です。(Anthropic) ※Sonnet 4の β 版 1 M 文脈では入力 $6 / 出力 $22.5に倍増します。 ※Gemini 2.5 Proでは200 K を超えると入力 $2.50 / 出力 $15.00に切り替わります。(Google AI for Developers)

割引になるケース

単価は固定ではなく、リクエストの送り方などによって “最大 90％ OFF” まで変動 します。 「同じ入力が多いか」「リアルタイム性が要るか」「長文かどうか」 の 3 つを軸にワークロードを整理すると、割引を最大化しやすくなります。

キャッシュ再利用・長文脈しきい値・バッチ APIとは？

用語	どういう仕組み？	どんな割引になる？	代表的な条件	向いているケース
キャッシュ再利用(Prompt / Context Caching)	同じ入力をもう一度送ったときに、前回の結果を流用。モデルには“差分”だけ渡すので入力分がほぼタダ。	入力料金が最大 90 %OFF	- OpenAI Cached Input（GPT-5 系） - Anthropic Prompt Caching - Google Context Caching	FAQ・ABテスト・リトライ処理
長文脈しきい値	モデルごとに設定されたトークン数の境界を超えると、自動的に“高いレーン”へ切り替わる段階課金。	境界を超えた部分だけ単価アップ	例：Gemini 2.5 Pro は 200k まで通常、超えると入力 $2.50／出力 $15.00	会議録・大型レポートの解析
バッチ API / Batch Mode	リアルタイム性が要らない大量リクエストを、まとめて夜間などに処理。サーバーの空き時間を活用できる。	入力も出力も最大 50 %OFF	- OpenAI Batch API - Claude Batch Processing - Gemini Batch Mode	ログの一括要約・夜間ジョブ

見積精度を上げる 4 つのコツ

やること	ひとことで言うと	具体例・なぜ大事？
① 公式トークナイザーで数える	まずは正しいトークン数を確認	公式ツール（OpenAI / Claude / Gemini）でプロンプトを貼り付け → 数字をメモ。これだけで見積もり誤差がほぼ消えます。
② キャッシュ再利用を設計に組む	同じ入力は“使い回し”	FAQ や AB テストのように同じプロンプトを何度も送るなら「キャッシュ再利用」を ON。入力料金が最大 90 %OFF になります。
③ 長文しきい値をまたがない	200 K を超えると単価急騰	例：Gemini Pro は 200 K 超から入力単価が 2 倍。大きな文書は章ごとに分割して送ると安く済みます。
④ バッチ API を夜に流す	“急がない大量処理”はまとめ送り	昼間は見積もりだけ、深夜にバッチ API で一括実行。入出力とも最大 50 %OFF。ログ集計や大量分類と相性抜群。

FAQ

Q	A
Dify・GPTs 経由だと請求先は？	呼び出し API キーの所有者へ課金されます。社内ツールに組み込む場合は管理キーと個人キーを分ける運用が安全です。
日本語だと誤差が大きい？	文字数÷3〜4 が経験則。業務で厳密に積算する場合はトークン数入力版＋公式トークナイザー併用が必須。
モデル自動切替は有効？	FAQ・チャット → Flash／Nano 精密レポート → GPT-5／Opus など、品質・速度・コストの三軸最適化が可能。