AI API 料金比較 2026:GPT-4.1、Claude Sonnet 4.6、Gemini 2.5 の真のコスト
OpenAI、Anthropic、Google、OpenRouter、LemonData における AI API コールの実際の支払額をデータに基づいて徹底解説。誰も語らない隠れたコストについても触れます。
この比較が必要な理由
AI API の料金体系は一見シンプルです。入力 token は X ドル、出力 token は Y ドルといった具合です。しかし、prompt caching、最低入金額、決済の手間、為替変換による損失などを考慮すると、どこで token を購入するかによって実際のコストは大きく変わります。
ここでは、2026 年初頭時点で最も人気のあるモデルについて、5 つのプラットフォームを並べて比較します。特に断りのない限り、すべての価格は 100万 token あたりの米ドル(USD)表記です。
比較対象のプラットフォーム:
- OpenAI (直接): api.openai.com
- Anthropic (直接): api.anthropic.com
- Google (直接): Vertex AI / AI Studio
- OpenRouter: openrouter.ai
- LemonData: api.lemondata.cc
Token 料金:主要な数値
OpenAI モデル
| モデル | メトリクス | OpenAI 直接 | OpenRouter | LemonData |
|---|---|---|---|---|
| GPT-4.1 | 入力 / 100万 token | $2.00 | $2.00 | ~$2.00 |
| 出力 / 100万 token | $8.00 | $8.00 | ~$8.00 | |
| GPT-4.1-mini | 入力 / 100万 token | $0.40 | $0.40 | ~$0.40 |
| 出力 / 100万 token | $1.60 | $1.60 | ~$1.60 | |
| GPT-4o | 入力 / 100万 token | $2.50 | $2.50 | ~$2.50 |
| 出力 / 100万 token | $10.00 | $10.00 | ~$10.00 | |
| o3 | 入力 / 100万 token | $2.00 | $2.00 | ~$2.00 |
| 出力 / 100万 token | $8.00 | $8.00 | ~$8.00 | |
| o4-mini | 入力 / 100万 token | $1.10 | $1.10 | ~$1.10 |
| 出力 / 100万 token | $4.40 | $4.40 | ~$4.40 |
Anthropic モデル
| モデル | メトリクス | Anthropic 直接 | OpenRouter | LemonData |
|---|---|---|---|---|
| Claude Opus 4.6 | 入力 / 100万 token | $5.00 | $5.00 | ~$5.00 |
| 出力 / 100万 token | $25.00 | $25.00 | ~$25.00 | |
| Claude Sonnet 4.6 | 入力 / 100万 token | $3.00 | $3.00 | ~$3.00 |
| 出力 / 100万 token | $15.00 | $15.00 | ~$15.00 | |
| Claude Haiku 4.5 | 入力 / 100万 token | $1.00 | $1.00 | ~$1.00 |
| 出力 / 100万 token | $5.00 | $5.00 | ~$5.00 |
Google モデル
| モデル | メトリクス | Google 直接 | OpenRouter | LemonData |
|---|---|---|---|---|
| Gemini 2.5 Pro | 入力 / 100万 token | $1.25 | $1.25 | ~$1.25 |
| 出力 / 100万 token | $10.00 | $10.00 | ~$10.00 | |
| Gemini 2.5 Flash | 入力 / 100万 token | $0.30 | $0.30 | ~$0.30 |
| 出力 / 100万 token | $2.50 | $2.50 | ~$2.50 |
主なポイント:
- OpenRouter はモデルの価格自体にマージンを上乗せしていませんが、利用料に対して 5.5% のプラットフォーム手数料を適用しています。LemonData の価格は公式レートと同等か、それに近い設定です。
- 大量利用ユーザーにとって、プラットフォーム間の実質的なコスト差は token 価格よりも、決済の手間や caching サポートの有無に集約されます。
- Google AI Studio は Gemini モデルに対して寛大な無料枠を提供しており、少量利用ユーザーにとっては注目に値します。
Prompt Caching:見落とされがちなコスト削減策
Prompt caching は、繰り返しのワークロード(system prompt、few-shot の例、ドキュメント分析など)において、コストを 50〜90% 削減できます。すべてのプラットフォームが同様にサポートしているわけではありません。
| モデル | Cache 書き込み / 100万 token | Cache 読み取り / 100万 token | プラットフォーム |
|---|---|---|---|
| GPT-4.1 | 該当なし (自動) | $1.00 (入力の 50%) | OpenAI |
| Claude Sonnet 4.6 | $3.75 | $0.30 | Anthropic |
| Claude Sonnet 4.6 | $3.75 | $0.30 | LemonData |
| Gemini 2.5 Pro | 該当なし | $0.125 |
プロバイダーごとの caching の仕組み:
- OpenAI:自動 prompt caching。書き込みコストなし。キャッシュされた入力 token は、標準入力価格の 50% で請求されます。1024 token を超える prompt で有効になります。
- Anthropic:
cache_controlブレークポイントによる明示的な caching。書き込みコストは標準入力より 25% 高くなりますが、読み取りコストは 90% 安くなります。キャッシュの TTL は 5 分間です(ヒットするたびに延長)。 - Google:Gemini モデルで context caching が利用可能。料金はモデルや保存期間によって異なります。
結論: アプリケーションが同じ system prompt を繰り返し送信する場合、caching だけで請求額を半分に減らせる可能性があります。選択したプラットフォームが caching サポートをパススルーしているか確認してください。一部のアグリゲーターは cache ヘッダーを削除してしまいます。
LemonData は、Anthropic の明示的な cache_control や OpenAI の自動 caching を含め、サポートされているすべてのモデルで prompt caching パラメータをパススルーします。
動画生成:Seedance 2.0
動画生成モデルは、根本的に異なる料金モデルを採用しています。token 単位ではなく、生成ごと、あるいは出力の秒数ごとに支払います。
| モデル | メトリクス | 公式価格 | LemonData |
|---|---|---|---|
| Seedance 2.0 | 5秒動画あたり | ~$0.10 | ~$0.10 |
| 10秒動画あたり | ~$0.20 | ~$0.20 |
備考:
- Seedance 2.0 は text-to-video と image-to-video の両方をサポートしています
- 料金は通常リクエスト単位で、出力時間や解像度によってコストが変動します
- LemonData は Seedance に対してリクエスト単位で課金し、価格は公式レートと同等かそれに近い設定です
Token 料金の先にあるもの:隠れたコスト
単純な token 料金は、全体像の一部に過ぎません。料金表には現れないコストを以下に示します。
1. 最低入金額と前払い
| プラットフォーム | 最低入金額 | 無料枠 |
|---|---|---|
| OpenAI | $5 からチャージ可能 | 新規アカウントに限定的な無料クレジット |
| Anthropic | $5 からチャージ可能 | 新規アカウントに限定的な無料クレジット |
| Google AI Studio | なし (無料枠あり) | Gemini モデルに寛大な無料枠 |
| OpenRouter | $5 から購入可能 | 無料枠:25以上のモデル、50リクエスト/日 |
| LemonData | $5 からチャージ可能 | サインアップ時に $1 の無料クレジット |
2. 決済方法の手間
これは、特に米国や欧州以外の開発者にとって、想像以上に重要です。
| プラットフォーム | 決済方法 | 米ドル以外での摩擦 |
|---|---|---|
| OpenAI | Visa/Mastercard/Amex | 米ドル以外のカードで約 1-3% の為替手数料 |
| Anthropic | Visa/Mastercard | 米ドル以外のカードで約 1-3% の為替手数料 |
| Google Cloud 請求 | 地域によって異なる | |
| OpenRouter | 仮想通貨、クレジットカード | 仮想通貨は為替手数料なし、カードは変動 |
| LemonData | WeChat Pay、Alipay、カード | ネイティブな人民元(CNY)決済、為替損失なし |
中国の開発者の場合: 為替の摩擦は無視できません。中国の開発者が Visa カードで OpenAI に支払う場合、通貨換算で約 1-3% を失い、さらに海外取引手数料が発生する可能性があります。月額 $50-100 程度の利用でも、年間では $10-30 が純粋な無駄となります。LemonData は WeChat/Alipay による人民元決済を受け付けているため、これを完全に排除できます。
3. サブスクリプションの無駄
多くの開発者が API アクセスとサブスクリプション製品を混同しています。
| 製品 | コスト | 得られるもの |
|---|---|---|
| ChatGPT Plus | $20/月 | チャットインターフェース、GPT-4o アクセス、限定的な GPT-4.1 |
| Claude Pro | $20/月 | チャットインターフェース、より高い利用制限 |
| API (従量課金) | $0/月 + 利用料 | プログラムによるアクセス、任意のモデル |
月間の API コールが $20 未満であれば、サブスクリプションの方が割高になります。参考までに、$20 で購入できる目安は以下の通りです:
- ~5000万 GPT-4.1-mini 入力 token
- ~2000万 Claude Haiku 4.5 入力 token
- ~2,000-3,000 回の典型的な GPT-4.1 会話(1会話あたり入力 2K + 出力 1K と仮定)
ほとんどの個人開発者や小規模プロジェクトでは、月間の API 利用料は $20 を大幅に下回ります。
コストシナリオ:実際の利用イメージ
シナリオ 1:個人開発者、AI 搭載機能
- 1日 500 回の API コール、1コールあたり平均 入力 1K + 出力 500 token
- モデル:GPT-4.1-mini
| プラットフォーム | 月間コスト |
|---|---|
| OpenAI 直接 | 約 $18/月 |
| LemonData | 約 $18-20/月 |
シナリオ 2:スタートアップ、カスタマーサポートボット
- 1日 5,000 回の API コール、平均 入力 2K + 出力 1K token
- モデル:Claude Sonnet 4.6
- system prompt の再利用が多い(caching 適用可能)
| プラットフォーム | 月間コスト (キャッシュなし) | 月間コスト (キャッシュあり) |
|---|---|---|
| Anthropic 直接 | 約 $3,150/月 | 約 $2,502/月 |
| LemonData | 約 $3,150/月 | 約 $2,502/月 |
シナリオ 3:AI コーディングツール、マルチモデル
- 1日 2,000 回のコールを GPT-4.1 (40%)、Claude Sonnet 4.6 (40%)、Gemini 2.5 Pro (20%) で分割
- 平均 入力 3K + 出力 2K token
| プラットフォーム | 月間コスト |
|---|---|
| 複数の直接 API | 約 $1,749/月 (3プロバイダーの合計) |
| OpenRouter | 約 $1,840/月 |
| LemonData | 約 $1,749-1,800/月 |
注:複数の直接 API を使用する場合、3 つの別々のアカウント、請求システム、API key を管理する必要があります。アグリゲーターはこれを 1 つのアカウントに集約します。OpenRouter の約 $1,840 という数字は、ベースとなるモデル価格に 5.5% のプラットフォーム手数料を加算したものです。
プラットフォーム機能比較
価格以外にも、本番環境での利用にはプラットフォームの機能が重要になります。
| 機能 | OpenAI | Anthropic | OpenRouter | LemonData | |
|---|---|---|---|---|---|
| 利用可能なモデル | OpenAI のみ | Anthropic のみ | Google のみ | 400+ | 300+ |
| OpenAI 互換 API | はい | いいえ (独自形式) | いいえ (独自形式) | はい | はい |
| Streaming | はい | はい | はい | はい | はい |
| Prompt caching | 自動 | 明示的 | Context caching | パススルー | パススルー |
| Function calling | はい | はい (tools) | はい | はい | はい |
| Vision | はい | はい | はい | はい | はい |
| 動画生成 | Sora | いいえ | Veo | プロバイダー経由 | Seedance 2.0 + その他 |
| Rate limits | ティア制 | ティア制 | クォータ制 | クレジット制 | ロール制 |
| 人民元(CNY)決済 | いいえ | いいえ | いいえ | いいえ | はい |
推奨事項
以下の場合、直接 API を選択してください:
- 保証された SLA とベンダーによる直接サポートが必要な場合
- 厳格なコンプライアンス要件の下で、非常に機密性の高いデータを処理している場合
- 1 つのプロバイダーのモデルしか使用しない場合
以下の場合、アグリゲーター(OpenRouter / LemonData)を選択してください:
- 1 つの API を通じて複数のプロバイダーにアクセスしたい場合
- 直接の API アクセスが困難な地域(決済、ネットワークなど)にいる場合
- インテグレーションを変更せずにモデルを切り替えたい場合
- モデルの柔軟性が必要な製品を構築している場合
特に以下の場合、LemonData を選択してください:
- 中国を拠点としており、ネイティブな人民元決済を利用したい場合
- VPN なしで直接ネットワークアクセスが必要な場合
- 中国のプロバイダー(Qwen、DeepSeek など)を含む 300 以上のモデルを利用したい場合
方法論と免責事項
- すべての価格は、公式料金ページで公開されている 2026 年初頭の価格を反映しています
- 価格は頻繁に変更されます。最新のレートについては、常にプロバイダーの公式料金ページを確認してください
- アグリゲーターの価格にはマージンが含まれています。直接 API の価格には決済手数料は含まれていません
- 「隠れたコスト」の計算は、米国以外の開発者の典型的な決済シナリオを想定しています
- シナリオ計算では簡略化された token 数を使用しており、実際の利用状況は異なります
確認用価格ソース:
- OpenAI: https://openai.com/api/pricing
- Anthropic: https://www.anthropic.com/pricing
- Google: https://ai.google.dev/pricing
- OpenRouter: https://openrouter.ai/models
- LemonData: https://docs.lemondata.cc/pricing
最終更新日:2026年2月。この記事に記載されている価格は概算であり、変更される可能性があります。最新のレートについては、常にプロバイダーの公式料金ページを確認してください。
LemonData を試す:lemondata.cc
