Perbandingan Harga AI API 2026: Biaya Sebenarnya dari GPT-4.1, Claude Sonnet 4.6, dan Gemini 2.5
Analisis berbasis data tentang biaya yang sebenarnya Anda bayar untuk panggilan AI API di OpenAI, Anthropic, Google, OpenRouter, dan LemonData, termasuk biaya tersembunyi yang jarang dibahas.
Mengapa Perbandingan Ini Ada
Harga AI API terlihat sederhana di permukaan: token input seharga X, token output seharga Y. Namun, setelah memperhitungkan prompt caching, setoran minimum, hambatan pembayaran, dan kerugian konversi mata uang, biaya sebenarnya bisa sangat bervariasi tergantung di mana Anda membeli token Anda.
Berikut adalah perbandingan berdampingan dari lima platform untuk model-model terpopuler pada awal 2026. Semua harga dalam USD per 1 juta token kecuali dinyatakan lain.
Platform yang dibandingkan:
- OpenAI (langsung): api.openai.com
- Anthropic (langsung): api.anthropic.com
- Google (langsung): Vertex AI / AI Studio
- OpenRouter: openrouter.ai
- LemonData: api.lemondata.cc
Harga Token: Angka Inti
Model OpenAI
| Model | Metrik | OpenAI Langsung | OpenRouter | LemonData |
|---|---|---|---|---|
| GPT-4.1 | Input / 1 juta token | $2.00 | $2.00 | ~$2.00 |
| Output / 1 juta token | $8.00 | $8.00 | ~$8.00 | |
| GPT-4.1-mini | Input / 1 juta token | $0.40 | $0.40 | ~$0.40 |
| Output / 1 juta token | $1.60 | $1.60 | ~$1.60 | |
| GPT-4o | Input / 1 juta token | $2.50 | $2.50 | ~$2.50 |
| Output / 1 juta token | $10.00 | $10.00 | ~$10.00 | |
| o3 | Input / 1 juta token | $2.00 | $2.00 | ~$2.00 |
| Output / 1 juta token | $8.00 | $8.00 | ~$8.00 | |
| o4-mini | Input / 1 juta token | $1.10 | $1.10 | ~$1.10 |
| Output / 1 juta token | $4.40 | $4.40 | ~$4.40 |
Model Anthropic
| Model | Metrik | Anthropic Langsung | OpenRouter | LemonData |
|---|---|---|---|---|
| Claude Opus 4.6 | Input / 1 juta token | $5.00 | $5.00 | ~$5.00 |
| Output / 1 juta token | $25.00 | $25.00 | ~$25.00 | |
| Claude Sonnet 4.6 | Input / 1 juta token | $3.00 | $3.00 | ~$3.00 |
| Output / 1 juta token | $15.00 | $15.00 | ~$15.00 | |
| Claude Haiku 4.5 | Input / 1 juta token | $1.00 | $1.00 | ~$1.00 |
| Output / 1 juta token | $5.00 | $5.00 | ~$5.00 |
Model Google
| Model | Metrik | Google Langsung | OpenRouter | LemonData |
|---|---|---|---|---|
| Gemini 2.5 Pro | Input / 1 juta token | $1.25 | $1.25 | ~$1.25 |
| Output / 1 juta token | $10.00 | $10.00 | ~$10.00 | |
| Gemini 2.5 Flash | Input / 1 juta token | $0.30 | $0.30 | ~$0.30 |
| Output / 1 juta token | $2.50 | $2.50 | ~$2.50 |
Pengamatan utama:
- OpenRouter mengenakan markup 0% pada harga model itu sendiri, tetapi menerapkan biaya platform sebesar 5,5% pada penggunaan. Harga LemonData berada pada atau mendekati tarif resmi.
- Bagi pengguna bervolume tinggi, perbedaan biaya efektif antar platform lebih disebabkan oleh hambatan pembayaran dan dukungan caching daripada harga token.
- Google AI Studio menawarkan free tier yang melimpah untuk model Gemini, patut dicatat bagi pengguna bervolume rendah.
Prompt Caching: Penghemat Biaya yang Sering Terlewatkan
Prompt caching dapat mengurangi biaya sebesar 50-90% untuk beban kerja yang berulang (system prompt, contoh few-shot, analisis dokumen). Tidak semua platform mendukungnya secara setara.
| Model | Cache Write / 1 juta token | Cache Read / 1 juta token | Platform |
|---|---|---|---|
| GPT-4.1 | N/A (otomatis) | $1.00 (50% dari input) | OpenAI |
| Claude Sonnet 4.6 | $3.75 | $0.30 | Anthropic |
| Claude Sonnet 4.6 | $3.75 | $0.30 | LemonData |
| Gemini 2.5 Pro | N/A | $0.125 |
Cara kerja caching per penyedia:
- OpenAI: Prompt caching otomatis. Tidak ada biaya penulisan (write cost). Token input yang di-cache ditagih sebesar 50% dari harga input standar. Caching aktif untuk prompt > 1024 token.
- Anthropic: Caching eksplisit melalui breakpoint
cache_control. Biaya penulisan 25% lebih tinggi dari input standar. Biaya pembacaan (read cost) 90% lebih murah. Cache TTL adalah 5 menit (diperpanjang saat ada hit). - Google: Context caching tersedia untuk model Gemini. Harga bervariasi berdasarkan model dan durasi penyimpanan.
Intinya: Jika aplikasi Anda mengirimkan system prompt yang sama berulang kali, caching saja dapat memotong tagihan Anda hingga setengahnya. Pastikan platform pilihan Anda meneruskan dukungan caching. Beberapa agregator menghapus header cache.
LemonData meneruskan parameter prompt caching untuk semua model yang didukung, termasuk cache_control eksplisit milik Anthropic dan caching otomatis milik OpenAI.
Generasi Video: Seedance 2.0
Model generasi video menggunakan model penetapan harga yang mendasar berbeda: Anda membayar per generasi atau per detik output, bukan per token.
| Model | Metrik | Harga Resmi | LemonData |
|---|---|---|---|
| Seedance 2.0 | Per video 5 detik | ~$0.10 | ~$0.10 |
| Per video 10 detik | ~$0.20 | ~$0.20 |
Catatan:
- Seedance 2.0 mendukung text-to-video dan image-to-video
- Harga biasanya per permintaan (request), dengan biaya bervariasi berdasarkan durasi output dan resolusi
- LemonData menagih per permintaan untuk Seedance, dengan harga pada atau mendekati tarif resmi
Di Luar Harga Token: Biaya Tersembunyi
Harga token mentah hanya menceritakan sebagian dari ceritanya. Berikut adalah biaya-biaya yang tidak muncul dalam tabel harga.
1. Setoran Minimum dan Pembayaran Di Muka
| Platform | Setoran Minimum | Free Tier |
|---|---|---|
| OpenAI | Top-up minimum $5 | Akun baru mendapatkan kredit gratis terbatas |
| Anthropic | Top-up minimum $5 | Akun baru mendapatkan kredit gratis terbatas |
| Google AI Studio | Tidak ada (tersedia free tier) | Free tier melimpah untuk model Gemini |
| OpenRouter | Pembelian minimum $5 | Free tier: 25+ model, 50 permintaan/hari |
| LemonData | Top-up minimum $5 | Kredit gratis $1 saat pendaftaran |
2. Hambatan Metode Pembayaran
Hal ini lebih penting daripada yang dipikirkan kebanyakan orang, terutama bagi pengembang di luar AS/UE.
| Platform | Metode Pembayaran | Hambatan Non-USD |
|---|---|---|
| OpenAI | Visa/Mastercard/Amex | Biaya kurs ~1-3% pada kartu non-USD |
| Anthropic | Visa/Mastercard | Biaya kurs ~1-3% pada kartu non-USD |
| Penagihan Google Cloud | Bervariasi menurut wilayah | |
| OpenRouter | Crypto, kartu kredit | Crypto tidak ada biaya kurs; kartu bervariasi |
| LemonData | WeChat Pay, Alipay, kartu | CNY asli, nol kerugian kurs untuk pengguna Tiongkok |
Untuk pengembang di Tiongkok: Hambatan kurs mata uang itu nyata. Seorang pengembang Tiongkok yang membayar OpenAI dengan kartu Visa kehilangan sekitar 1-3% pada konversi mata uang, ditambah potensi biaya transaksi luar negeri. Selama setahun penggunaan moderat ($50-100/bulan), itu setara dengan pemborosan murni sebesar $10-30. LemonData menerima WeChat/Alipay dalam CNY, menghilangkan hal ini sepenuhnya.
3. Pemborosan Langganan
Banyak pengembang menyamakan akses API dengan produk langganan:
| Produk | Biaya | Apa yang Anda Dapatkan |
|---|---|---|
| ChatGPT Plus | $20/bulan | Antarmuka chat, akses GPT-4o, GPT-4.1 terbatas |
| Claude Pro | $20/bulan | Antarmuka chat, batas penggunaan lebih tinggi |
| API (pay-as-you-go) | $0/bulan + penggunaan | Akses terprogram, model apa pun |
Jika Anda menggunakan kurang dari ~$20 panggilan API per bulan, langganan akan terasa lebih mahal. Sebagai referensi, $20 dapat membeli kira-kira:
- ~50 juta token input GPT-4.1-mini
- ~20 juta token input Claude Haiku 4.5
- ~2.000-3.000 percakapan GPT-4.1 tipikal (asumsi ~2K input + 1K output per percakapan)
Kebanyakan pengembang individu dan proyek kecil menghabiskan jauh di bawah $20/bulan dalam penggunaan API.
Skenario Biaya: Seperti Apa Penggunaan Nyata
Skenario 1: Pengembang Indie, Fitur Berbasis AI
- 500 panggilan API/hari, rata-rata 1K input + 500 token output per panggilan
- Model: GPT-4.1-mini
| Platform | Biaya Bulanan |
|---|---|
| OpenAI Langsung | ~$18/bln |
| LemonData | ~$18-20/bln |
Skenario 2: Startup, Bot Layanan Pelanggan
- 5.000 panggilan API/hari, rata-rata 2K input + 1K token output
- Model: Claude Sonnet 4.6
- Penggunaan ulang system prompt yang berat (caching berlaku)
| Platform | Biaya Bulanan (tanpa cache) | Biaya Bulanan (dengan cache) |
|---|---|---|
| Anthropic Langsung | ~$3.150/bln | ~$2.502/bln |
| LemonData | ~$3.150/bln | ~$2.502/bln |
Skenario 3: Alat Coding AI, Multi-Model
- 2.000 panggilan/hari dibagi antara GPT-4.1 (40%), Claude Sonnet 4.6 (40%), Gemini 2.5 Pro (20%)
- Rata-rata 3K input + 2K token output
| Platform | Biaya Bulanan |
|---|---|
| Beberapa API langsung | ~$1.749/bln (total dari 3 penyedia) |
| OpenRouter | ~$1.840/bln |
| LemonData | ~$1.749-1.800/bln |
Catatan: Menggunakan beberapa API langsung berarti mengelola 3 akun, sistem penagihan, dan API key yang terpisah. Agregator menyederhanakan ini menjadi satu akun saja. Angka ~$1.840 OpenRouter mencerminkan biaya platform 5,5% mereka di atas harga dasar model.
Perbandingan Fitur Platform
Selain harga, kapabilitas platform sangat penting untuk penggunaan produksi.
| Fitur | OpenAI | Anthropic | OpenRouter | LemonData | |
|---|---|---|---|---|---|
| Model yang tersedia | Hanya OpenAI | Hanya Anthropic | Hanya Google | 400+ | 300+ |
| API kompatibel OpenAI | Ya | Tidak (format sendiri) | Tidak (format sendiri) | Ya | Ya |
| Streaming | Ya | Ya | Ya | Ya | Ya |
| Prompt caching | Otomatis | Eksplisit | Context caching | Passthrough | Passthrough |
| Function calling | Ya | Ya (tools) | Ya | Ya | Ya |
| Vision | Ya | Ya | Ya | Ya | Ya |
| Generasi video | Sora | Tidak | Veo | Via penyedia | Seedance 2.0 + lainnya |
| Rate limits | Berbasis tier | Berbasis tier | Berbasis kuota | Berbasis kredit | Berbasis peran |
| Pembayaran CNY | Tidak | Tidak | Tidak | Tidak | Ya |
Rekomendasi
Pilih API langsung jika:
- Anda membutuhkan jaminan SLA dan dukungan vendor langsung
- Anda memproses data yang sangat sensitif di bawah persyaratan kepatuhan yang ketat
- Anda hanya menggunakan model dari satu penyedia
Pilih agregator (OpenRouter / LemonData) jika:
- Anda ingin akses ke beberapa penyedia melalui satu API
- Anda berada di wilayah di mana akses API langsung sulit (pembayaran, jaringan)
- Anda ingin mengganti model tanpa mengubah integrasi Anda
- Anda sedang membangun produk yang membutuhkan fleksibilitas model
Pilih LemonData secara khusus jika:
- Anda berbasis di Tiongkok dan menginginkan pembayaran CNY asli
- Anda membutuhkan akses jaringan langsung tanpa VPN
- Anda menginginkan 300+ model termasuk penyedia asal Tiongkok (Qwen, DeepSeek, dll.)
Metodologi dan Penafian
- Semua harga mencerminkan harga awal 2026 seperti yang dipublikasikan di halaman harga resmi
- Harga sering berubah. Selalu periksa halaman harga resmi penyedia untuk tarif terbaru
- Harga agregator sudah termasuk margin mereka; harga API langsung tidak termasuk biaya pemrosesan pembayaran
- Perhitungan "biaya tersembunyi" mengasumsikan skenario pembayaran pengembang non-AS yang tipikal
- Perhitungan skenario menggunakan jumlah token yang disederhanakan; penggunaan dunia nyata bervariasi
Sumber harga untuk diverifikasi:
- OpenAI: https://openai.com/api/pricing
- Anthropic: https://www.anthropic.com/pricing
- Google: https://ai.google.dev/pricing
- OpenRouter: https://openrouter.ai/models
- LemonData: https://docs.lemondata.cc/pricing
Terakhir diperbarui: Februari 2026. Harga dalam artikel ini adalah perkiraan dan dapat berubah sewaktu-waktu. Selalu periksa halaman harga resmi penyedia untuk tarif terbaru.
Coba LemonData: lemondata.cc
