So sánh giá AI API năm 2026: Chi phí thực tế của GPT-4.1, Claude Sonnet 4.6 và Gemini 2.5
Bản phân tích dựa trên dữ liệu về số tiền thực tế bạn phải trả cho các lượt gọi AI API trên OpenAI, Anthropic, Google, OpenRouter và LemonData, bao gồm cả những chi phí ẩn mà không ai nhắc tới.
Tại sao có bản so sánh này
Giá AI API nhìn bề ngoài có vẻ đơn giản: input tokens giá X, output tokens giá Y. Nhưng khi bạn tính đến prompt caching, khoản nạp tối thiểu, khó khăn trong thanh toán và tổn thất chuyển đổi ngoại tệ, chi phí thực tế có thể thay đổi đáng kể tùy thuộc vào nơi bạn mua tokens.
Dưới đây là cái nhìn so sánh giữa năm nền tảng đối với các model phổ biến nhất tính đến đầu năm 2026. Tất cả giá được tính bằng USD trên 1 triệu tokens trừ khi có ghi chú khác.
Các nền tảng được so sánh:
- OpenAI (trực tiếp): api.openai.com
- Anthropic (trực tiếp): api.anthropic.com
- Google (trực tiếp): Vertex AI / AI Studio
- OpenRouter: openrouter.ai
- LemonData: api.lemondata.cc
Giá Token: Những con số cốt lõi
Các Model OpenAI
| Model | Chỉ số | OpenAI Trực tiếp | OpenRouter | LemonData |
|---|---|---|---|---|
| GPT-4.1 | Input / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Output / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| GPT-4.1-mini | Input / 1M tokens | $0.40 | $0.40 | ~$0.40 |
| Output / 1M tokens | $1.60 | $1.60 | ~$1.60 | |
| GPT-4o | Input / 1M tokens | $2.50 | $2.50 | ~$2.50 |
| Output / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| o3 | Input / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Output / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| o4-mini | Input / 1M tokens | $1.10 | $1.10 | ~$1.10 |
| Output / 1M tokens | $4.40 | $4.40 | ~$4.40 |
Các Model Anthropic
| Model | Chỉ số | Anthropic Trực tiếp | OpenRouter | LemonData |
|---|---|---|---|---|
| Claude Opus 4.6 | Input / 1M tokens | $5.00 | $5.00 | ~$5.00 |
| Output / 1M tokens | $25.00 | $25.00 | ~$25.00 | |
| Claude Sonnet 4.6 | Input / 1M tokens | $3.00 | $3.00 | ~$3.00 |
| Output / 1M tokens | $15.00 | $15.00 | ~$15.00 | |
| Claude Haiku 4.5 | Input / 1M tokens | $1.00 | $1.00 | ~$1.00 |
| Output / 1M tokens | $5.00 | $5.00 | ~$5.00 |
Các Model Google
| Model | Chỉ số | Google Trực tiếp | OpenRouter | LemonData |
|---|---|---|---|---|
| Gemini 2.5 Pro | Input / 1M tokens | $1.25 | $1.25 | ~$1.25 |
| Output / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| Gemini 2.5 Flash | Input / 1M tokens | $0.30 | $0.30 | ~$0.30 |
| Output / 1M tokens | $2.50 | $2.50 | ~$2.50 |
Quan sát chính:
- OpenRouter không tính thêm phí chênh lệch trên giá model, nhưng áp dụng phí nền tảng 5.5% dựa trên mức sử dụng. Giá của LemonData bằng hoặc gần bằng mức giá chính thức.
- Đối với người dùng khối lượng lớn, sự khác biệt về chi phí thực tế giữa các nền tảng nằm ở sự thuận tiện trong thanh toán và hỗ trợ caching thay vì giá token.
- Google AI Studio cung cấp một gói miễn phí hào phóng cho các model Gemini, đáng lưu ý cho người dùng khối lượng thấp.
Prompt Caching: Cách tiết kiệm chi phí bị bỏ qua
Prompt caching có thể giảm chi phí từ 50-90% cho các khối lượng công việc lặp đi lặp lại (system prompts, ví dụ few-shot, phân tích tài liệu). Không phải tất cả các nền tảng đều hỗ trợ tính năng này như nhau.
| Model | Cache Write / 1M tokens | Cache Read / 1M tokens | Nền tảng |
|---|---|---|---|
| GPT-4.1 | N/A (tự động) | $1.00 (50% input) | OpenAI |
| Claude Sonnet 4.6 | $3.75 | $0.30 | Anthropic |
| Claude Sonnet 4.6 | $3.75 | $0.30 | LemonData |
| Gemini 2.5 Pro | N/A | $0.125 |
Cách hoạt động của caching theo từng nhà cung cấp:
- OpenAI: Prompt caching tự động. Không tốn phí ghi (write). Các input tokens được cache sẽ được tính phí bằng 50% giá input tiêu chuẩn. Caching được kích hoạt cho các prompt > 1024 tokens.
- Anthropic: Caching rõ ràng thông qua các
cache_controlbreakpoints. Phí ghi cao hơn 25% so với input tiêu chuẩn. Phí đọc rẻ hơn 90%. Cache TTL là 5 phút (được gia hạn khi có lượt hit). - Google: Context caching có sẵn cho các model Gemini. Giá thay đổi tùy theo model và thời gian lưu trữ.
Điểm mấu chốt: Nếu ứng dụng của bạn gửi cùng một system prompt lặp đi lặp lại, chỉ riêng caching đã có thể giảm một nửa hóa đơn của bạn. Hãy đảm bảo nền tảng bạn chọn có hỗ trợ truyền tiếp (pass through) caching. Một số bên tổng hợp (aggregators) có thể loại bỏ các cache headers.
LemonData truyền tiếp các tham số prompt caching cho tất cả các model được hỗ trợ, bao gồm cache_control rõ ràng của Anthropic và caching tự động của OpenAI.
Tạo Video: Seedance 2.0
Các model tạo video sử dụng mô hình định giá hoàn toàn khác: bạn trả tiền cho mỗi lần tạo hoặc mỗi giây video đầu ra, không phải theo token.
| Model | Chỉ số | Giá chính thức | LemonData |
|---|---|---|---|
| Seedance 2.0 | Mỗi video 5 giây | ~$0.10 | ~$0.10 |
| Mỗi video 10 giây | ~$0.20 | ~$0.20 |
Ghi chú:
- Seedance 2.0 hỗ trợ cả text-to-video và image-to-video
- Giá thường được tính theo mỗi yêu cầu (request), với chi phí thay đổi tùy theo thời lượng đầu ra và độ phân giải
- LemonData tính phí theo mỗi yêu cầu cho Seedance, với mức giá bằng hoặc gần bằng giá chính thức
Ngoài giá Token: Những chi phí ẩn
Giá token thô chỉ nói lên một phần của câu chuyện. Dưới đây là những chi phí không xuất hiện trong bảng giá.
1. Khoản nạp tối thiểu và Trả trước
| Nền tảng | Khoản nạp tối thiểu | Gói miễn phí |
|---|---|---|
| OpenAI | Nạp tối thiểu $5 | Tài khoản mới nhận được credit miễn phí giới hạn |
| Anthropic | Nạp tối thiểu $5 | Tài khoản mới nhận được credit miễn phí giới hạn |
| Google AI Studio | Không có (có gói miễn phí) | Gói miễn phí hào phóng cho các model Gemini |
| OpenRouter | Mua tối thiểu $5 | Gói miễn phí: hơn 25 model, 50 yêu cầu/ngày |
| LemonData | Nạp tối thiểu $5 | $1 credit miễn phí khi đăng ký |
2. Khó khăn về phương thức thanh toán
Điều này quan trọng hơn nhiều người nghĩ, đặc biệt là đối với các nhà phát triển bên ngoài Mỹ/EU.
| Nền tảng | Phương thức thanh toán | Khó khăn khi không dùng USD |
|---|---|---|
| OpenAI | Visa/Mastercard/Amex | ~1-3% phí FX trên thẻ không phải USD |
| Anthropic | Visa/Mastercard | ~1-3% phí FX trên thẻ không phải USD |
| Google Cloud billing | Thay đổi theo khu vực | |
| OpenRouter | Crypto, thẻ tín dụng | Crypto không có phí FX; thẻ thay đổi tùy loại |
| LemonData | WeChat Pay, Alipay, thẻ | CNY nội địa, không mất phí FX cho người dùng Trung Quốc |
Đối với các nhà phát triển tại Trung Quốc: Tổn thất do phí FX là có thật. Một nhà phát triển Trung Quốc thanh toán cho OpenAI bằng thẻ Visa sẽ mất khoảng 1-3% phí chuyển đổi ngoại tệ, cộng với các khoản phí giao dịch nước ngoài tiềm ẩn. Sau một năm sử dụng ở mức trung bình ($50-100/tháng), số tiền lãng phí thuần túy có thể lên tới $10-30. LemonData chấp nhận WeChat/Alipay bằng CNY, loại bỏ hoàn toàn vấn đề này.
3. Lãng phí gói đăng ký (Subscription)
Nhiều nhà phát triển nhầm lẫn giữa quyền truy cập API và các sản phẩm đăng ký thuê bao:
| Sản phẩm | Chi phí | Những gì bạn nhận được |
|---|---|---|
| ChatGPT Plus | $20/tháng | Giao diện chat, truy cập GPT-4o, giới hạn GPT-4.1 |
| Claude Pro | $20/tháng | Giao diện chat, giới hạn sử dụng cao hơn |
| API (pay-as-you-go) | $0/tháng + sử dụng | Truy cập lập trình, bất kỳ model nào |
Nếu bạn sử dụng ít hơn ~$20 giá trị lượt gọi API mỗi tháng, gói đăng ký sẽ đắt hơn. Để tham khảo, $20 có thể mua được khoảng:
- ~50 triệu input tokens GPT-4.1-mini
- ~20 triệu input tokens Claude Haiku 4.5
- ~2,000-3,000 cuộc hội thoại GPT-4.1 điển hình (giả sử ~2K input + 1K output mỗi cuộc hội thoại)
Hầu hết các nhà phát triển cá nhân và dự án nhỏ đều sử dụng API dưới mức $20/tháng.
Các kịch bản chi phí: Sử dụng thực tế trông như thế nào
Kịch bản 1: Nhà phát triển độc lập (Indie Developer), Tính năng tích hợp AI
- 500 lượt gọi API/ngày, trung bình 1K input + 500 output tokens mỗi lượt
- Model: GPT-4.1-mini
| Nền tảng | Chi phí hàng tháng |
|---|---|
| OpenAI Trực tiếp | ~$18/tháng |
| LemonData | ~$18-20/tháng |
Kịch bản 2: Startup, Bot hỗ trợ khách hàng
- 5,000 lượt gọi API/ngày, trung bình 2K input + 1K output tokens
- Model: Claude Sonnet 4.6
- Tái sử dụng system prompt nhiều (có áp dụng caching)
| Nền tảng | Chi phí tháng (không cache) | Chi phí tháng (có cache) |
|---|---|---|
| Anthropic Trực tiếp | ~$3,150/tháng | ~$2,502/tháng |
| LemonData | ~$3,150/tháng | ~$2,502/tháng |
Kịch bản 3: Công cụ lập trình AI, Đa model
- 2,000 lượt gọi/ngày chia cho GPT-4.1 (40%), Claude Sonnet 4.6 (40%), Gemini 2.5 Pro (20%)
- Trung bình 3K input + 2K output tokens
| Nền tảng | Chi phí hàng tháng |
|---|---|
| Nhiều API trực tiếp | ~$1,749/tháng (tổng của 3 nhà cung cấp) |
| OpenRouter | ~$1,840/tháng |
| LemonData | ~$1,749-1,800/tháng |
Lưu ý: Sử dụng nhiều API trực tiếp đồng nghĩa với việc quản lý 3 tài khoản, hệ thống thanh toán và API keys riêng biệt. Các bên tổng hợp đơn giản hóa việc này thành một tài khoản duy nhất. Con số ~$1,840 của OpenRouter phản ánh phí nền tảng 5.5% của họ trên giá model cơ bản.
So sánh tính năng nền tảng
Ngoài giá cả, khả năng của nền tảng cũng rất quan trọng đối với việc sử dụng trong môi trường production.
| Tính năng | OpenAI | Anthropic | OpenRouter | LemonData | |
|---|---|---|---|---|---|
| Model có sẵn | Chỉ OpenAI | Chỉ Anthropic | Chỉ Google | 400+ | 300+ |
| API tương thích OpenAI | Có | Không (định dạng riêng) | Không (định dạng riêng) | Có | Có |
| Streaming | Có | Có | Có | Có | Có |
| Prompt caching | Tự động | Rõ ràng | Context caching | Truyền tiếp | Truyền tiếp |
| Function calling | Có | Có (tools) | Có | Có | Có |
| Vision | Có | Có | Có | Có | Có |
| Tạo video | Sora | Không | Veo | Qua nhà cung cấp | Seedance 2.0 + khác |
| Rate limits | Theo cấp bậc | Theo cấp bậc | Theo hạn ngạch | Theo credit | Theo vai trò |
| Thanh toán CNY | Không | Không | Không | Không | Có |
Khuyến nghị
Chọn API trực tiếp nếu:
- Bạn cần cam kết SLA và hỗ trợ trực tiếp từ nhà cung cấp
- Bạn đang xử lý dữ liệu cực kỳ nhạy cảm theo các yêu cầu tuân thủ nghiêm ngặt
- Bạn chỉ sử dụng model của một nhà cung cấp duy nhất
Chọn một bên tổng hợp (OpenRouter / LemonData) nếu:
- Bạn muốn truy cập nhiều nhà cung cấp thông qua một API duy nhất
- Bạn ở khu vực khó tiếp cận API trực tiếp (thanh toán, mạng lưới)
- Bạn muốn chuyển đổi model mà không cần thay đổi mã tích hợp
- Bạn đang xây dựng một sản phẩm cần sự linh hoạt về model
Chọn LemonData cụ thể nếu:
- Bạn ở Trung Quốc và muốn thanh toán bằng CNY nội địa
- Bạn cần truy cập mạng trực tiếp mà không cần VPN
- Bạn muốn sử dụng hơn 300 model bao gồm cả các nhà cung cấp Trung Quốc (Qwen, DeepSeek, v.v.)
Phương pháp luận và Tuyên bố miễn trừ trách nhiệm
- Tất cả giá cả phản ánh mức giá đầu năm 2026 được công bố trên các trang giá chính thức
- Giá thay đổi thường xuyên. Luôn kiểm tra trang giá chính thức của nhà cung cấp để biết mức giá mới nhất
- Giá của bên tổng hợp đã bao gồm biên lợi nhuận của họ; giá API trực tiếp không bao gồm phí xử lý thanh toán
- Các tính toán "chi phí ẩn" giả định các kịch bản thanh toán điển hình của nhà phát triển ngoài Hoa Kỳ
- Các tính toán kịch bản sử dụng số lượng token đơn giản hóa; mức sử dụng thực tế sẽ khác nhau
Nguồn giá để xác minh:
- OpenAI: https://openai.com/api/pricing
- Anthropic: https://www.anthropic.com/pricing
- Google: https://ai.google.dev/pricing
- OpenRouter: https://openrouter.ai/models
- LemonData: https://docs.lemondata.cc/pricing
Cập nhật lần cuối: Tháng 2 năm 2026. Giá trong bài viết này là xấp xỉ và có thể thay đổi. Luôn kiểm tra trang giá chính thức của nhà cung cấp để biết mức giá hiện tại nhất.
Dùng thử LemonData: lemondata.cc
