Bản phân tích dựa trên dữ liệu về số tiền thực tế bạn phải trả cho các lượt gọi AI API trên OpenAI, Anthropic, Google, OpenRouter và LemonData, bao gồm cả những chi phí ẩn mà không ai nhắc đến.
Tại sao có bản so sánh này
Giá AI API nhìn bề ngoài có vẻ đơn giản: token đầu vào (input) giá X, token đầu ra (output) giá Y. Nhưng một khi bạn tính đến prompt caching, mức nạp tiền tối thiểu, những khó khăn trong thanh toán và tổn thất do chuyển đổi ngoại tệ, chi phí thực tế có thể thay đổi đáng kể tùy thuộc vào nơi bạn mua token.
Dưới đây là cái nhìn so sánh trực quan giữa năm nền tảng đối với các mô hình phổ biến nhất tính đến đầu năm 2026. Tất cả giá được tính bằng USD trên 1 triệu token trừ khi có ghi chú khác.
Các nền tảng được so sánh:
- OpenAI (trực tiếp): api.openai.com
- Anthropic (trực tiếp): api.anthropic.com
- Google (trực tiếp): Vertex AI / AI Studio
- OpenRouter: openrouter.ai
- LemonData: api.lemondata.cc
Nếu bạn đang sử dụng trang này để quyết định lộ trình triển khai thực tế, hãy mở sẵn hướng dẫn di chuyển, so sánh OpenRouter và hướng dẫn cho nhà phát triển tại Trung Quốc bên cạnh. Giá cả chỉ là một phần ba của quyết định.
Giá Token: Những con số cốt lõi
Các mô hình OpenAI
| Mô hình | Chỉ số | OpenAI Trực tiếp | OpenRouter | LemonData |
|---|---|---|---|---|
| GPT-4.1 | Input / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Output / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| GPT-4.1-mini | Input / 1M tokens | $0.40 | $0.40 | ~$0.40 |
| Output / 1M tokens | $1.60 | $1.60 | ~$1.60 | |
| GPT-4o | Input / 1M tokens | $2.50 | $2.50 | ~$2.50 |
| Output / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| o3 | Input / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Output / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| o4-mini | Input / 1M tokens | $1.10 | $1.10 | ~$1.10 |
| Output / 1M tokens | $4.40 | $4.40 | ~$4.40 |
Các mô hình Anthropic
| Mô hình | Chỉ số | Anthropic Trực tiếp | OpenRouter | LemonData |
|---|---|---|---|---|
| Claude Opus 4.6 | Input / 1M tokens | $5.00 | $5.00 | ~$5.00 |
| Output / 1M tokens | $25.00 | $25.00 | ~$25.00 | |
| Claude Sonnet 4.6 | Input / 1M tokens | $3.00 | $3.00 | ~$3.00 |
| Output / 1M tokens | $15.00 | $15.00 | ~$15.00 | |
| Claude Haiku 4.5 | Input / 1M tokens | $1.00 | $1.00 | ~$1.00 |
| Output / 1M tokens | $5.00 | $5.00 | ~$5.00 |
Các mô hình Google
| Mô hình | Chỉ số | Google Trực tiếp | OpenRouter | LemonData |
|---|---|---|---|---|
| Gemini 2.5 Pro | Input / 1M tokens | $1.25 | $1.25 | ~$1.25 |
| Output / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| Gemini 2.5 Flash | Input / 1M tokens | $0.30 | $0.30 | ~$0.30 |
| Output / 1M tokens | $2.50 | $2.50 | ~$2.50 |
Các quan sát chính:
- OpenRouter không tính phí chênh lệch (markup) trên giá mô hình, nhưng áp dụng phí nền tảng 5.5% trên mức sử dụng. Giá của LemonData bằng hoặc gần bằng mức giá chính thức.
- Đối với người dùng có lưu lượng lớn, sự khác biệt về chi phí thực tế giữa các nền tảng nằm ở sự thuận tiện trong thanh toán và hỗ trợ caching thay vì giá token.
- Google AI Studio cung cấp gói miễn phí hào phóng cho các mô hình Gemini, điều này đáng lưu ý cho người dùng có lưu lượng thấp.
Prompt Caching: Cách tiết kiệm chi phí thường bị bỏ qua
Prompt caching có thể giảm chi phí từ 50-90% cho các khối lượng công việc lặp đi lặp lại (system prompts, ví dụ few-shot, phân tích tài liệu). Không phải tất cả các nền tảng đều hỗ trợ tính năng này như nhau.
| Mô hình | Cache Write / 1M tokens | Cache Read / 1M tokens | Nền tảng |
|---|---|---|---|
| GPT-4.1 | N/A (tự động) | $1.00 (50% input) | OpenAI |
| Claude Sonnet 4.6 | $3.75 | $0.30 | Anthropic |
| Claude Sonnet 4.6 | $3.75 | $0.30 | LemonData |
| Gemini 2.5 Pro | N/A | $0.125 |
Cách thức hoạt động của caching theo từng nhà cung cấp:
- OpenAI: Tự động prompt caching. Không tốn phí ghi (write). Các token đầu vào được cache sẽ được tính phí bằng 50% giá đầu vào tiêu chuẩn. Caching được kích hoạt cho các prompt > 1024 token.
- Anthropic: Caching rõ ràng thông qua các điểm ngắt
cache_control. Phí ghi cao hơn 25% so với đầu vào tiêu chuẩn. Phí đọc rẻ hơn 90%. Thời gian sống của cache (TTL) là 5 phút (được gia hạn khi có lượt truy cập). - Google: Context caching có sẵn cho các mô hình Gemini. Giá thay đổi tùy theo mô hình và thời gian lưu trữ.
Tóm lại: Nếu ứng dụng của bạn gửi cùng một system prompt lặp đi lặp lại, chỉ riêng caching đã có thể cắt giảm một nửa hóa đơn của bạn. Hãy đảm bảo nền tảng bạn chọn có hỗ trợ truyền qua (passthrough) caching. Một số bên trung gian có thể loại bỏ các cache header.
LemonData hỗ trợ truyền qua các tham số prompt caching cho tất cả các mô hình được hỗ trợ, bao gồm cache_control rõ ràng của Anthropic và caching tự động của OpenAI.
Tạo Video: Seedance 2.0
Các mô hình tạo video sử dụng một mô hình định giá khác biệt hoàn toàn: bạn trả tiền cho mỗi lần tạo hoặc mỗi giây đầu ra, không phải theo token.
| Mô hình | Chỉ số | Giá chính thức | LemonData |
|---|---|---|---|
| Seedance 2.0 | Mỗi video 5 giây | ~$0.10 | ~$0.10 |
| Mỗi video 10 giây | ~$0.20 | ~$0.20 |
Lưu ý:
- Seedance 2.0 hỗ trợ cả text-to-video và image-to-video
- Định giá thường theo mỗi yêu cầu, với chi phí thay đổi tùy theo thời lượng đầu ra và độ phân giải
- LemonData tính phí theo mỗi yêu cầu cho Seedance, với mức giá bằng hoặc gần bằng giá chính thức
Ngoài giá Token: Những chi phí ẩn
Giá token thô chỉ nói lên một phần của câu chuyện. Dưới đây là những chi phí không xuất hiện trong bảng giá.
1. Nạp tiền tối thiểu và Trả trước
| Nền tảng | Mức nạp tối thiểu | Gói miễn phí |
|---|---|---|
| OpenAI | Nạp tối thiểu $5 | Tài khoản mới nhận được credit miễn phí giới hạn |
| Anthropic | Nạp tối thiểu $5 | Tài khoản mới nhận được credit miễn phí giới hạn |
| Google AI Studio | Không (có gói miễn phí) | Gói miễn phí hào phóng cho các mô hình Gemini |
| OpenRouter | Mua tối thiểu $5 | Gói miễn phí: hơn 25 mô hình, 50 yêu cầu/ngày |
| LemonData | Nạp tối thiểu $5 | Tặng $1 credit khi đăng ký |
2. Khó khăn về phương thức thanh toán
Điều này quan trọng hơn nhiều người nghĩ, đặc biệt là đối với các nhà phát triển bên ngoài Mỹ/EU.
| Nền tảng | Phương thức thanh toán | Khó khăn khi không dùng USD |
|---|---|---|
| OpenAI | Visa/Mastercard/Amex | ~1-3% phí FX trên thẻ không phải USD |
| Anthropic | Visa/Mastercard | ~1-3% phí FX trên thẻ không phải USD |
| Thanh toán Google Cloud | Thay đổi theo khu vực | |
| OpenRouter | Crypto, thẻ tín dụng | Crypto không có phí FX; thẻ thì tùy loại |
| LemonData | WeChat Pay, Alipay, thẻ | Dùng CNY nội địa, không mất phí FX cho người dùng Trung Quốc |
Đối với các nhà phát triển tại Trung Quốc: Tổn thất do phí FX là có thật. Một nhà phát triển Trung Quốc thanh toán cho OpenAI bằng thẻ Visa sẽ mất khoảng 1-3% phí chuyển đổi ngoại tệ, cộng với các khoản phí giao dịch nước ngoài tiềm ẩn. Sau một năm sử dụng ở mức trung bình ($50-100/tháng), con số đó có thể lên tới $10-30 lãng phí hoàn toàn. LemonData chấp nhận WeChat/Alipay bằng CNY, loại bỏ hoàn toàn vấn đề này.
3. Lãng phí từ gói đăng ký
Nhiều nhà phát triển nhầm lẫn giữa quyền truy cập API và các sản phẩm đăng ký thuê bao:
| Sản phẩm | Chi phí | Những gì bạn nhận được |
|---|---|---|
| ChatGPT Plus | $20/tháng | Giao diện chat, quyền truy cập GPT-4o, giới hạn GPT-4.1 |
| Claude Pro | $20/tháng | Giao diện chat, giới hạn sử dụng cao hơn |
| API (trả theo mức dùng) | $0/tháng + sử dụng | Truy cập lập trình, bất kỳ mô hình nào |
Nếu bạn sử dụng ít hơn khoảng $20 giá trị lượt gọi API mỗi tháng, gói đăng ký thuê bao sẽ đắt hơn. Để tham khảo, $20 có thể mua được khoảng:
- ~50 triệu token đầu vào GPT-4.1-mini
- ~20 triệu token đầu vào Claude Haiku 4.5
- ~2,000-3,000 cuộc hội thoại GPT-4.1 điển hình (giả sử ~2K input + 1K output mỗi cuộc hội thoại)
Hầu hết các nhà phát triển cá nhân và dự án nhỏ đều sử dụng API dưới mức $20/tháng.
Các kịch bản chi phí: Sử dụng thực tế trông như thế nào
Kịch bản 1: Nhà phát triển độc lập, tính năng hỗ trợ bởi AI
- 500 lượt gọi API/ngày, trung bình 1K input + 500 output token mỗi lượt
- Mô hình: GPT-4.1-mini
| Nền tảng | Chi phí hàng tháng |
|---|---|
| OpenAI Trực tiếp | ~$18/tháng |
| LemonData | ~$18-20/tháng |
Kịch bản 2: Startup, Bot hỗ trợ khách hàng
- 5,000 lượt gọi API/ngày, trung bình 2K input + 1K output token
- Mô hình: Claude Sonnet 4.6
- Sử dụng lại system prompt nhiều (có thể áp dụng caching)
| Nền tảng | Chi phí hàng tháng (không cache) | Chi phí hàng tháng (có cache) |
|---|---|---|
| Anthropic Trực tiếp | ~$3,150/tháng | ~$2,502/tháng |
| LemonData | ~$3,150/tháng | ~$2,502/tháng |
Kịch bản 3: Công cụ lập trình AI, đa mô hình
- 2,000 lượt gọi/ngày chia cho GPT-4.1 (40%), Claude Sonnet 4.6 (40%), Gemini 2.5 Pro (20%)
- Trung bình 3K input + 2K output token
| Nền tảng | Chi phí hàng tháng |
|---|---|
| Nhiều API trực tiếp | ~$1,749/tháng (tổng của 3 nhà cung cấp) |
| OpenRouter | ~$1,840/tháng |
| LemonData | ~$1,749-1,800/tháng |
Lưu ý: Sử dụng nhiều API trực tiếp đồng nghĩa với việc quản lý 3 tài khoản, hệ thống thanh toán và API key riêng biệt. Các bên trung gian đơn giản hóa việc này thành một tài khoản duy nhất. Con số ~$1,840 của OpenRouter phản ánh mức phí nền tảng 5.5% của họ trên giá mô hình cơ bản.
So sánh tính năng nền tảng
Ngoài giá cả, khả năng của nền tảng cũng rất quan trọng đối với việc sử dụng trong sản xuất.
| Tính năng | OpenAI | Anthropic | OpenRouter | LemonData | |
|---|---|---|---|---|---|
| Mô hình hiện có | Chỉ OpenAI | Chỉ Anthropic | Chỉ Google | 400+ | 300+ |
| API tương thích OpenAI | Có | Không (định dạng riêng) | Không (định dạng riêng) | Có | Có |
| Streaming | Có | Có | Có | Có | Có |
| Prompt caching | Tự động | Rõ ràng | Context caching | Passthrough | Passthrough |
| Function calling | Có | Có (tools) | Có | Có | Có |
| Vision | Có | Có | Có | Có | Có |
| Tạo video | Sora | Không | Veo | Qua nhà cung cấp | Seedance 2.0 + khác |
| Rate limits | Theo cấp bậc | Theo cấp bậc | Theo hạn ngạch | Theo credit | Theo vai trò |
| Thanh toán CNY | Không | Không | Không | Không | Có |
Khuyến nghị
Chọn API trực tiếp nếu:
- Bạn cần cam kết SLA và hỗ trợ trực tiếp từ nhà cung cấp
- Bạn đang xử lý dữ liệu cực kỳ nhạy cảm theo các yêu cầu tuân thủ nghiêm ngặt
- Bạn chỉ sử dụng mô hình của một nhà cung cấp duy nhất
Chọn một bên trung gian (OpenRouter / LemonData) nếu:
- Bạn muốn truy cập nhiều nhà cung cấp thông qua một API duy nhất
- Bạn ở khu vực khó truy cập API trực tiếp (thanh toán, mạng lưới)
- Bạn muốn chuyển đổi mô hình mà không cần thay đổi tích hợp của mình
- Bạn đang xây dựng một sản phẩm cần sự linh hoạt về mô hình
Chọn LemonData cụ thể nếu:
- Bạn ở Trung Quốc và muốn thanh toán bằng CNY nội địa
- Bạn cần truy cập mạng trực tiếp mà không cần VPN
- Bạn muốn sử dụng hơn 300 mô hình bao gồm cả các nhà cung cấp Trung Quốc (Qwen, DeepSeek, v.v.)
Phương pháp luận và Tuyên bố miễn trừ trách nhiệm
- Tất cả giá cả phản ánh mức giá đầu năm 2026 được công bố trên các trang định giá chính thức
- Giá cả thay đổi thường xuyên. Luôn kiểm tra trang định giá chính thức của nhà cung cấp để biết mức giá mới nhất
- Giá của bên trung gian đã bao gồm lợi nhuận của họ; giá API trực tiếp không bao gồm phí xử lý thanh toán
- Các tính toán "chi phí ẩn" giả định các kịch bản thanh toán điển hình của nhà phát triển không ở Mỹ
- Các tính toán kịch bản sử dụng số lượng token được đơn giản hóa; mức sử dụng thực tế sẽ thay đổi
Nguồn giá để xác minh:
- OpenAI: https://openai.com/api/pricing
- Anthropic: https://www.anthropic.com/pricing
- Google: https://ai.google.dev/pricing
- OpenRouter: https://openrouter.ai/models
- LemonData: https://docs.lemondata.cc/pricing
Cập nhật lần cuối: Tháng 2 năm 2026. Giá trong bài viết này là xấp xỉ và có thể thay đổi. Luôn kiểm tra trang định giá chính thức của nhà cung cấp để biết mức giá mới nhất.
Dùng thử LemonData: lemondata.cc
