Cài đặt

Ngôn ngữ

So sánh giá AI API 2026: Chi phí thực tế của GPT-4.1, Claude Sonnet 4.6 và Gemini 2.5

L
LemonData
·26 tháng 2, 2026·3566 lượt xem
So sánh giá AI API 2026: Chi phí thực tế của GPT-4.1, Claude Sonnet 4.6 và Gemini 2.5

Bản phân tích dựa trên dữ liệu về số tiền thực tế bạn phải trả cho các lượt gọi AI API trên OpenAI, Anthropic, Google, OpenRouter và LemonData, bao gồm cả những chi phí ẩn mà không ai nhắc đến.


Tại sao có bản so sánh này

Giá AI API nhìn bề ngoài có vẻ đơn giản: token đầu vào (input) giá X, token đầu ra (output) giá Y. Nhưng một khi bạn tính đến prompt caching, mức nạp tiền tối thiểu, những khó khăn trong thanh toán và tổn thất do chuyển đổi ngoại tệ, chi phí thực tế có thể thay đổi đáng kể tùy thuộc vào nơi bạn mua token.

Dưới đây là cái nhìn so sánh trực quan giữa năm nền tảng đối với các mô hình phổ biến nhất tính đến đầu năm 2026. Tất cả giá được tính bằng USD trên 1 triệu token trừ khi có ghi chú khác.

Các nền tảng được so sánh:

  • OpenAI (trực tiếp): api.openai.com
  • Anthropic (trực tiếp): api.anthropic.com
  • Google (trực tiếp): Vertex AI / AI Studio
  • OpenRouter: openrouter.ai
  • LemonData: api.lemondata.cc

Nếu bạn đang sử dụng trang này để quyết định lộ trình triển khai thực tế, hãy mở sẵn hướng dẫn di chuyển, so sánh OpenRouterhướng dẫn cho nhà phát triển tại Trung Quốc bên cạnh. Giá cả chỉ là một phần ba của quyết định.


Giá Token: Những con số cốt lõi

Các mô hình OpenAI

Mô hình Chỉ số OpenAI Trực tiếp OpenRouter LemonData
GPT-4.1 Input / 1M tokens $2.00 $2.00 ~$2.00
Output / 1M tokens $8.00 $8.00 ~$8.00
GPT-4.1-mini Input / 1M tokens $0.40 $0.40 ~$0.40
Output / 1M tokens $1.60 $1.60 ~$1.60
GPT-4o Input / 1M tokens $2.50 $2.50 ~$2.50
Output / 1M tokens $10.00 $10.00 ~$10.00
o3 Input / 1M tokens $2.00 $2.00 ~$2.00
Output / 1M tokens $8.00 $8.00 ~$8.00
o4-mini Input / 1M tokens $1.10 $1.10 ~$1.10
Output / 1M tokens $4.40 $4.40 ~$4.40

Các mô hình Anthropic

Mô hình Chỉ số Anthropic Trực tiếp OpenRouter LemonData
Claude Opus 4.6 Input / 1M tokens $5.00 $5.00 ~$5.00
Output / 1M tokens $25.00 $25.00 ~$25.00
Claude Sonnet 4.6 Input / 1M tokens $3.00 $3.00 ~$3.00
Output / 1M tokens $15.00 $15.00 ~$15.00
Claude Haiku 4.5 Input / 1M tokens $1.00 $1.00 ~$1.00
Output / 1M tokens $5.00 $5.00 ~$5.00

Các mô hình Google

Mô hình Chỉ số Google Trực tiếp OpenRouter LemonData
Gemini 2.5 Pro Input / 1M tokens $1.25 $1.25 ~$1.25
Output / 1M tokens $10.00 $10.00 ~$10.00
Gemini 2.5 Flash Input / 1M tokens $0.30 $0.30 ~$0.30
Output / 1M tokens $2.50 $2.50 ~$2.50

Các quan sát chính:

  • OpenRouter không tính phí chênh lệch (markup) trên giá mô hình, nhưng áp dụng phí nền tảng 5.5% trên mức sử dụng. Giá của LemonData bằng hoặc gần bằng mức giá chính thức.
  • Đối với người dùng có lưu lượng lớn, sự khác biệt về chi phí thực tế giữa các nền tảng nằm ở sự thuận tiện trong thanh toán và hỗ trợ caching thay vì giá token.
  • Google AI Studio cung cấp gói miễn phí hào phóng cho các mô hình Gemini, điều này đáng lưu ý cho người dùng có lưu lượng thấp.

Prompt Caching: Cách tiết kiệm chi phí thường bị bỏ qua

Prompt caching có thể giảm chi phí từ 50-90% cho các khối lượng công việc lặp đi lặp lại (system prompts, ví dụ few-shot, phân tích tài liệu). Không phải tất cả các nền tảng đều hỗ trợ tính năng này như nhau.

Mô hình Cache Write / 1M tokens Cache Read / 1M tokens Nền tảng
GPT-4.1 N/A (tự động) $1.00 (50% input) OpenAI
Claude Sonnet 4.6 $3.75 $0.30 Anthropic
Claude Sonnet 4.6 $3.75 $0.30 LemonData
Gemini 2.5 Pro N/A $0.125 Google

Cách thức hoạt động của caching theo từng nhà cung cấp:

  • OpenAI: Tự động prompt caching. Không tốn phí ghi (write). Các token đầu vào được cache sẽ được tính phí bằng 50% giá đầu vào tiêu chuẩn. Caching được kích hoạt cho các prompt > 1024 token.
  • Anthropic: Caching rõ ràng thông qua các điểm ngắt cache_control. Phí ghi cao hơn 25% so với đầu vào tiêu chuẩn. Phí đọc rẻ hơn 90%. Thời gian sống của cache (TTL) là 5 phút (được gia hạn khi có lượt truy cập).
  • Google: Context caching có sẵn cho các mô hình Gemini. Giá thay đổi tùy theo mô hình và thời gian lưu trữ.

Tóm lại: Nếu ứng dụng của bạn gửi cùng một system prompt lặp đi lặp lại, chỉ riêng caching đã có thể cắt giảm một nửa hóa đơn của bạn. Hãy đảm bảo nền tảng bạn chọn có hỗ trợ truyền qua (passthrough) caching. Một số bên trung gian có thể loại bỏ các cache header.

LemonData hỗ trợ truyền qua các tham số prompt caching cho tất cả các mô hình được hỗ trợ, bao gồm cache_control rõ ràng của Anthropic và caching tự động của OpenAI.


Tạo Video: Seedance 2.0

Các mô hình tạo video sử dụng một mô hình định giá khác biệt hoàn toàn: bạn trả tiền cho mỗi lần tạo hoặc mỗi giây đầu ra, không phải theo token.

Mô hình Chỉ số Giá chính thức LemonData
Seedance 2.0 Mỗi video 5 giây ~$0.10 ~$0.10
Mỗi video 10 giây ~$0.20 ~$0.20

Lưu ý:

  • Seedance 2.0 hỗ trợ cả text-to-video và image-to-video
  • Định giá thường theo mỗi yêu cầu, với chi phí thay đổi tùy theo thời lượng đầu ra và độ phân giải
  • LemonData tính phí theo mỗi yêu cầu cho Seedance, với mức giá bằng hoặc gần bằng giá chính thức

Ngoài giá Token: Những chi phí ẩn

Giá token thô chỉ nói lên một phần của câu chuyện. Dưới đây là những chi phí không xuất hiện trong bảng giá.

1. Nạp tiền tối thiểu và Trả trước

Nền tảng Mức nạp tối thiểu Gói miễn phí
OpenAI Nạp tối thiểu $5 Tài khoản mới nhận được credit miễn phí giới hạn
Anthropic Nạp tối thiểu $5 Tài khoản mới nhận được credit miễn phí giới hạn
Google AI Studio Không (có gói miễn phí) Gói miễn phí hào phóng cho các mô hình Gemini
OpenRouter Mua tối thiểu $5 Gói miễn phí: hơn 25 mô hình, 50 yêu cầu/ngày
LemonData Nạp tối thiểu $5 Tặng $1 credit khi đăng ký

2. Khó khăn về phương thức thanh toán

Điều này quan trọng hơn nhiều người nghĩ, đặc biệt là đối với các nhà phát triển bên ngoài Mỹ/EU.

Nền tảng Phương thức thanh toán Khó khăn khi không dùng USD
OpenAI Visa/Mastercard/Amex ~1-3% phí FX trên thẻ không phải USD
Anthropic Visa/Mastercard ~1-3% phí FX trên thẻ không phải USD
Google Thanh toán Google Cloud Thay đổi theo khu vực
OpenRouter Crypto, thẻ tín dụng Crypto không có phí FX; thẻ thì tùy loại
LemonData WeChat Pay, Alipay, thẻ Dùng CNY nội địa, không mất phí FX cho người dùng Trung Quốc

Đối với các nhà phát triển tại Trung Quốc: Tổn thất do phí FX là có thật. Một nhà phát triển Trung Quốc thanh toán cho OpenAI bằng thẻ Visa sẽ mất khoảng 1-3% phí chuyển đổi ngoại tệ, cộng với các khoản phí giao dịch nước ngoài tiềm ẩn. Sau một năm sử dụng ở mức trung bình ($50-100/tháng), con số đó có thể lên tới $10-30 lãng phí hoàn toàn. LemonData chấp nhận WeChat/Alipay bằng CNY, loại bỏ hoàn toàn vấn đề này.

3. Lãng phí từ gói đăng ký

Nhiều nhà phát triển nhầm lẫn giữa quyền truy cập API và các sản phẩm đăng ký thuê bao:

Sản phẩm Chi phí Những gì bạn nhận được
ChatGPT Plus $20/tháng Giao diện chat, quyền truy cập GPT-4o, giới hạn GPT-4.1
Claude Pro $20/tháng Giao diện chat, giới hạn sử dụng cao hơn
API (trả theo mức dùng) $0/tháng + sử dụng Truy cập lập trình, bất kỳ mô hình nào

Nếu bạn sử dụng ít hơn khoảng $20 giá trị lượt gọi API mỗi tháng, gói đăng ký thuê bao sẽ đắt hơn. Để tham khảo, $20 có thể mua được khoảng:

  • ~50 triệu token đầu vào GPT-4.1-mini
  • ~20 triệu token đầu vào Claude Haiku 4.5
  • ~2,000-3,000 cuộc hội thoại GPT-4.1 điển hình (giả sử ~2K input + 1K output mỗi cuộc hội thoại)

Hầu hết các nhà phát triển cá nhân và dự án nhỏ đều sử dụng API dưới mức $20/tháng.


Các kịch bản chi phí: Sử dụng thực tế trông như thế nào

Kịch bản 1: Nhà phát triển độc lập, tính năng hỗ trợ bởi AI

  • 500 lượt gọi API/ngày, trung bình 1K input + 500 output token mỗi lượt
  • Mô hình: GPT-4.1-mini
Nền tảng Chi phí hàng tháng
OpenAI Trực tiếp ~$18/tháng
LemonData ~$18-20/tháng

Kịch bản 2: Startup, Bot hỗ trợ khách hàng

  • 5,000 lượt gọi API/ngày, trung bình 2K input + 1K output token
  • Mô hình: Claude Sonnet 4.6
  • Sử dụng lại system prompt nhiều (có thể áp dụng caching)
Nền tảng Chi phí hàng tháng (không cache) Chi phí hàng tháng (có cache)
Anthropic Trực tiếp ~$3,150/tháng ~$2,502/tháng
LemonData ~$3,150/tháng ~$2,502/tháng

Kịch bản 3: Công cụ lập trình AI, đa mô hình

  • 2,000 lượt gọi/ngày chia cho GPT-4.1 (40%), Claude Sonnet 4.6 (40%), Gemini 2.5 Pro (20%)
  • Trung bình 3K input + 2K output token
Nền tảng Chi phí hàng tháng
Nhiều API trực tiếp ~$1,749/tháng (tổng của 3 nhà cung cấp)
OpenRouter ~$1,840/tháng
LemonData ~$1,749-1,800/tháng

Lưu ý: Sử dụng nhiều API trực tiếp đồng nghĩa với việc quản lý 3 tài khoản, hệ thống thanh toán và API key riêng biệt. Các bên trung gian đơn giản hóa việc này thành một tài khoản duy nhất. Con số ~$1,840 của OpenRouter phản ánh mức phí nền tảng 5.5% của họ trên giá mô hình cơ bản.


So sánh tính năng nền tảng

Ngoài giá cả, khả năng của nền tảng cũng rất quan trọng đối với việc sử dụng trong sản xuất.

Tính năng OpenAI Anthropic Google OpenRouter LemonData
Mô hình hiện có Chỉ OpenAI Chỉ Anthropic Chỉ Google 400+ 300+
API tương thích OpenAI Không (định dạng riêng) Không (định dạng riêng)
Streaming
Prompt caching Tự động Rõ ràng Context caching Passthrough Passthrough
Function calling Có (tools)
Vision
Tạo video Sora Không Veo Qua nhà cung cấp Seedance 2.0 + khác
Rate limits Theo cấp bậc Theo cấp bậc Theo hạn ngạch Theo credit Theo vai trò
Thanh toán CNY Không Không Không Không

Khuyến nghị

Chọn API trực tiếp nếu:

  • Bạn cần cam kết SLA và hỗ trợ trực tiếp từ nhà cung cấp
  • Bạn đang xử lý dữ liệu cực kỳ nhạy cảm theo các yêu cầu tuân thủ nghiêm ngặt
  • Bạn chỉ sử dụng mô hình của một nhà cung cấp duy nhất

Chọn một bên trung gian (OpenRouter / LemonData) nếu:

  • Bạn muốn truy cập nhiều nhà cung cấp thông qua một API duy nhất
  • Bạn ở khu vực khó truy cập API trực tiếp (thanh toán, mạng lưới)
  • Bạn muốn chuyển đổi mô hình mà không cần thay đổi tích hợp của mình
  • Bạn đang xây dựng một sản phẩm cần sự linh hoạt về mô hình

Chọn LemonData cụ thể nếu:

  • Bạn ở Trung Quốc và muốn thanh toán bằng CNY nội địa
  • Bạn cần truy cập mạng trực tiếp mà không cần VPN
  • Bạn muốn sử dụng hơn 300 mô hình bao gồm cả các nhà cung cấp Trung Quốc (Qwen, DeepSeek, v.v.)

Phương pháp luận và Tuyên bố miễn trừ trách nhiệm

  • Tất cả giá cả phản ánh mức giá đầu năm 2026 được công bố trên các trang định giá chính thức
  • Giá cả thay đổi thường xuyên. Luôn kiểm tra trang định giá chính thức của nhà cung cấp để biết mức giá mới nhất
  • Giá của bên trung gian đã bao gồm lợi nhuận của họ; giá API trực tiếp không bao gồm phí xử lý thanh toán
  • Các tính toán "chi phí ẩn" giả định các kịch bản thanh toán điển hình của nhà phát triển không ở Mỹ
  • Các tính toán kịch bản sử dụng số lượng token được đơn giản hóa; mức sử dụng thực tế sẽ thay đổi

Nguồn giá để xác minh:


Cập nhật lần cuối: Tháng 2 năm 2026. Giá trong bài viết này là xấp xỉ và có thể thay đổi. Luôn kiểm tra trang định giá chính thức của nhà cung cấp để biết mức giá mới nhất.


Dùng thử LemonData: lemondata.cc

Share: