Comparativa de precios de AI API 2026: El coste real de GPT-4.1, Claude Sonnet 4.6 y Gemini 2.5
Un desglose basado en datos de lo que realmente pagas por las llamadas a la AI API en OpenAI, Anthropic, Google, OpenRouter y LemonData, incluyendo los costes ocultos de los que nadie habla.
Por qué existe esta comparativa
Los precios de las AI API parecen sencillos a primera vista: los input tokens cuestan X, los output tokens cuestan Y. Pero una vez que se tienen en cuenta el prompt caching, los depósitos mínimos, la fricción en los pagos y las pérdidas por conversión de moneda, el coste real puede variar significativamente dependiendo de dónde compres tus tokens.
Aquí tienes una comparativa detallada de cinco plataformas con los modelos más populares a principios de 2026. Todos los precios están en USD por cada 1 millón de tokens, a menos que se indique lo contrario.
Plataformas comparadas:
- OpenAI (directo): api.openai.com
- Anthropic (directo): api.anthropic.com
- Google (directo): Vertex AI / AI Studio
- OpenRouter: openrouter.ai
- LemonData: api.lemondata.cc
Precios de tokens: Las cifras clave
Modelos de OpenAI
| Modelo | Métrica | OpenAI Direct | OpenRouter | LemonData |
|---|---|---|---|---|
| GPT-4.1 | Input / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Output / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| GPT-4.1-mini | Input / 1M tokens | $0.40 | $0.40 | ~$0.40 |
| Output / 1M tokens | $1.60 | $1.60 | ~$1.60 | |
| GPT-4o | Input / 1M tokens | $2.50 | $2.50 | ~$2.50 |
| Output / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| o3 | Input / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Output / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| o4-mini | Input / 1M tokens | $1.10 | $1.10 | ~$1.10 |
| Output / 1M tokens | $4.40 | $4.40 | ~$4.40 |
Modelos de Anthropic
| Modelo | Métrica | Anthropic Direct | OpenRouter | LemonData |
|---|---|---|---|---|
| Claude Opus 4.6 | Input / 1M tokens | $5.00 | $5.00 | ~$5.00 |
| Output / 1M tokens | $25.00 | $25.00 | ~$25.00 | |
| Claude Sonnet 4.6 | Input / 1M tokens | $3.00 | $3.00 | ~$3.00 |
| Output / 1M tokens | $15.00 | $15.00 | ~$15.00 | |
| Claude Haiku 4.5 | Input / 1M tokens | $1.00 | $1.00 | ~$1.00 |
| Output / 1M tokens | $5.00 | $5.00 | ~$5.00 |
Modelos de Google
| Modelo | Métrica | Google Direct | OpenRouter | LemonData |
|---|---|---|---|---|
| Gemini 2.5 Pro | Input / 1M tokens | $1.25 | $1.25 | ~$1.25 |
| Output / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| Gemini 2.5 Flash | Input / 1M tokens | $0.30 | $0.30 | ~$0.30 |
| Output / 1M tokens | $2.50 | $2.50 | ~$2.50 |
Observaciones clave:
- OpenRouter cobra un 0% de margen sobre el precio del modelo en sí, pero aplica una comisión de plataforma del 5,5% sobre el uso. Los precios de LemonData están en o cerca de las tarifas oficiales.
- Para usuarios de alto volumen, la diferencia de coste efectivo entre plataformas se reduce a la fricción en el pago y el soporte de caching, más que a los precios de los tokens.
- Google AI Studio ofrece un nivel gratuito generoso para los modelos Gemini, algo digno de mención para usuarios de bajo volumen.
Prompt Caching: El ahorro de costes que se pasa por alto
El prompt caching puede reducir los costes entre un 50% y un 90% para flujos de trabajo repetitivos (system prompts, ejemplos few-shot, análisis de documentos). No todas las plataformas lo soportan por igual.
| Modelo | Escritura en Cache / 1M tokens | Lectura de Cache / 1M tokens | Plataforma |
|---|---|---|---|
| GPT-4.1 | N/A (automático) | $1.00 (50% del input) | OpenAI |
| Claude Sonnet 4.6 | $3.75 | $0.30 | Anthropic |
| Claude Sonnet 4.6 | $3.75 | $0.30 | LemonData |
| Gemini 2.5 Pro | N/A | $0.125 |
Cómo funciona el caching por proveedor:
- OpenAI: Prompt caching automático. Sin coste de escritura. Los input tokens cacheados se facturan al 50% del precio de input estándar. El caching se activa para prompts > 1024 tokens.
- Anthropic: Caching explícito mediante puntos de interrupción
cache_control. El coste de escritura es un 25% superior al input estándar. El coste de lectura es un 90% más barato. El TTL de la cache es de 5 minutos (se extiende con cada acierto). - Google: Context caching disponible para modelos Gemini. El precio varía según el modelo y la duración del almacenamiento.
Conclusión: Si tu aplicación envía el mismo system prompt repetidamente, el caching por sí solo puede reducir tu factura a la mitad. Asegúrate de que la plataforma que elijas transmita el soporte de caching. Algunos agregadores eliminan los encabezados de cache.
LemonData transmite los parámetros de prompt caching para todos los modelos compatibles, incluyendo el cache_control explícito de Anthropic y el caching automático de OpenAI.
Generación de vídeo: Seedance 2.0
Los modelos de generación de vídeo utilizan un modelo de precios fundamentalmente diferente: pagas por generación o por segundo de salida, no por token.
| Modelo | Métrica | Precio oficial | LemonData |
|---|---|---|---|
| Seedance 2.0 | Por vídeo de 5s | ~$0.10 | ~$0.10 |
| Por vídeo de 10s | ~$0.20 | ~$0.20 |
Notas:
- Seedance 2.0 soporta tanto text-to-video como image-to-video
- El precio suele ser por solicitud, variando el coste según la duración de la salida y la resolución
- LemonData cobra por solicitud para Seedance, con precios iguales o cercanos a las tarifas oficiales
Más allá de los precios de los tokens: Los costes ocultos
El precio bruto de los tokens solo cuenta una parte de la historia. Aquí están los costes que no aparecen en las tablas de precios.
1. Depósitos mínimos y prepago
| Plataforma | Depósito mínimo | Nivel gratuito |
|---|---|---|
| OpenAI | Recarga mínima de $5 | Las cuentas nuevas reciben créditos gratuitos limitados |
| Anthropic | Recarga mínima de $5 | Las cuentas nuevas reciben créditos gratuitos limitados |
| Google AI Studio | Ninguno (nivel gratuito disponible) | Nivel gratuito generoso para modelos Gemini |
| OpenRouter | Compra mínima de $5 | Nivel gratuito: más de 25 modelos, 50 solicitudes/día |
| LemonData | Recarga mínima de $5 | $1 en créditos gratuitos al registrarse |
2. Fricción en los métodos de pago
Esto importa más de lo que la mayoría de la gente piensa, especialmente para desarrolladores fuera de EE. UU./UE.
| Plataforma | Métodos de pago | Fricción fuera de USD |
|---|---|---|
| OpenAI | Visa/Mastercard/Amex | ~1-3% de comisión FX en tarjetas que no sean USD |
| Anthropic | Visa/Mastercard | ~1-3% de comisión FX en tarjetas que no sean USD |
| Facturación de Google Cloud | Varía según la región | |
| OpenRouter | Cripto, tarjeta de crédito | Cripto no tiene comisión FX; las tarjetas varían |
| LemonData | WeChat Pay, Alipay, tarjeta | CNY nativo, cero pérdidas FX para usuarios chinos |
Para desarrolladores en China: La fricción por FX es real. Un desarrollador chino que paga a OpenAI con una tarjeta Visa pierde aproximadamente entre un 1% y un 3% en la conversión de moneda, además de posibles comisiones por transacciones extranjeras. En un año de uso moderado ($50-100/mes), eso suma entre $10 y $30 de puro desperdicio. LemonData acepta WeChat/Alipay en CNY, eliminando esto por completo.
3. Desperdicio de suscripciones
Muchos desarrolladores confunden el acceso a la API con los productos de suscripción:
| Producto | Coste | Qué obtienes |
|---|---|---|
| ChatGPT Plus | $20/mes | Interfaz de chat, acceso a GPT-4o, GPT-4.1 limitado |
| Claude Pro | $20/mes | Interfaz de chat, límites de uso más altos |
| API (pago por uso) | $0/mes + uso | Acceso programático, cualquier modelo |
Si utilizas menos de ~$20 en llamadas a la API al mes, la suscripción es más cara. Como referencia, $20 te permiten comprar aproximadamente:
- ~50 millones de tokens de input de GPT-4.1-mini
- ~20 millones de tokens de input de Claude Haiku 4.5
- ~2,000-3,000 conversaciones típicas de GPT-4.1 (asumiendo ~2K de input + 1K de output por conversación)
La mayoría de los desarrolladores individuales y proyectos pequeños se sitúan muy por debajo de los $20/mes en uso de API.
Escenarios de costes: Cómo se ve el uso real
Escenario 1: Desarrollador independiente, función impulsada por AI
- 500 llamadas API/día, promedio de 1K input + 500 output tokens por llamada
- Modelo: GPT-4.1-mini
| Plataforma | Coste mensual |
|---|---|
| OpenAI Direct | ~$18/mes |
| LemonData | ~$18-20/mes |
Escenario 2: Startup, bot de atención al cliente
- 5,000 llamadas API/día, promedio de 2K input + 1K output tokens
- Modelo: Claude Sonnet 4.6
- Reutilización intensiva de system prompts (caching aplicable)
| Plataforma | Coste mensual (sin cache) | Coste mensual (con cache) |
|---|---|---|
| Anthropic Direct | ~$3,150/mes | ~$2,502/mes |
| LemonData | ~$3,150/mes | ~$2,502/mes |
Escenario 3: Herramienta de programación con AI, multimodelo
- 2,000 llamadas/día divididas entre GPT-4.1 (40%), Claude Sonnet 4.6 (40%), Gemini 2.5 Pro (20%)
- Promedio de 3K input + 2K output tokens
| Plataforma | Coste mensual |
|---|---|
| Múltiples API directas | ~$1,749/mes (suma de 3 proveedores) |
| OpenRouter | ~$1,840/mes |
| LemonData | ~$1,749-1,800/mes |
Nota: Usar múltiples API directas significa gestionar 3 cuentas, sistemas de facturación y API keys independientes. Los agregadores simplifican esto a una sola cuenta. La cifra de ~$1,840 de OpenRouter refleja su comisión de plataforma del 5,5% sobre el precio base del modelo.
Comparativa de características de las plataformas
Más allá del precio, las capacidades de la plataforma son importantes para el uso en producción.
| Característica | OpenAI | Anthropic | OpenRouter | LemonData | |
|---|---|---|---|---|---|
| Modelos disponibles | Solo OpenAI | Solo Anthropic | Solo Google | 400+ | 300+ |
| API compatible con OpenAI | Sí | No (formato propio) | No (formato propio) | Sí | Sí |
| Streaming | Sí | Sí | Sí | Sí | Sí |
| Prompt caching | Automático | Explícito | Context caching | Passthrough | Passthrough |
| Function calling | Sí | Sí (tools) | Sí | Sí | Sí |
| Vision | Sí | Sí | Sí | Sí | Sí |
| Generación de vídeo | Sora | No | Veo | Vía proveedores | Seedance 2.0 + otros |
| Límites de tasa | Por niveles | Por niveles | Por cuotas | Por créditos | Por roles |
| Pago en CNY | No | No | No | No | Sí |
Recomendaciones
Elige API directas si:
- Necesitas un SLA garantizado y soporte directo del proveedor
- Estás procesando datos altamente sensibles bajo requisitos de cumplimiento estrictos
- Solo utilizas los modelos de un único proveedor
Elige un agregador (OpenRouter / LemonData) si:
- Quieres acceso a múltiples proveedores a través de una sola API
- Te encuentras en una región donde el acceso directo a la API es difícil (pago, red)
- Quieres cambiar de modelo sin modificar tu integración
- Estás creando un producto que necesita flexibilidad de modelos
Elige LemonData específicamente si:
- Resides en China y quieres pago nativo en CNY
- Necesitas acceso directo a la red sin VPN
- Quieres más de 300 modelos, incluyendo proveedores chinos (Qwen, DeepSeek, etc.)
Metodología y avisos legales
- Todos los precios reflejan las tarifas de principios de 2026 publicadas en las páginas oficiales de precios
- Los precios cambian con frecuencia. Consulta siempre la página de precios oficial del proveedor para conocer las tarifas más actuales
- El precio del agregador incluye su margen; el precio de la API directa no incluye las comisiones de procesamiento de pagos
- Los cálculos de "costes ocultos" asumen escenarios típicos de pago de desarrolladores fuera de EE. UU.
- Los cálculos de los escenarios utilizan recuentos de tokens simplificados; el uso en el mundo real varía
Fuentes de precios para verificar:
- OpenAI: https://openai.com/api/pricing
- Anthropic: https://www.anthropic.com/pricing
- Google: https://ai.google.dev/pricing
- OpenRouter: https://openrouter.ai/models
- LemonData: https://docs.lemondata.cc/pricing
Última actualización: febrero de 2026. Los precios en este artículo son aproximados y están sujetos a cambios. Consulta siempre la página de precios oficial del proveedor para conocer las tarifas más actuales.
Prueba LemonData: lemondata.cc
