Un desglose basado en datos de lo que realmente pagas por las llamadas a AI API en OpenAI, Anthropic, Google, OpenRouter y LemonData, incluyendo los costos ocultos de los que nadie habla.
Por qué existe esta comparativa
Los precios de las AI API parecen sencillos a primera vista: los tokens de entrada cuestan X, los tokens de salida cuestan Y. Pero una vez que se tienen en cuenta el prompt caching, los depósitos mínimos, la fricción en los pagos y las pérdidas por conversión de moneda, el costo real puede variar significativamente dependiendo de dónde compres tus tokens.
Aquí presentamos una comparativa detallada de cinco plataformas con los modelos más populares a principios de 2026. Todos los precios están en USD por cada 1 millón de tokens, a menos que se indique lo contrario.
Plataformas comparadas:
- OpenAI (directo): api.openai.com
- Anthropic (directo): api.anthropic.com
- Google (directo): Vertex AI / AI Studio
- OpenRouter: openrouter.ai
- LemonData: api.lemondata.cc
Si estás utilizando esta página para decidir una ruta de implementación real, mantén abierta la guía de migración, la comparativa de OpenRouter y la guía para desarrolladores en China junto a esta. El precio es solo un tercio de la decisión.
Precios de tokens: Las cifras clave
Modelos de OpenAI
| Modelo | Métrica | OpenAI Directo | OpenRouter | LemonData |
|---|---|---|---|---|
| GPT-4.1 | Entrada / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Salida / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| GPT-4.1-mini | Entrada / 1M tokens | $0.40 | $0.40 | ~$0.40 |
| Salida / 1M tokens | $1.60 | $1.60 | ~$1.60 | |
| GPT-4o | Entrada / 1M tokens | $2.50 | $2.50 | ~$2.50 |
| Salida / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| o3 | Entrada / 1M tokens | $2.00 | $2.00 | ~$2.00 |
| Salida / 1M tokens | $8.00 | $8.00 | ~$8.00 | |
| o4-mini | Entrada / 1M tokens | $1.10 | $1.10 | ~$1.10 |
| Salida / 1M tokens | $4.40 | $4.40 | ~$4.40 |
Modelos de Anthropic
| Modelo | Métrica | Anthropic Directo | OpenRouter | LemonData |
|---|---|---|---|---|
| Claude Opus 4.6 | Entrada / 1M tokens | $5.00 | $5.00 | ~$5.00 |
| Salida / 1M tokens | $25.00 | $25.00 | ~$25.00 | |
| Claude Sonnet 4.6 | Entrada / 1M tokens | $3.00 | $3.00 | ~$3.00 |
| Salida / 1M tokens | $15.00 | $15.00 | ~$15.00 | |
| Claude Haiku 4.5 | Entrada / 1M tokens | $1.00 | $1.00 | ~$1.00 |
| Salida / 1M tokens | $5.00 | $5.00 | ~$5.00 |
Modelos de Google
| Modelo | Métrica | Google Directo | OpenRouter | LemonData |
|---|---|---|---|---|
| Gemini 2.5 Pro | Entrada / 1M tokens | $1.25 | $1.25 | ~$1.25 |
| Salida / 1M tokens | $10.00 | $10.00 | ~$10.00 | |
| Gemini 2.5 Flash | Entrada / 1M tokens | $0.30 | $0.30 | ~$0.30 |
| Salida / 1M tokens | $2.50 | $2.50 | ~$2.50 |
Observaciones clave:
- OpenRouter no aplica recargos sobre el precio del modelo en sí, pero aplica una tarifa de plataforma del 5.5% sobre el uso. Los precios de LemonData están en o cerca de las tarifas oficiales.
- Para usuarios de alto volumen, la diferencia de costo efectivo entre plataformas se reduce a la fricción en los pagos y el soporte de caching más que a los precios de los tokens.
- Google AI Studio ofrece un nivel gratuito generoso para los modelos Gemini, algo digno de mención para usuarios de bajo volumen.
Prompt Caching: El ahorro de costos que se pasa por alto
El prompt caching puede reducir los costos entre un 50% y un 90% para cargas de trabajo repetitivas (system prompts, ejemplos few-shot, análisis de documentos). No todas las plataformas lo soportan por igual.
| Modelo | Escritura de caché / 1M tokens | Lectura de caché / 1M tokens | Plataforma |
|---|---|---|---|
| GPT-4.1 | N/A (automático) | $1.00 (50% de entrada) | OpenAI |
| Claude Sonnet 4.6 | $3.75 | $0.30 | Anthropic |
| Claude Sonnet 4.6 | $3.75 | $0.30 | LemonData |
| Gemini 2.5 Pro | N/A | $0.125 |
Cómo funciona el caching por proveedor:
- OpenAI: Prompt caching automático. Sin costo de escritura. Los tokens de entrada en caché se facturan al 50% del precio de entrada estándar. El caching se activa para prompts > 1024 tokens.
- Anthropic: Caching explícito mediante puntos de interrupción
cache_control. El costo de escritura es un 25% más alto que la entrada estándar. El costo de lectura es un 90% más barato. El TTL de la caché es de 5 minutos (se extiende al haber un acierto). - Google: Context caching disponible para modelos Gemini. El precio varía según el modelo y la duración del almacenamiento.
Conclusión: Si tu aplicación envía el mismo system prompt repetidamente, el caching por sí solo puede reducir tu factura a la mitad. Asegúrate de que la plataforma que elijas transmita el soporte de caching. Algunos agregadores eliminan los encabezados de caché.
LemonData transmite los parámetros de prompt caching para todos los modelos compatibles, incluyendo el cache_control explícito de Anthropic y el caching automático de OpenAI.
Generación de video: Seedance 2.0
Los modelos de generación de video utilizan un modelo de precios fundamentalmente diferente: pagas por generación o por segundo de salida, no por token.
| Modelo | Métrica | Precio Oficial | LemonData |
|---|---|---|---|
| Seedance 2.0 | Por video de 5s | ~$0.10 | ~$0.10 |
| Por video de 10s | ~$0.20 | ~$0.20 |
Notas:
- Seedance 2.0 admite tanto text-to-video como image-to-video
- El precio suele ser por solicitud, y el costo varía según la duración y la resolución de la salida
- LemonData cobra por solicitud para Seedance, con precios iguales o cercanos a las tarifas oficiales
Más allá de los precios de los tokens: Los costos ocultos
El precio bruto de los tokens solo cuenta una parte de la historia. Estos son los costos que no aparecen en las tablas de precios.
1. Depósitos mínimos y prepago
| Plataforma | Depósito mínimo | Nivel gratuito |
|---|---|---|
| OpenAI | Recarga mínima de $5 | Las cuentas nuevas reciben créditos gratuitos limitados |
| Anthropic | Recarga mínima de $5 | Las cuentas nuevas reciben créditos gratuitos limitados |
| Google AI Studio | Ninguno (nivel gratuito disponible) | Nivel gratuito generoso para modelos Gemini |
| OpenRouter | Compra mínima de $5 | Nivel gratuito: más de 25 modelos, 50 solicitudes/día |
| LemonData | Recarga mínima de $5 | $1 en créditos gratuitos al registrarse |
2. Fricción en los métodos de pago
Esto importa más de lo que la mayoría piensa, especialmente para desarrolladores fuera de EE. UU. o la UE.
| Plataforma | Métodos de pago | Fricción fuera de USD |
|---|---|---|
| OpenAI | Visa/Mastercard/Amex | ~1-3% de comisión por tipo de cambio en tarjetas fuera de USD |
| Anthropic | Visa/Mastercard | ~1-3% de comisión por tipo de cambio en tarjetas fuera de USD |
| Facturación de Google Cloud | Varía según la región | |
| OpenRouter | Criptomonedas, tarjeta de crédito | Las criptomonedas no tienen comisión por tipo de cambio; las tarjetas varían |
| LemonData | WeChat Pay, Alipay, tarjeta | CNY nativo, cero pérdida por tipo de cambio para usuarios chinos |
Para desarrolladores en China: La fricción por tipo de cambio (FX) es real. Un desarrollador chino que paga a OpenAI con una tarjeta Visa pierde aproximadamente entre un 1% y un 3% en la conversión de moneda, además de posibles comisiones por transacciones extranjeras. En un año de uso moderado ($50-100/mes), eso suma entre $10 y $30 de puro desperdicio. LemonData acepta WeChat/Alipay en CNY, eliminando esto por completo.
3. Desperdicio por suscripción
Muchos desarrolladores confunden el acceso a la API con productos de suscripción:
| Producto | Costo | Lo que obtienes |
|---|---|---|
| ChatGPT Plus | $20/mes | Interfaz de chat, acceso a GPT-4o, GPT-4.1 limitado |
| Claude Pro | $20/mes | Interfaz de chat, límites de uso más altos |
| API (pago por uso) | $0/mes + uso | Acceso programático, cualquier modelo |
Si utilizas menos de ~$20 en llamadas a la API por mes, la suscripción es más cara. Como referencia, $20 compran aproximadamente:
- ~50 millones de tokens de entrada de GPT-4.1-mini
- ~20 millones de tokens de entrada de Claude Haiku 4.5
- ~2,000-3,000 conversaciones típicas de GPT-4.1 (asumiendo ~2K de entrada + 1K de salida por conversación)
La mayoría de los desarrolladores individuales y proyectos pequeños se sitúan muy por debajo de los $20/mes en uso de API.
Escenarios de costos: Cómo se ve el uso real
Escenario 1: Desarrollador independiente, función impulsada por AI
- 500 llamadas a la API/día, promedio de 1K tokens de entrada + 500 de salida por llamada
- Modelo: GPT-4.1-mini
| Plataforma | Costo mensual |
|---|---|
| OpenAI Directo | ~$18/mes |
| LemonData | ~$18-20/mes |
Escenario 2: Startup, bot de atención al cliente
- 5,000 llamadas a la API/día, promedio de 2K tokens de entrada + 1K de salida
- Modelo: Claude Sonnet 4.6
- Reutilización intensiva de system prompt (caching aplicable)
| Plataforma | Costo mensual (sin caché) | Costo mensual (con caché) |
|---|---|---|
| Anthropic Directo | ~$3,150/mes | ~$2,502/mes |
| LemonData | ~$3,150/mes | ~$2,502/mes |
Escenario 3: Herramienta de programación con AI, multimodelo
- 2,000 llamadas/día repartidas entre GPT-4.1 (40%), Claude Sonnet 4.6 (40%), Gemini 2.5 Pro (20%)
- Promedio de 3K tokens de entrada + 2K de salida
| Plataforma | Costo mensual |
|---|---|
| Múltiples API directas | ~$1,749/mes (suma de 3 proveedores) |
| OpenRouter | ~$1,840/mes |
| LemonData | ~$1,749-1,800/mes |
Nota: Usar múltiples API directas significa gestionar 3 cuentas, sistemas de facturación y API keys independientes. Los agregadores simplifican esto a una sola cuenta. La cifra de ~$1,840 de OpenRouter refleja su tarifa de plataforma del 5.5% sobre el precio base del modelo.
Comparativa de características de las plataformas
Más allá del precio, las capacidades de la plataforma son importantes para el uso en producción.
| Característica | OpenAI | Anthropic | OpenRouter | LemonData | |
|---|---|---|---|---|---|
| Modelos disponibles | Solo OpenAI | Solo Anthropic | Solo Google | 400+ | 300+ |
| API compatible con OpenAI | Sí | No (formato propio) | No (formato propio) | Sí | Sí |
| Streaming | Sí | Sí | Sí | Sí | Sí |
| Prompt caching | Automático | Explícito | Context caching | Passthrough | Passthrough |
| Function calling | Sí | Sí (tools) | Sí | Sí | Sí |
| Vision | Sí | Sí | Sí | Sí | Sí |
| Generación de video | Sora | No | Veo | Vía proveedores | Seedance 2.0 + otros |
| Rate limits | Basado en niveles | Basado en niveles | Basado en cuotas | Basado en créditos | Basado en roles |
| Pago en CNY | No | No | No | No | Sí |
Recomendaciones
Elige API directas si:
- Necesitas un SLA garantizado y soporte directo del proveedor
- Estás procesando datos altamente sensibles bajo estrictos requisitos de cumplimiento
- Solo utilizas los modelos de un único proveedor
Elige un agregador (OpenRouter / LemonData) si:
- Quieres acceso a múltiples proveedores a través de una sola API
- Te encuentras en una región donde el acceso directo a la API es difícil (pago, red)
- Quieres cambiar de modelo sin modificar tu integración
- Estás construyendo un producto que necesita flexibilidad de modelos
Elige LemonData específicamente si:
- Resides en China y quieres pago nativo en CNY
- Necesitas acceso directo a la red sin VPN
- Quieres más de 300 modelos, incluidos proveedores chinos (Qwen, DeepSeek, etc.)
Metodología y descargos de responsabilidad
- Todos los precios reflejan los precios de principios de 2026 publicados en las páginas oficiales de precios
- Los precios cambian con frecuencia. Consulta siempre la página oficial de precios del proveedor para conocer las tarifas más actuales
- Los precios de los agregadores incluyen su margen; los precios de las API directas no incluyen las comisiones por procesamiento de pagos
- Los cálculos de "costos ocultos" asumen escenarios típicos de pago para desarrolladores fuera de EE. UU.
- Los cálculos de los escenarios utilizan recuentos de tokens simplificados; el uso en el mundo real varía
Fuentes de precios para verificar:
- OpenAI: https://openai.com/api/pricing
- Anthropic: https://www.anthropic.com/pricing
- Google: https://ai.google.dev/pricing
- OpenRouter: https://openrouter.ai/models
- LemonData: https://docs.lemondata.cc/pricing
Última actualización: febrero de 2026. Los precios en este artículo son aproximados y están sujetos a cambios. Consulta siempre la página oficial de precios del proveedor para conocer las tarifas más actuales.
Prueba LemonData: lemondata.cc
