Por qué los productos de IA necesitan cobro por uso
El pricing tradicional de SaaS funciona porque el consumo de recursos es predecible. Los productos de IA rompen esta lógica. Cada llamada a un LLM tiene un costo real que escala con los tokens de entrada y salida. Un solo request puede costar desde $0.001 hasta $0.50. Un cliente que hace 100 requests por día cuesta 100x más de servir que uno que hace uno solo.
Con tarifa plana, tus usuarios más pesados destruyen tu margen mientras los livianos los subsidian. El cobro por uso resuelve esto alineando lo que el cliente paga con lo que realmente consume.
Los tres modelos de consumo
Medido (Overage)
Los clientes se suscriben a un plan con una cantidad base de uso incluida. El consumo que supere esa cantidad se cobra como excedente al final del período.
Un cliente en tu plan Pro tiene 100,000 tokens incluidos. Durante el mes usa 250,000. Al cierre, se le cobran los 150,000 extra a tu tarifa de excedente.
Ideal para: plataformas de API, herramientas de analytics, y asistentes de IA con patrones de uso estables donde los clientes quieren acceso ininterrumpido.
Tradeoff: los clientes pueden sorprenderse con cargos de excedente, y cargás con el riesgo crediticio durante el período porque entregás valor antes de cobrar.
Créditos (Bloques prepagos)
Los clientes compran bloques de créditos que se consumen a medida que usan tu producto. Cuando se agotan, deben comprar más.
Un cliente compra 500,000 créditos por $50. Cada llamada consume créditos según la complejidad (100 por una consulta simple, 1,000 por una generación compleja). A saldo cero, el cliente recarga.
Ideal para: generación de imágenes, generación de código, y productos donde los requests varían significativamente en costo. La abstracción de créditos oculta la varianza de costo real.
Tradeoff: fricción cuando se agotan. Si un cliente se queda sin créditos en medio de un flujo crítico, puede irse en lugar de recargar.
Balance (Billetera prepaga)
Los clientes depositan un monto en dólares en una billetera. Cada evento de uso deduce el costo real del saldo en tiempo real.
Ideal para: infraestructura para developers, plataformas de API, y marketplaces multi-modelo donde los clientes esperan visibilidad directa de costos.
Tradeoff: la visibilidad directa del costo puede hacer que los clientes sean demasiado cautelosos con el uso.
Cómo elegir el modelo correcto
Si tu producto tiene costos por request relativamente uniformes (un chatbot con conversaciones de largo similar), el modelo medido es la opción más simple. Si los costos varían significativamente (generación de imágenes donde una edición simple cuesta 10x menos que una creación completa), los créditos te dan flexibilidad. Si estás construyendo infraestructura para developers que esperan transparencia, el balance es lo indicado.
Regla importante: estos modelos son mutuamente excluyentes dentro de un mismo plan. Mezclarlos crea confusión. Elegí uno por plan y comprometete con él.
Estrategias de pricing para productos de IA
Precio por token
Cobrás según la cantidad de tokens de entrada y salida procesados. Refleja cómo los proveedores de modelos te cobran a vos. Ideal para productos de API con usuarios técnicos.
Precio por request
Monto fijo por llamada a la API sin importar la cantidad de tokens. Más simple para los clientes, pero absorbés la varianza en complejidad. Funciona cuando podés normalizar el tamaño de los requests desde el diseño del producto.
Precio por minuto o unidad de cómputo
Para procesamiento en tiempo real (IA de voz, análisis de video, transcripción), cobrar por tiempo es más intuitivo. Los clientes entienden "minutos" mejor que "tokens."
Tiers con uso
Combiná un tier de suscripción fijo con componentes de uso. El tier base incluye una cantidad generosa para el consumo típico, y los usuarios pesados pagan más. Previsibilidad para clientes, protección de margen para vos.
Implementar cobro por uso con Commet
Commet actúa como Merchant of Record y soporta los tres modelos de consumo (medido, créditos, balance) de forma nativa.
Definí tu plan
Creá un plan en el dashboard de Commet con un precio base y features medidas. Por ejemplo, $29/mes con 50,000 tokens incluidos y excedente a $0.03 por cada 1,000 tokens.
Reportá eventos de uso
Cada vez que un cliente hace una llamada a la API, reportá el uso a través del SDK.
import { Commet } from "@commet/sdk";
const commet = new Commet({ apiKey: "tu_api_key" });
await commet.usage.report({
customerId: "cus_abc123",
featureId: "feat_tokens",
quantity: 1500,
});Facturación automática
Al final de cada período, Commet calcula el uso total, aplica la cantidad incluida, computa excedentes, y genera una factura. Para créditos y balance, las deducciones ocurren en tiempo real.
Visibilidad en tiempo real
Los clientes ven su uso actual y la cantidad restante a través del Customer Portal de Commet, reduciendo sorpresas de facturación y tickets de soporte.
Ejemplos reales
Asistente de escritura con IA (medido): $19/mes incluye 100,000 tokens. Excedente a $0.02/1,000 tokens. Power users pagan proporcionalmente más.
Plataforma de generación de imágenes (créditos): paquetes de 100 créditos por $10. Generaciones simples cuestan 1 crédito, complejas 5-10.
Plataforma de API para developers (balance): depositan fondos y pagan por request. Distintos modelos, distintas tarifas, mismo saldo.
Lo esencial
El cobro por uso no es opcional para productos de IA. Los tres modelos (medido, créditos, balance) sirven para distintos tipos de producto. Elegí uno por plan, implementá tracking de uso limpio, y dejá que tu sistema de facturación maneje todo automáticamente.