La familia Gemma 4 de Google incluye dos variantes open source: 26B MoE (3.8B parámetros activos, optimizado para latencia) y 31B Dense (todos los parámetros activos, optimizado para calidad). Ambas soportan function calling, JSON estructurado, visión, hasta 256K de contexto y más de 140 idiomas.
Si tu producto usa Gemma 4 para inferencia, Commet puede trackear el consumo de tokens y cobrarle a tus clientes automáticamente basándose en el margen que configures.
Cómo funciona
- Configurás una feature con Margin AI habilitado en tu plan.
- Definís un porcentaje de margen sobre el costo base de Gemma 4.
- Tu app reporta el uso de tokens a través del SDK.
- Commet calcula el cargo usando el pricing del catálogo de modelos y tu margen, y le factura al cliente.
No necesitás hardcodear precios por token. Commet busca el pricing del modelo en el catálogo y aplica tu margen automáticamente.
Pricing de Gemma 4
| Tipo de token | Costo por millón de tokens |
|---|---|
| Input | $0.15 |
| Output | $0.30 |
| Cache read | $0.04 |
Estos son los costos base del catálogo de modelos. Tu cliente paga el costo base más el margen que configuraste.
Trackear uso de Gemma 4 con el SDK
Reportá el uso de tokens después de cada llamada de inferencia:
import { Commet } from "@commet/node";
const commet = new Commet({
apiKey: process.env.COMMET_API_KEY!,
environment: "production",
});
await commet.usage.track({
externalId: "org_123",
feature: "ai_generation",
model: "google/gemma-4-31b",
inputTokens: 1200,
outputTokens: 450,
cacheReadTokens: 800,
});Commet resuelve el identificador del modelo a los rates correctos por token y calcula el cargo incluyendo tu margen.
Tracking automático con @commet/ai-sdk
Si usás el Vercel AI SDK, @commet/ai-sdk reporta los tokens automáticamente después de cada llamada a generateText o streamText:
import { google } from "@ai-sdk/google";
import { generateText } from "ai";
import { Commet } from "@commet/node";
import { tracked } from "@commet/ai-sdk";
const commet = new Commet({
apiKey: process.env.COMMET_API_KEY!,
environment: "production",
});
const result = await generateText({
model: tracked(google("gemma-4-31b"), {
commet,
feature: "ai_generation",
customerId: "org_123",
}),
prompt: "Explain quantum computing",
});Sin conteo manual de tokens.
Configurar tu margen
En el dashboard de Commet, andá a la configuración de features de tu plan y habilitá Margin AI. Definí un margen en basis points — por ejemplo, 3000 basis points significa que tu cliente paga 130% del costo base del token (base + 30% de margen).
El margen se aplica uniformemente a tokens de input, output y cache read. Commet calcula el rate final por token y lo usa para toda la facturación.
Cómo pagan tus clientes
Tu cliente carga saldo en dólares en su cuenta. Cada llamada a Gemma 4 descuenta el costo calculado — precio base del token más tu margen — en tiempo real. Sin facturas a fin de mes, sin sorpresas de uso. Ven exactamente lo que gastan a medida que lo gastan, y recargan cuando el saldo baja.