Cómo cobrarle a tus clientes por el uso de Gemma 4. Precios por token, configuración de margen y tracking automático con el SDK de Commet.

La familia Gemma 4 de Google incluye dos variantes open source: 26B MoE (3.8B parámetros activos, optimizado para latencia) y 31B Dense (todos los parámetros activos, optimizado para calidad). Ambas soportan function calling, JSON estructurado, visión, hasta 256K de contexto y más de 140 idiomas.

Si tu producto usa Gemma 4 para inferencia, Commet puede trackear el consumo de tokens y cobrarle a tus clientes automáticamente basándose en el margen que configures.

Cómo funciona

Configurás una feature con Margin AI habilitado en tu plan.
Definís un porcentaje de margen sobre el costo base de Gemma 4.
Tu app reporta el uso de tokens a través del SDK.
Commet calcula el cargo usando el pricing del catálogo de modelos y tu margen, y se lo cobra al cliente.

No necesitás hardcodear precios por token. Commet busca el pricing del modelo en el catálogo y aplica tu margen automáticamente.

Pricing de Gemma 4

Tipo de token	Costo por millón de tokens
Input	$0.15
Output	$0.30
Cache read	$0.04

Estos son los costos base del catálogo de modelos. Tu cliente paga el costo base más el margen que configuraste.

Trackear uso de Gemma 4 con el SDK

Reportá el uso de tokens después de cada llamada de inferencia:

import { Commet } from "@commet/node";

const commet = new Commet({
  apiKey: process.env.COMMET_API_KEY!,
  environment: "production",
});

await commet.usage.track({
  customerId: "org_123",
  feature: "ai_generation",
  model: "google/gemma-4-31b",
  inputTokens: 1200,
  outputTokens: 450,
  cacheReadTokens: 800,
});

Commet resuelve el identificador del modelo a los rates correctos por token y calcula el cargo incluyendo tu margen.

Tracking automático con `@commet/ai-sdk`

Si usás el Vercel AI SDK, @commet/ai-sdk reporta los tokens automáticamente después de cada llamada a generateText o streamText:

import { google } from "@ai-sdk/google";
import { generateText } from "ai";
import { Commet } from "@commet/node";
import { tracked } from "@commet/ai-sdk";

const commet = new Commet({
  apiKey: process.env.COMMET_API_KEY!,
  environment: "production",
});

const result = await generateText({
  model: tracked(google("gemma-4-31b"), {
    commet,
    feature: "ai_generation",
    customerId: "org_123",
  }),
  prompt: "Explain quantum computing",
});

Sin conteo manual de tokens.

Configurar tu margen

En el dashboard de Commet, andá a la configuración de features de tu plan y habilitá Margin AI. Definí un margen en basis points — por ejemplo, 3000 basis points significa que tu cliente paga 130% del costo base del token (base + 30% de margen).

El margen se aplica uniformemente a tokens de input, output y cache read. Commet calcula el rate final por token y lo usa para todos los cobros.

Cómo pagan tus clientes

Tu cliente carga saldo en dólares en su cuenta. Cada llamada a Gemma 4 descuenta el costo calculado — precio base del token más tu margen — en tiempo real. Sin recibos a fin de mes, sin sorpresas de uso. Ven exactamente lo que gastan a medida que lo gastan, y recargan cuando el saldo baja.

Si tu producto usa Gemma 4 para inferencia, Commet puede trackear el consumo de tokens y cobrarle a tus clientes automáticamente basándose en el margen que configures.

Cómo funciona

Configurás una feature con Margin AI habilitado en tu plan.
Definís un porcentaje de margen sobre el costo base de Gemma 4.
Tu app reporta el uso de tokens a través del SDK.
Commet calcula el cargo usando el pricing del catálogo de modelos y tu margen, y se lo cobra al cliente.

No necesitás hardcodear precios por token. Commet busca el pricing del modelo en el catálogo y aplica tu margen automáticamente.

Pricing de Gemma 4

Tipo de token	Costo por millón de tokens
Input	$0.15
Output	$0.30
Cache read	$0.04

Estos son los costos base del catálogo de modelos. Tu cliente paga el costo base más el margen que configuraste.

Trackear uso de Gemma 4 con el SDK

Reportá el uso de tokens después de cada llamada de inferencia:

import { Commet } from "@commet/node";

const commet = new Commet({
  apiKey: process.env.COMMET_API_KEY!,
  environment: "production",
});

await commet.usage.track({
  customerId: "org_123",
  feature: "ai_generation",
  model: "google/gemma-4-31b",
  inputTokens: 1200,
  outputTokens: 450,
  cacheReadTokens: 800,
});

Commet resuelve el identificador del modelo a los rates correctos por token y calcula el cargo incluyendo tu margen.

Tracking automático con `@commet/ai-sdk`

Si usás el Vercel AI SDK, @commet/ai-sdk reporta los tokens automáticamente después de cada llamada a generateText o streamText:

import { google } from "@ai-sdk/google";
import { generateText } from "ai";
import { Commet } from "@commet/node";
import { tracked } from "@commet/ai-sdk";

const commet = new Commet({
  apiKey: process.env.COMMET_API_KEY!,
  environment: "production",
});

const result = await generateText({
  model: tracked(google("gemma-4-31b"), {
    commet,
    feature: "ai_generation",
    customerId: "org_123",
  }),
  prompt: "Explain quantum computing",
});

Sin conteo manual de tokens.

Configurar tu margen

El margen se aplica uniformemente a tokens de input, output y cache read. Commet calcula el rate final por token y lo usa para todos los cobros.

Cobrar por uso de Gemma 4

Cómo funciona

Pricing de Gemma 4

Trackear uso de Gemma 4 con el SDK

Tracking automático con `@commet/ai-sdk`

Configurar tu margen

Cómo pagan tus clientes

Cobrar por uso de Gemma 4

Cómo funciona

Pricing de Gemma 4

Trackear uso de Gemma 4 con el SDK

Tracking automático con `@commet/ai-sdk`

Configurar tu margen

Cómo pagan tus clientes