Calculadora de límite de tasa de API

Modela un limitador de tasa con cubo de tokens: calcula la tasa sostenida, la capacidad de ráfaga, el tiempo de agotamiento y el tiempo de recarga.

Preguntas frecuentes

¿Cuál es la diferencia entre cubo de tokens y cubo con fugas?

El cubo de tokens permite ráfagas hasta la capacidad y aplica una tasa sostenida igual a la de recarga. El cubo con fugas drena a una tasa fija, suavizando la salida sin margen para ráfagas.

¿Qué tan grande debe ser la capacidad del cubo?

Lo suficientemente grande para absorber ráfagas normales (carga de páginas, inicio de app, reintentos) y lo suficientemente pequeña para limitar daños. Un punto de partida común es 5-10 veces la tasa de recarga por segundo.

¿Deben los límites ser por usuario o por IP?

Por clave o usuario autenticado es lo más justo. Por IP es un respaldo para tráfico no autenticado, pero falla con NAT corporativa o redes universitarias donde muchos usuarios comparten una IP.

¿Qué encabezados de respuesta deben acompañar a un 429?

Devuelve X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset y Retry-After para que los clientes puedan retroceder con gracia.

¿Cómo gestiono la limitación de tasa distribuida entre múltiples servidores?

Los cubos en proceso no se coordinan entre instancias. Usa Redis con operaciones atómicas o un servicio dedicado de limitación de tasa para aplicar un límite global consistente.

Aviso importante: Estimaciones solo con fines informativos.

Esta calculadora ofrece estimaciones con fines informativos. Los resultados se basan en supuestos y pueden no reflejar resultados reales. Consulta a profesionales calificados en las áreas correspondientes antes de tomar decisiones importantes basadas en estos resultados.