¿Qué es Rate Limiting (Limitación de peticiones)?

Desarrollo API

Rate Limiting (Limitación de peticiones)

El rate limiting es un mecanismo de control que limita el número de peticiones que un cliente puede enviar a una API en un intervalo de tiempo dado, protegiendo al servidor contra abusos.

¿Qué es el rate limiting?

El rate limiting (o limitación de tasa) es un mecanismo de protección implementado por las APIs para controlar el número de peticiones que un cliente puede realizar en un intervalo de tiempo dado. Protege la infraestructura contra sobrecargas y garantiza un servicio equitativo para todos los usuarios.

¿Cómo funciona?

Cuando supera el límite permitido, la API devuelve un código HTTP 429 Too Many Requests. Los headers de respuesta le informan sobre su consumo:

X-RateLimit-Limit: Número máximo de peticiones por ventana
X-RateLimit-Remaining: Peticiones restantes
X-RateLimit-Reset: Timestamp de reinicio

Estrategias de gestión

Backoff exponencial: Aumentar progresivamente el retraso entre intentos
Caché: Almacenar respuestas localmente para evitar llamadas redundantes
Cola: Poner en cola las peticiones y espaciarlas

Rate limiting en AILabsAudit

La API REST de AILabsAudit permite 60 peticiones por minuto por clave API. Los headers de respuesta incluyen sistemáticamente la información de rate limit para ayudarle a gestionar su consumo.

En las respuestas de las IA, una marca aparece solo 1 de cada 6 veces. ¿Y la suya?

Cada pregunta hecha a ChatGPT sin su nombre en la respuesta es un competidor recomendado en su lugar — medido sobre 6 820 respuestas reales de IA.

Probar gratis Descubrir la plataforma ¿Es usted una marca? Prediagnóstico gratuito en AI Labs Radar

Para ir más lejos

Descubra nuestro artículo en profundidad sobre este tema

Leer artículo