El rate limiting es un mecanismo de control que limita el número de peticiones que un cliente puede enviar a una API en un intervalo de tiempo dado, protegiendo al servidor contra abusos.
¿Qué es el rate limiting?
El rate limiting (o limitación de tasa) es un mecanismo de protección implementado por las APIs para controlar el número de peticiones que un cliente puede realizar en un intervalo de tiempo dado. Protege la infraestructura contra sobrecargas y garantiza un servicio equitativo para todos los usuarios.
¿Cómo funciona?
Cuando supera el límite permitido, la API devuelve un código HTTP 429 Too Many Requests. Los headers de respuesta le informan sobre su consumo:
X-RateLimit-Limit: Número máximo de peticiones por ventanaX-RateLimit-Remaining: Peticiones restantesX-RateLimit-Reset: Timestamp de reinicio
Estrategias de gestión
- Backoff exponencial: Aumentar progresivamente el retraso entre intentos
- Caché: Almacenar respuestas localmente para evitar llamadas redundantes
- Cola: Poner en cola las peticiones y espaciarlas
Rate limiting en AILabsAudit
La API REST de AILabsAudit permite 60 peticiones por minuto por clave API. Los headers de respuesta incluyen sistemáticamente la información de rate limit para ayudarle a gestionar su consumo.