Rate Limiting ist ein Kontrollmechanismus, der die Anzahl der Anfragen begrenzt, die ein Client in einem bestimmten Zeitintervall an eine API senden kann, und so den Server vor Missbrauch schützt.
Was ist Rate Limiting?
Rate Limiting (oder Anfragebegrenzung) ist ein Schutzmechanismus, der von APIs implementiert wird, um die Anzahl der Anfragen zu kontrollieren, die ein Client in einem bestimmten Zeitintervall stellen kann. Er schützt die Infrastruktur vor Überlastung und gewährleistet einen fairen Dienst für alle Nutzer.
Wie funktioniert es?
Wenn Sie das erlaubte Limit überschreiten, gibt die API den HTTP-Code 429 Too Many Requests zurück. Die Antwort-Header informieren Sie über Ihren Verbrauch:
X-RateLimit-Limit: Maximale Anzahl von Anfragen pro ZeitfensterX-RateLimit-Remaining: Verbleibende AnfragenX-RateLimit-Reset: Zeitstempel der Zurücksetzung
Verwaltungsstrategien
- Exponentielles Backoff: Die Wartezeit zwischen Versuchen schrittweise erhöhen
- Cache: Antworten lokal speichern, um redundante Aufrufe zu vermeiden
- Warteschlange: Anfragen in eine Warteschlange einreihen und zeitlich verteilen
Rate Limiting bei AILabsAudit
Die REST-API von AILabsAudit erlaubt 60 Anfragen pro Minute pro API-Schlüssel. Die Antwort-Header enthalten systematisch die Rate-Limit-Informationen, damit Sie Ihren Verbrauch verwalten können.