Billing, quotas et PAYG
Chaque requête de génération passe par les vérifications quota, PAYG et rate limit avant le routage modèle.
Cycle de vie requête
- Authentifier la clé API
La requête est rattachée à un compte client et une clé API.
- Résoudre le modèle public
L’ID public
modelest vérifié contre le catalogue activé et les accès plan. - Décider le billing
Le quota abonnement est réservé en premier. Si indisponible, PAYG peut réserver un montant wallet estimé quand il est activé.
- Appeler la route modèle
La requête est routée uniquement après validation billing et rate limit.
- Settler l’usage
L’usage final settle les réservations quota ou wallet. Les requêtes échouées libèrent les réservations.
Règles quota et PAYG
- Les plans abonnement utilisent des fenêtres rolling
5het7d. - Chaque modèle peut consommer un multiplicateur de requêtes différent par appel API.
- Le fallback PAYG exige du crédit wallet et PAYG activé au niveau compte.
- Le PAYG streaming exige les données d’usage finales pour settle correctement.
Rate limits
- Les limites compte et clé API sont appliquées par minute.
- Une réponse
429signifie que la requête a été bloquée avant génération. - Crée des clés séparées par intégration pour simplifier le diagnostic rate limit.