Перейти к содержимому

Пороги токенов

В разделе «Политики» настраиваются пороги токенов, используемые для контроля размера отдельных запросов и ответов моделей. Пороги позволяют ограничивать и отслеживать потенциально аномальные или ресурсоемкие взаимодействия с моделью на уровне одного обращения.

Страница "Политики"

Поддерживается настройка порогов для:

  • Input — количество токенов во входящем запросе пользователя;
  • Output — количество токенов в ответе модели.

Можно задать несколько уровней критичности:

  • Low — предупреждающий уровень, сигнализирующий о приближении к лимиту;
  • High — указывает на существенное превышение ожидаемого размера сообщения;
  • Critical — критический порог, требующий немедленного внимания и, при необходимости, блокирующих действий.

Проверка выполняется для каждого запроса отдельно, что позволяет точно контролировать размер входных и выходных сообщений, снижать риск злоупотреблений и поддерживать предсказуемое поведение AI-приложений.