Nvidia запустила три новые функции безопасности для своей платформы NeMo Guardrails, улучшая контроль над чат-ботами ИИ.
Эти микросервисы направлены на решение распространенных проблем безопасности и модерации контента ИИ. Сервис безопасности контента проверяет ответы ИИ на наличие вредоносного контента до их доставки пользователям, в то время как сервис контроля тем обеспечивает соблюдение утвержденных тем в разговорах. Кроме того, сервис обнаружения обхода выявляет и блокирует попытки обойти меры безопасности ИИ.
В отличие от традиционных крупных языковых моделей, эти сервисы работают на меньших специализированных моделях, требующих меньше вычислительной мощности. Компании, такие как Amdocs, Cerence AI и Lowe's, в настоящее время тестируют эти функции, которые доступны разработчикам через пакет с открытым исходным кодом NeMo Guardrails от Nvidia.