Bezpieczeństwo i zaufanie
Jailbreak
„Sprytny prompt, który omija zabezpieczenia modelu. Dla AI jak inżynieria społeczna dla ludzi.”
Klasyki: DAN ('Do Anything Now'), grandma exploit, ASCII art injection. Dla biznesu: ktoś może podpiąć się do Twojego chatbota i wyciągnąć system prompt albo dane innych userów.
Po co Ci to: Wiesz, jak Twój chatbot może paść – wiesz, jak go chronić.
Mylone z:prompt-injection
🥚Jailbreak to lockpicking dla AI: pokazuje, że alignment to ścianka z dykty.
