Bezpieczeństwo i zaufanie
Red teaming
„Wynajmujesz ludzi, żeby próbowali złamać Twojego bota. Lepiej oni niż klient.”
Wewnętrzny red team (jak w Anthropic, OpenAI) lub zewnętrzny (HackerOne, Lakera). Standard dla produkcyjnego AI. Output: lista podatności + priorytety naprawcze.
Po co Ci to: Znajdziesz dziury zanim znajdzie je klient (albo dziennikarz).
Mylone z:jailbreak
🥚Red team to ekipa, której zlecasz włamanie do własnego domu. Po to, żeby wiedzieć, gdzie zamknąć okna.
