Guardrails to constraints na output modelu. Trzy główne typy: (1) Schema validation — model musi wygenerować JSON z określoną strukturą; (2) Allowlist/blocklist — niedozwolone treści (nazwiska, adresy, kwoty poza zakresem); (3) Confidence threshold — model musi wskazać confidence, odpowiedzi poniżej progu są blokowane.
Narzędzia 2026: Guardrails AI (open-source framework), Outlines (constrained generation), własne regex+post-processing. Większość systemów produkcyjnych używa kombinacji.
Przykład praktyczny: AI w obsłudze faktur. Guardrail: kwota faktury MUSI być w predefined range (np. 100-1,000,000 PLN). Jeśli model wygeneruje '5,000,000,000 PLN' — blokuj odpowiedź, eskaluj do człowieka. To eliminuje 80% kosztownych błędów.