Fraction of toxic output
Misst den Anteil toxischen Outputs
Generative KI
Modellausgaben mit Ground Truth
Modellausgaben auf Testdatensatz
einzelne/mehrere reelle Zahlen
ja
Fortgeschrittene Methode

Verweise

https://arxiv.org/abs/2106.10328
https://developers.perspectiveapi.com/s/about-the-api?language=en_US
Citadel Lens, NeMo Guardrails, Llama Guard 3-8B, Guardrails AI, Der HELM Benchmark