MISSION KI Portal

Name

TruthfulQA

Beschreibung

Question-Answering Benchmark für potentiell maschinell gelernte, bei Menschen häufige Irrglauben, erfordert Maching-Algorithmus (e.g. Rouge)

Task

Generative KI

Datenanf.

Benchmarkdatensatz

Modellzugriff

Inferenzzugang

Ergebnis

einzelne/mehrere reelle Zahlen

Automatisierbar

Tiefe

Basismethode

Verweise

Relevante Qualitätskriterien

Leistungsfähigkeit und Robustheit Menschliche Aufsicht

Relevante Indikatoren

MA2.3 VE1.2 VE1.4 VE1.5

Referenz

Implementierungen

https://huggingface.co/datasets/truthfulqa/truthful_qa

Prüfwerkzeuge & Frameworks

Citadel Lens