TruthfulQA
Question-Answering Benchmark für potentiell maschinell gelernte, bei Menschen häufige Irrglauben, erfordert Maching-Algorithmus (e.g. Rouge)
Generative KI
Benchmarkdatensatz
Inferenzzugang
einzelne/mehrere reelle Zahlen
ja
Basismethode

Verweise

https://huggingface.co/datasets/truthfulqa/truthful_qa
Citadel Lens