MATH
Benchmark für mathematische Fähigkeiten von generativen Modellen
Generative KI
Benchmarkdatensatz
Inferenzzugang
einzelne/mehrere reelle Zahlen
ja
Basismethode

Verweise

https://github.com/hendrycks/math