GSM8K
Benchmark für mathematische Fähigkeiten von generativen Modellen
Generative KI
Benchmarkdatensatz
Inferenzzugang
komplexe Ergebnisse
ja
Basismethode
Verweise
https://huggingface.co/datasets/openai/gsm8k