HumanEval
Coding-Benchmark mit Metrik zur Evaluation (Pass@k)
Generative KI
Benchmarkdatensatz
Inferenzzugang
komplexe Ergebnisse
ja
Basismethode
Verweise
https://github.com/openai/human-eval