HumanEval
Coding-Benchmark mit Metrik zur Evaluation (Pass@k)
Generative KI
Benchmarkdatensatz
Inferenzzugang
komplexe Ergebnisse
ja
Basismethode

Verweise

https://github.com/openai/human-eval