APPS
Benchmark für die Qualität generierten Codes
Generative KI
Benchmarkdatensatz
Inferenzzugang
komplexe Ergebnisse
ja
Basismethode

Verweise

https://github.com/hendrycks/apps