arXivYavuz Durmazkeser, Patrik Okanovic, Andreas Kirsch, Torsten Hoefler, Nezihe Merve GürelSun, May 24, 2026, 3:18 AM PDT

score 16.2

Framework picks best AI language models with fewer human labels

Original: Large Language Model Selection with Limited Annotations

Writing ELI5 summary…