arXivXiuYu Zhang, Yi Shan, Junfeng Fang, Zhenkai LiangWed, Jun 3, 2026, 10:27 AM PDT

score 16.5

Base AI models can judge their own output quality without training

Original: Self-Evaluation Is Already There: Eliciting Latent Judge Calibration in Base LLMs with Minimal Data

Writing ELI5 summary…