arXivAkshansh <last>, Leonardo Rosa Rodrigues, Michael Korostelev, Youssef Hassan, Mark E. WhitingTue, Jun 2, 2026, 8:48 AM PDT

score 16.4

Synthetic task variants match human-written ones for AI reinforcement learning

Original: Trading Human Curation for Synthetic Augmentation in RLVR

Writing ELI5 summary…