arXivMingxian Lin, Shengju Qian, Yuqi Liu, Yi-Hua Huang, Yiyu Wang, Wei Huang, Yitang Li, Fan Zhang, Zeyu Hu, Lingting Zhu, Xin Wang, Xiaojuan QiMon, Jun 8, 2026, 10:59 AM PDT

score 17.2

New benchmark tests AI game agents across diverse game types

Original: OmniGameArena: A Unified UE5 Benchmark for VLM Game Agents with Improvement Dynamics

Source: arxiv.org ↗

Writing ELI5 summary…