New benchmark tests if AI agents can update software tests alongside code changes

Original: TestEvo-Bench: An Executable and Live Benchmark for Test and Code Co-Evolution

Writing ELI5 summary…

New benchmark tests if AI agents can update software tests alongside code changes · TinyNews · TinyNews