New benchmark tests AI healthcare agents on patient history recall

Original: Synthesis and Evaluation of Long-term History-aware Medical Dialogue

Writing ELI5 summary…