Algorithm learns user preferences faster by asking clarifying questions

Original: Provably Efficient Personalized Multi-Objective Bandits with Proactive Conversational Queries

Writing ELI5 summary…