Proving convergence for transport-based reinforcement learning

Original: Global Convergence of Wasserstein Policy Gradient for Entropy-Regularized Reinforcement Learning

Writing ELI5 summary…