https://transferlab.ai/seminar/2024/double-gumbel-q-learning/