探索利用权衡论文

  • 序列决策问题中汤普森采样的理论与应用研究

    序列决策问题中汤普森采样的理论与应用研究

    论文摘要现实生活中的很多问题可以被模型化为序列决策问题。在序列决策问题中,算法通过与未知且充满噪音的环境交互最大化累积收益。汤普森采样算法是解决随机序列决策问题最重要的算法之一...