构建可信的智能决策体系：渊亭科技多智能体强化学习可解释性探索

作者：渊亭科技 2022-11-01 当前位置：方案 > 虚拟仿真 >

近年来，强化学习技术在游戏、技术科学领域取得了优异的表现，如 DeepMind 的 AlphaGo Zero 在围棋比赛中击败人类顶尖围棋高手、OpenAI Five 训练的智能体在 Dota2 5v5中击败人类玩家等。但是，作为机器学习的重要分支之一，强化学习也同样面临着可解释性不足的痛点，即在实际应用中“难以被理解”，也因此“难以被信任”，这导致了强化学习在对安全敏感的业务领域（比如医疗、自动驾驶等）发展受到了较大的限制。