文章详情
构建可信的智能决策体系:渊亭科技多智能体强化学习可解释性探索
作者:渊亭科技 2022-11-01 当前位置:方案 > 虚拟仿真 >
近年来,强化学习技术在游戏、技术科学领域取得了优异的表现,如 DeepMind 的 AlphaGo Zero 在围棋比赛中击败人类顶尖围棋高手、OpenAI Five 训练的智能体在 Dota2 5v5中击败人类玩家等。但是,作为机器学习的重要分支之一,强化学习也同样面临着可解释性不足的痛点,即在实际应用中“难以被理解”,也因此“难以被信任”,这导致了强化学习在对安全敏感的业务领域(比如医疗、自动驾驶等)发展受到了较大的限制。
标签:
渊亭科技 兵棋推演
索取“此方案”详细资料,请留言
  • *姓名:
  • *手机:
  • *邮寄地址:
相关阅读