【论文阅读】Deep Reinforcement Learning from Self

阅读: 评论:0

【论文阅读】Deep Reinforcement Learning from Self

【论文阅读】Deep Reinforcement Learning from Self

【论文阅读】Deep Reinforcement Learning from Self-Play in Imperfect-Information Games

  • 博弈论基础
  • Abstract
  • Introduction
  • Background
    • RL
    • Extensive-Form Games
    • FSP
  • NFSP
  • 总结

博弈论基础

Abstract

现实中很多实际问题都可以理解为是一个大规模非完美信息博弈(游戏)。为了解决这样的问题,之前的工作基本都集中在用手工设计的领域抽象(or 先验知识)去计算纳什均衡(i.e.非完美博弈的最优解)。在这篇文章里,我们第一个提出一种scalable的端到端的方法:在没有先验知识的情况下,直接学习近似的纳什均衡。我们的方法将虚拟自我博弈(Fict

本文发布于:2024-02-04 09:10:51,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170703800854256.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:论文   Deep   Learning   Reinforcement
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23