现实中很多实际问题都可以理解为是一个大规模非完美信息博弈(游戏)。为了解决这样的问题,之前的工作基本都集中在用手工设计的领域抽象(or 先验知识)去计算纳什均衡(i.e.非完美博弈的最优解)。在这篇文章里,我们第一个提出一种scalable的端到端的方法:在没有先验知识的情况下,直接学习近似的纳什均衡。我们的方法将虚拟自我博弈(Fict
本文发布于:2024-02-04 09:10:51,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170703800854256.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |