常见数学符号的直观理解笔记

阅读: 评论:0

常见数学符号的直观理解笔记

常见数学符号的直观理解笔记

常见数学符号的直观理解笔记

文章目录

  • 常见数学符号的直观理解笔记
    • 前言:
    • a r g m a x ( f ( x ) ) argmax(f(x)) argmax(f(x))
    • m a x a Q ( s , a ) max_{a}Q(s, a) maxa​Q(s,a)
    • E s ∼ p ( s ) [ f ( s ) ] E_{ssim p(s)}[f(s)] Es∼p(s)​[f(s)] <=> ∑ s ∈ S p ( s ) [ f ( s ) ] sum_{s in S} p(s)[f(s)] ∑s∈S​p(s)[f(s)]<=> ∫ f ( s ) p ( s ) d s int{f(s)p(s)ds} ∫f(s)p(s)ds

前言:

不少常见的数学符号,我经常不认识,看论文的时候,每次小丑都是我自己…
所以先把这些花里胡哨的公式列出来,方便查找。

a r g m a x ( f ( x ) ) argmax(f(x)) argmax(f(x))

argmax(f(x))是使得 f(x)取得最大值所对应的变量点x(或x的集合),

这个定义也太容易理解了吧…

对于Q-learning系列, a r g m a x a ( Q ( s , a ) ) argmax_a(Q(s, a)) argmaxa​(Q(s,a))是指使得Q值最大的那个动作a,整体表达式输出的是动作a。

m a x a Q ( s , a ) max_{a}Q(s, a) maxa​Q(s,a)

m a x a Q ( s , a ) max_{a}Q(s, a) maxa​Q(s,a)是指对于Q(s, a)这个函数输出的最大值。

对于Q-learning系列,这个Q(s, a)的输出本身意味着动作的选择,所以max下面会有a的下标,但表达式整体仍然是指最大的Q值。

E s ∼ p ( s ) [ f ( s ) ] E_{ssim p(s)}[f(s)] Es∼p(s)​[f(s)] <=> ∑ s ∈ S p ( s ) [ f ( s ) ] sum_{s in S} p(s)[f(s)] ∑s∈S​p(s)[f(s)]<=> ∫ f ( s ) p ( s ) d s int{f(s)p(s)ds} ∫f(s)p(s)ds

期望和求和以及求积分的关系。
左边期望的意思是指,对于f(s)函数求平均,而其中的变量s,服从p(s)的分布。
如果变量s为离散变量,即对f(s)的期望,等价于对每个s求一个平均。
如果变量s为连续变量,即对f(s)的期望,等价于,沿着s的概率密度函数的求积分。
这段描述如果有问题的话,欢迎批评指正,我目前的理解是这样的。

本文发布于:2024-01-29 11:28:53,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170649893714953.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:直观   符号   常见   数学   笔记
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23