描述你在学习、使用数学表达式时的困难, 可举例说明.
- 对于数学表达式用latex表达时,还不是太熟练,因此在表达某些式子时可能会产生一些细节上的错误,而这些错误往往是我们这种初次使用者难以发现的,比如今天所讲的圆括号的区别,我之前都是直接使用圆括号 ( ,并未使用过 left(,区别如下:
( ∭ E V d x d y d z ) (iiint_{E}^{V} , dx,dy,dz) (∭EVdxdydz)
( ∭ E V d x d y d z ) left(iiint_{E}^{V} , dx,dy,dzright) (∭EVdxdydz)- 一些特殊符号的理解,有一些可能是数学界中已有的符号,但是由于知识面较窄,无法在第一时间了解该符号的含义,就比较尴尬了。
作业
2 A = { ∅ , { 3 } , { 5 } , { 3 , 5 } } 2^{mathbf{A}}={emptyset, {3}, {5}, {3, 5}} 2A={∅,{3},{5},{3,5}}.
2 ∅ = { ∅ } 2^{emptyset}={emptyset} 2∅={∅}.
1) A = [ 5..9 ] mathbf{A}=[5..9] A=[5..9]
2) A = { x ∈ N + ∣ 5 ≤ x ≤ 9 } mathbf{A}={x in mathbf{N^+} vert 5 leq x leq 9 } A={x∈N+∣5≤x≤9}
以下为原博文涉及相关数学式子的内容复现:
枚举法
A = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 } mathbf{A} = {0,1,2,3,4,5,6,7,8,9} A={0,1,2,3,4,5,6,7,8,9}是阿拉伯数字的集合.
N = { 0 , 1 , 2 , … } mathbf{N}={0,1,2, dots} N={0,1,2,…}是自然数的集合.
Ω = { a , b , … , z } mathbf{Omega}={textrm{a},textrm{b}, dots, textrm{z}} Ω={a,b,…,z}是英文字母表
向量、集合等,用粗体 mathbf{x} ( x mathbf{x} x), bm{x} ( x bm{x} x), boldsymbol{x} ( x boldsymbol{x} x). 全文统一即可.
枚举法的几种简记
谓词法
奇数集合: O = { x ∣ x ∈ N , x m o d 2 = 1 } = { x ∈ N ∣ x m o d 2 = 1 } mathbf{O}={x vert xin mathbf{N},x mod 2 = 1}={xin mathbf{N} vert x mod 2=1} O={x∣x∈N,xmod2=1}={x∈N∣xmod2=1}.
常用集合
实数 R mathbb{R} R
有理数 Q mathbf{Q} Q
平凡子集
空集 ∅ emptyset ∅
全集 U mathbf{U} U
2 A = { B ∣ B ⊆ A } 2^{mathbf{A}}={mathbf{B}vert mathbf{B}subseteq mathbf{A}} 2A={B∣B⊆A}
A = { 0 , 1 , 2 } , 2 A = { ∅ , { 0 } , { 1 } , { 2 } , { 0 , 1 } , { 0 , 2 } , { 1 , 3 } , { 0 , 1 , 2 } } mathbf{A} = {0,1,2},2^{mathbf{A}} = {emptyset, {0}, {1}, {2}, {0, 1}, {0, 2}, {1, 3}, {0, 1, 2}} A={0,1,2},2A={∅,{0},{1},{2},{0,1},{0,2},{1,3},{0,1,2}}
自己出数据, 做一个 3 × 2 3 times 2 3×2 与 2 × 4 2 times 4 2×4的矩阵乘法.
A = [ 1 2 3 4 5 6 ] mathbf{A}=begin{bmatrix} 1 & 2 \ 3 & 4 \ 5 & 6 end{bmatrix} A=⎣⎡135246⎦⎤,
B = [ 1 2 3 4 4 3 2 1 ] mathbf{B}=begin{bmatrix} 1 & 2 & 3 & 4\ 4 & 3 & 2 & 1\ end{bmatrix} B=[14233241],
A × B = [ 9 6 9 6 19 14 21 16 29 22 33 26 ] mathbf{A} timesmathbf{B}=begin{bmatrix} 9 & 6 & 9 & 6\ 19 & 14 & 21 & 16\ 29 & 22 & 33 & 26\ end{bmatrix} A×B=⎣⎡91929614229213361626⎦⎤.
R = { ( a , b ) ∈ A × A ∣ a m o d 2 = b m o d 2 } mathbf{R} = {(a, b) in mathbf{A} times mathbf{A} vert a mod 2 = b mod 2} R={(a,b)∈A×A∣amod2=bmod2}.
R = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R} = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}.
R 1 = = { ( a , b ) ∈ A × A ∣ a m o d 2 = b m o d 2 } mathbf{R}_1 = = {(a, b) in mathbf{A} times mathbf{A} vert a mod 2 = b mod 2} R1=={(a,b)∈A×A∣amod2=bmod2}
R 2 = = { ( a , b ) ∈ A × A ∣ a m o d 3 = b m o d 3 } mathbf{R}_2 = = {(a, b) in mathbf{A} times mathbf{A} vert a mod 3 = b mod 3} R2=={(a,b)∈A×A∣amod3=bmod3}
R 1 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R1={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}.
R 2 = { ⟨ 1 , 1 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 5 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 2 ⟩ , ⟨ 5 , 5 ⟩ , ⟨ 5 , 8 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_2 = {langle 1, 1 rangle ,langle 2, 2 rangle ,langle 2, 5 rangle , langle2,8 rangle , langle5,2 rangle, langle 5, 5 rangle , langle5,8 rangle,langle8,2 rangle, langle 8, 8 rangle ,langle 9, 9 rangle } R2={⟨1,1⟩,⟨2,2⟩,⟨2,5⟩ ,⟨2,8⟩ ,⟨5,2⟩,⟨5,5⟩,⟨5,8⟩,⟨8,2⟩,⟨8,8⟩,⟨9,9⟩}.
R 1 ∘ R 2 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 2 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 8 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 5 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ , ⟨ 5 , 2 ⟩ , ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 5 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 2 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 8 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1∘mathbf{R}_2={langle 1, 1 rangle ,langle 1, 2 rangle,langle 1, 5 rangle ,langle 1, 8 rangle,langle 1, 9 rangle , langle 2, 2 rangle,langle 2, 5 rangle , langle2,8 rangle ,langle 5, 1 rangle,langle5,2 rangle, langle 5, 5 rangle ,langle5,9 rangle,langle 8, 2 rangle,langle 8, 5 rangle,langle 8, 8 rangle,langle 9, 1 rangle,langle 9, 2 rangle,langle 9, 5 rangle,langle 9, 8 rangle,langle 9, 9 rangle} R1∘R2={⟨1,1⟩,⟨1,2⟩,⟨1,5⟩,⟨1,8⟩,⟨1,9⟩,⟨2,2⟩,⟨2,5⟩ ,⟨2,8⟩ ,⟨5,1⟩,⟨5,2⟩,⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,5⟩,⟨8,8⟩,⟨9,1⟩,⟨9,2⟩,⟨9,5⟩,⟨9,8⟩,⟨9,9⟩}.
R 1 1 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^1 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R11={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 2 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^2 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R12={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 3 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^3 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R13={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 4 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^4 ={langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R14={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 5 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^5 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R15={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 + = ⋃ i = 1 ∣ A ∣ R 1 i = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^+ = bigcup_{i=1}^{|mathbf{A}|}mathbf{R}_1^i={langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R1+=⋃i=1∣A∣R1i={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 ∗ = R 1 + ∪ A 0 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^* = mathbf{R}_1^+ cup mathbf{A}^0={langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R1∗=R1+∪A0={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
举例说明你对函数的认识.
给定一个矩阵并计算其各种范数.
给定矩阵为:
X = [ 1 2 3 4 ] mathbf{X}= begin{bmatrix} 1 & 2 \ 3 & 4 end{bmatrix} X=[1324]
l 0 l_0 l0 范数(非零项个数):
∥ X ∥ 0 = ∣ { ( i , j ) ∣ x i j ≠ 0 } ∣ = 4 (1) |mathbf{X}|_0 = vert {(i,j)vert x_{ij} neq 0} vert =4 tag{1} ∥X∥0=∣{(i,j)∣xij=0}∣=4(1)
l 1 l_1 l1 范数(绝对值之和):
∥ X ∥ 1 = ∑ i , j ∣ x i j ∣ = 10 (2) |mathbf{X}|_1 = sum_{i,j}vert x_{ij} vert = 10 tag{2} ∥X∥1=i,j∑∣xij∣=10(2)
l 2 l_2 l2 范数(平方和):
∥ X ∥ 2 = ∑ i , j x i j 2 = 1 2 + 2 2 + 3 2 + 4 2 = 30 (3) |mathbf{X}|_2 = sqrt{sum_{i,j} x_{ij}^2 } = sqrt{1^2+2^2+3^2+4^2}=sqrt{30} tag{3} ∥X∥2=i,j∑xij2 =12+22+32+42 =30 (3)
∥ X ∥ 2 2 = ∑ i , j x i j 2 = 1 2 + 2 2 + 3 2 + 4 2 = 30 (4) |mathbf{X}|_2^2 = sum_{i,j} x_{ij}^2 = 1^2+2^2+3^2+4^2=30 tag{4} ∥X∥22=i,j∑xij2=12+22+32+42=30(4)
l ∞ l_{infty} l∞ 范数(相当于最大绝对值):
∥ X ∥ ∞ = max i , j ∣ x i j ∣ = 4 (5) |mathbf{X}|_{infty} = max_{i,j}{vert x_{ij}vert}=4 tag{5} ∥X∥∞=i,jmax∣xij∣=4(5)
解释 推荐系统: 问题、算法与研究思路 2.1 中的优化目标
min ∑ ( i , j ) ∈ Ω ( f ( x i , t j ) − r i j ) 2 min{sum_{(i,j)in Omega} (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2} min(i,j)∈Ω∑(f(xi,tj)−rij)2
各符号及含义.
f ( x i , t j ) f(mathbf{x}_i, mathbf{t}_j) f(xi,tj) 表示预测的第 i i i 个用户对第 j j j 个商品的评分.
r i j r_{ij} rij 表示第 i i i 个用户对第 j j j 个商品的评分.
( f ( x i , t j ) − r i j ) 2 (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2 (f(xi,tj)−rij)2 表示当前函数的预测评分与实际评分的误差平方.
∑ ( i , j ) ∈ Ω ( f ( x i , t j ) − r i j ) 2 sum_{(i,j)in Omega} (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2 ∑(i,j)∈Ω(f(xi,tj)−rij)2 表示当前函数的误差平方和.
min ∑ ( i , j ) ∈ Ω ( f ( x i , t j ) − r i j ) 2 min{sum_{(i,j)in Omega} (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2} min∑(i,j)∈Ω(f(xi,tj)−rij)2 表示找出最小误差平方和
∑ i m o d 2 = 0 n ( x i ) sum_{imod2=0}^n{left( x_iright)} imod2=0∑n(xi)
int sum = 0;
int n = 10;
for (int i = 1; i <= n; i++) {//这里假设x_i=iif (i % 2 == 0) {sum += i;}
}
累加: ∑ i m o d 3 = 0 3 n ( x i ) , X = { 1 , 2 , 3 , ⋯ , 3 n } sum_{imod3=0}^{3n}(x_i), mathbf{X}={1, 2, 3,cdots, 3n} imod3=0∑3n(xi),X={1,2,3,⋯,3n}
答案: ∑ i m o d 3 = 0 3 n ( x i ) = n ( 3 + 3 n ) 2 sum_{imod3=0}^{3n}(x_i)=frac{n(3+3n)}{2} imod3=0∑3n(xi)=2n(3+3n)
累乘: ∏ i 10 i prod_{i}^{10} {i} i∏10i
答案: ∏ i 10 i = 1 × 2 × 3 × ⋯ × 10 = 3628800 prod_{i}^{10} {i}=1times2times3timesdotstimes10=3628800 i∏10i=1×2×3×⋯×10=3628800
积分表达式: ∫ − 2 2 e x d x int_{-2}^{2} e^x, dx ∫−22exdx
答案: ∫ − 2 2 e x d x = e x ∣ − 2 + 2 = e 2 − e − 2 int_{-2}^{2} e^x, dx = e^x vert_{-2}^{+2}=e^2-e^{-2} ∫−22exdx=ex∣−2+2=e2−e−2
用过,比如涉及空间问题的时候,此时为三维空间,那么假设对这个空间里的离散点附带的值进行求和,那么便可用三重累加,将每个空间点值加起来。
∫ − 1 1 ( x 2 ) d x int_{-1}^{1} (x^2) mathrm{d}x ∫−11(x2)dx
∫ − 1 1 ( x 2 ) d x = 1 3 x 3 ∣ − 1 + 1 = 1 3 − ( − 1 3 ) = 2 3 int_{-1}^{1} (x^2) mathrm{d}x = frac{1}{3}x^3 vert_{-1}^{+1}=frac{1}{3}-(-frac{1}{3})=frac{2}{3} ∫−11(x2)dx=31x3∣−1+1=31−(−31)=32
程序:
double sum = 0;double delta = 0.001;for (double i = -1; i <= 1; i += delta) {sum += i * i * delta;}System.out.println(sum);
程序结果:
delta=0.001
0.6666670000000002
delta=0.000001
0.6666666666680293
结论:可以看出差距很小,若delta越小,则精度越高,但是过于太小,循环次数就会增多,时间复杂度随之提高。
X w − Y mathbf{Xw}-mathbf{Y} Xw−Y 是一个 n × 1 ntimes1 n×1的矩阵, 因此可以根据利用 1 × n 1times n 1×n的转置矩阵与其相乘获得 1 × 1 1times 1 1×1的标量, 即
计算化简:
∥ X w − Y ∥ 2 2 = ( X w − Y ) T ( X w − Y ) = ( w T X T − Y T ) ( X w − Y ) = w T X T X w − w T X T Y − Y T X w + Y T Y begin{aligned} |mathbf{Xw}-mathbf{Y}|_2^2 &= (mathbf{Xw}-mathbf{Y})^{mathrm{T}}(mathbf{Xw}-mathbf{Y}) \&=(mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}-mathbf{Y}^{mathrm{T}})(mathbf{Xw}-mathbf{Y}) \&=mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Y}-mathbf{Y}^{mathrm{T}}mathbf{Xw}+mathbf{Y}^{mathrm{T}}mathbf{Y} end{aligned} ∥Xw−Y∥22=(Xw−Y)T(Xw−Y)=(wTXT−YT)(Xw−Y)=wTXTXw−wTXTY−YTXw+YTY
同理:
λ ∥ w ∥ 2 2 = λ w T w lambda|mathbf{w}|_2^2 =lambda mathbf{w}^{mathrm{T}}mathbf{w} λ∥w∥22=λwTw
对 w mathbf{w} w 求导使得下式为0:
∂ ( ∥ X w − Y ∥ 2 2 + λ ∥ w ∥ 2 2 ) ∂ w = ∂ ( w T X T X w − w T X T Y − Y T X w + Y T Y + λ w T w ) ∂ w = 0 begin{aligned} frac{partialleft( |mathbf{Xw}-mathbf{Y}|_2^2+lambda|mathbf{w}|_2^2right)}{partialmathbf{w}} &=frac{partialleft( mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Y}-mathbf{Y}^{mathrm{T}}mathbf{Xw}+mathbf{Y}^{mathrm{T}}mathbf{Y}+lambda mathbf{w}^{mathrm{T}}mathbf{w} right)}{partialmathbf{w}}=0 end{aligned} ∂w∂(∥Xw−Y∥22+λ∥w∥22)=∂w∂(wTXTXw−wTXTY−YTXw+YTY+λwTw)=0
∂ ( w T X T X w ) ∂ w = 2 X T X w frac{partialleft(mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Xw}right)}{partialmathbf{w}}=2mathbf{X}^{mathrm{T}}mathbf{Xw} ∂w∂(wTXTXw)=2XTXw
∂ ( w T X T Y ) ∂ w = X T Y frac{partialleft(mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Y}right)}{partialmathbf{w}}=mathbf{X}^{mathrm{T}}mathbf{Y} ∂w∂(wTXTY)=XTY
∂ ( Y T X w ) ∂ w = X T Y frac{partialleft(mathbf{Y}^{mathrm{T}}mathbf{X}mathbf{w}right)}{partialmathbf{w}}=mathbf{X}^{mathrm{T}}mathbf{Y} ∂w∂(YTXw)=XTY
∂ ( Y T Y ) ∂ w = 0 frac{partialleft(mathbf{Y}^{mathrm{T}}mathbf{Y}right)}{partialmathbf{w}}=0 ∂w∂(YTY)=0
∂ ( λ w T w ) ∂ w = 2 λ w frac{partialleft(lambda mathbf{w}^{mathrm{T}}mathbf{w}right)}{partialmathbf{w}}=2lambda mathbf{w} ∂w∂(λwTw)=2λw
2 X T X w − X T Y − X T Y + 2 λ w = 0 ⇔ 2 ( X T X w − X T Y + λ w ) = 0 ⇔ X T X w − X T Y + λ w = 0 ⇔ ( X T X + λ I ) w = X T Y ⇔ w = ( X T X + λ I ) − 1 X T Y begin{aligned} &2mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{X}^{mathrm{T}}mathbf{Y}-mathbf{X}^{mathrm{T}}mathbf{Y}+2lambda mathbf{w}=0 \ &Leftrightarrow 2(mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{X}^{mathrm{T}}mathbf{Y} + lambdamathbf{w})=0 \ &Leftrightarrow mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{X}^{mathrm{T}}mathbf{Y} + lambdamathbf{w}=0 \ &Leftrightarrow (mathbf{X}^{mathrm{T}}mathbf{X}+lambda mathbf{I})mathbf{w}=mathbf{X}^{mathrm{T}}mathbf{Y} \ &Leftrightarrow mathbf{w}=(mathbf{X}^{mathrm{T}}mathbf{X}+lambda mathbf{I})^{-1}mathbf{X}^{mathrm{T}}mathbf{Y} end{aligned} 2XTXw−XTY−XTY+2λw=0⇔2(XTXw−XTY+λw)=0⇔XTXw−XTY+λw=0⇔(XTX+λI)w=XTY⇔w=(XTX+λI)−1XTY
x x x | y y y |
---|---|
2 | 10 |
4 | 14 |
6 | 19 |
8 | ? |
这里的 x i x_i xi 可以表示为 X = [ x i j ] 3 × 2 mathbf{X}=[x_{ij}]_{3times2} X=[xij]3×2, 即
[ 1 2 1 4 1 6 ] begin{bmatrix}1&2\1&4\1&6 end{bmatrix} ⎣⎡111246⎦⎤
y i y_i yi 则表示为 Y = [ 10 14 19 ] T mathbf{Y} = begin{bmatrix}10&14&19 end{bmatrix}^{mathrm{T}} Y=[101419]T
w = [ a , b ] mathbf{w}=[a, b] w=[a,b]
求:
arg min w ∥ X w − Y ∥ 2 2 argmin_{mathbf{w}}|mathbf{Xw}-mathbf{Y}|_2^2 wargmin∥Xw−Y∥22
当 w = [ 2 , 6 ] mathbf{w}=[2, 6] w=[2,6] ,此时 ∥ X w − Y ∥ 2 2 |mathbf{Xw}-mathbf{Y}|_2^2 ∥Xw−Y∥22取得最小值,因此得到 w mathbf{w} w
那么式子为
y = f ( x ) = 2 x + 6 y=f(x)=2x+6 y=f(x)=2x+6
y 4 = f ( 8 ) = 22 y_4=f(8)=22 y4=f(8)=22
已知:
log L ( w ) = ∑ i = 1 n log P ( y i ∣ x i ; w ) = ∑ i = 1 n y i log P ( y i = 1 ∣ x i ; w ) + ( 1 − y i ) log ( 1 − P ( y i = 1 ∣ x i ; w ) ) = ∑ i = 1 n y i log P ( y i = 1 ∣ x i ; w ) 1 − P ( y i = 1 ∣ x i ; w ) + log ( 1 − P ( y i = 1 ∣ x i ; w ) ) = ∑ i = 1 n y i x i w − log ( 1 + e x i w ) begin{aligned} log L(mathbf{w}) &= sum_{i = 1}^n log P(y_i vert mathbf{x}i; mathbf{w}) \& = sum_{i = 1}^n y_i log P(y_i = 1 vert mathbf{x}_i; mathbf{w}) + (1 - y_i) log(1 - P(y_i = 1 vert mathbf{x}i; mathbf{w})) \ & = sum_{i = 1}^n y_i log frac{P(y_i = 1 vert mathbf{x}_i; mathbf{w})}{1 - P(y_i = 1 vert mathbf{x}_i; mathbf{w})} + log (1 - P(y_i = 1 vert mathbf{x}i; mathbf{w})) \ &= sum_{i = 1}^n y_i mathbf{x}_i mathbf{w} - log (1 + e^{mathbf{x}_i mathbf{w}}) end{aligned} logL(w)=i=1∑nlogP(yi∣xi;w)=i=1∑nyilogP(yi=1∣xi;w)+(1−yi)log(1−P(yi=1∣xi;w))=i=1∑nyilog1−P(yi=1∣xi;w)P(yi=1∣xi;w)+log(1−P(yi=1∣xi;w))=i=1∑nyixiw−log(1+exiw)
求:
∂ log L ( w ) ∂ w frac{partial log L(mathbf{w})}{partial mathbf{w}} ∂w∂logL(w)
∂ ( y i x i w ) ∂ w = y i x i frac{partialleft(y_i mathbf{x}_i mathbf{w}right)}{partialmathbf{w}}=y_i mathbf{x}_i ∂w∂(yixiw)=yixi
∂ ( log ( 1 + e x i w ) ) ∂ w = 1 ( 1 + e x i w ) × ∂ ( e x i w ) ∂ w = 1 ( 1 + e x i w ) × e x i w = e x i w ( 1 + e x i w ) begin{aligned} frac{partialleft( log (1 + e^{mathbf{x}_i mathbf{w}})right)}{partialmathbf{w}}&=frac{1}{(1 + e^{mathbf{x}_i mathbf{w}})}times frac{partialleft(e^{mathbf{x}_i mathbf{w}}right)}{partialmathbf{w}}\ &=frac{1}{(1 + e^{mathbf{x}_i mathbf{w}})}times e^{mathbf{x}_i mathbf{w}}\ &=frac{e^{mathbf{x}_i mathbf{w}}}{(1 + e^{mathbf{x}_i mathbf{w}})} end{aligned} ∂w∂(log(1+exiw))=(1+exiw)1×∂w∂(exiw)=(1+exiw)1×exiw=(1+exiw)exiw
∂ log L ( w ) ∂ w = ∑ i = 1 n ∂ ( y i x i w − log ( 1 + e x i w ) ) ∂ w = ∑ i = 1 n y i x i − e x i w 1 + e x i w x i = ∑ i = 1 n ( y i − e x i w 1 + e x i w ) x i begin{aligned} frac{partial log L(mathbf{w})}{partial mathbf{w}} &= sum_{i = 1}^n frac{partialleft(y_imathbf{x}_i mathbf{w} - log (1 + e^{mathbf{x}_i mathbf{w}})right)}{partialmathbf{w}} \&= sum_{i = 1}^n y_i mathbf{x}_i - frac{e^{mathbf{x}_i mathbf{w}}}{1 + e^{mathbf{x}_i mathbf{w}}} mathbf{x}i\ & = sum_{i = 1}^n left(y_i - frac{e^{mathbf{x}_i mathbf{w}}}{1 + e^{mathbf{x}_i mathbf{w}}}right) mathbf{x}_iend{aligned} ∂w∂logL(w)=i=1∑n∂w∂(yixiw−log(1+exiw))=i=1∑nyixi−1+exiwexiwxi=i=1∑n(yi−1+exiwexiw)xi
- 用于分类(特别是二分类).
- 运用到了点与直线的距离.
- 用到了激活函数,比如sigmoid,当前还可以用其它的激活函数.
- 用到了最大似然.
- 用到了向量的偏导
- 用到了梯度下降
定义无向网络.
Definition: A undirected net is a tuple G = ( V , w ) G=(mathbf{V}, w) G=(V,w), where
自己画一棵树, 将其元组各部分写出来 (特别是函数 p p p).
T = ( V , r , p ) T=(mathbf{V},r,p) T=(V,r,p)
V = { v 0 , v 1 , … , v 4 } V={v_0,v_1,dots,v_4} V={v0,v1,…,v4}
r = v 0 r=v_0 r=v0
p ( v 0 ) = ϕ p(v_0)=phi p(v0)=ϕ
p ( v 1 ) = v 0 p_(v_1)=v_0 p(v1)=v0
p ( v 2 ) = v 0 p_(v_2)=v_0 p(v2)=v0
p ( v 3 ) = v 1 p_(v_3)=v_1 p(v3)=v1
p ( v 4 ) = v 2 p_(v_4)=v_2 p(v4)=v2
针对该树, 将代码中的变量值写出来 (特别是 parent 数组).
原文章中的代码:
public class Tree {/*** 节点数. 表示节点 v_0 至 v_{n-1}.*/int n;/*** 根节点. 0 至 n-1.*/int root;/*** 父节点.*/int[] parent;/*** 构造一棵树, 第一个节点为根节点, 其余节点均为其直接子节点, 也均为叶节点.*/public Tree(int paraN) {n = paraN;parent = new int[n];parent[0] = -1; // -1 即 phi}// Of the constructor
}//Of class Tree
变量值如下:
n = 5;
root = 0;
parent = {-1, 0, 0, 1, 2}
画一棵三叉树, 并写出它的 child 数组.
child数组:
{ { 1 , 2 , − 1 } , { 3 , 4 , 5 } , { − 1 , − 1 , − 1 } , { − 1 , − 1 , − 1 } , { − 1 , − 1 , − 1 } , { − 1 , − 1 , − 1 } } {{1,2,-1}, {3,4,5},{-1,-1,-1},{-1,-1,-1},{-1,-1,-1},{-1,-1,-1}} {{1,2,−1},{3,4,5},{−1,−1,−1},{−1,−1,−1},{−1,−1,−1},{−1,−1,−1}}
按照本贴风格, 重新定义树. 提示: 还是应该定义 parent 函数, 字母表里面只有一个元素.
Let ϕ phi ϕ be the empty node, a tree is a quadruple T = ( V , r , Σ , p ) T=(mathbf{V},r,Sigma,p) T=(V,r,Σ,p) where
说明:
我认为元组实际上就是数据与数据关系的一个组合体。
定义一个标签分布系统, 即各标签的值不是 0/1, 而是 [ 0 , 1 ] [0,1] [0,1] 区间的实数, 且同一对象的标签和为 1.
Definition. A label distribution system is a tuple S = ( X , Y ) S = (mathbf{X},mathbf{Y}) S=(X,Y) where
本文发布于:2024-01-31 07:42:26,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170665814926787.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |