数学表达式学习

阅读: 评论:0

数学表达式学习

数学表达式学习

第一天

原文链接: 数学表达式: 从恐惧到单挑 (1. 概述)

描述你在学习、使用数学表达式时的困难, 可举例说明.

  1. 对于数学表达式用latex表达时,还不是太熟练,因此在表达某些式子时可能会产生一些细节上的错误,而这些错误往往是我们这种初次使用者难以发现的,比如今天所讲的圆括号的区别,我之前都是直接使用圆括号 ( ,并未使用过 left(,区别如下:
    ( ∭ E V d x d y d z ) (iiint_{E}^{V} , dx,dy,dz) (∭EV​dxdydz)
    ( ∭ E V d x d y d z ) left(iiint_{E}^{V} , dx,dy,dzright) (∭EV​dxdydz)
  2. 一些特殊符号的理解,有一些可能是数学界中已有的符号,但是由于知识面较窄,无法在第一时间了解该符号的含义,就比较尴尬了。

原文链接: 数学表达式: 从恐惧到单挑 (2. 集合的表示与运算)

作业

  1. 令 A = { 3 , 5 } mathbf{A} = {3, 5} A={3,5}, 写出 2 A 2^{mathbf{A}} 2A.

2 A = { ∅ , { 3 } , { 5 } , { 3 , 5 } } 2^{mathbf{A}}={emptyset, {3}, {5}, {3, 5}} 2A={∅,{3},{5},{3,5}}.

  1. 展开 2 ∅ 2^{emptyset} 2∅

2 ∅ = { ∅ } 2^{emptyset}={emptyset} 2∅={∅}.

  1. 令 A = { 5 , 6 , 7 , 8 , 9 } mathbf{A} = {5, 6, 7, 8, 9} A={5,6,7,8,9}, 写出 A mathbf{A} A 的其它两种表示法.

1) A = [ 5..9 ] mathbf{A}=[5..9] A=[5..9]
2) A = { x ∈ N + ∣ 5 ≤ x ≤ 9 } mathbf{A}={x in mathbf{N^+} vert 5 leq x leq 9 } A={x∈N+∣5≤x≤9}

  1. 使用 markdown 模式写 CSDN 贴子, 根据提供的源码将相应表达式写出来.
    提示: markdown 模式写表达式的源码与 Latex 比较一致 (估计就是从后者学习的), 仅在少数地方不同. 这里抄会了, 就为以后写论文就扫除了重要障碍.

以下为原博文涉及相关数学式子的内容复现:

2.1 集合的表示

  • 枚举法
    A = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 } mathbf{A} = {0,1,2,3,4,5,6,7,8,9} A={0,1,2,3,4,5,6,7,8,9}是阿拉伯数字的集合.
    N = { 0 , 1 , 2 , … } mathbf{N}={0,1,2, dots} N={0,1,2,…}是自然数的集合.
    Ω = { a , b , … , z } mathbf{Omega}={textrm{a},textrm{b}, dots, textrm{z}} Ω={a,b,…,z}是英文字母表

  • 向量、集合等,用粗体 mathbf{x} ( x mathbf{x} x), bm{x} ( x bm{x} x), boldsymbol{x} ( x boldsymbol{x} x). 全文统一即可.

  • 枚举法的几种简记

    • 如果是两个整数之间的枚举集合, 可以使用简记 [ 1..10 ] = { 1 , 2 , … , 10 } [1..10] = {1, 2, dots, 10} [1..10]={1,2,…,10}, 也可以使用变量如 [ i . . j ] [i..j] [i..j]. 注意这里是两个点, 而不是 3 个点的 dots.
    • 开区间 (3, 5) 表示大于 3, 小于 5 的所有实数. 闭区间 [3, 5] 表示大于或等于 3, 小于或等于 5 的所有实数. 这是基础数学的内容, 不仅限于离散数学的范畴.
    • X = { x i } i = 1 n = { x 1 , x 2 , … , x n } mathbf{X}={x_i}_{i=1}^n={x_1, x_2, dots, x_n} X={xi​}i=1n​={x1​,x2​,…,xn​}表示集合有 n n n 个元素. 式子源码为 mathbf{X} = {x_i}_{i = 1}^n) = {x_1, x_2, dots, x_n}. 不写 x_2 其实也没有影响.
  • 谓词法
    奇数集合: O = { x ∣ x ∈ N , x m o d 2 = 1 } = { x ∈ N ∣ x m o d 2 = 1 } mathbf{O}={x vert xin mathbf{N},x mod 2 = 1}={xin mathbf{N} vert x mod 2=1} O={x∣x∈N,xmod2=1}={x∈N∣xmod2=1}.

  • 常用集合
    实数 R mathbb{R} R
    有理数 Q mathbf{Q} Q

  • 平凡子集
    空集 ∅ emptyset ∅
    全集 U mathbf{U} U

2.2 元素与子集

  • x ∈ X x in mathbf{X} x∈X
  • A ⊆ B mathbf{A} subseteq mathbf{B} A⊆B

2.3 集合的运算

  • 集合的基数
    ∣ X ∣ vert mathbf{X} vert ∣X∣, 指集合元素个数.

  • X ∪ Y mathbf{X} cup mathbf{Y} X∪Y
    ⋃ i = 1 n X i bigcup_{i=1}^n mathbf{X}_i ⋃i=1n​Xi​表示 n n n 个集合的并.
    ∑ i = 1 n i = 1 + 2 + ⋯ + n = n ( n + 1 ) 2 sum_{i = 1}^n i = 1 + 2 + dots + n = frac{n (n + 1)}{2} ∑i=1n​i=1+2+⋯+n=2n(n+1)​

  • X ∩ Y mathbf{X} cap mathbf{Y} X∩Y
    ⋂ i = 1 n X i bigcap_{i=1}^n mathbf{X}_i ⋂i=1n​Xi​表示 n n n 个集合的交.

  • X ∖ Y mathbf{X} setminus mathbf{Y} X∖Y表示两个集合的差.

  • X ‾ = U ∖ X overline{mathbf{X}} = mathbf{U} setminus mathbf{X} X=U∖X
    ¬ X neg mathbf{X} ¬X

2.4 幂集

2 A = { B ∣ B ⊆ A } 2^{mathbf{A}}={mathbf{B}vert mathbf{B}subseteq mathbf{A}} 2A={B∣B⊆A}
A = { 0 , 1 , 2 } , 2 A = { ∅ , { 0 } , { 1 } , { 2 } , { 0 , 1 } , { 0 , 2 } , { 1 , 3 } , { 0 , 1 , 2 } } mathbf{A} = {0,1,2},2^{mathbf{A}} = {emptyset, {0}, {1}, {2}, {0, 1}, {0, 2}, {1, 3}, {0, 1, 2}} A={0,1,2},2A={∅,{0},{1},{2},{0,1},{0,2},{1,3},{0,1,2}}

2.5 笛卡尔积

  • A × B = { ( a , b ) ∣ a ∈ A , b ∈ B } mathbf{A} times mathbf{B} = {(a, b) vert a in mathbf{A}, b in mathbf{B}} A×B={(a,b)∣a∈A,b∈B}.
  • ( a , b ) ≠ ( b , a ) (a, b) neq (b, a) (a,b)​=(b,a), 因此 A × B ≠ B × A mathbf{A} times mathbf{B} neq mathbf{B} times mathbf{A} A×B​=B×A.
  • ∅ × B = ∅ emptyset times mathbf{B} = emptyset ∅×B=∅
  • ∣ A × B ∣ = ∣ A ∣ × ∣ B ∣ vert mathbf{A} times mathbf{B} vert = vert mathbf{A} vert times vert mathbf{B} vert ∣A×B∣=∣A∣×∣B∣
  • 一维数据所在的空间为 R mathbb{R} R, 二维数据的空间为 R × R = R 2 mathbb{R} times mathbb{R} = mathbb{R}^2 R×R=R2, 三维数据的空间为 R 3 mathbb{R}^3 R3, n n n 维数据的 R n mathbb{R}^n Rn.

原文链接: 数学表达式: 从恐惧到单挑 (3. 向量与矩阵)

自己出数据, 做一个 3 × 2 3 times 2 3×2 与 2 × 4 2 times 4 2×4的矩阵乘法.

A = [ 1 2 3 4 5 6 ] mathbf{A}=begin{bmatrix} 1 & 2 \ 3 & 4 \ 5 & 6 end{bmatrix} A=⎣⎡​135​246​⎦⎤​,

B = [ 1 2 3 4 4 3 2 1 ] mathbf{B}=begin{bmatrix} 1 & 2 & 3 & 4\ 4 & 3 & 2 & 1\ end{bmatrix} B=[14​23​32​41​],

A × B = [ 9 6 9 6 19 14 21 16 29 22 33 26 ] mathbf{A} timesmathbf{B}=begin{bmatrix} 9 & 6 & 9 & 6\ 19 & 14 & 21 & 16\ 29 & 22 & 33 & 26\ end{bmatrix} A×B=⎣⎡​91929​61422​92133​61626​⎦⎤​.


作业:Deep Multi-View 符号系统的矛盾

  1. 在 3.1 中的 B = { b i } i = 1 N mathbf{B}={b_i}_{i=1}^N B={bi​}i=1N​ 中的 i = 1 i=1 i=1 是否应该修改为 i = 0 i=0 i=0 , 因为他说了 b i b_i bi​ 与 o i o_i oi​ 是由关联的二进制码, 而 O = { o i } i = 0 N mathbf{O}={o_i}_{i=0}^N O={oi​}i=0N​, 两者下标应该相一致.
  2. φ ( X ) = [ φ 1 ( ε ( F ( X 1 , … , X N ) ) , X ( 1 ) ) , … , φ m ( ε ( F ( X 1 , … , X N ) ) , X ( m ) ) ] varphi(mathbf{X}) = [varphi_1(varepsilon(mathcal{F}(mathbf{X}_1,dots, mathbf{X}_N)), mathbf{X}^{(1)}), dots, varphi_m(varepsilon(mathcal{F}(mathbf{X}_1,dots, mathbf{X}_N)), mathbf{X}^{(m)})] φ(X)=[φ1​(ε(F(X1​,…,XN​)),X(1)),…,φm​(ε(F(X1​,…,XN​)),X(m))]
    这里的 X 1 , … , X N mathbf{X_1},dots,mathbf{X_N} X1​,…,XN​ 与 X ( m ) mathbf{X}^{(m)} X(m) 感觉有点矛盾,前文中只看到了 x N ( m ) x_N^{(m)} xN(m)​,并未看到 X N mathbf{X_N} XN​.
  3. φ : X → B varphi:mathbf{X}tomathbf{B} φ:X→B, 这里的箭头用的to
    φ : X → B varphi:mathbf{X}rightarrowmathbf{B} φ:X→B, 这里用的是rightarrow
    φ : X ↦ B varphi:mathbf{X}mapstomathbf{B} φ:X↦B, 这里用的是mapsto
    这里老板说在论文中应该用第三种,并不是很理解,需要通过再看回放理解,不过现在还看不了。

第二天

原文链接: 数学表达式: 从恐惧到单挑 (4. 二元关系)

  1. 令 A = { 1 , 2 , 5 , 8 , 9 } mathbf{A} = {1, 2, 5, 8, 9} A={1,2,5,8,9}, 写出 A mathbf{A} A 上的 “模 2 同余” 关系及相应的划分.

R = { ( a , b ) ∈ A × A ∣ a m o d 2 = b m o d 2 } mathbf{R} = {(a, b) in mathbf{A} times mathbf{A} vert a mod 2 = b mod 2} R={(a,b)∈A×A∣amod2=bmod2}.
R = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R} = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}.

  1. A = { 1 , 2 , 5 , 8 , 9 } mathbf{A} = {1, 2, 5, 8, 9} A={1,2,5,8,9}, 自己给定两个关系 R 1 mathbf{R}_1 R1​ 和 R 2 mathbf{R}_2 R2​, 并计算 R 1 ∘ R 2 mathbf{R}_1 ∘mathbf{R}_2 R1​∘R2​, R 1 + mathbf{R}_1^+ R1+​, R 1 ∗ mathbf{R}_1^* R1∗​.

R 1 = = { ( a , b ) ∈ A × A ∣ a m o d 2 = b m o d 2 } mathbf{R}_1 = = {(a, b) in mathbf{A} times mathbf{A} vert a mod 2 = b mod 2} R1​=={(a,b)∈A×A∣amod2=bmod2}
R 2 = = { ( a , b ) ∈ A × A ∣ a m o d 3 = b m o d 3 } mathbf{R}_2 = = {(a, b) in mathbf{A} times mathbf{A} vert a mod 3 = b mod 3} R2​=={(a,b)∈A×A∣amod3=bmod3}
R 1 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R1​={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}.
R 2 = { ⟨ 1 , 1 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 5 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 2 ⟩ , ⟨ 5 , 5 ⟩ , ⟨ 5 , 8 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_2 = {langle 1, 1 rangle ,langle 2, 2 rangle ,langle 2, 5 rangle , langle2,8 rangle , langle5,2 rangle, langle 5, 5 rangle , langle5,8 rangle,langle8,2 rangle, langle 8, 8 rangle ,langle 9, 9 rangle } R2​={⟨1,1⟩,⟨2,2⟩,⟨2,5⟩ ,⟨2,8⟩ ,⟨5,2⟩,⟨5,5⟩,⟨5,8⟩,⟨8,2⟩,⟨8,8⟩,⟨9,9⟩}.
R 1 ∘ R 2 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 2 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 8 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 5 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ , ⟨ 5 , 2 ⟩ , ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 5 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 2 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 8 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1∘mathbf{R}_2={langle 1, 1 rangle ,langle 1, 2 rangle,langle 1, 5 rangle ,langle 1, 8 rangle,langle 1, 9 rangle , langle 2, 2 rangle,langle 2, 5 rangle , langle2,8 rangle ,langle 5, 1 rangle,langle5,2 rangle, langle 5, 5 rangle ,langle5,9 rangle,langle 8, 2 rangle,langle 8, 5 rangle,langle 8, 8 rangle,langle 9, 1 rangle,langle 9, 2 rangle,langle 9, 5 rangle,langle 9, 8 rangle,langle 9, 9 rangle} R1​∘R2​={⟨1,1⟩,⟨1,2⟩,⟨1,5⟩,⟨1,8⟩,⟨1,9⟩,⟨2,2⟩,⟨2,5⟩ ,⟨2,8⟩ ,⟨5,1⟩,⟨5,2⟩,⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,5⟩,⟨8,8⟩,⟨9,1⟩,⟨9,2⟩,⟨9,5⟩,⟨9,8⟩,⟨9,9⟩}.
R 1 1 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^1 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R11​={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 2 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^2 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R12​={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 3 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^3 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R13​={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 4 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^4 ={langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R14​={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 5 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^5 = {langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R15​={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 + = ⋃ i = 1 ∣ A ∣ R 1 i = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^+ = bigcup_{i=1}^{|mathbf{A}|}mathbf{R}_1^i={langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R1+​=⋃i=1∣A∣​R1i​={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}
R 1 ∗ = R 1 + ∪ A 0 = { ⟨ 1 , 1 ⟩ , ⟨ 1 , 5 ⟩ , ⟨ 1 , 9 ⟩ , ⟨ 2 , 2 ⟩ , ⟨ 2 , 8 ⟩ , ⟨ 5 , 1 ⟩ ⟨ 5 , 5 ⟩ , ⟨ 5 , 9 ⟩ , ⟨ 8 , 2 ⟩ , ⟨ 8 , 8 ⟩ , ⟨ 9 , 1 ⟩ , ⟨ 9 , 5 ⟩ , ⟨ 9 , 9 ⟩ } mathbf{R}_1^* = mathbf{R}_1^+ cup mathbf{A}^0={langle1,1 rangle ,langle1,5 rangle , langle1,9 rangle ,langle2,2 rangle , langle2,8 rangle, langle5,1 rangle, langle5,5 rangle ,langle5,9 rangle, langle8,2 rangle,langle8,8 rangle ,langle9,1 rangle,langle9,5 rangle,langle9,9 rangle } R1∗​=R1+​∪A0={⟨1,1⟩,⟨1,5⟩,⟨1,9⟩ ,⟨2,2⟩,⟨2,8⟩,⟨5,1⟩⟨5,5⟩,⟨5,9⟩,⟨8,2⟩,⟨8,8⟩,⟨9,1⟩,⟨9,5⟩,⟨9,9⟩}

  1. 查阅粗糙集上下近似的定义并大致描述
    根据百度百科,可以理解:
    A mathbf{A} A 有八个元素, A = { x 1 , x 2 , … , x 8 } mathbf{A} = {x_1, x_2, dots, x_8} A={x1​,x2​,…,x8​}, 表示八个积木,每个积木块有颜色关系,大小关系,形状关系。
    R 1 = { 红 , 黑 , 蓝 } = { { x 1 , x 2 , x 6 } , { x 3 , x 4 } , { x 5 , x 7 , x 8 } } mathbf{R}_1 = {红, 黑, 蓝}={{x_1,x_2,x_6}, {x_3,x_4},{x_5,x_7,x_8}} R1​={红,黑,蓝}={{x1​,x2​,x6​},{x3​,x4​},{x5​,x7​,x8​}}
    R 2 = { 三 角 , 方 块 , 圆 形 } = { { x 1 , x 2 } , { x 5 , x 8 } , { x 3 , x 4 , x 6 , x 7 } } mathbf{R}_2 = {三角, 方块, 圆形} = {{x_1,x_2}, {x_5, x_8},{x_3,x_4,x_6,x_7}} R2​={三角,方块,圆形}={{x1​,x2​},{x5​,x8​},{x3​,x4​,x6​,x7​}}
    R 3 = { 大 , 中 , 小 } = { { x 1 , x 2 , x 5 } , { x 6 , x 8 } , { x 3 , x 4 , x 7 } } mathbf{R}_3 = {大, 中, 小} = {{x_1,x_2,x_5}, {x_6,x_8},{x_3,x_4,x_7}} R3​={大,中,小}={{x1​,x2​,x5​},{x6​,x8​},{x3​,x4​,x7​}}
    通过这里的关系进行交集或者并集可以得到很多的概念,但是若出现了一个无法用前面的运算得出的集合,就涉及到了上近似和下近似的概念。比如 X = { x 2 , x 5 , x 7 } mathbf{X}={x_2, x_5, x_7} X={x2​,x5​,x7​}, 它的上近似和下近似分别为 { x 5 , x 7 } {x_5, x_7} {x5​,x7​}和 { x 1 , x 2 , x 5 , x 7 } {x_1, x_2, x_5, x_7} {x1​,x2​,x5​,x7​},我理解的下近似集就是X的子集,同时这个子集与上面的集合有相应关系,比如被包含,而上近似则是X被这个集合包含,该集合也可以由上述的集合通过运算得到。

原文链接: 数学表达式: 从恐惧到单挑 (5. 函数)

举例说明你对函数的认识.

  1. 一元函数也就是只有一种自变量,然后与因变量产生了一种关系,构成一个函数。
  2. 二元函数则意味着有两种自变量,道理同上。
  3. 多元函数的概念也可以同上,值得一提的是多元函数也可以当成一元函数,此时把自变量的集合可以当作向量,此时就把向量当作了一种自变量,从而转化成了一元函数。

原文链接: 数学表达式: 从恐惧到单挑 (6. 向量/矩阵的范数)

给定一个矩阵并计算其各种范数.

给定矩阵为:
X = [ 1 2 3 4 ] mathbf{X}= begin{bmatrix} 1 & 2 \ 3 & 4 end{bmatrix} X=[13​24​]
l 0 l_0 l0​ 范数(非零项个数):
∥ X ∥ 0 = ∣ { ( i , j ) ∣ x i j ≠ 0 } ∣ = 4 (1) |mathbf{X}|_0 = vert {(i,j)vert x_{ij} neq 0} vert =4 tag{1} ∥X∥0​=∣{(i,j)∣xij​​=0}∣=4(1)

l 1 l_1 l1​ 范数(绝对值之和):
∥ X ∥ 1 = ∑ i , j ∣ x i j ∣ = 10 (2) |mathbf{X}|_1 = sum_{i,j}vert x_{ij} vert = 10 tag{2} ∥X∥1​=i,j∑​∣xij​∣=10(2)

l 2 l_2 l2​ 范数(平方和):
∥ X ∥ 2 = ∑ i , j x i j 2 = 1 2 + 2 2 + 3 2 + 4 2 = 30 (3) |mathbf{X}|_2 = sqrt{sum_{i,j} x_{ij}^2 } = sqrt{1^2+2^2+3^2+4^2}=sqrt{30} tag{3} ∥X∥2​=i,j∑​xij2​ ​=12+22+32+42 ​=30 ​(3)
∥ X ∥ 2 2 = ∑ i , j x i j 2 = 1 2 + 2 2 + 3 2 + 4 2 = 30 (4) |mathbf{X}|_2^2 = sum_{i,j} x_{ij}^2 = 1^2+2^2+3^2+4^2=30 tag{4} ∥X∥22​=i,j∑​xij2​=12+22+32+42=30(4)
l ∞ l_{infty} l∞​ 范数(相当于最大绝对值):
∥ X ∥ ∞ = max ⁡ i , j ∣ x i j ∣ = 4 (5) |mathbf{X}|_{infty} = max_{i,j}{vert x_{ij}vert}=4 tag{5} ∥X∥∞​=i,jmax​∣xij​∣=4(5)


原文链接: 数学表达式: 从恐惧到单挑 (7. min 与 argmin)

解释 推荐系统: 问题、算法与研究思路 2.1 中的优化目标
min ⁡ ∑ ( i , j ) ∈ Ω ( f ( x i , t j ) − r i j ) 2 min{sum_{(i,j)in Omega} (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2} min(i,j)∈Ω∑​(f(xi​,tj​)−rij​)2
各符号及含义.

f ( x i , t j ) f(mathbf{x}_i, mathbf{t}_j) f(xi​,tj​) 表示预测的第 i i i 个用户对第 j j j 个商品的评分.

r i j r_{ij} rij​ 表示第 i i i 个用户对第 j j j 个商品的评分.

( f ( x i , t j ) − r i j ) 2 (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2 (f(xi​,tj​)−rij​)2 表示当前函数的预测评分与实际评分的误差平方.

∑ ( i , j ) ∈ Ω ( f ( x i , t j ) − r i j ) 2 sum_{(i,j)in Omega} (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2 ∑(i,j)∈Ω​(f(xi​,tj​)−rij​)2 表示当前函数的误差平方和.

min ⁡ ∑ ( i , j ) ∈ Ω ( f ( x i , t j ) − r i j ) 2 min{sum_{(i,j)in Omega} (f(mathbf{x}_i, mathbf{t}_j)-r_{ij})^2} min∑(i,j)∈Ω​(f(xi​,tj​)−rij​)2 表示找出最小误差平方和


第三天

原文链接: 数学表达式: 从恐惧到单挑 (8. 累加、累乘与积分)

  1. 将向量下标为偶数的分量 (x2, x4, …) 累加, 写出相应表达式.

∑ i m o d 2 = 0 n ( x i ) sum_{imod2=0}^n{left( x_iright)} imod2=0∑n​(xi​)

int sum = 0;
int n = 10;
for (int i = 1; i <= n; i++) {//这里假设x_i=iif (i % 2 == 0) {sum += i;}
}
  1. 各出一道累加、累乘、积分表达式的习题, 并给出标准答案.

累加: ∑ i m o d 3 = 0 3 n ( x i ) , X = { 1 , 2 , 3 , ⋯ , 3 n } sum_{imod3=0}^{3n}(x_i), mathbf{X}={1, 2, 3,cdots, 3n} imod3=0∑3n​(xi​),X={1,2,3,⋯,3n}
答案: ∑ i m o d 3 = 0 3 n ( x i ) = n ( 3 + 3 n ) 2 sum_{imod3=0}^{3n}(x_i)=frac{n(3+3n)}{2} imod3=0∑3n​(xi​)=2n(3+3n)​

累乘: ∏ i 10 i prod_{i}^{10} {i} i∏10​i
答案: ∏ i 10 i = 1 × 2 × 3 × ⋯ × 10 = 3628800 prod_{i}^{10} {i}=1times2times3timesdotstimes10=3628800 i∏10​i=1×2×3×⋯×10=3628800

积分表达式: ∫ − 2 2 e x d x int_{-2}^{2} e^x, dx ∫−22​exdx
答案: ∫ − 2 2 e x d x = e x ∣ − 2 + 2 = e 2 − e − 2 int_{-2}^{2} e^x, dx = e^x vert_{-2}^{+2}=e^2-e^{-2} ∫−22​exdx=ex∣−2+2​=e2−e−2

  1. 你使用过三重累加吗? 描述一下其应用.

用过,比如涉及空间问题的时候,此时为三维空间,那么假设对这个空间里的离散点附带的值进行求和,那么便可用三重累加,将每个空间点值加起来。

  1. 给一个常用的定积分, 将手算结果与程序结果对比.

∫ − 1 1 ( x 2 ) d x int_{-1}^{1} (x^2) mathrm{d}x ∫−11​(x2)dx
∫ − 1 1 ( x 2 ) d x = 1 3 x 3 ∣ − 1 + 1 = 1 3 − ( − 1 3 ) = 2 3 int_{-1}^{1} (x^2) mathrm{d}x = frac{1}{3}x^3 vert_{-1}^{+1}=frac{1}{3}-(-frac{1}{3})=frac{2}{3} ∫−11​(x2)dx=31​x3∣−1+1​=31​−(−31​)=32​

程序:

        double sum = 0;double delta = 0.001;for (double i = -1; i <= 1; i += delta) {sum += i * i * delta;}System.out.println(sum);

程序结果:

delta=0.001
0.6666670000000002
delta=0.000001
0.6666666666680293

结论:可以看出差距很小,若delta越小,则精度越高,但是过于太小,循环次数就会增多,时间复杂度随之提高。


原文链接: 数学表达式: 从恐惧到单挑 (9. 线性回归)

  1. 推导
    arg min ⁡ w ∥ X w − Y ∥ 2 2 + λ ∥ w ∥ 2 2 argmin_{mathbf{w}}|mathbf{Xw}-mathbf{Y}|_2^2+lambda|mathbf{w}|_2^2 wargmin​∥Xw−Y∥22​+λ∥w∥22​

X w − Y mathbf{Xw}-mathbf{Y} Xw−Y 是一个 n × 1 ntimes1 n×1的矩阵, 因此可以根据利用 1 × n 1times n 1×n的转置矩阵与其相乘获得 1 × 1 1times 1 1×1的标量, 即

计算化简:
∥ X w − Y ∥ 2 2 = ( X w − Y ) T ( X w − Y ) = ( w T X T − Y T ) ( X w − Y ) = w T X T X w − w T X T Y − Y T X w + Y T Y begin{aligned} |mathbf{Xw}-mathbf{Y}|_2^2 &= (mathbf{Xw}-mathbf{Y})^{mathrm{T}}(mathbf{Xw}-mathbf{Y}) \&=(mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}-mathbf{Y}^{mathrm{T}})(mathbf{Xw}-mathbf{Y}) \&=mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Y}-mathbf{Y}^{mathrm{T}}mathbf{Xw}+mathbf{Y}^{mathrm{T}}mathbf{Y} end{aligned} ∥Xw−Y∥22​​=(Xw−Y)T(Xw−Y)=(wTXT−YT)(Xw−Y)=wTXTXw−wTXTY−YTXw+YTY​

同理:
λ ∥ w ∥ 2 2 = λ w T w lambda|mathbf{w}|_2^2 =lambda mathbf{w}^{mathrm{T}}mathbf{w} λ∥w∥22​=λwTw

对 w mathbf{w} w 求导使得下式为0:
∂ ( ∥ X w − Y ∥ 2 2 + λ ∥ w ∥ 2 2 ) ∂ w = ∂ ( w T X T X w − w T X T Y − Y T X w + Y T Y + λ w T w ) ∂ w = 0 begin{aligned} frac{partialleft( |mathbf{Xw}-mathbf{Y}|_2^2+lambda|mathbf{w}|_2^2right)}{partialmathbf{w}} &=frac{partialleft( mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Y}-mathbf{Y}^{mathrm{T}}mathbf{Xw}+mathbf{Y}^{mathrm{T}}mathbf{Y}+lambda mathbf{w}^{mathrm{T}}mathbf{w} right)}{partialmathbf{w}}=0 end{aligned} ∂w∂(∥Xw−Y∥22​+λ∥w∥22​)​​=∂w∂(wTXTXw−wTXTY−YTXw+YTY+λwTw)​=0​

∂ ( w T X T X w ) ∂ w = 2 X T X w frac{partialleft(mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Xw}right)}{partialmathbf{w}}=2mathbf{X}^{mathrm{T}}mathbf{Xw} ∂w∂(wTXTXw)​=2XTXw

∂ ( w T X T Y ) ∂ w = X T Y frac{partialleft(mathbf{w}^{mathrm{T}}mathbf{X}^{mathrm{T}}mathbf{Y}right)}{partialmathbf{w}}=mathbf{X}^{mathrm{T}}mathbf{Y} ∂w∂(wTXTY)​=XTY

∂ ( Y T X w ) ∂ w = X T Y frac{partialleft(mathbf{Y}^{mathrm{T}}mathbf{X}mathbf{w}right)}{partialmathbf{w}}=mathbf{X}^{mathrm{T}}mathbf{Y} ∂w∂(YTXw)​=XTY

∂ ( Y T Y ) ∂ w = 0 frac{partialleft(mathbf{Y}^{mathrm{T}}mathbf{Y}right)}{partialmathbf{w}}=0 ∂w∂(YTY)​=0

∂ ( λ w T w ) ∂ w = 2 λ w frac{partialleft(lambda mathbf{w}^{mathrm{T}}mathbf{w}right)}{partialmathbf{w}}=2lambda mathbf{w} ∂w∂(λwTw)​=2λw

2 X T X w − X T Y − X T Y + 2 λ w = 0 ⇔ 2 ( X T X w − X T Y + λ w ) = 0 ⇔ X T X w − X T Y + λ w = 0 ⇔ ( X T X + λ I ) w = X T Y ⇔ w = ( X T X + λ I ) − 1 X T Y begin{aligned} &2mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{X}^{mathrm{T}}mathbf{Y}-mathbf{X}^{mathrm{T}}mathbf{Y}+2lambda mathbf{w}=0 \ &Leftrightarrow 2(mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{X}^{mathrm{T}}mathbf{Y} + lambdamathbf{w})=0 \ &Leftrightarrow mathbf{X}^{mathrm{T}}mathbf{Xw}-mathbf{X}^{mathrm{T}}mathbf{Y} + lambdamathbf{w}=0 \ &Leftrightarrow (mathbf{X}^{mathrm{T}}mathbf{X}+lambda mathbf{I})mathbf{w}=mathbf{X}^{mathrm{T}}mathbf{Y} \ &Leftrightarrow mathbf{w}=(mathbf{X}^{mathrm{T}}mathbf{X}+lambda mathbf{I})^{-1}mathbf{X}^{mathrm{T}}mathbf{Y} end{aligned} ​2XTXw−XTY−XTY+2λw=0⇔2(XTXw−XTY+λw)=0⇔XTXw−XTY+λw=0⇔(XTX+λI)w=XTY⇔w=(XTX+λI)−1XTY​

  1. 自己写一个小例子 ( n = 3 , m = 1 ) (n = 3, m = 1) (n=3,m=1) 来验证最小二乘法.
x x x y y y
210
414
619
8?

这里的 x i x_i xi​ 可以表示为 X = [ x i j ] 3 × 2 mathbf{X}=[x_{ij}]_{3times2} X=[xij​]3×2​, 即
[ 1 2 1 4 1 6 ] begin{bmatrix}1&2\1&4\1&6 end{bmatrix} ⎣⎡​111​246​⎦⎤​

y i y_i yi​ 则表示为 Y = [ 10 14 19 ] T mathbf{Y} = begin{bmatrix}10&14&19 end{bmatrix}^{mathrm{T}} Y=[10​14​19​]T

w = [ a , b ] mathbf{w}=[a, b] w=[a,b]

求:
arg min ⁡ w ∥ X w − Y ∥ 2 2 argmin_{mathbf{w}}|mathbf{Xw}-mathbf{Y}|_2^2 wargmin​∥Xw−Y∥22​

当 w = [ 2 , 6 ] mathbf{w}=[2, 6] w=[2,6] ,此时 ∥ X w − Y ∥ 2 2 |mathbf{Xw}-mathbf{Y}|_2^2 ∥Xw−Y∥22​取得最小值,因此得到 w mathbf{w} w

那么式子为
y = f ( x ) = 2 x + 6 y=f(x)=2x+6 y=f(x)=2x+6
y 4 = f ( 8 ) = 22 y_4=f(8)=22 y4​=f(8)=22


原文链接: 数学表达式: 从恐惧到单挑 (10. Logistic 回归)

  1. 推导

已知:
log ⁡ L ( w ) = ∑ i = 1 n log ⁡ P ( y i ∣ x i ; w ) = ∑ i = 1 n y i log ⁡ P ( y i = 1 ∣ x i ; w ) + ( 1 − y i ) log ⁡ ( 1 − P ( y i = 1 ∣ x i ; w ) ) = ∑ i = 1 n y i log ⁡ P ( y i = 1 ∣ x i ; w ) 1 − P ( y i = 1 ∣ x i ; w ) + log ⁡ ( 1 − P ( y i = 1 ∣ x i ; w ) ) = ∑ i = 1 n y i x i w − log ⁡ ( 1 + e x i w ) begin{aligned} log L(mathbf{w}) &= sum_{i = 1}^n log P(y_i vert mathbf{x}i; mathbf{w}) \& = sum_{i = 1}^n y_i log P(y_i = 1 vert mathbf{x}_i; mathbf{w}) + (1 - y_i) log(1 - P(y_i = 1 vert mathbf{x}i; mathbf{w})) \ & = sum_{i = 1}^n y_i log frac{P(y_i = 1 vert mathbf{x}_i; mathbf{w})}{1 - P(y_i = 1 vert mathbf{x}_i; mathbf{w})} + log (1 - P(y_i = 1 vert mathbf{x}i; mathbf{w})) \ &= sum_{i = 1}^n y_i mathbf{x}_i mathbf{w} - log (1 + e^{mathbf{x}_i mathbf{w}}) end{aligned} logL(w)​=i=1∑n​logP(yi​∣xi;w)=i=1∑n​yi​logP(yi​=1∣xi​;w)+(1−yi​)log(1−P(yi​=1∣xi;w))=i=1∑n​yi​log1−P(yi​=1∣xi​;w)P(yi​=1∣xi​;w)​+log(1−P(yi​=1∣xi;w))=i=1∑n​yi​xi​w−log(1+exi​w)​

求:
∂ log ⁡ L ( w ) ∂ w frac{partial log L(mathbf{w})}{partial mathbf{w}} ∂w∂logL(w)​

∂ ( y i x i w ) ∂ w = y i x i frac{partialleft(y_i mathbf{x}_i mathbf{w}right)}{partialmathbf{w}}=y_i mathbf{x}_i ∂w∂(yi​xi​w)​=yi​xi​

∂ ( log ⁡ ( 1 + e x i w ) ) ∂ w = 1 ( 1 + e x i w ) × ∂ ( e x i w ) ∂ w = 1 ( 1 + e x i w ) × e x i w = e x i w ( 1 + e x i w ) begin{aligned} frac{partialleft( log (1 + e^{mathbf{x}_i mathbf{w}})right)}{partialmathbf{w}}&=frac{1}{(1 + e^{mathbf{x}_i mathbf{w}})}times frac{partialleft(e^{mathbf{x}_i mathbf{w}}right)}{partialmathbf{w}}\ &=frac{1}{(1 + e^{mathbf{x}_i mathbf{w}})}times e^{mathbf{x}_i mathbf{w}}\ &=frac{e^{mathbf{x}_i mathbf{w}}}{(1 + e^{mathbf{x}_i mathbf{w}})} end{aligned} ∂w∂(log(1+exi​w))​​=(1+exi​w)1​×∂w∂(exi​w)​=(1+exi​w)1​×exi​w=(1+exi​w)exi​w​​

∂ log ⁡ L ( w ) ∂ w = ∑ i = 1 n ∂ ( y i x i w − log ⁡ ( 1 + e x i w ) ) ∂ w = ∑ i = 1 n y i x i − e x i w 1 + e x i w x i = ∑ i = 1 n ( y i − e x i w 1 + e x i w ) x i begin{aligned} frac{partial log L(mathbf{w})}{partial mathbf{w}} &= sum_{i = 1}^n frac{partialleft(y_imathbf{x}_i mathbf{w} - log (1 + e^{mathbf{x}_i mathbf{w}})right)}{partialmathbf{w}} \&= sum_{i = 1}^n y_i mathbf{x}_i - frac{e^{mathbf{x}_i mathbf{w}}}{1 + e^{mathbf{x}_i mathbf{w}}} mathbf{x}i\ & = sum_{i = 1}^n left(y_i - frac{e^{mathbf{x}_i mathbf{w}}}{1 + e^{mathbf{x}_i mathbf{w}}}right) mathbf{x}_iend{aligned} ∂w∂logL(w)​​=i=1∑n​∂w∂(yi​xi​w−log(1+exi​w))​=i=1∑n​yi​xi​−1+exi​wexi​w​xi=i=1∑n​(yi​−1+exi​wexi​w​)xi​​

  1. 特点:
  • 用于分类(特别是二分类).
  • 运用到了点与直线的距离.
  • 用到了激活函数,比如sigmoid,当前还可以用其它的激活函数.
  • 用到了最大似然.
  • 用到了向量的偏导
  • 用到了梯度下降

第四天

原文链接: 数学表达式: 从恐惧到单挑 (11. 图与网络)

定义无向网络.

Definition: A undirected net is a tuple G = ( V , w ) G=(mathbf{V}, w) G=(V,w), where

  • V mathbf{V} V is the set of nodes;
  • w w w : V × V → R mathbf{V}timesmathbf{V}tomathbb{R} V×V→R is the weight function where
    • w ( ⟨ v i , v j ⟩ ) w(lang v_i,v_jrang) w(⟨vi​,vj​⟩) is the weight of the arc ⟨ v i , v j ⟩ lang v_i,v_jrang ⟨vi​,vj​⟩
    • w ( ⟨ v i , v j ⟩ ) = w ( ⟨ v j , v i ⟩ ) w(lang v_i,v_jrang) = w(lang v_j,v_irang) w(⟨vi​,vj​⟩)=w(⟨vj​,vi​⟩).

原文链接: 数学表达式: 从恐惧到单挑 (12. 树)

  1. 自己画一棵树, 将其元组各部分写出来 (特别是函数 p p p).

    T = ( V , r , p ) T=(mathbf{V},r,p) T=(V,r,p)
    V = { v 0 , v 1 , … , v 4 } V={v_0,v_1,dots,v_4} V={v0​,v1​,…,v4​}
    r = v 0 r=v_0 r=v0​
    p ( v 0 ) = ϕ p(v_0)=phi p(v0​)=ϕ
    p ( v 1 ) = v 0 p_(v_1)=v_0 p(​v1​)=v0​
    p ( v 2 ) = v 0 p_(v_2)=v_0 p(​v2​)=v0​
    p ( v 3 ) = v 1 p_(v_3)=v_1 p(​v3​)=v1​
    p ( v 4 ) = v 2 p_(v_4)=v_2 p(​v4​)=v2​

  2. 针对该树, 将代码中的变量值写出来 (特别是 parent 数组).

原文章中的代码:

public class Tree {/*** 节点数. 表示节点 v_0 至 v_{n-1}.*/int n;/*** 根节点. 0 至 n-1.*/int root;/*** 父节点.*/int[] parent;/*** 构造一棵树, 第一个节点为根节点, 其余节点均为其直接子节点, 也均为叶节点.*/public Tree(int paraN) {n = paraN;parent = new int[n];parent[0] = -1; // -1 即 phi}// Of the constructor
}//Of class Tree

变量值如下:

n = 5;
root = 0;
parent = {-1, 0, 0, 1, 2}

原文链接: 数学表达式: 从恐惧到单挑 (13. m 叉树)

  1. 画一棵三叉树, 并写出它的 child 数组.

    child数组:
    { { 1 , 2 , − 1 } , { 3 , 4 , 5 } , { − 1 , − 1 , − 1 } , { − 1 , − 1 , − 1 } , { − 1 , − 1 , − 1 } , { − 1 , − 1 , − 1 } } {{1,2,-1}, {3,4,5},{-1,-1,-1},{-1,-1,-1},{-1,-1,-1},{-1,-1,-1}} {{1,2,−1},{3,4,5},{−1,−1,−1},{−1,−1,−1},{−1,−1,−1},{−1,−1,−1}}

  2. 按照本贴风格, 重新定义树. 提示: 还是应该定义 parent 函数, 字母表里面只有一个元素.


Let ϕ phi ϕ be the empty node, a tree is a quadruple T = ( V , r , Σ , p ) T=(mathbf{V},r,Sigma,p) T=(V,r,Σ,p) where

  • V ≠ ∅ mathbf{V} neq emptyset V​=∅ is the set of nodes;
  • r ∈ V rin mathbf{V} r∈V is the root node;
  • Σ = { t o p } Sigma={mathrm{top}} Σ={top};
  • p : V → V ∪ { ϕ } p:mathbf{V}tomathbf{V}cup{phi} p:V→V∪{ϕ} is the parent mapping satisfying
    • when v = r v=r v=r, ∃ ! s ∈ Σ exists!sin Sigma ∃!s∈Σ , st. p ( r , s ) = ϕ p(r,s)=phi p(r,s)=ϕ;
    • ∀ v ∈ V , ∃ ! n ≥ 0 forall vin mathbf{V},exists!ngeq 0 ∀v∈V,∃!n≥0 and ! s ∈ Σ !sin Sigma !s∈Σ, st. p ( n ) ( v , s ) = r p^{(n)}(v,s)=r p(n)(v,s)=r.

说明:


  1. 根据图、树、 m m m-叉树的学习, 谈谈你对元组的理解.

我认为元组实际上就是数据与数据关系的一个组合体。


第五天

原文链接: 数学表达式: 从恐惧到单挑 (14. 决策表)

定义一个标签分布系统, 即各标签的值不是 0/1, 而是 [ 0 , 1 ] [0,1] [0,1] 区间的实数, 且同一对象的标签和为 1.

Definition. A label distribution system is a tuple S = ( X , Y ) S = (mathbf{X},mathbf{Y}) S=(X,Y) where

  • X = [ x i j ] n × m ∈ R n × m mathbf{X} = [x_{ij}]_{ntimes m} in mathbb{R}^{ntimes m} X=[xij​]n×m​∈Rn×m is the data matrix;
  • Y = [ y i k ] n × l ∈ [ 0 , 1 ] n × l mathbf{Y} = [y_{ik}]_{ntimes l}in [0,1]^{ntimes l} Y=[yik​]n×l​∈[0,1]n×l is the label matrix, satisfying
    • ∀ y i ∈ Y forall y_i in mathbf{Y} ∀yi​∈Y, st. ∑ k = 1 l y i k = 1 sum_{k=1}^{l} y_{ik}=1 ∑k=1l​yik​=1
  • n n n is the number of instances;
  • m m m is the number of features;
  • l l l is the number of labels,

本文发布于:2024-01-31 07:42:26,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170665814926787.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:表达式   数学
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23