2024年2月3日发(作者:)
上课材料之二:
第二章 数学基础 (Mathematics)
第一节 矩阵(Matrix)及其二次型(Quadratic Forms)
第二节 分布函数(Distribution Function),数学期望(Expectation)及方差(Variance)
第三节 数理统计(Mathematical Statistics)
第一节 矩阵及其二次型(Matrix and its Quadratic Forms)
2.1 矩阵的基本概念与运算
一个m×n矩阵可表示为:
a11aA[aij]21am1a12a1na22a2nv
am2amn矩阵的加法较为简单,若C=A+B,cij=aij+bij
但矩阵的乘法的定义比较特殊,若A是一个m×n1的矩阵,B是一个n1×n的矩阵,则C=AB是一个m×n的矩阵,而且cij的:
结合律(Associative Law) (AB)C=A(BC)
分配律(Distributive Law) A(B+C)=AB+AC
问题:(A+B)2=A2+2AB+B2是否成立?
向量(Vector)是一个有序的数组,既可以按行,也可以按列排列。 行向量(row vector)是只有一行的向量,列向量(column vector)只有一列的向量。
如果α是一个标量,则αA=[αaij]。
矩阵A的转置矩阵(transpose matrix)记为A,是通过把A的行向量变成相应的列向量而得到。
显然(A)′=A,而且(A+B)′=A+B,
乘积的转置(Transpose ofa production )
(AB)BA,(ABC)CBA。
可逆矩阵(inverse matrix),如果n级方阵(square matrix)A和B,满足AB=BA=I。则称A、B是可逆矩阵,显然AB,BA。如下结果是成立的:
1
11ak1nikbkj,一般来讲,AB≠BA,但如下运算是成立
(A1)1A
2.2 特殊矩阵
(A1)(A)1(AB)1B1A1。
1)恒等矩阵(identity matrix)
对角线上元素全为1,其余全为0,可记为I;
2)标量矩阵(scalar matrix)
即形如αI的矩阵,其中α是标量;
3)幂等矩阵(idempotent matrix)
如果矩阵A具有性质AAA2A,这样的矩阵称为幂等矩阵。
定理:幂等矩阵的特征根要么是1,要么是零。
4)正定矩阵(positive definite)和负定矩阵(negative definite),非负定矩阵(nonnegative ) 或 半正定矩阵(positive semi-definite ),非正定矩阵(nonpositive
definite) 或 半负定矩阵(negative semi-definite);
对于任意的非零向量x,如有xAx>0(<0),则称A是正(负)定矩阵;如有xAx≥0(≤0),非负(非正)定矩阵。如果A是非负定的,则记为A≥0;如果是正定的,则记为A>0。协方差矩阵是半正定矩阵,几个结论:
a)恒等矩阵或单位矩阵是正定的;
b)如果A是正定的,则A也是正定的;
c)如果A是正定的,B是可逆矩阵,则BAB是正定的;
d)如果A是一个n×m矩阵,且n>m,r(A)m,则AA是正定的,AA是非负定矩阵。
5)对称矩阵(symmetric matrix);
如果A=A′,则A称为对称矩阵。
2.3 矩阵的迹(trace)
一个n×n矩阵的迹被定义为它的对角线上的元素之和,记为tr(A),则tr(A)如下结论是显然的。
1)tr(A)tr(A) (是标量) 特例tr(I)n
2
1ai1nii,
2)tr(A)tr(A)
3)tr(AB)tr(A)tr(B)
4)tr(AB)tr(BA),特例tr(AA)i1j1nn2aij
5)循环排列原则 tr(ABCD)=tr(BCDA)=tr(CDAB)=tr(DABC)
定理:实对称矩阵A的迹等于它的特征根之和。
1因为A是实对称矩阵,故有在矩阵C,使得CAC,其中CCI,n所以,i1nitr()tr(CAC)tr(ACC)tr(AI)tr(A)。
2.4 矩阵的秩(rank)
一个矩阵A的行秩和列秩一定相等,一个矩阵的秩就可以定义为它的行秩或列秩,记为r(A),不加证明,我们给出如下结果:
1)r(A)r(A)≤min(行数、列数)
2)r(A)r(B)n1≤r(AB)≤min(r(A),r(B)),其中A、B分别为m×n1、n1×n矩阵,特例:如果A、B为n×n矩阵,而且AB=0,则r(A)r(B)≤n
3)r(A)r(AA)r(AA),其中A是n×n的方阵
4)r(AB)≤r(A)r(B)
5)设A是n×n矩阵,且AI,则r(AI)r(AI)n
6)设A是n×n矩阵,且AA,则r(A)r(AI)n
2.5 统计量的矩阵表示
向量可理解为特殊的矩阵。i是一个其元素都为1的n维列向量,即i=(1,1,…,1),如果我们再假定x(x1,x2,,xn),计量经济模型中的许多统计量就可以用矩阵的形式表示出来,很方便进行数学推导。
n2显而易见,xiix,xixx,样本的均值与方差的矩阵表示如下:
ni1i122
3
1)样本均值矩阵表示;
1111111n11事实上iin即ii1,而ii,xxiix;
ni1nn1112)样本方差矩阵表示
x1111易知:ixiixiix。其中矩阵ii是一个每个元素都为的n阶nnnnxx1xxx11(x方阵,从而2ix)(xiix)(Iii)xnnxnx定理:矩阵M0是幂等矩阵。
矩阵M的对角线上的元素为(1),非对角线的元素为0M0x。
1n1,是一个对称矩阵。
n1n12故样本方差:S(xix)(xx)(xx)
ni1n2
2.6 矩阵的二次型与多元正态分布
1121xM0M0xxM0xxM0x。
nnn1)矩阵的二次型(Quadratic Forms)和线性变换(linear transferring)
设P是一数域,一个系数在数域P中的x1,x2,,xn的二次齐次多项式
2
f(x1,x2,,xn)a11x12a12x1x22a1nx1xn
2
a22x22a2nx2xn
……………………………
2
annxn (1)
称为数域P上的一个n元二次型,或者,在不致引起混淆时简称二次型。例如
22x12x1x23x1x32x24x2x33x3
4
就是有理数域上的一个三元二次型,为了以后讨论上的方便,在(1)中,xixj(i<j)的系数写在2aij。而不简单地写成aij。
和在几何中一样,在处理许多其它问题时也常常希望通过变量的线性替换简化有关的二次型,为此,我们引入
定义1 设中的一级关系式
.x1,,xn;y1,,yn是两组文字,系数在数域...........P........x1c11y1c12y2c1nynxcycycy22112222nn (2)
xncn1y1cn2y2cnnyn称为由或简称线性替换,如果系数行列式
...x1,,xn,xn到.y1,,yn的一个线性替换,.......................cij0
那么线性替换(2)就称为非退化的。
.............在讨论二次型时,矩阵是一个有力的工具,因此我们先把二次型与线性替换用矩阵来表示。
令
ajiaij,
i<j
由于
xixjxjxi
所以二次型(1)可以写成
f(x1,x2,,xn)a11x12a12x1x2a1nx1xn
2
a21x2x1a22x2a2nx2xn
……………………………………
2
an1xnx1an2xnx2annxn
ai1j1nnijxixj (3)
把(3)的系数排成一个n×n矩阵
5
a11a12a1naaa222n
A21 (4)
aaan2nnn1它就称为二次型(3)的矩阵,因为aijaji,i,j1,,n,所以
AA
我们把这样的矩阵称为对称矩阵,因此,二次型的矩阵都是对称的。
...........令
x1x2
Xxn于是,二次型可以用矩阵的乘积表示出来,
XAX
a11a12a1nx1aaa222nx2
(x1,x2,,xn)21aaan2nnxnn1a11x1a12x2a1nxnaxaxxx2222nn
(x1,x2,,xn)211axaxaxn22nnnn11aijxixj
i1j1nnAX
故
f(x1,x2,,xn)X应该看到,二次型(1)的矩阵A的元素aijaji正是它的xixj项的系数的一半,因此二次型和它的矩阵是相互唯一决定的,由此还能得到,若二次型
f(x1,x2,,xn)XAXXBX
且AA,BB,则AB。
令
6
c11c12c1ny1cccy222nC21,Y2
cccn2nnynn1于是线性替换(2)可以写成
x1c11c12c1ny1xccc222ny2221
xcccn2nnynnn1或者
XCY
我们知道,经过一个非退化的线性替换,二次型还是变成二次型,现在就来看一下,替换后的二次型与原来的二次型之间有什么关系,也就是说,找出替换后的二次的矩阵与原二次型的矩阵之间的关系。
设
f(x1,x2,,xn)XAX,是一个二次型,作非退化线性替换
AA (5)
XCY (6)
我们得到一个y1,y2,,yn的二次型
YBY
现在来看矩阵B与A的关系。
把(6)代入(5),有
f(x1,x2,,xn)XAX(CY)A(CY)YCACY
Y(CAC)YYBY
容易看出,矩阵CAC也是对称的,事实上,
(CAC)CACCAC
由此,即得
BCAC
这就是前后两个二次型的矩阵的关系,与之相应,我们引入
7
定义2 数域,如果有数域..P上.n×n矩阵..A,B称为合同的..........P上可逆的....n×n矩阵..C,使
.BCAC
合同是矩阵之间的一个关系,不难看出,合同关系具有
1)反身性:AEAE;
2)对称性:由BCAC即得A(C)BC11;
AC1和A2C2A1C2即得 3)传递性:由A1C1A2(C1C2)A(C1C2)
因之,经过非退化的线性替换,新二次型的矩阵与原二次型的矩阵是合同的。这样,我们就把二次型的变换通过矩阵表示出来,为以下的探讨提供了有力的工具。
最后指出,在变换二次型时,我们总是要求所作的线性替换是非退化的。从几何上看,这一点是自然的,因为坐标变换一定是非退化的,一般地,当线性替换
XCY
是非退化时,由上面的关系即得
YC1X
这也是一个线性替换,它把所得的二次型还原。这样就使我们从所得二次型的性质可以推知原来二次型的一些性质。
1定理:若A是实对称矩阵,则存在可逆矩阵C,满足:CAC。
n2)多元正态分布
a)二元正态分布
直观上,二元正态分布是两个正态随机变量的联合分布。如果两个随机变量X1和X2的联合密度函数为
f(x1,x2)12121exp
221这里<x1,x2<,1>0,2>0,1<<1,
8
22xxxx1111112222122,
1122我们称X1和X2服从二元正态分布。通过计算可得X1和X2的边际分布分别为N(1,1)和N(2,2)。上式中的参数是X1和X2的相关系数。
如果X1和X2服从二元正态分布,那么在给定X1x1的条件下X2的条件分布也是正态的。它的条件密度函数为
2f(x2x1)~N(b,2(12))
22这里
b22(x11)
1条件均值bE[X1X2]是x1的线性函数。并且,二元正态分布具有一个独特的性质,那就是如果0,那么X1和X2是相互独立的。这是由于当0时,我们有f(x2x1)f(x2)。这对于一般的两个随机变量是不对的。
有时如果把联合概率密度函数写成矩阵的形式,则从形式上来看就简单多了。记X(X1,X2),那么二元正态概率密度函数可以写成如下的简单形式
f(x)(2)1这里
1/21exp(x)1(x)
21212x11x,,2
x22212b)多元正态分布
1g(x)(2)11/2exp(x)1(x),xRn这就是均值为协方差2矩阵为的多元正态分布,记为X~N(,)。
c)多元正态分布的二次型的分布
如果X~N(,),那么
9
Y(X)1(X)~x(2n)
这里n是X的维数。我们可以简单地证明这个结果。由于是对称可逆矩阵,那么存在一个可逆的矩阵A,使得AAI。我们有AX~N(A,I),ZA(X)~N(0,I),所以YZZ(X)1(X)~x(2n)。
2.7
幂等矩阵与二次型
1、幂等矩阵满足A2=A的矩阵称为幂等矩阵。
幂等矩阵可以是对称的,也可以是非对称的,但在我们计量统计学中,所研究的幂等矩阵都是对称的。与幂等矩阵的有关的结果有:
1)幂等矩阵的特征根要么是1,要么是零。
证明:设是A的特征根,E是特征向量,则AE=E,同时E=A=A2=E,故,从而1或0。
2)唯一满秩的对称幂等矩阵是单位矩阵。
证明:∵A2=AA(IA)0AA(IA)0IA
即除了单位矩阵外,所有幂等矩阵是奇异的。
3)A是幂等矩阵,则I-A也是幂等矩阵,且秩(A)+秩(I-A)=n。
4)对称幂等矩阵的秩等于它的迹。(为什么?)
从而我们很容易知道M0的秩。
因M0的每个对角元素都是122211100,因此tr(M)n(1)n1r(M)。
nn5)nSn的服从x(n1)分布(如果i~N(0,I),i1,n)
这是因为:nS2n202(xx)xMx和r(M0)n1。
ini11X)X X是一个n×m的矩阵,秩(X)=m 6)MIX(X则M是幂等矩阵。
10
2.8 微分及其矩阵的微分表示
1)微分的应用
微分的应用在经济学领域中被广泛地用来作近似计算。为了说明这种技巧如何运作,考虑一个例子。设P代表GDP平减指数,Y代表实际GDP,则名义GDP为P×Y,于是有:
(P×Y)变动的百分比的≈(P变动的百分比)+(Y变动的百分比);
同样一个比率变动的百分比近似地是分子变动的百分比减去分母变动的百分比。例如:设Y代表GDP,而L代表人口数,则人均GDP为Y,则:
L(Y/L)变动的百分比≈(Y变动的百分比)-(L变动的百分比)
问题1:1)上述2个近似公式在什么条件下成立?
2)推导上述两个公式
3)宏观经济中,GDP的确定由4个组成部分,即:GDP=C+I+G+NX。能否按如下公式计算GDP变动百分比:
GDP变动的百分比≈(消费C变动的百分比)+(投资I变为的百分比)+(政府购买G变动的百分比)+(净出口NX变动百分比)。
如果不能,哪边的值较大?为什么?
问题2:
In the country of Wiknam, the velocity of money is constant. Real GDP grows by 5
percent per year, the money stock grows by 14 percent per year, and the nominal
interest rate is 11 percent . What is the real interest rate?
2)计量模型的推导
带技术进步的Solow模型
假定生产函数为希克斯(Hicks)中性技术进步条件下的产出增长型函数,其一般形式Solow模型为:
YA(t)f(L,K) (1)
t对A(t)作进一步假定,令A(t)A0e,这里A0为基本的技术水平,表示由于技术进步而使产出增长的部分,称为技术进步增长率。于是(1)式变为:
YA0etf(L,K) (2)
对(2)式两边取对数并求导得到:
11
1dYLY1dLKY1dK (3)
YdtYLLdtYKKdt由于Y、L、K的实际数据都是离散的,故对(3)进行离散化,并令t1年,于是有:
YLK (4)
YLK表示产出的劳动力弹性,表示产出的资本弹性。于是(4)式实际上就是我们的科技进步贡献率的测算模型,注意到:
L/LK/K
Y/YY/YY/YL/L这里表示科技进步对产出增长的贡献率,表示劳动力增长对产出增长的贡Y/YY/YK/K献率,表示资本增长对产出增长的贡献率。从而有:
Y/YL/LK/K (5)
1Y/YY/YY/Y1(5)式就给出了技术进步贡献率的测算公式。
通过假定一定规模报酬不变,即1这一条件,比较合理有效地预防或克服了变量间可能出现的共线性。由(4)式,根据1,有:
YLKL(1)()
YLKLYLKL设D1,则有:
,D2YLKLD1D2 (6)
一般来讲,只要D1序列不存在异方差性,(6)式就是测算科技进步增长率所用的最终模型。
3、矩阵的微分
如果yf(x1,x2,,xn)或写成yf(x),那么梯度向量为
y/x1f1y/x2f2f(x)
xy/xfnn二阶偏导数矩阵为
12
2y/x1x12y/x1x22y/x1xnf2(x)2y/x2x12y/x2x22y/x2xn
xx222y/xxy/xxy/xxn1n2nn特别地,如果yaxxaaxii1ni,那么
(ax)(xa)a
xx同样地可得
AxA
x如果A是对称矩阵,那么
xAx2Ax
x一般地,有
xAx(AA)x
x思考题:
1、证明:tr(AA)ai1j1nn2ij
2、证明矩阵M0是幂等矩阵。
3、如果L1、L2…Ln的百分比变动较小L1,Ln
如果Y1、Y2…Ym的百分比变动较小Y1,Ym
则如下计算公式是否可行?
a)(L1,L2Ln)Li1ni
nY1YmmYiLi b)LLi1i1n1
13
4. 矩阵的分块(partitioned matrix)
在表述一个矩阵的元素时——如构造一个方程组——将一些元素以子矩阵的形式进行分组有时是有用的,例如,我们可以写
145A293
896
11A21AA12
A22A称为一个分块矩阵,子矩阵的下标和矩阵中的元素的下标按同样方式定义,一个普通的特殊情形是分块对角矩阵。
AA110其中A11和A22都是方阵。
分块矩阵的加法和乘法
0
A22加法和乘法可以推广到分块矩阵,对一致的分块矩阵A和B有:
AB11AB11A21B21和
A12B12 (1)
A22B22A11ABA21A12B11A22B21B12
B22A11B12A12B22 (2)
A21B12A22B22ABA12B211111A21B11A22B21其中所有矩阵必须适于所用运算,对于加法,Aij和Bij的阶数必须相同;在乘法中,对所有的数对i和j,Aij的列数必须等于Bij的行数,即矩阵相乘所必需的条件都要得到满足。
两个经常遇到的情况是如下的形式:
A1A2A1AA12A1
A2A2A1A2A2 (3)
A1和
14
A110分块矩阵的行列式
0A22A110A1100A11 (4)
A220A22A22类似于对角矩阵的行列式,分块对角矩阵的行列式可以得到
A1100A11A22 (5)
A22一个一般的2×2分块矩阵的结果为:
A11A21A121A22A11A12A22A21
A221A11A22A21A11A12 (6)
大于2×2分块矩阵的结果极其繁琐,且在我们的工作中也不必要。
分块矩阵的逆
分块对角矩阵的逆是:
A110这可由直接相乘证实。
0A2211A1100 (7)
1A22对一般的2×2分块矩阵,分块逆的一个形式是:
A11A21其中
A12A22111A11(IA12F2A21A11)1F2A21A111A11A12F2 (8)
F21F2(A22A21A11A12)1
这可以最简单地用逆去乘A来证实。由于计算的对称性,左上块可以写作:
1F1(A11A12A22A21)1
问题:请推倒上面的公式(5)、(6)、(7)和(8)。
对均值的偏差
上述内容的一个有用的应用是如下的计算:假设我们从一个n个元素的列向量x开始。且令
ixinA
2ixiixi
15
xiiiix
xx我们关心的是A-1中的右下角元素,根据(8)中F2的定义,这将是
F2[xx(xi)(ii)1(ix)]1
1
xIxiix
n1
xIiix
n[xM0x]1
所以,逆矩阵中的右下角值是
11(xM0x)11a22
i(xix)2现在,假设以含有若干列的矩阵X代替只有一列的x,我们要求[Z′Z]-1中的右下块,这里Z=[i,X],类似的结果是
(ZZ)22[XXXi(ii)1iX]1
[XM0X]1
这暗示着[Z′Z]-1的右下块,K×K矩阵是第jk元素为i(xijxj)(xikxk)的K×K矩阵的逆,这样,当一个数据矩阵含有一列1时,平方和及交叉积矩阵的逆的元素将用原始数据以对其相对应列均值的离差的形式计算得出。
16
本文发布于:2024-02-03 13:48:46,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170693932650540.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |