首页 范文大全 古典文学 职场知识 中国文学 公文书信 外国名著 寓言童话 百家讲坛 散文/诗歌 美文欣赏 礼仪知识 民俗风情
  • 范文大全
  • 古典文学
  • 职场知识
  • 中国文学
  • 公文书信
  • 外国名著
  • 寓言童话
  • 百家讲坛
  • 散文/诗歌
  • 美文欣赏
  • 礼仪知识
  • 民俗风情
  • 谜语大全
  • 名言警句
  • 二元选择(Probit&Logit)模型.doc

    时间:2021-02-05 15:11:00 来源:蒲公英阅读网 本文已影响 蒲公英阅读网手机站

    相关热词搜索:模型 选择 Logit

     硕士研究生课程作业

     作业题目: 二元选择模型分析

      作业类型:

     模型分析

      课程名称: 中级计量经济学

      授课老师: 崔百胜

      专业班级: 5 15 级应用统计 5 5 班

      研究生姓名: 谢亚利

      研究生学号: 152502732

      完成时间 2015

     年

     11

     月

      二元选择(Probit 及 logit)模型

     通常,经济计量模型都是假定隐变量是连续的,但是在现实经济决策中经常面临许多选择问题,即为离散选择模型。最为基础的便是二元选择模型其研究目的是研究具有给定特征得个体做某种而不做另一种选择的概率。

     如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。

     以下是常用得 Probit 及 logit 模型、实例分析并进行 Eviews 实现。

     一、二元选择模型原理:

      为了深刻地理解二元选择模型,首先从最简单的线性概率模型开始讨论。线性概率模型的回归形式为:

     i ki k i i iu x x x y         2 2 1 1

      (1)

     其中:N 是样本容量;k 是解释变量个数;xj 为第 j 个个体特征的取值。例如,x1 表示收入;x2 表示汽车的价格;x3 表示消费者的偏好等。设 yi 表示取值为 0 和 1 的离散型随机变量:

      择(如不买车)

     如果作出的是第二种选择(如买车)

     如果作出的是第一种选01iy 式(1)中 ui 为相互独立且均值为 0 的随机扰动项。

     i i i ip y P y P y E        ) 0 ( 0 ) 1 ( 1 ) (

     (2)

     令 pi = P ( yi =1) ,那么 1 - pi = P ( yi =0) ,于是

     又因为 E(ui ) = 0 ,所以 E(yi ) = xi xi =(x1i , x2i ,…, xki ),

     ( i=1 ,2 ,…, k ),从而有下面的等式:

     β x ii i ip y P y E     ) 1 ( ) (

      (3)

      式(3)只有当 xi

     的取值在(0,1)之间时才成立,否则就会产生矛盾,而在实际应用时很可能超出这个范围。因此,线性概率模型常常写成下面的形式:

      0 , 01 , 11 0 ,β xβ xβ x β xiii iip

     (4)

     此时就可以把因变量看成是一个概率。

     那么扰动项的方差为:

     )] ( 1 )[ ( ) (2 2i i i iy E y E u E    

      (5) 或 ) 1 ( ) 1 ( ) ( ) 1 ( ) (2 2 2i i i i i i ip p p p u E        β x β x

     (6)

      由此可以看出,误差项具有异方差性。异方差性使得参数估计不再是有效的,修正异方差的一个方法就是使用加权最小二乘估计。但是加权最小二乘法无法保证预测值ŷ在(0,1)之内,这是线性概率模型一个严重的弱点。由于上述问题,我们考虑对线性概率模型进行一些变换,由此得到下面要讨论的模型。

      假设有一个未被观察到的潜在变量 yi*,它与 xi 之间具有线性关系,即 * *i i iu y   β x

      (7)

     其中:

     ui*是扰动项。yi 和 yi*的关系如下:

     0 00 1**iiiyyy

      (8)

      yi*大于临界值 0 时,yi =1;小于等于 0 时,yi =0。这里把临界值选为 0,但事实上只要 xi 包含有常数项,临界值的选择就是无关的,所以不妨设为 0。这样 ) ( ) ( ) 0 ( ) , | 0 () ( 1 ) ( ) 0 ( ) , | 1 (* ** *β x β x β xβ x β x β xi i i i i ii i i i i iF u P y P y PF u P y P y P               

      (9)

      其中:F 是 ui*的分布函数,要求它是一个连续函数,并且是单调递增的。因此,原始的回归模型可以看成如下的一个回归模型:

      i i iu F y     β x 1

     (10) 即 yi 关于它的条件均值的一个回归。

      根据分布函数 F 的不同,即可确定不同的类型。

     二、研究模型分析:

     1.Probit 模型:

     如果将 F 定义为标准正态分布函数, dz X X Y PiXi i i)2z(- exp21) ( ) | 1 (2""    

     (11)

     ) (" iX 会把概率取值限定在 0、1 之间,此时的概率模型为 Probit 模型。

     2.Logit 模型:

     如果把 F 定义为 Logistic 分布函数,则产生的概率模型为 Logit 模型:

     ) ( exp 1) ( exp) ( ) | 1 ("""iii i iXXX X Y P   

     (12)

      二、实例分析:

     例如书中 7.1: Eviews 实现:

     第一步,导入表 7.2 数据; 第二步,选择模型; (1)Probit 模型

     图 1 (2)Logit 模型:

     图 2 第三步,分析结果:

     (1)Probit 模型

     图 3

     Probit 模型参数分析表

      参数估计结果的上半部分包含与一般的回归结果类似的基本信息,标题包含关于估计方法(ML 表示极大似然估计)和估计中所使用的样本的基本信息,也包括达到收敛要求的迭代次数(4 次)。和计算系数协方差矩阵所使用方法的信息。在其下面显示的是系数的估计、渐近的标准误差、z-统计量、P 值及各种有关统计量。

     当分布函数采用标准正态分布,即得到解释变量 GPA(X1)、TUCE(X2)、PSI(X3)对因变量 GRADE 的 Probit 模型:

     3 2 1*426332 . 1 051729 . 0 625810 . 1 452320 . 7ˆX X X Y     

      (13)

     (2)Logit 模型:

      图 4

     Probit 模型参数分析表

     分布函数采用逻辑分布,即 Logit 模型为:

     3 2 1*379 . 2 095 . 0 826 . 2 021 . 13ˆX X X Y     

     注:

     其他的数据说明如下:

     ① log likelihood 是对数似然函数的最大值 L(b),b 是未知参数的估计值。

     ② Avg. log likelihood 是用观察值的个数 N 去除以对数似然函数 L(b) ,即对数似然函数的平均值。

     ③ Restr. Log likelihood 是除了常数以外所有系数被限制为 0 时的极大似然函数 L(b) 。

     ④ LR统计量检验除了常数以外所有系数都是0的假设,这类似于线性回归模型中的统计量,测试模型整体的显著性。圆括号中的数字表示自由度,它是该测试下约束变量的个数。

     ⑤ Probability(LR stat)是 LR 检验统计量的 P 值。在零假设下,LR 检验统计量近似服从于自由度等于检验下约束变量的个数的2 分布。

     此题中 P<0.01,则得到:此模型整体比较显著。

     ⑥ McFadden R-squared 是计算似然比率指标,正像它的名字所表示的,它同线性回归模型中的 R2 是类似的。它具有总是介于 0 和 1 之间的性质。

     可用标准化残差序列图来检验模型的充分性(程序 2 见附件):

     以 Logit 模型为例:

     首先,用 Eviews 计算出标准化残差:

      其次利用 SAS 做出标准化残差序列图如下:

     图 5 标准化残差序列图

     从而可以看出,标准化残差介于-3~3 之间,此模型较为充分。

     以 Probit 模型为例,对假设进行检验:

     对于 Probit 模型:利用其系数,本例按如下公式给出新教学法对学习成绩影响的概率,

      当 PSI = 0 时:( 938 . 212 X )

     ) 938 . 21 0517 . 0 6258 . 1 4523 . 7 ( ) 1 P(1*       X Y

     (14 )

      当 PSI = 1 时:

     ) 4263 . 1 938 . 21 0517 . 0 6258 . 1 4523 . 7 ( ) 1 P(1*        X Y

      (15)

     可用 SAS 做出新教学法对学习成绩的影响概率图:(程序 1 见附件)

     图 6 新教学法对学习成绩的影响概率

     由图 6 得,PSI 对学习成绩影响的概率重大,接受新教学法成绩改善的概率明显高于不接受的概率。

     四、检验与预测:

     以 Logit 模型为例:

     1、进行拟合优度检验:

     首先,进行 Eviews 操作:

      其次,结果分析:

     图 7

     Logit 模型拟合优度检验分析表

     最下方给出了 H-L 和 Andrews 检验的 x2 统计量。由相伴概率的 P 值可以看出,在 5%的显著性水平下,不能拒绝原假设,因而认为模型的拟合优度很高,拟合效果很好。

     2、预测:

     图 8

     Logit 模型预测表

     由此图,可进行其他新的数学方法对成绩的有效性预测。

     附件:

     程序 1 data a; input GPA @@; P0=probnorm(- 7.4523+ 1.6258*GPA+ 0.0517* 21.938); P1=probnorm(- 7.4523+ 1.6258*GPA+ 0.0517* 21.938+ 1.42); cards; 2.06 2.39 2.63 2.66 2.67 2.74 2.75 2.76 2.83 2.83 2.86 2.87 2.89 2.89 2.92 3.03 3.1 3.12 3.16 3.26 3.28 3.32 3.39 3.51 3.53 3.54 3.57 3.62 3.65 3.92 4 4 ; proc sgplot; series x=GPA y=P0; series x=GPA y=P1; inset"PSI=0"/position=bottom;

     run; 程序 2: data b; input i r; cards; 1 -0.165238224 2 -0.251526619 3 -0.480005922 4 -0.16306554 5 0.868743639 6 -0.190045398 7 -0.16500196 8 -0.233156259 9 -0.353581213 10 0.664783839 11 -0.158379892 12 -0.484318071 13 -0.689527056 14 2.043449136 15 -0.751611958 16 -0.176417596 17 -0.238044453 18 -0.200342611 19 -1.199277332 20 0.716484213 21 -0.255713052 22 0.324282103 23 -0.564681585 24 -2.400189277 25 0.43920824 26 1.038473506 27 0.757469984 28 -0.665925583 29 0.433665696 30 0.240458276 31 -1.060033344 32 2.829577106 ; p p roc sgplot; series x=i y=r; run;

    • 范文大全
    • 职场知识
    • 精美散文
    • 名著
    • 讲坛
    • 诗歌
    • 礼仪知识