线性模型

作者&投稿:吴仲 (若有异议请与网页底部的电邮联系)
~ 1.线性方程与非线性方程

线性方程:代数方程如y = 2x + 5,其中任何一个变量都为1次幂,这种方程的图像为一条直线(平面),所以称为线性方程

非线性方程:y**2 = 2x + 5,因变量和自变量之间不是线性关系,如平方关系、对数关系、指数关系和三角函数关系等

2.基本形式

给定有m个属性描述的实例x=(x1,x2...,xm),其中xi是x在第i个属性上的取值,线性模型(linear model)试图学得一个通过属性组合的线性组合来进行预测的函数,即

                                               f(x) = w1*x1 + w2*x2 +...+ wm*xm + b

线性模型形式简单、易于建模,但却蕴涵着机器学习中一些重要的基本思想。许多功能更为强大的非线性模型可以在线性模型的基础上通过引入层级结构或高维映射而得。

3.线性回归

线性模型试图学得f(x) = w*x + b,使得f(x)约等于y,如何确定w和b呢?这是一个组合问题,已知一些数据,如何求里面的未知参数,给出一个最优解。这是一个线性矩阵方程,直接求解很可能无法求解,有唯一解的数据集更是微乎其微,基本上都是解不存在的超定方程组。在这种情况下,我们将参数求解问题转化为误差最小化问题,求出一个最接近的解,这就是一个松弛求解。

均方误差作为回归任务中最常用的性能度量,因此我们可以试图让均方误差最小化,即

基于均方误差最小化来进行线性模型的求解方法称为“最小二乘法”。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧式距离之和最小。求解w和b使均方误差最小化的过程,称为线性回归模型的最小二乘“参数估计(parameterestimation)”。更一般的样本由d个属性描述,此时称为多元线性回归

第一步:把w和b吸收入向量形式w=(w,b),相应的把数据集D表示为一个m*(d+1)大小的矩阵X,其中每一行对应一个示例,改行的前d个元素对应于示例的d个属性值,最后一个元素恒置为1,当为满秩矩阵(full-rank matrix)或正定矩阵(positivedefinite matrix)时,有

然而,现实任务中往往不是满秩矩阵,例如在许多任务中我们会遇到大量的变量,其数目甚至超过样例数,导致矩阵的列数多余行数,此时可以解出多个w,他们都能使均方误差最小化,选择哪一个解作为输出,将由学习算法的归纳偏好决定,常见的做法是引入正则化。

4.对数线性回归

                                                                      lny = wx + b

它实际上是在试图让e**(wx + b)逼近y,这里的对数函数起到了将线性回归模型预测的预测值与真实值标记联系起来的作用。

5.对数几率回归

将回归模型应用到分类模型中:找一个单调可微函数将分类标记y与线性回归模型的预测值联系起来。利用对数几率函数(logistic function)

                                                             y = 1/[1+e**-(wx + b)]

                                                               ln[y/(1-y)] = wx + b

若将y视为样本为正例的可能性,1-y视为样本为负例的可能性,两者的比值y/(1-y)称为几率(odds),反应了样本为正例的相对可能性,对几率取对数则得到对数几率(log odds,亦称为logit)。虽然模型名字叫对数几率回归,但实际是一种分类算法,算法的主要优点有:直接对分类的可能性建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题;它不仅预测类别,而是预测概率可以帮助决策;几率函数是任意阶可导的凸函数有很好的数学性质,现有的许多数值优化算法都可以直接用于求解最优解。

1.在什么情况下线性回归不必考虑偏置项b?

偏置项b(或者说是常数项)的变化体现出来的就是拟合曲线的上下整体浮动,可以看做是其他各个解释变量留下的bias的线性修正。因此在线性拟合过程中是需要考虑偏置项的。

如果目标变量的均值为0则不需要包含截距,那么我们对目标变量做减去均值向量(做“趋中化”sum(x)-m*mean(sum(x)) == 0)处理和标准化(把变量都进行“趋中化”处理,得到一个标准正态分布,都是经过零点的,这样会消除截距项)处理也不用包含截距。不过,我们一般都是看非标准化的统计结果,解释不同变量的偏作用。

2.利用多元回归的依据和理由一般是什么?

回归并不单单是一种方法,更是一种思想,关于因果关系的一种解释。无论是计量经济学,还是社会学等其他学科里面的因果解释,本质上的方法都是回归。因为,影响某一个事件的原因可能有许许多多,而并非单一原因,所以,在具体分析中,肯定不会使用一元。举个例子时间序列,逻辑模型,概率模型,无一例外都是用的GLS或者OLS,或者就是OLS衍生出来的其他模型,都是建立在最小二乘法基础上的。

3.证明,对于参数w,对数回归的目标函数是非凸的,但其对数似然函数是凸的。

解:要证明一个函数为凸函数可从以下两个方面考虑

1.其二阶导恒大于等于0

2.f[(x1+x2)/2]>=[f(x1)+f(x2)]/2

a)对数回归目标函数





取y对x的微分(),得:

取y对x二阶微分,得:

其二阶微分在y取(0.5,1)时小于0,因此其为非凸函数。

b)为方便表述向量转置符号忽略,令x=(x:1),x=xi,y=yi

则对数几率的对数似然函数

对其求一阶导,得:

对其求二阶导,得:

其个项均大于等于0,所以其为凸函数。


什么是线性回归模型
给定一个变量y和一些变量X1,...,Xp,这些变量有可能与y相关,线性回归分析可以用来量化y与Xj之间相关性的强度,评估出与y不相关的Xj,并识别出哪些Xj的子集包含了关于y的冗余信息。 问题二:线性回归模型和非线性回归模型的区别是什么 线性回归模型和非线性回归模型的区别是: 线性就是每个变量的指数都是1,而非...

为什么广义相加模型比线性回归效果好?
当我们结合光滑惩罚时,我们会惩罚模型中的复杂度,这有助于减少过度拟合。 请点击输入图片描述 6广义相加模型(GAM) 广义加性模型(GAM)(Hastie,1984)使用光滑函数(如样条曲线)作为回归模型中的预测因子。这些模型是严格可加的,这意味着我们不能像正常回归那样使用交互项,但是我们可以通过重新参数化作为一个更光滑的...

对性染色体进行关联分析
-frequentist 指的是用的模型。模型可选加性模型、显性模型、隐性模型、常规模型、杂合子模型。分别用1,2,3,4,5表示。 1=Additive, 2=Dominant, 3=Recessive, 4=General and 5=Heterozygote -pheno 指的是所分析的表型列名。报错1:!! Error: (genfile::DuplicateIndividualError) A duplicate ...

统计模型有哪些
三、时间序列模型 时间序列模型主要用于分析具有时间顺序的数据。它通过提取时间序列数据中的趋势、周期和季节性成分,对未来趋势进行预测。时间序列模型广泛应用于经济预测、销售预测等领域。四、广义线性模型 广义线性模型是一种扩展的线性回归模型,可以处理响应变量和解释变量之间的非线性关系。它通过引入非...

什么是精细加工可能性模式?
详尽可能性模型简介详尽可能性模型(ELM)是由心理学家理查德·E.派蒂(Richard E.Petty) 和约翰·T.卡乔鲍(John T.Cacioppo)提出的。是消费者信息处理中最有影响的理论模型。根据这一模型信息处理和态度改变的一个基本量纲是信息处理的深度和数量。ELM模型的基本原则是:不同的说服方法...

全基因组选择的模型汇总(转载)
GCA模型可以基于GBLUP,重点在基因型亲缘关系矩阵构建。SCA模型有两种方法:一是将杂优SNP位点的Panel作为固定效应整合进GBLUP模型中;二是使用非线性模型,如贝叶斯和机器学习方法。据报道,对于加性模型的中低遗传力性状,机器学习和一般统计模型比较一致。但在非加性模型中,机器学习方法表现更优。 传统的GS模型往往只针对...

有没有对数线性混合模型
有的,对数线性混合模型描述的是概率与协变量之间的关系;对数线性模型也用来描述期望频数与协变量之间的关系。对数线性混合模型的统计检验 饱和对数线性模型可以完美无缺的再现观测频数,因此不需要对饱和模型进行整体性检验。 DF等于0,意味着所检验的模型与饱和模型之间的效应项目没有差别。 已赞过 已踩过< 你对这个...

新经济增长模型 经济增长模型有哪些
2.外部性模型。既不放弃资本收益递减假定和完全竞争,又能产生内生增长的经济增长模型,是以外部性和知识溢出为基础的增长模型。它在经济增长理论中具有较长的研究传统,也是第一轮内生增长模型的核心,在增长理论文献中占有重要的位置。这类增长模型的基本特征是:其一,技术进步、知识积累或人力资本积累是其他经济活动的...

一致性是什么意思?
数据一致性通常指关联数据之间的逻辑关系是否正确和完整。而数据存储的一致性模型则可以认为是存储系统和数据使用者之间的一种约定。如果使用者遵循这种约定,则可以得到系统所承诺的访问结果 常用的一致性模型有:a、严格一致性(linearizability, strict\/atomic Consistency):读出的数据始终为最近写入的数据。

需求结构模型包括
前瞻性模型由美国学者Terry.L.leap和Michael D.Crino提出的,在现有需求满足的情况下,员工也可能会因为工作调动做、职位晋升、工作要求变化等原因提出培训的要求,前瞻性培训需求分析模型为这些提供了预判。这个模型的优点在于,对员工的发展做了充分的考虑,但是在现在瞬息万变的市场环境下,对于组织的战略...

长岛县17621544297: 线性模型 - 搜狗百科
庞奇迪克: 1、广义线性模型GLM很简单,举个例子,物的疗效和物的剂量有关.这个相关性可能是多种多样的,可能是简单线性关系(发烧时吃一片退烧0.1度,两片退烧0.2度,以此类推;这种情况就是一般线性模型),也可能是比较复杂的其他关系,...

长岛县17621544297: 二极管的直流等效模型中的线性模型是怎么回事 -
庞奇迪克: 二极管的直流等效模型,就是在直流电路中,以一个与二极管的电路效应相同的假想负载来分析电路的模型.二极管是一个非线性元件,对于非线性电路的分析与计算是比较复杂的.为了使电路的分析简化,可以用线性元件组成的电路来模拟二...

长岛县17621544297: 线性模型和非线性模型的区别,以及激活函数的作用 -
庞奇迪克: 线性回归模型和非线性回归模型的区别是: 线性就是每个变量的指数都是1,而非线性就是至少有一个变量的指数不是1.通过指数来进行判断即可.线性回归模型,是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量...

长岛县17621544297: 广义线性模型的介绍 -
庞奇迪克: 《广义线性模型》由四本介绍线性模型的小册子组成,它们分别是《广义线性模型导论》、《应用logistic回归分析》、《定序因变量的logistic回归模型》以及《logit与probit:次序模型和多类别模型》.《广义线性模型》集中介绍了社会学研究分析方法中的一个非常有效且重要的数据分析方法,即线性模型.作者通过阐释广义线性模型的概念、基本原则,探讨了从线性模型推广至其他模型的可能路径,并举例比较了不同模型的拟合优度,为读者全面掌握线性模型分析法提供了一个可行的指南.

长岛县17621544297: 以一元回归模型为例,写出线性模型,双对数模型以及两个半对数模型,并对解释变量的系数的经济意义加以解释 -
庞奇迪克:[答案] 1、一元线性回归:y=a+b*x+u,x每增加1个单位,y平均增加b个单位; 2、双对数模型:lny=a+b*lnx+u,x每增加1%,y平均增加b%; 3、半对数模型:y=a+b*lnx+u,x每增加1%,y平均增加b个单位; 4、半对数模型:lny=a+b*x+u,x每增加1个单位,y平均增加...

长岛县17621544297: 什么是线性回归模型 -
庞奇迪克: 实验数据是离散的,用一线性方程式逼近数据,此线性方程式就是线性回归模型.

长岛县17621544297: 线性规划模型的共同特征各项之间如何取得联系? -
庞奇迪克: 线性规划问题的形式特征,三个要素组成:1、变量或决策变量; 2、目标函数; 3、约束条件. 求解线性规划问题的基本方法是单纯形法,已有单纯形法的标准软件,可在电子计算机上求解约束条件和决策变量数达 10000个以上的线性规划问...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网