首页技术文章正文

机器学习的关键元素介绍【大数据培训】

更新时间:2022年12月22日 15时09分07秒 来源:黑马程序员

                                               先复习下监督学习的关键概念:模型(model)、参数(parameters)、目标函数(objective function)模型就是所要学习的条件概率分布或者决策函数,它决定了在给定特征向量x时如何预测出目标y。

定义任意x(属于R)为训练集中的第i个训练样本,则线性模型(linear mode)可以表示为:

1566530282827_机器学习元素1.png


模型预测的分数y^i在不同的任务中有不同的解释。例如在逻辑回归任务中,

1566530300143_机器学习元素1.5.png

表示模型预测为正例的概率;而在排序学习任务中, 表示排序分。

参数就是我们要从数据中学习得到的内容。模型通常是由一个参数向量决定的函数。例如:线性模型的参数可以表示为:


1566530316429_机器学习元素2.png

目标函数通常定义为如下形式:

1566530333514_机器学习元素3.png

其中, 1566530344486_3.5.png是损失函数,用来衡量模型拟合训练数据的好坏程度;1566530358483_3.6.png 称之为正则项,用来衡量学习到的模型的复杂度。训练集上的损失(Loss)定义为:

1566530374586_机器学习元素4.png

常用的损失函数有平方损失(square loss):

1566530384953_机器学习元素5.png

logistic 损失:

1566530399905_机器学习元素6.png

常用的正则项有L1范数:

1566530412339_机器学习元素7.png

常用的正则项有L2范数:

1566530429111_机器学习元素8.png


Ridge regression就是指使用平方损失和L2范数正则项的线性回归模型;
Lasso regression就是指使用平方损失和L1范数正则项的线性回归模型;
逻辑回归(Logistic regression)指使用logistic损失和L2范数或L1范数正则项的线性模型

目标函数之所以定义为损失函数( )和正则项( )两部分,是为了尽可能平衡模型的偏差和方差(Bias Variance Trade-off)

最小化目标函数意味着同时最小化损失函数和正则项,损失函数最小化表明模型能够较好的拟合训练数据,一般也预示着模型能够较好地拟合真实数据(groud true)

另一方面,对正则项的优化鼓励算法学习到较简单的模型,简单模型一般在测试样本上的预测结果

比较稳定、方差较小(奥坎姆剃刀原则)。也就是说,优化损失函数尽量使模型走出欠拟合的状态,优化正则项尽量使模型避免过拟合。

从概念上区分模型、参数和目标函数给学习算法的工程实现带来了益处,使得机器学习的各个组成部分之间耦合尽量松散。





黑马中级程序员课程


推荐了解热门学科

java培训Python人工智能Web前端培训PHP培训
智能机器人软件开发影视制作培训C++培训产品经理培训
UI设计培训新媒体培训产品经理培训Linux运维
大数据培训



以下是黑马程序员热门视频教程,欢迎学习关注!


Python入门教程完整版(懂中文就能学会)【点击】

零起点打开Java世界的大门【点击】
C++| 匠心之作 从0到1入门学编程【点击】

PHP|零基础入门开发者编程核心技术【点击】
Web前端入门教程_Web前端html+css+JavaScript【点击】

软件测试入门到精通【点击】
分享到:
在线咨询 我要报名
和我们在线交谈!