热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习(六)——l1,l2正则化以及ElasticNet

1.RidgeRegression上图的公式后面是惩罚项,用来保证泛化能力的;前面是我们的损失函数,用来保证我们的拟合效果的,

1. Ridge Regression

在这里插入图片描述
上图的公式 +后面是惩罚项,用来保证泛化能力的;+ 前面是我们的损失函数,用来保证我们的拟合效果的,而α是一个参数,用来让你决定更看重正确性还是泛化性,|| | |这个代表加和,即w0+w1+…
对于泛化性和正确性的评估:
当我们有数据时,把它分为两部分,训练集和测试集,一般训练集比较多
正确性:通过模型对训练集里的数据求一下正确性,看拟合程度怎么样
泛化性:通过模型对测试集里的数据来看正确性怎么样,

代码实现1:
官网:https://scikit-learn.org/stable/modules/linear_model.html#ridge-regression

import numpy as np
from sklearn.linear_model import Ridge
from sklearn.linear_model import SGDRegressorX = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)ridge_reg = Ridge(alpha=1, solver='auto')
ridge_reg.fit(X, y)
# 预测
print(ridge_reg.predict([[1.5]]))
# 截距
print(ridge_reg.intercept_)
# 参数
print(ridge_reg.coef_)

我们来看一下Ridge的参数:
在这里插入图片描述
alpha:就是惩罚项里的参数,用来决定更看重正确性还是泛化性
fit_intercept :截距,如果为true,则会产生w0
normalize: 是否归一化
max_inter:最大迭代次数
tol:阈值,就是用来控制梯度的,当梯度小于阈值后就收敛停止了,当到达最大迭代次数后,不管有没有小于阈值都会认为收敛了,停止了
solver:用什么方法

auto:根据你的数据自动为你选择最优的方法
svd:就是之前讲过的通过线性代数把答案解出来
sag:随机梯度下降
…还有几个方法,自己去看

结果:
在这里插入图片描述
从结果我们发现,这次没有x0,但是它还是把w0算出来了,这就是因为上面说的fit_intercept=True的作用

代码2:

import numpy as np
from sklearn.linear_model import Ridge
from sklearn.linear_model import SGDRegressorX = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)# ridge_reg = Ridge(alpha=1, solver='auto')
# ridge_reg.fit(X, y)
ridge_reg = SGDRegressor(penalty='l2')
ridge_reg.fit(X, y.ravel())
# 预测
print(ridge_reg.predict([[1.5]]))
# 截距
print(ridge_reg.intercept_)
# 参数
print(ridge_reg.coef_)

我们来看一下SGDRegressor的参数:
在这里插入图片描述
loss=“squared_loss” 平方均值损失
SGDRegressor的方法可以做到和Ridge一样,只要指定penalty=" l2 ",它还可以做另三种,自己取源码中看啊

y.ravel()把列向量拉平变成行向量

结果:
在这里插入图片描述

2. Lasso

在这里插入图片描述
代码实现:也是有两种方法

import numpy as np
from sklearn.linear_model import Lasso
from sklearn.linear_model import SGDRegressorX = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)ridge_reg = Lasso(alpha=0.15)
ridge_reg.fit(X, y)
# 预测
print(ridge_reg.predict([[1.5]]))
# 截距
print(ridge_reg.intercept_)
# 参数
print(ridge_reg.coef_)
ridge_reg = SGDRegressor(penalty='l1')
ridge_reg.fit(X, y.ravel())
# 预测
print(ridge_reg.predict([[1.5]]))
# 截距
print(ridge_reg.intercept_)
# 参数
print(ridge_reg.coef_)

3. Elastic-Net

在这里插入图片描述
它就是一个模型,既包含l1,又包含l2,当你不知道用里正则化还是l2的时候可以用Elastic Net,实际上用l1还是l2取决于你的需求。
有个有意思的特点:l1 会使w有的接近于0,有的接近于1;l2使w整体偏小

上图的公式我们也能看出来它结合了Ridge 和 Lasso两个公式,其中ap决定 l1 的权重,a(1-p)/2 决定l2 的权重

代码实现:

import numpy as np
from sklearn.linear_model import ElasticNet
from sklearn.linear_model import SGDRegressorX = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)elastic_net = ElasticNet(alpha=0.0001, l1_ratio=0.15)
elastic_net.fit(X, y)
# 预测
print(elastic_net.predict([[1.5]]))ridge_reg = SGDRegressor(penalty='elasticnet', n_iter=1000)
ridge_reg.fit(X, y.ravel())
# 预测
print(ridge_reg.predict([[1.5]]))

4. 总结

在这里插入图片描述


推荐阅读
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程,将每个考题分配给3个独立的专家,如果他们的评分不一致,则需要请一位裁判做出最终决定。文章详细描述了评分规则,并给出了解决该问题的程序。 ... [详细]
  • 本文介绍了P1651题目的描述和要求,以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术,将问题转化为求解差值的问题,并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • Linux重启网络命令实例及关机和重启示例教程
    本文介绍了Linux系统中重启网络命令的实例,以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法,以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]
  • 本文介绍了一个Java猜拳小游戏的代码,通过使用Scanner类获取用户输入的拳的数字,并随机生成计算机的拳,然后判断胜负。该游戏可以选择剪刀、石头、布三种拳,通过比较两者的拳来决定胜负。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • 本文讨论了如何优化解决hdu 1003 java题目的动态规划方法,通过分析加法规则和最大和的性质,提出了一种优化的思路。具体方法是,当从1加到n为负时,即sum(1,n)sum(n,s),可以继续加法计算。同时,还考虑了两种特殊情况:都是负数的情况和有0的情况。最后,通过使用Scanner类来获取输入数据。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • 本文详细介绍了Java中vector的使用方法和相关知识,包括vector类的功能、构造方法和使用注意事项。通过使用vector类,可以方便地实现动态数组的功能,并且可以随意插入不同类型的对象,进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下,使用vector类是一个很好的选择。 ... [详细]
  • 本文讨论了在openwrt-17.01版本中,mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下,而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等,生成后的mac地址会保存在/etc/config/network下。 ... [详细]
author-avatar
天勤-科技
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有