机器学习（六）——l1，l2正则化以及ElasticNet

作者：天勤-科技 | 来源：互联网 | 2023-09-18 14:20

1.RidgeRegression上图的公式后面是惩罚项，用来保证泛化能力的；前面是我们的损失函数，用来保证我们的拟合效果的，

1. Ridge Regression

在这里插入图片描述
上图的公式 &＃43;后面是惩罚项&＃xff0c;用来保证泛化能力的&＃xff1b;&＃43; 前面是我们的损失函数&＃xff0c;用来保证我们的拟合效果的&＃xff0c;而α是一个参数&＃xff0c;用来让你决定更看重正确性还是泛化性&＃xff0c;|| | |这个代表加和&＃xff0c;即w0&＃43;w1&＃43;…
对于泛化性和正确性的评估&＃xff1a;
当我们有数据时&＃xff0c;把它分为两部分&＃xff0c;训练集和测试集&＃xff0c;一般训练集比较多
正确性&＃xff1a;通过模型对训练集里的数据求一下正确性&＃xff0c;看拟合程度怎么样
泛化性&＃xff1a;通过模型对测试集里的数据来看正确性怎么样&＃xff0c;

代码实现1&＃xff1a;
官网&＃xff1a;https://scikit-learn.org/stable/modules/linear_model.html#ridge-regression

import numpy as np from sklearn.linear_model import Ridge from sklearn.linear_model import SGDRegressorX &＃61; 2 * np.random.rand(100, 1) y &＃61; 4 &＃43; 3 * X &＃43; np.random.randn(100, 1)ridge_reg &＃61; Ridge(alpha&＃61;1, solver&＃61;&＃39;auto&＃39;) ridge_reg.fit(X, y) # 预测 print(ridge_reg.predict([[1.5]])) # 截距 print(ridge_reg.intercept_) # 参数 print(ridge_reg.coef_)

我们来看一下Ridge的参数&＃xff1a;
在这里插入图片描述
alpha&＃xff1a;就是惩罚项里的参数&＃xff0c;用来决定更看重正确性还是泛化性
fit_intercept &＃xff1a;截距&＃xff0c;如果为true&＃xff0c;则会产生w0
normalize&＃xff1a; 是否归一化
max_inter&＃xff1a;最大迭代次数
tol&＃xff1a;阈值&＃xff0c;就是用来控制梯度的&＃xff0c;当梯度小于阈值后就收敛停止了&＃xff0c;当到达最大迭代次数后&＃xff0c;不管有没有小于阈值都会认为收敛了&＃xff0c;停止了
solver&＃xff1a;用什么方法

auto&＃xff1a;根据你的数据自动为你选择最优的方法
svd&＃xff1a;就是之前讲过的通过线性代数把答案解出来
sag&＃xff1a;随机梯度下降
…还有几个方法&＃xff0c;自己去看

结果&＃xff1a;
在这里插入图片描述
从结果我们发现&＃xff0c;这次没有x0&＃xff0c;但是它还是把w0算出来了&＃xff0c;这就是因为上面说的fit_intercept&＃61;True的作用

代码2&＃xff1a;

import numpy as np from sklearn.linear_model import Ridge from sklearn.linear_model import SGDRegressorX &＃61; 2 * np.random.rand(100, 1) y &＃61; 4 &＃43; 3 * X &＃43; np.random.randn(100, 1)# ridge_reg &＃61; Ridge(alpha&＃61;1, solver&＃61;&＃39;auto&＃39;) # ridge_reg.fit(X, y) ridge_reg &＃61; SGDRegressor(penalty&＃61;&＃39;l2&＃39;) ridge_reg.fit(X, y.ravel()) # 预测 print(ridge_reg.predict([[1.5]])) # 截距 print(ridge_reg.intercept_) # 参数 print(ridge_reg.coef_)

我们来看一下SGDRegressor的参数&＃xff1a;
在这里插入图片描述
loss&＃61;“squared_loss” 平方均值损失
SGDRegressor的方法可以做到和Ridge一样&＃xff0c;只要指定penalty&＃61;" l2 "&＃xff0c;它还可以做另三种&＃xff0c;自己取源码中看啊

y.ravel()把列向量拉平变成行向量

结果&＃xff1a;
在这里插入图片描述

2. Lasso

在这里插入图片描述
代码实现&＃xff1a;也是有两种方法

import numpy as np from sklearn.linear_model import Lasso from sklearn.linear_model import SGDRegressorX &＃61; 2 * np.random.rand(100, 1) y &＃61; 4 &＃43; 3 * X &＃43; np.random.randn(100, 1)ridge_reg &＃61; Lasso(alpha&＃61;0.15) ridge_reg.fit(X, y) # 预测 print(ridge_reg.predict([[1.5]])) # 截距 print(ridge_reg.intercept_) # 参数 print(ridge_reg.coef_) ridge_reg &＃61; SGDRegressor(penalty&＃61;&＃39;l1&＃39;) ridge_reg.fit(X, y.ravel()) # 预测 print(ridge_reg.predict([[1.5]])) # 截距 print(ridge_reg.intercept_) # 参数 print(ridge_reg.coef_)

3. Elastic-Net

在这里插入图片描述
它就是一个模型&＃xff0c;既包含l1&＃xff0c;又包含l2&＃xff0c;当你不知道用里正则化还是l2的时候可以用Elastic Net&＃xff0c;实际上用l1还是l2取决于你的需求。
有个有意思的特点&＃xff1a;l1 会使w有的接近于0&＃xff0c;有的接近于1&＃xff1b;l2使w整体偏小

上图的公式我们也能看出来它结合了Ridge 和 Lasso两个公式&＃xff0c;其中ap决定 l1 的权重&＃xff0c;a&＃xff08;1-p&＃xff09;/2 决定l2 的权重

代码实现&＃xff1a;

import numpy as np from sklearn.linear_model import ElasticNet from sklearn.linear_model import SGDRegressorX &＃61; 2 * np.random.rand(100, 1) y &＃61; 4 &＃43; 3 * X &＃43; np.random.randn(100, 1)elastic_net &＃61; ElasticNet(alpha&＃61;0.0001, l1_ratio&＃61;0.15) elastic_net.fit(X, y) # 预测 print(elastic_net.predict([[1.5]]))ridge_reg &＃61; SGDRegressor(penalty&＃61;&＃39;elasticnet&＃39;, n_iter&＃61;1000) ridge_reg.fit(X, y.ravel()) # 预测 print(ridge_reg.predict([[1.5]]))

4. 总结

在这里插入图片描述

推荐阅读

io
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
io
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
io
九度OnlineJudge之1002：Grading问题的解决方法

本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程，将每个考题分配给3个独立的专家，如果他们的评分不一致，则需要请一位裁判做出最终决定。文章详细描述了评分规则，并给出了解决该问题的程序。 ... [详细]

蜡笔小新 2023-12-14 13:00:09
io
P1651 塔 (动态规划) 的最大高度计算方法

本文介绍了P1651题目的描述和要求，以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术，将问题转化为求解差值的问题，并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]

蜡笔小新 2023-12-13 19:52:19
io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
hook
VScode格式化文档换行或不换行的设置方法

本文介绍了在VScode中设置格式化文档换行或不换行的方法，包括使用插件和修改settings.json文件的内容。详细步骤为：找到settings.json文件，将其中的代码替换为指定的代码。 ... [详细]

蜡笔小新 2023-12-14 17:15:38
io
Android 新闻App的本地服务器搭建教程

本文介绍了在开发Android新闻App时，搭建本地服务器的步骤。通过使用XAMPP软件，可以一键式搭建起开发环境，包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表，并设置相应的属性。最后，给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]

蜡笔小新 2023-12-14 17:15:19
require
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
io
Java猜拳小游戏代码

本文介绍了一个Java猜拳小游戏的代码，通过使用Scanner类获取用户输入的拳的数字，并随机生成计算机的拳，然后判断胜负。该游戏可以选择剪刀、石头、布三种拳，通过比较两者的拳来决定胜负。 ... [详细]

蜡笔小新 2023-12-14 15:39:08
io
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
io
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
sum
求解hdu 1003 java题目的动态规划优化方法

本文讨论了如何优化解决hdu 1003 java题目的动态规划方法，通过分析加法规则和最大和的性质，提出了一种优化的思路。具体方法是，当从1加到n为负时，即sum(1,n)sum(n,s)，可以继续加法计算。同时，还考虑了两种特殊情况：都是负数的情况和有0的情况。最后，通过使用Scanner类来获取输入数据。 ... [详细]

蜡笔小新 2023-12-14 13:11:00
io
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
io
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新 2023-12-13 14:14:39
io
【openwrt】设备mt7628关于wan侧eth0.1 mac地址固定的问题

本文讨论了在openwrt-17.01版本中，mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下，而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等，生成后的mac地址会保存在/etc/config/network下。 ... [详细]

蜡笔小新 2023-12-12 17:47:48

天勤-科技

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章