热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

直观上理解PCA中特征值和特征向量

很多人都了解PCA算法,但是总很难直观上去想象和理解整个过程,特别是为什么特征向量可以作为一个PCA特征空间变换后的一个基?特征向量和特征值到底怎么理解?也许很
很多人都了解PCA算法,但是总很难直观上去想象和理解整个过程,特别是为什么特征向量可以作为一个PCA特征空间变换后的一个基?特征向量和特征值到底怎么理解?

也许很多人查了很多文章和书籍,但是它们几乎没有直面回答。就连解释特征向量和特征值也都是搬特征值分解公式:(XX^T)w=lambda*w。这种解释是苍白无力的,我们依然不能直观理解特征向量和特征值。也有文章将XX^T当做变换矩阵,并从特征向量w的缩放上试图说明,然而依然不能解释透彻(就我而言),更难回答第一个问题“为什么特征向量可以作为一个PCA特征空间变换后的一个基?”

下面的解释过程不是很严谨,反过来却适合直观上去找找感觉。首先我先列个思路:
1.协方差矩阵表示什么?
2.特征向量为什么能表示协方差矩阵特性?特点?
3.扣住常识的特征值分解公式,把故事说圆
4.特征向量为什么能作为PCA变换后特征空间的一个基?
5.特征值部分扣住第四点

=================================
直观理解协方差矩阵

首先将X表示样本特征矩阵R^{d*n}, XX^T 表示为协方差矩阵(注意X已中心化),元素  (XX^T)_ij  的值反映在特征 i 维度和特征 j 维度上对应样本分布一致性程度(其实XX^T反映了两两特征在样本空间间的距离,再深入一点,就反映这里的样本分布一致性)。比如 a、b和c 三个样本,在特征 i 维度和特征 j 维度上投影的值分别为 a_i、b_i和c_i(假设特征 i 维度 上三个样本的分布情况为 a_i>b_i>c_i ,且a_i-b_i>b_i -c_i ),a_j、b_j和c_j,如果  (XX^T)_ij  比较大,那么在特征 j 维度 上三个样本的分布情况也大致符合为a_j>b_j>c_j,且a_j-b_j>b_j -c_j。

=================================
直观理解特征向量

这里要强调的是我们全文讲的特征向量是特指协方差矩阵的特征向量(当然也可拓展到其他矩阵)。如果现在存在特征 k ,使得:对于大多特征 i (特征 i 属于特征集合),(XX^T)_ik 都很大。这说明特征k有以下特性:
  1. 代表性,能代表大多特征维度上的样本分布。(这或许是很多资料没有强调的)
  2. 样本普遍在特征k维度上投影的值差异相对其他特征比较大(一定程度反映方差大)。为什么差异比较大?直观上的理解比价简单,比如假设有 k、k1和k2 三个特征,它们上面的样本分布比较一致,但是 (XX^T)_k1 和 (XX^T)_k2k 还是大于(XX^T)_k1k2,那就说明特征k维度上样本投影的值(再次强调已中心化)除了和 k1、k2 比较一致外,而且幅值比较大。

好了,那怎么理解特征向量,很多地方只会列出那个特征分解的公式来定义,但在我看来甚至对很多人来讲并不能解渴。现在有某个向量 w,若在对应的第 k 个分量值比较大,那么 (XX^T)w  得到的向量的各个分量的值普遍比较大,我们用 lambda*w 来表示(约束),其中的lambda比较大。这样的w 向量我们就把它当做特征向量,因为它反映了 XX^T 中样本分布的特性(通过强调特征k,而特征k有代表性。我们可以用特征向量作为PCA变换后特征空间的一个基因为把它作为变换向量能使样本投影的方差大,满足最大可分性(通过强调特征k,而特征k上样本方差大

至此直观解释了:
特征向量到底怎么理解
为什么特征向量可以作为一个PCA变换后特征空间的一个基

=================================
直观理解特征值

前一部分的lambda就是特征值,w 的lambda越大,w越能反映XX^T中样本的分布特性。这恰说明w上样本投影值得方差比较大,信息比较明确,该w上的样本投影可以作为一个特征维度用于分类等任务。
=================================

上面的解释过程不是很严谨,反过来却适合直观上去找找感觉。希望对大家有帮助,欢迎留言交流




推荐阅读
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文详细解析了JavaScript中相称性推断的知识点,包括严厉相称和宽松相称的区别,以及范例转换的规则。针对不同类型的范例值,如差别范例值、统一类的原始范例值和统一类的复合范例值,都给出了具体的比较方法。对于宽松相称的情况,也解释了原始范例值和对象之间的比较规则。通过本文的学习,读者可以更好地理解JavaScript中相称性推断的概念和应用。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • qt学习(六)数据库注册用户的实现方法
    本文介绍了在qt学习中实现数据库注册用户的方法,包括登录按钮按下后出现注册页面、账号可用性判断、密码格式判断、邮箱格式判断等步骤。具体实现过程包括UI设计、数据库的创建和各个模块调用数据内容。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 无线认证设置故障排除方法及注意事项
    本文介绍了解决无线认证设置故障的方法和注意事项,包括检查无线路由器工作状态、关闭手机休眠状态下的网络设置、重启路由器、更改认证类型、恢复出厂设置和手机网络设置等。通过这些方法,可以解决无线认证设置可能出现的问题,确保无线网络正常连接和上网。同时,还提供了一些注意事项,以便用户在进行无线认证设置时能够正确操作。 ... [详细]
  • 本文介绍了游戏开发中的人工智能技术,包括定性行为和非定性行为的分类。定性行为是指特定且可预测的行为,而非定性行为则具有一定程度的不确定性。其中,追逐算法是定性行为的具体实例。 ... [详细]
  • JavaScript设计模式之策略模式(Strategy Pattern)的优势及应用
    本文介绍了JavaScript设计模式之策略模式(Strategy Pattern)的定义和优势,策略模式可以避免代码中的多重判断条件,体现了开放-封闭原则。同时,策略模式的应用可以使系统的算法重复利用,避免复制粘贴。然而,策略模式也会增加策略类的数量,违反最少知识原则,需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例,说明了策略模式的应用场景和实现方式。 ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
author-avatar
Angels萱萱
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有