热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

机器学习_有趣的数学,给你的机器学习增加点信心

相似的判断下面两个句子相同吗?怎么判断?思路呢?句子A:这只皮靴号码大了。那只

相似的判断
下面两个句子相同吗?怎么判断?思路呢?

句子A:这只皮靴号码大了。那只号码合适

句子B:这只皮靴号码不小,那只更合适

1)分词

句子A:这只/皮靴/号码/大了。那只/号码/合适。

句子B:这只/皮靴/号码/不/小,那只/更/合适。

列出所有的词:这只,皮靴,号码,大了。那只,合适,不,小,很

2)计算词频(词出现的次数)

句子A:这只1,皮靴1,号码2,大了1。那只1,合适1,不0,小0,更0

句子B:这只1,皮靴1,号码1,大了0。那只1,合适1,不1,小1,更1

3)写出词频向量。

句子A:(1,1,2,1,1,1,0,0,0),即:x 坐标数据

句子B:(1,1,1,0,1,1,1,1,1),即:y 坐标数据

4)余弦公式
技术分享图片

,∑表示求和符号技术分享图片

0.81非常接近于1,所以上面的句子A和句子B是基本相似的

虽然上面的例子并无法用于正式场合,但是基本说明了“数学不难”,高中知识就足够

对数函数的魅力
有一个这样的场景:某两个字的频率分别都是500,另外两个字的频率分别为200和800,如果单纯比较频率和都是相等的,但是取对数后,log500=2.69897, log200=2.30103, log800=2.90308 这时候前者为2xlog500=5.39794, 后者为log200+log800=5.20411,这时前者的和更大,取前者。

我们再看另外一个场景:产品A卖500元打完折后卖200元 和 产品B卖800元折后价格500元,同样是相差300元,但是消费者对哪组数据更加敏感呢? log500-log200>log800-log500

也就是说,数值小的“差异”敏感程度比数值大“差异”敏感程度更高。这也是符合生活常识的,例如对于价格,买个家电,如果价格相差几百元能够很大程度影响你决策,但是你买汽车时相差几百元你会忽略不计了

求导的意义
简单的介绍:一阶导数-求某一时间点的瞬时速度。二阶导数-求某一时间点的瞬时加速度。

技术分享图片

函数求导主要是研究函数值随自变量的值的变化而变化的趋势,如果导数小于零,那么事物发展的趋势是越来越慢或者是越来越小,相反如果导数大于零,那么事物发展的趋势是越来越快或者是越来越大。

特征值和特征向量什么意思
举例说:去让你给我接个人,她有很多特征,我会挑几个特典型如长发超级大美女、身材高挑皮肤好...其中特征值就是多高,多美,特征向量就是这些分类。

矩阵中的特征值和特征向量呢,再举例:小红姑娘是个矩阵,在这个矩阵中脸部轮廓是特征向量,相貌就是特征值,等比例伸缩就是“眼睛多大,鼻子多高”,最后通过特征值大小=你能知道这个人到底有多美,体型身材是特征向量,三围就是特征值,等比例伸缩就是“胸部多大,臀部多高”,最后通过特征值大小=你能知道这个人到身材多好。

给一任意矩阵,该矩阵到底是谁,不容易知道,例如哪一个矩阵代表的是小红姑娘?但是当你把矩阵附加到某一具体事物(相貌)上观察,例如反复运用矩阵相乘(相乘就是多个相同数量的相加,加就是放大,其他事物也放大,但是程度不如特征向量),矩阵所代表的人的最明显的特征,如相貌最大的方向(特征值是特征向量的等比伸缩),就由最大特征值对应的特征向量展现出来(即运算越来越贴合到最大的特征值对应的特征空间,注意也不是无限运算,因为某次结果后又将远离特征空间,即围绕特征空间旋转)

以上内容来自网易云课堂海畅智慧出品的《机器学习算法》,转载请注明。


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 本文详细介绍了商汤科技面试中涉及的CV算法面经内容,包括CornerNet的介绍与CornerPooling的解决方案、Mimic知识蒸馏的实现方式、MobileNet的特点、普通卷积和DW PW卷积的计算量推导、Residual结构的来源等。同时还讨论了在人脸关键点和检测中的mimic实现方式、pose对人脸关键点的提升作用、目标检测中可能遇到的问题以及处理检测类别冲突的方法。此外,还涉及了对机器学习的了解程度和相似度分析的问题。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • qt学习(六)数据库注册用户的实现方法
    本文介绍了在qt学习中实现数据库注册用户的方法,包括登录按钮按下后出现注册页面、账号可用性判断、密码格式判断、邮箱格式判断等步骤。具体实现过程包括UI设计、数据库的创建和各个模块调用数据内容。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
author-avatar
烧蕉_233
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有