深度学习训练和推理之间有什么差异

作者：手机用户2402852307 | 来源：互联网 | 2023-06-25 18:18

就像在学校上课一样，神经网络在“训练”阶段得到的教育跟大多数人一样——学会去做一份工作。更具体的说，经过训练的神经网络可以利用自己学到的知识在数字世界

就像在学校上课一样&＃xff0c;神经网络在“训练”阶段得到的教育跟大多数人一样——学会去做一份工作。

更具体的说&＃xff0c;经过训练的神经网络可以利用自己学到的知识在数字世界中发挥作用&＃xff0c;例如&＃xff1a; 识别图像、口语、判断血液疾病、或是换位思考&＃xff0c;你可以将其称之为——被简化过的应用程序形式。这种更快速、高效的神经网络基于训练来推断出所呈现的新数据&＃xff0c;在AI词典中&＃xff0c;被称之为“推理”。

推理是在深入学习训练中所学到的并会投入使用的地方。

没有训练就不会有推理。可以理解&＃xff0c;这就是我们在大多数情况下获得并使用知识的方式。就像我们不能拉着我们所有的老师、一些超载的书架以及红砖校园来阅读莎士比亚的十四行诗一样&＃xff0c;推理并不需要其训练方案的所有基础设施来做好它的工作。

因此&＃xff0c;让我们分解推理从训练到推理的过程&＃xff0c;以及在人工智能的大背景下应该如何发挥作用。

训练深度神经网络

虽然我们的目标是一致的——知识——神经网络的教育过程或训练&＃xff08;谢天谢地&＃xff09;并不像我们自己那样。神经网络在我们生物学的大脑上松散地建模——神经元之间的所有相互连接。与我们的大脑不同&＃xff0c;任何神经元可以和任何神经元有确定物理距离的连接&＃xff0c;人造神经网络有单独的层&＃xff0c;连接和数据传输的方向。

当训练的神经网络&＃xff0c;训练数据被放到网络的第一层和独立神经元中&＃xff0c;并且独立神经元根据正在执行的任务为输入的分配权重——这是多么正确或者不正确。

在图像识别网络中&＃xff0c;第一层可能会寻找边缘。接下来可能会找这些边缘如何形成形状——矩形或圆形。第三层可能会寻找特定的功能——例如闪亮的眼睛和按钮式鼻子。每一层都把图像传递给下一层&＃xff0c;直到最终层并且最终输出由所有的这些权重的总和确定。

但是这些训练不同于我们自己。我们就说定义猫咪图片的任务吧。神经网络得到所有的这些训练图像&＃xff0c;将它们做一个权重并且得出是否是猫的结论。从训练算法中得到的回答只是“对”或“错”。

训练是集中计算

如果算法告知神经网络这是错的&＃xff0c;就没有得到正确的回答是什么。错误是神经网络层的后向传播和它要去猜其他的东西。每次尝试必须考虑其他的属性——在我们的“猫性”示例属性——并且在每一层更高或更低权衡被检查过的属性。然后再猜一遍。再一遍。再又一遍。直到它有正确的权重并且每一次训练得到正确的回答。这是一只猫。

训练可以教深度学习网络&＃xff0c;以便在网络被用于检测更广阔世界中的猫之前&＃xff0c;在一个限制的集合中去正确地标注猫的图片。

现在你有一个数据结构&＃xff0c;并且根据你在传输训练数据时所学到的内容&＃xff0c;平衡了所有权重。这真是一个美丽的调整。问题是&＃xff0c;它在小号计算方面也是一个怪物。 Andrew Ng曾在谷歌和斯坦福大学从事人工智能研究&＃xff0c;也曾担任百度硅谷实验室的首席科学家。他说训练百度的其中一个中文语音识别模型不仅需要4TB的训练数据&＃xff0c;还需要20个计算机——在整个训练周期中&＃xff0c;这是200亿次数学运算。正尝试在智能手机上运行。

这就是推理的来源。

祝贺你&＃xff01;你的神经网络已经训练有素并可以推理了。

适当加权的神经网络的本质是一个笨蛋&＃xff0c;大量的数据库。你需要放些什么才能让那个傻瓜学习——类比在我们的教育中所有的那些铅笔&＃xff0c;书本&＃xff0c;教师的肮脏外表——比你完成特定任务需要的多。难道毕业的重点不是摆脱所有的这些东西吗&＃xff1f;

重点是如果有人要在现实世界中使用所有的训练&＃xff0c;你需要一个快速的应用可以留存学习并快速应用于从来没见过的数据。这是推论&＃xff1a; 采用较小批量真实世界的数据并快速返回相同的正确答案&＃xff08;实际上是某些事的正确预测&＃xff09;。

虽然这是计算机科学领域的全新领域&＃xff0c;但主要有两种方法可以采用这种笨重的神经网络并对其进行修改&＃xff0c;以提高在其他网络上的运行速度。

推理是怎么工作的

推理怎么用&＃xff1f; 只要打开你的手机。推理被用于深度学习从语义识别去分类你的快照。

第一种方法是查看神经网络中经过训练后未激活的部分。这些部分不是必须的&＃xff0c;可以“修剪”掉。第二种方法是训中将多层神经网络融合成单个计算步骤的方式。

它类似于数字图像中发生的压缩。设计师可能致力于生成巨大&＃xff0c;漂亮&＃xff0c;百万像素快读和高度的图片&＃xff0c;但是当它们放到网上时&＃xff0c;它们会转为一个jpeg。他几乎完全相同&＃xff0c;人眼无法区分&＃xff0c;但是分辨率更小。类似的推理你也会获得几乎与预测相同的准确度&＃xff0c;但是对于运行性能进行简化&＃xff0c;压缩和优化。

这意味着我们所有人都在使用推理。你的智能手机的语音助手使用推理&＃xff0c;Google的语音识别&＃xff0c;图像搜索和垃圾邮件过滤的应用程序也是如此。百度也在语音识别&＃xff0c;恶意软件检测和垃圾邮件过滤上使用推理。 Facebook的图像识别和Amazon和Netflix的推荐引擎都依赖于推理。

GPU&＃xff0c;多亏它们的并行计算能力——或者一次做多件事的能力——在训练和推理上都很好。

系统在GPU上训练也允许计算机去判定模式和物体——或在一些情况比人类更好&＃xff08;见“人工智能用GPUs加速&＃xff1a; 新的计算模式”&＃xff09;。

在训练完成后&＃xff0c;网络被部署到“推理”领域——依据“推理”结果进行数据分类。这里也一样&＃xff0c;GPUs——和他们的并行计算能力——在他们依据训练好的网络运行百万计算去辨别已知的模式和物体提供了优势。

你可以看到这些模式和应用将被更小&＃xff0c;更快和更精确。训练会不那么繁琐&＃xff0c;推理会为我们生活的方方面面带来新的应用。

原文链接&＃xff1a;
https://blogs.nvidia.com/blog/2016/08/22/difference-deep-learning-training-inference-ai/

推荐阅读

压缩
基于深度学习的遥感应用

文章目录深度学习的发展过程深度学习在遥感中的应用基于深度学习的遥感样例库建设基于深度学习的遥感影像目标及场景检索基于深度学习的建筑物提取基于深度学习的密集建筑物自动检测基于深度学习 ... [详细]

蜡笔小新 2023-10-15 18:33:51
压缩
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
process
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
process
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
process
读手语图像识别论文笔记2

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1（手语识别背景和方法）一、前言一句：“做完了&#x ... [详细]

蜡笔小新 2023-10-17 20:45:15
process
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
process
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
process
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
process
鄂维南：从数学角度，理解机器学习的「黑魔法」，并应用于更广泛的科学问题...

作者|Hertz来源|科学智能AISI北京时间2022年7月8日晚上22:30，鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenarytalk)。今 ... [详细]

蜡笔小新 2023-10-15 23:41:17
process
分享篇：第十届“泰迪杯”数据挖掘挑战赛农田害虫图像识别（特等奖）一

1.1赛题背景昆虫的种类浩如烟海，农田常见的昆虫是人工生态系统的重要组成部分。分辨益虫和害虫，保留益虫，消灭害虫，对于减轻害 ... [详细]

蜡笔小新 2023-10-15 19:37:42
process
开源真香离线识别率高 Python 人脸识别系统

本文主要介绍关于python,人工智能,计算机视觉的知识点，对【开源真香离线识别率高Python人脸识别系统】和【】有兴趣的朋友可以看下由【000X000】投稿的技术文章，希望该技术和经验能帮到 ... [详细]

蜡笔小新 2023-10-14 15:43:38
process
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
process
面试经验分享：华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试

最近有朋友去华为面试，面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败，因为缺乏基础知识。面试问题涉及 ... [详细]

蜡笔小新 2023-12-09 10:22:03
process
1 Vue基础

Vue基础一、什么是Vue1.1概念Vue(读音vjuː，类似于view)是一套用于构建用户界面的渐进式JavaScript框架，与其它大型框架不 ... [详细]

蜡笔小新 2023-10-17 19:45:53
process
【观察】中国产业AI化的破局之路：加速算力释放与生态合作共赢

申耀的科技观察读懂科技，赢取未来！电影《斗士》中，有这么一句台词令人印象深刻：“知道路要怎么走，和走上这条路& ... [详细]

蜡笔小新 2023-10-14 15:32:28

手机用户2402852307

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章