深度学习+大规模计算+大数据，谁才是未来的算力之王

作者：lucky燕子加加加 | 来源：互联网 | 2023-06-06 16:23

深度学习+大规模计算+大数据，谁才是未来的算力之王-纵观时代演进的脉络，从农业革命到工业革命再到知识革命，从远古结绳计数到古代珠算与机械计算再到现在的电子计算，数学一直是人类文明进

纵观时代演进的脉络，从农业革命到工业革命再到知识革命，从远古结绳计数到古代珠算与机械计算再到现在的电子计算，数学一直是人类文明进步的主要力量。当今时代，算力作为新型生产力，数据作为新的生产要素，参与价值创造和分配，信息技术成为了驱动经济社会发展的基础动力。随着5G、人工智能、云计算、大数据、IoT等技术的推动，万物互联的时代即将到来，算力需求将越来越大，有望替代热力、电力，成为拉动数字经济向前发展的新动能、新引擎，并成为影响国家综合实力和国际话语权的关键要素，国与国的核心竞争力正在聚焦于以计算速度、计算方法、通信能力、存储能力为代表的算力，未来谁掌握先进的算力，谁就掌握了发展的主动权。人工智能与深度学习人工智能(Artificial Intelligence)，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它起源于20世纪五六十年代，经过半个多世纪的演变，经历了符号主义、连接主义和行为主体三次浪潮的相互交织发展，到如今，作为一项新兴的通用技术，正在推动着社会生活与各行各业的巨变。现阶段人们普遍认为，深度学习+大规模计算+大数据=人工智能。什么是深度学习？在人工智能领域，机器学习是其中的一个技术流派，通过从已知样本中提炼规律来获得判断未知样本的智能；深度学习则是机器学习的一种，它所学习出来的模型是深度神经网络。具体来说，机器学习可以理解为机器从已知的经验数据（样本）中，通过某种特定的方法（算法），自己去寻找提炼（训练/学习）出一些规律（模型）；提炼出的规律就可以用来判断一些未知的事情（预测），自2006年以来，机器学习领域深度学习（Deep Learning）取得了突破性的进展。深度学习是一种特殊的机器学习，在语音和图像识别方面取得的效果，远远超过先前相关技术。它通过学习将世界表示为嵌套的概念层次结构来实现强大的功能和灵活性，每个概念都是根据更简单的概念进行定义的，而更抽象的表示则用不那么抽象的概念计算出来。深度学习算法分「训练」和「推理」两个过程。简单来讲，人工智能需要以大数据为基础，通过「训练」得到各种参数（也就是模型），然后把模型传递给「推理」部分，得到最终结果。神经网络分为前向计算（包括矩阵相乘、卷积、循环层）和后向更新（主要是梯度运算）两类，「训练」是两者兼而有之，「推理」主要是前向计算，都包含大量并行运算。一般来说，「训练+推理」在云端进行，终端人工智能硬件只负责「推理」。

算力：人工智能的核心要素近年来，随着深度学习的推进，AI领域对算力的要求每年增加10倍左右。为了达到这个目标，我们需要处理大量的数据。因此，人工智能三大要素：算法、算力和大数据，缺一不可，都是人工智能能够实现大规模应用的必备条件。1、数据。人类要获取一定的技能都必须经过不断的训练，才能熟能生巧，AI也是如此。人工智能的根基是训练，只有经过大量的训练，神经网络才能总结出规律，应用到新的样本上。只有拥有大量数据，且能覆盖各种可能的场景，才能得到一个表现良好的智能模型。2、算力。有了数据之后，需要进行不断地重复的训练。深度学习中有三个概念叫Epoch(“一代训练”)，Batch（“一批数据”），Iteration（“一次训练”）。仅仅将训练集从头到尾训练一遍是不够的，需要把训练集翻来覆去训练很多轮。训练和推理都需要强大算力的支撑。3、算法。神经网络算法和深度学习是目前最主流的人工智能算法。算力是人工智能的三大要素之一，需要芯片的支撑，这是人工智能进一步发展并实现产业化的关键。芯片：人工智能竞争的制高点AI芯片提供算力，承载算法，是实现人工智能的物理载体，因此是人工智能领域竞争的制高点。什么是AI芯片？从广义上GPU与GPGPU的定义说，所有面向AI应用的芯片都可以称为AI芯片，但目前人们普遍认为，AI芯片是针对AI算法做了特殊加速设计的芯片。AI深度学习需要很高的并行计算、浮点计算以及矩阵运算能力，基于CPU的传统计算架构无法充分满足人工智能高性能并行计算(HPC)的需求，因此需要发展适合AI架构的专属芯片。对于人工智能计算架构来说，CPU配合加速芯片的模式是典型的AI部署方案：CPU提供算力，加速芯片提升算力并助推算法的产生。常见的AI加速芯片按照技术路线可以分为GPU、FPGA、ASIC三类。其中，应用于图形、图像处理领域的GPU 可以并行处理大量数据，非常适合深度学习的高并行、高本地化数据场景，是目前主流的人工智能计算架构。1、GPU用于大量重复计算，由数以千计的更小、更高效的核心组成大规模并行计算架构，配备GPU的服务器可取代数百台通用CPU服务器来处理高性能计算和AI业务。2、FPGA是一种半定制芯片，灵活性强集成度高，但运算量小，量产成本高，适用于算法更新频繁或市场规模小的专用领域。3、ASIC专用性强，适合市场需求量大的专用领域，但开发周期较长且难度极高。GPU：最适合AI深度学习的异构芯片GPU与GPGPU的定义GPU（Graphics Processing Unit，图形处理器）是进行图像图形相关运算工作的微处理器，最初用途是将计算机系统需要显示的信息进行转换驱动，从而控制显示器的正确显示。GPGPU（General-Purpose Computing on Graphics Processing Units，通用计算图形处理器）用专门处理图形任务的处理器，运行图形渲染之外的通用计算任务，这些通用计算常常与图形处理没有任何关系。GPU的特点是并行处理能力强、计算能效比高，并且有很大的存储带宽。某些应用，例如人工智能（机器学习）模型训练与推理、高性能计算等，往往是大数据流应用，这时，用GPGPU解决这类问题，就比CPU效率更高，它对于用传统语言编写的、软件形式的计算有较好的支持，具有高度的灵活性。目前GPGPU广泛应用于高性能计算、行业AI应用、安防与政府项目、互联网及云数据中心等。其主要应用场景：一是人工智能模型训练与推理；二是高性能计算机。GPU的结构由于CPU在图像渲染方面能力不足，GPU被发明出来分担这部分工作，在屏幕上进行多边形图像渲染，其本质就是并行处理简单任务：每个像素点的色彩可以独立计算，不需要考虑其它像素点。有了这样上千个简单的核心，再配合合适的代码，就能处理超大规模的数学运算，实现逼真的游戏体验。由于CPU有通用性的需求，其单个核心往往会设计得大而全；加上CPU计算的特性，核心中有很大一部分面积用来构建缓存（包含L1和L2两级缓存）和控制单元（解码器与分支预测等前端单元），实际用来运算的单元面积可能仅占整个核心的一半甚至不到。GPU的设计理念就不同，图形计算本身就是一项简单而暴力的“粗活”，复杂度远不如CPU要负责的各种不同类型的工作，想要提高图形计算速度最简单的办法就是扩大处理器中含有的单元数量。所以GPU对于特定的计算任务，因为拥有更大的计算单元，就很容易达到比CPU更高的计算速度，表现出来就是GPU在浮点运算吞吐量上远超CPU。GPU是基于数据的并行计算GPU的关键性能在于可以同时运算一些更简单的问题，然后并行处理，适用于高性能计算领域所涉及的诸如气象、宇宙模型和DNA序列等问题，以及数据库查询、密码学领域的暴力搜索、机器学习/深度学习、地理可视化等企业应用。GPU 并行编程的核心在于线程，一个线程就是程序中的一个单一指令流，无数个线程组合在一起就构成了并行计算网格，成为并行程序，下图展示了多核 CPU 与 GPU 的计算网格：并行计算有两种类型：一是基于任务的并行处理，这种模式将计算任务拆分成若干个小的但不同的任务，如有的运算单元负责取数，有的运算单元负责计算，等等，这样一个大的任务可以组成一道流水线。二是基于数据的并行处理，这种并行模式将数据分解为多个部分，让多个运算单元分别去计算这些小块的数据，最后再将其汇总起来。一般来说，CPU的多线程编程偏向于第一种并行模式，GPU并行编程模式则偏向于第二种，其对于数据的计算能力更加强大。

人工智能的研究者选择了GPU最初，并不是GPU选择了人工智能，而是人工智能的研究者选择了GPU，进而成就了GPU：2012年Alex Krizhevsky（前谷歌计算机科学家）利用深度学习+GPU的方案，一举赢得Image Net LSVRC-2010 图像识别大赛，并奇迹般地将识别成功率从74%提升到85%。NVIDIA敏锐地洞察到了这一趋势，于是耗费巨大的人力物力优化基于自家GPU的CUDA深度学习生态系统，在三年时间里将GPU性能提升了65倍，并提供基于其GPU的从后端模型训练到前端推理应用的全套深度学习解决方案，使得一般的开发人员都可以非常容易地使用GPU进行深度学习开发或高性能运算，从而奠定了其目前的王者之位。可以说，是人工智能和GPU互相成就了对方：人工智能算法促进GPU的发展，而GPU也让算法更加简单。综上所述，GPU是AI时代的算力核心，但AI算力的构成不仅仅只是GPU加速芯片，还需要构建包括网络互联、操作系统、深度学习框架及相应 SDK、算法与应用程序等，形成一个完整的计算生态系统。

推荐阅读

算法
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
算法
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
算法
一句话解决高并发的核心原则

本文介绍了解决高并发的核心原则，即将用户访问请求尽量往前推，避免访问CDN、静态服务器、动态服务器、数据库和存储，从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例，以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]

蜡笔小新 2023-12-12 10:56:24
算法
携手生态伙伴，希捷发布银河X16数据存储方案

2019年6月26日，希捷科技在北京举办“容海量数据筑云之基石”——2019希捷科技企业级生态合作伙伴沟通会暨银河ExosX16新品发布会。在本次发布会上࿰ ... [详细]

蜡笔小新 2023-10-17 20:10:18
算法
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
schema
adg架构设置及其在企业数据治理中的应用

本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展，企业IT系统的快速发展使得数据成为企业业务增长的新动力，但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题，并提出了解决方案，包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外，本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍，读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]

蜡笔小新 2023-12-14 13:05:22
function
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
uri
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
string
Android自定义控件绘图篇之Paint函数大汇总

本文介绍了Android自定义控件绘图篇中的Paint函数大汇总，包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数，可以更好地掌握Paint的用法。 ... [详细]

蜡笔小新 2023-12-10 23:11:57
string
OkHttp3的基本使用及其特性

本文介绍了OkHttp3的基本使用和特性，包括支持HTTP/2、连接池、GZIP压缩、缓存等功能。同时还提到了OkHttp3的适用平台和源码阅读计划。文章还介绍了OkHttp3的请求/响应API的设计和使用方式，包括阻塞式的同步请求和带回调的异步请求。 ... [详细]

蜡笔小新 2023-12-10 22:46:04
function
Smarty / views / templates中的数据库调用 - Database calls in Smarty/views/templates

Todayatworksomeonetriedtoconvincemethat:今天在工作中有人试图说服我:{$obj->getTableInfo()}isfine ... [详细]

蜡笔小新 2023-12-10 20:58:53
function
Android图形架构学习笔记（待修改）

以下简单总结来自Android官网，稍作总结：https:source.android.google.cndevicesgraphics概览Andr ... [详细]

蜡笔小新 2023-10-17 19:26:14
function
2018年数字化转型调查

PointSource发布了2018年数字化转型调查，主要发现包括：1、由于缺乏战略，企业迫切需要进行数字化转型。2、企业急于开始数字化转型过程，但他们缺乏进行智能投资的战 ... [详细]

蜡笔小新 2023-10-17 17:44:46
function
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
function
OpenStack Q版本新功能以及各核心组件功能对比

OpenStackQ版本已经发布了一段时间了。今天,小编来总结一下OpenStackQ版本核心组件的各项主要新功能,再来汇总一下最近2年来OpenStackN、O、P、Q各版本核心 ... [详细]

蜡笔小新 2023-10-17 09:24:46

lucky燕子加加加

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章