当前位置: 开发笔记 > 运维 > 正文

深度学习库中不同LSTM实现的效率对比

作者：mobiledu2502902687 | 来源：互联网 | 2023-05-19 10:29

论文链接是https:arxiv.orgpdf1806.01818.pdf，这篇文章给出了多个深度学习库中LSTM实现的性能对比，对工作和学习中要使用RNN的人员有一定参考意义。不

论文链接是https://arxiv.org/pdf/1806.01818.pdf，这篇文章给出了多个深度学习库中LSTM实现的性能对比，对工作和学习中要使用RNN的人员有一定参考意义。不足的是没有考虑效果的对比。这里做个简单记录。

一、各实现简介

文中对比的深度学习框架包括PyTorch、TensorFlow、Lasagne和Keras对比。针对LSTM结构来说，可以考虑一些优化方式，比如增加并行度，单步操作的融合等，但是这样做的缺点是想要改进内部结构的话就偏难，不够灵活。深度学习框架一般提供多个LSTM的实现，区别在于训练速度和灵活性。LSTM实现包括cuDNN LSTM、fused LSTM变式和优化较少但更灵活的LSTM基础实现。例如TensorFlow中提供了5种LSTM变式，分别是BasicLSTMCell、LSTMCell、LSTMBlockCell、LSTMBlockFusedCell和cuDNNLSTM。

下图中给出了参与比较的LSTM实现以及细节信息。

《深度学习库中不同LSTM实现的效率对比》

二、实验结果分析

下图是在定长数据集上单层单向lstm的效率对比。

《深度学习库中不同LSTM实现的效率对比》

最快的LSTM实现：cuDNNLSTM是所有输入数据和实验设置下最快的LSTM实现。TensorFlow cuDNNLSTM要比最慢的实现(Keras/TensorFlow LSTM)快7.2x。Pytorch、TensorFlow和Keras提供了cuDNN LSTM实现的wrapper，三者速度差异较小。
优化的LSTM实现：除了cuDNNLSTM，TensorFlow中的LSTMBlockFusedCell是最快的变式，要比Pytorch LSTMCell-fused快1.3x，比TensorFlow LSTMBlockCell快3.4x。

下图是变长数据集上4层双向LSTM实验的效率对比。这里有些LSTM实现没有加入，这是由于接口实现不支持，比如TensorFlow cuDNNLSTM没法处理变长数据。

《深度学习库中不同LSTM实现的效率对比》

推荐阅读

4层
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
4层
mapreduce数据去重的实现方法

本文介绍了利用mapreduce实现数据去重的方法，同时还介绍了人工智能AI领域中常用的框架和工具，包括Keras、PyTorch、MXNet、TensorFlow和PaddlePaddle，并提供了深度学习实战的代码下载链接。 ... [详细]

蜡笔小新 2023-12-10 15:56:37
运维
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
运维
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
运维
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
运维
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
运维
阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾

本文介绍了阿里Treebased Deep Match(TDM)的学习笔记，同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法，再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用，并介绍了TDM的背景和优势。最后，文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]

蜡笔小新 2023-12-14 19:24:58
运维
生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍

一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks（论文下载链接arxiv：[h ... [详细]

蜡笔小新 2023-12-14 11:39:45
运维
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
运维
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
运维
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
运维
知识图谱表示吱吱了了

知识图谱表示概念：知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说，知识图谱是由一条条知识组成，每条知识表示为一个SPO三元组(Subject-Predicate-Obj ... [详细]

蜡笔小新 2023-10-17 17:32:42
运维
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
运维
Tensorflow 训练自己的cnn模型行人识别

代码如下：#coding:utf-8importstring,os,sysimportnumpyasnpimportmatplotlib.py ... [详细]

蜡笔小新 2023-10-16 16:57:06
运维
Win10+Python3.7+Tensorflow安装

Win10+Python3.7+Tensorflow安装Step1：安装AnacondaStep2：Tensorflow的安装转载请注明出处：https:blog.csdn.net ... [详细]

蜡笔小新 2023-10-16 16:09:49

mobiledu2502902687

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章