热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

交通预见未来(4):从NLP自然语言处理到工程领域中的时间序列:我们能学到什么?...

NLP自然语言处理中的单词,句子,经过各种处理编码,电脑识别到的还是一串数字,即一个有前后关系的时间序列。放到交通工程、土木

NLP自然语言处理中的单词,句子,经过各种处理编码,电脑识别到的还是一串数字,即一个有前后关系的时间序列。放到交通工程、土木工程领域,时间、速度、客流量、轨道形变量、桥梁变形位移等各类时间序列本来就是数值,相比于NLP,还省去了编码的过程呢,哈哈哈!所以做个大自然的搬运工岂不省事?!!!计算机小白的我,还是从NLP领域大火的Seq2Seq模型开始蜗牛吧……

文章信息

《Sequence to Sequence Learning with Neural Networks》。

这篇文章是2014年Google Brain团队的三位老外发的一篇文章,首次真正提出了Seq2Seq模型,被引6000多次。其实还有另外一篇文章《Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation》也是在2014年使用了 Seq2Seq 模型来解决机器翻译的问题,被引5000多次,这边文章比前者早了几个月,两篇文章的区别是前者是来自于谷歌的论文,工程应用性更强,后者来自蒙特利尔大学的一个博士生,学术性更强,后面这篇文章有空再看。

摘要

本文提出了一种end-to end序列学习方法,使用多层LSTM将输入序列映射到一个固定维数的向量上(编码),然后用另一个深层LSTM从向量上解码目标序列。将该方法应用在WMT-14数据集的英法翻译任务中。此外,LSTM擅长处理长句子(得益于LSTM处理long-term dependency的良好性能,交通领域即能记忆很久以前的交通状态,从而应用到当前状态的预测中)。LSTM还学习了对词序敏感、对主动语态和被动语态相对不敏感的短语和句子表示。最后,我们发现对所有输入序列(不是目标序列)做逆序处理后显著地提高了LSTM的性能,因为这样做会在输入序列和目标序列之间引入许多短期依赖关系,从而使优化问题变得更加容易。

简介

深度神经网络(DNNs)是一种功能极其强大的机器学习模型,在语音识别和视觉对象识别等困难问题上表现优异。DNNs之所以功能强大是因为它们可以用很少的步骤执行任意并行计算。虽然神经网络与传统的统计模型有关,但它们能够学习复杂的计算。此外,只要有足够的有标记的训练集来确定网络参数,就可以使用有监督的反向传播算法对DNNs进行训练。

尽管DNNs具有灵活性和强大的功能,但其输入和输出只能用用固定维数的向量来编码。这是很大限制,因为许多重要的问题最好用长度未知的序列来表示。例如,语音识别和机器翻译(输入输出不可能长度相等)。因此,一个学习将序列映射到序列的不受输入输出维数限制的方法显然是有用的。

DNNs要求输入和输出的维数是已知的和固定的。(对于RNN,只要预先知道输入和输出之间的固定长度,RNN就可以轻松地将序列映射到序列。然而,如何将RNN应用于输入和输出序列长度不同且关系复杂且非单调的问题,目前尚不清楚)。

本文展示了一个直观的长短期记忆(LSTM)结构解决一般序列对序列的问题(如下图)。其思想是使用一个LSTM来读取输入序列(每次一个时间步长)通过编码获得固定维度的向量,然后使用另一个LSTM进行解码,即从该向量中提取输出序列。第二个LSTM本质上是一个递归神经网络语言模型,但它的输入是编码得到的固定维度的向量。LSTM能够成功地学习具有长期时间依赖关系的数据,所以本文中的模型也自然是基于LSTM。

简单理解一下就是输入序列为ABC以及输入序列结束符号,从开始解码出WXYZ以及结束符号,停止解码。多说一句该模型架构在翻译任务上,均取得了不错的效果,且还有巨大的提升空间(比如引入Attention注意力机制)

该模型在长句子上表现很好,因为我们颠倒了训练集和测试集中输入序列中单词的顺序(只颠倒输入序列,不颠倒输出序列)。这样做,我们引入了许多短期依赖关系从而使优化问题变得更简单。

LSTM的一个特性是它能将一个可变长度的输入语句映射成一个固定维度的向量表示。考虑到翻译往往是原句段落的释义,翻译目标鼓励LSTM找到能够表示其含义的句子表示形式,因为具有含义相近的句子彼此接近,而含义不同的句子会距离很远。结果表明我们的模型能够识别词序,并且对主动语态和被动语态也不敏感。

创新点

(1)首先我们使用了两种不同的LSTM:一种用于输入序列,另一种用于输出序列,这样虽然增加了模型参数,但计算成本的增加可以忽略不计,并且可以提高模型的泛化能力。

(2)其次,我们发现深度LSTM明显优于浅层LSTM,因此我们选择了一个4层的LSTM。

(3)第三,我们发现颠倒输入句子的单词顺序非常有价值。例如,不是映射将a, b, c 映射到α, β, γ,而是将 c, b, a 映射到α, β, γ。其中α, β, γ是翻译后的a, b, c。这样, a 就离α很近, b 就离β很近, 依此类推。(正如上面所提到的,一个段落中有含义相近的句子彼此接近,而含义不同的句子会距离很远)

主体内容

只是学习建模思想,所以NLP领域的专业知识和建模过程就略过了。

模型的实现上,其实Seq2Seq模型就是一个使用了LSTM层Encoder-Decoder自编码器模型,Keras 中也比较适合新手实现。

类似于这样的……


或者这样的……

特别之处

将输入进行颠倒逆序:

文章说虽然我们对这一现象没有一个完整的解释,但我们认为这是由于对数据集引入了许多短期依赖关系造成的。

但是又强行解释到:通过颠倒输入序列中的单词,保持输入序列中对应单词与输出序列的平均距离不变。然而,输入序列中的前几个单词现在与输出序列中的前几个单词非常接近,因此问题的最小time lag大大减少,而句子末尾的词距离变长的代价似乎并不显著。因此,反向传播更容易在输入序列和输出序列之间“建立通信”,从而大大提高了整体性能。

展望

土木工程和交通工程领域的时间序列处理问题上,或许可以探索借鉴本文的建模思想,以得到更好的结果。

每一个不曾起舞的日子,都是对生命的辜负。

——  尼采

Transportation-ML

与你分享科研成长的乐趣

长按二维码关注


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • 开发笔记:图像识别基于主成分分析算法实现人脸二维码识别
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了图像识别基于主成分分析算法实现人脸二维码识别相关的知识,希望对你有一定的参考价值。 ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • 早晨七点半。北京初秋的凉风叫醒了住在望京西的你,睁开眼睛,一想到又要为人类的信息化事业贡献满满的正能量,你不禁哼唱起那句“早晨起来 ... [详细]
author-avatar
翻版的袁城
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有