热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以

最近 Google 的 Deepmind 开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。

深度学习目前可以做什么

深度学习框架 Keras 的作者在《Deep Learning with python》这本书的最后,讲述了目前人工智能的能力与缺陷。总结起来,“深度学习拥有将任何东西映射到另一样东西的强大能力,只要两者之间存在连续几何变换”。原文如下,

“Layers can be plugged together to map essentially anything to anything, given that you have appropriate training data available and that the mapping is achievable via a continuous geometric transformation of reasonable complexity. The space of possibilities is infinite.

1. Mapping Vector Data to Vector Data

  • 医保:通过病人的医疗记录预测未来健康状况
  • 网站访客行为:通过网站数据布局预测用户驻留时间
  • 产品质量控制:通过产品数据预测保质期

简言之,传统的使用特征向量进行分类和回归的机器学习方法,都可用深度学习代替。

2. Mapping Image Data to Vector data

  • 医生助理:通过医疗影像,自动定位肿瘤
  • 自动驾驶:通过汽车摄像头拍摄视频流,控制方向盘转动角度
  • 棋类游戏:通过围棋或象棋棋盘图像,计算下步棋所走位置
  • 饮食助理:通过食物照片,估计卡路里含量
  • 年龄预测:通过自拍照,预测一个人的年龄

如题,所有应用都是将图像映射到向量数据。

3. Mapping timeseries data to vector data

  • 天气预报:根据一个地区本地及周边的天气时间序列数据,预测下周天气
  • 脑机接口:将脑磁图MEG微弱生物磁场分布的时间序列,映射到计算机命令
  • 用户行为:根据用户与网站交互的时间序列数据,预测用户购买某物的几率

4. Mapping text to text

  • 智能回复:将收到的邮件映射到一行简短的回复 (这不是Google邮箱的功能吗!)
  • 智能问答:将基于自然语言的问题映射到答案
  • 文章概要:将长文章压缩为简短摘要

5. Mapping images to text

  • 打标签:将图像映射到一段简短的语言描述

6. Mapping text to images

  • 条件图像生成:根据简短的语言描述,自动生成满足描述的图像
  • Logo 的生成和选择:将公司的名字和描述,映射到公司的 Logo

7. Mapping images to images

  • 超分辨率:将低分辨率图片,映射到高分辨率的同内容图片
  • 测距:根据室内环境照片,估算不同位置的距离
  • 图像分割:UNET,MaskRCNN 等将图像映射为掩码
  • 风格变换:将任意照片转化为毕加索,梵高等艺术风格
  • 智能P图:一键P掉照片中路人,杂物,同时补全背景
  • 智能绘画:根据简单的色块或涂鸦,生成高真图片
  • Deepfakes: 视频中明星人物换脸

8. Mapping images and text to text

  • 图像问答:将图像和关于此图像内容的问题映射到自然语言回答

9. Mapping video and text to text

  • 视频问答:将短视频和关于此短视频内容的问题映射到自然语言回答

深度学习目前不能做什么:自动推理

接下来这个列表给出的,都是深度学习无法完成的任务

  • 阅读详细的机器操作手册,从而学会操作一辆机器
  • 阅读详细的代码描述,从而编写出一段功能一致的新程序
  • 应用科学方法和知识
  • 长期规划,模仿算法的数据制备

Keras 的作者认为机器能做的,“仅仅“是通过一系列简单,连续的几何变换,将一个向量空间映射到另一个,将一个数据流形X映射到另一个流形Y — 假设从X到Y存在可以学习的连续变换。所以,尽管深度学习模型可以解释为一种程序,但反过来,很多程序不能表示成深度学习模型。对于很多任务,或者不存在相应的深度神经网络来完成这个任务,或者存在这样的神经网络,但是不可学习 — 比如相应的几何变换太复杂而训练数据有限。所以,通过添加更多的层,准备更多的数据,将神经网络做大的方法,只能解决一部分问题,(比如Google的BERT以及OpenAI的GPT-2),却不能解决更根本的问题。目前深度学习模型局限于他们的表示能力,即很多任务不能表示为连续几何变换。

个人思考:在强化学习中加入假设/检验来增强推理能力

回到让 AI 做数学题这件事本身,如果允许外援,我们可以训练AI将数学题的自然语言描述,映射到 Mathematica 符号处理系统,或 Sympy 符号处理系统能够理解的输入,将其输入到外接软件中,获得最终结果。这样的系统并不难做。最近一个刷屏的软件 Mathpix 就可以将屏幕截屏到的数学方程转化为 Latex 源代码,将Latex源代码输入另一个编译器,从而得到原始数学公式的图像。根据深度学习的超强映射能力,将自然语言或数学方程图像映射为符号处理系统能够理解的输入,指日可待。而符号处理系统经过多年发展,已经拥有很强的推理能力。

人类的外推能力可能是一种错觉。比如已知粉红色区域的数据分布,如何预测黄色虚线部分的分布。深度学习系统会觉得,在这个没有任何训练数据的区域,一切皆有可能。就像CTEQ和NNPDF两种部分子分布函数,一种人工的假设了函数形式,在小x区给出较小的误差棒,但NNPDF在没有数据的区域,给出巨大的误差棒。人在看到粉红色实线部分,其实做了一个简单的假设,数据分布可能满足 Sin(x) 的形式或周期规律,如果这种假设跟后期的检验符合,那么这就是新的知识和规律,人类就会强化这种假设,如果假设总是跟经验相反,那么人类就会放弃这种假设,根据以往的知识提出新的假设。

《人工智能推理能力与假设检验》
《人工智能推理能力与假设检验》 手动构造的形似 Sin(x) 的曲线

这种假设检验,不仅对长期规划和无限外推有用,也已经用在了过往的研究中。一个成功的典范是 AlphaGo 中使用的 MonteCarlo 树搜索算法。其在局部棋局的战术网络训练时,使用蒙特卡洛树搜索算法,就是一种先假设怎么走,再检验其有效性的假设检验方法。对于这个 Sin(x) 函数的例子,我们可以先训练一个深度学习系统,将各种各样的函数形式与它们的几何表示(数据表示)映射起来,使神经网络看到粉红色曲线图像或数据,首先想到 Sin(x)函数,并作为假设Proposal。而假设的过程,可以融合AlphaGo中的蒙特卡洛树搜索算法与贝叶斯推理。使用贝叶斯推理对单个假设进行参数估计,使用蒙特卡洛树搜索筛选最好的假设。检验的过程即将假设的函数形式,逻辑规律,物理方程应用到新数据,获得正面或负面反馈的过程。

1. 如何训练神经网络,得到假设

  • 根据图像建议最可能的函数形式,如 Mathpix
  • 根据数据建议最可能的函数形式
  • 根据自然语言建议内在的逻辑,方程
  • 根据视频的不同帧,建议物理规律

2. 如何检验

  • 将 Latex 编译成公式,与原图对比
  • 将函数形式应用于验证数据,与标准答案对比
  • 将逻辑推理应用于新关系的获取,并与已存在数据库对比
  • 将物理方程应用于下一帧的预测,与结果对比

使用人工神经网络将文字,图像,视频映射到符号处理系统能够理解的输入,外接符号计算系统,物理方程,逻辑推理系统,然后使用假设的函数形式,外推或制订长期规划,应该能大大增强人工智能系统的能力。外接模块的加入,可能影响梯度的向后传播,强化学习将是解决这一困难的关键。

关于第三部分的个人思索,严肃的大神请轻拍 :)


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 突破MIUI14限制,自定义胶囊图标、大图标样式,支持任意APP
    本文介绍了如何突破MIUI14的限制,实现自定义胶囊图标和大图标样式,并支持任意APP。需要一定的动手能力和主题设计师账号权限或者会主题pojie。详细步骤包括应用包名获取、素材制作和封包获取等。 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 程序员如何选择机械键盘轴体?红轴和茶轴对比
    本文介绍了程序员如何选择机械键盘轴体,特别是红轴和茶轴的对比。同时还介绍了U盘安装Linux镜像的步骤,以及在Linux系统中安装软件的命令行操作。此外,还介绍了nodejs和npm的安装方法,以及在VSCode中安装和配置常用插件的方法。最后,还介绍了如何在GitHub上配置SSH密钥和git的基本配置。 ... [详细]
  • 本文介绍了腾讯最近开源的BERT推理模型TurboTransformers,该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想,通过简化问题和加速开发,实现了快速推理能力。同时,文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题,并提出了合并计算的解决方案。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • 本文介绍了使用readlink命令获取文件的完整路径的简单方法,并提供了一个示例命令来打印文件的完整路径。共有28种解决方案可供选择。 ... [详细]
author-avatar
heishi86188
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有