热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

【机器学习】隐含马尔科夫模型从初识到应用

一、前述马尔可夫(1856~1922),苏联数学家。切比雪夫的学生。在概率论、数论、函数逼近论和微分方程等方面卓有成就。马尔可夫模型&#x

一、前述

    马尔可夫(1856~1922),苏联数学家。切比雪夫的学生。在概率论、数论、函数逼近论和微分方程等方面卓有成就。
    马尔可夫模型(Markov Model)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通用的统计工具。

二、具体

1、案例

问题一:
         如果今天的天气状况是晴天,那么明天是多云而且后天有雾的概率是多大?

         1*0.2*0.1(1*0.2是从晴天转多云的概率,*0.1是从多云转向有雾的概率)
问题二:
         如果今天有雾,那么两天后有雨的概率是多大?(第二天的天气可以是晴天、多云、有雨或有雾)

 

 概率累加即可

         
 问题三:    
         在天气问题中,如果今天是晴天,我们求第三天最可能的天气状况,应该怎么做?
   (假定今天的天气只能通过过去几天已知的天气情况进行预测——而对于其他因素,譬如风力、气压等则没有考虑。在这个例子以及其他相似的例子中,这样的假设显然是不现实的)

问题四:

直接算法
如果今天的天气状况是晴天,那么明天是多云而且后天有雾的概率是多大?
        p(S2=cloudy,S3=foggy|S1=sunny)
      =P(S3=foggy|S2=cloudy,S1=sunny)*P(S2=cloudy|S1=sunny)
      =P(S3=foggy|S2=cloudy)*P(S2=cloudy|S1=sunndy)
      =0.1*0.2
      =0.02
总结:

在问题一中,我们注意到注意每一个状态都是唯一的依赖于前一个状态,就像交通灯一样,如果交通灯为绿色,那么下一个颜色状态将始终是黄色——也就是说,该系统是确定性的。确定性系统相对比较容易理解和分析,因为状态间的转移是完全已知的,对于给定的天气状况,我们可以直接通过状态间的装换概率来计算,但问题二中,我们只已知了今天和后天的天气状况,而明天的天气状况是隐藏的,未知的,它可能是晴天、雨天、多雾、多云这些状态,所以,这个时候我们前面的状态马尔可夫模型就要做一些变化


2、   隐马尔可夫模型(Hidden Markov Model,HMM)概述

      在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。
而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。
       HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、词性标注及语音识别等,在NLP中占有很重要的地位。
        一个更实际的问题是语音识别,我们听到的声音是来自于声带、喉咙大小、舌头位置以及其他一些东西的组合结果。所有这些因素相互作用产生一个单词的声音,一套语音识别系统检测的声音就是来自于个人发音时身体内部物理变化所引起的不断改变的声音。
  一些语音识别装置工作的原理是将内部的语音产出看作是隐藏的状态,而将声音结果作为一系列观察的状态,这些由语音过程生成并且最好的近似了实际(隐藏)的状态。在这两个例子中,需要着重指出的是,隐藏状态的数目与观察状态的数目可以是不同的。一个包含四个状态的天气系统(晴天、多云、雨天)中,一个观察现象;纯粹的语音可以由80个音素描述,而身体的发音系统会产生出不同数目的声音,或者比80多,或者比80少。
  在这种情况下,观察到的状态序列与隐藏过程有一定的概率关系。我们使用隐马尔科夫模型对这样的过程建模,这个模型包含了一个底层隐藏的随时间改变的马尔科夫过程,以及一个与隐藏状态某种程度相关的可观察到的状态集合。


3、   隐马尔可夫模型(Hidden Markov Model,HMM)原理

 

     HMM由初始概率分布Π,状态转移分布概率A以及观测概率分布B确定。


   Q是所有可能的状态的集合,N是可能的状态数:

 

  V是所有可能观测的集合,M是所有可能的观测数:

HMM由初始概率分布Π、状态转移概率分布A以及观测概率分布B确定。
 Π和A决定状态序列,B决定观测序列,因此HMM可以用三元符号表示,称为HMM三要素:
 

4、应用(对天气案例问题二)

        1、直接算法(暴力算法)

如果今天有雾,那么两天后有雨的概率是多大?(第二天的天气可以是晴天、多云、有雨或有雾)
       P(S3=foggy|S1=foggy)
=P(S3=foggy,S2=sunny|S1=foggy)+P(S3=foggy,S2=cloudy|S1=foggy)
  +P(S3=foggy,S2=rainy|S1=foggy)+P(S3=foggy,S2=foggy|S1=foggy)
=P(S3=foggy|S2=sunny)*P(S2=sunny|S1=foggy)+
   P(S3=foggy|S2=cloudy)*P(S2=cloudy|S1=foggy)+
   P(S3=foggy|S2=rainy)*P(S2=rainy|S1=foggy)+
    P(S3=foggy|S2=foggy)*P(S2=foggy|S1=foggy)
=0.1*0.0+0.1*0.4+0.1*0.3+0.3*0.3=0.16


    2、前向算法

 

 

 

       

 


转载于:https://www.cnblogs.com/LHWorldBlog/p/8759029.html


推荐阅读
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 推荐 :以数据驱动的方式讲故事
    直觉vs数据首先,你有思考过一个问题吗?当你的直觉与你所掌握的数据矛盾的时候,你是听从于直觉还是相信你所掌握的数据呢?201 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • NLP如何进阶?你应该先掌握四大基本任务!
    “语言理解是人工智能领域皇冠上的明珠。”——比尔盖茨自然语言处理是一门综合性的学问,它远远不止机器学习算法。相比图像或语音,文本的变化更加复杂ÿ ... [详细]
  • 拯救万千学子于水深火热之中!Facebook开源无梯度优化工具
    乾明发自凹非寺量子位出品|公众号QbitAI机器学习啥最苦?十有八九找参数!不少研究生,都被卡在这个环节上,久久不能毕业。现 ... [详细]
  • 作为机器学习最重要的一个分支,近年来深度学习(DeepLearning)发展势头迅猛,借助庞大的数据 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文介绍了网页播放视频的三种实现方式,分别是使用html5的video标签、使用flash来播放以及使用object标签。其中,推荐使用html5的video标签来简单播放视频,但有些老的浏览器不支持html5。另外,还可以使用flash来播放视频,需要使用object标签。 ... [详细]
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
  • 早晨七点半。北京初秋的凉风叫醒了住在望京西的你,睁开眼睛,一想到又要为人类的信息化事业贡献满满的正能量,你不禁哼唱起那句“早晨起来 ... [详细]
  • 机器学习毫无争议的是如今学术界和工业界最热的领域,它涵盖计算机视觉(CV)、自然语言处理(NLP)、深度学习(DL)等多种技术,在图像识别、知识图谱以及最近非常火热的无人驾驶等诸多领 ... [详细]
author-avatar
aaaa
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有