热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

面向机器学习的自然语言标注3.3语言模型

面向,机器,学习,的,自然,语言,标注

3.3 语言模型


n元语法的好处是什么呢?多年来自然语言处理已经利用n元语法开发了预测序列行为的统计语言模型(language model)。序列行为涉及在包含多个X的序列中识别下一个X。例如,语音识别、机器翻译等。在给定前一个元素的前提下语言模型预测序列中的下一个元素。

让我们更仔细地看看它是如何工作的,以及如何使用前几章讨论的工具。假设有一个单词序列,w1,w2,?wn。预测序列中的任意“下一个单词”wi可以表示为下面的概率函数:

 

等价于:

 

请注意,这里涉及两个联合概率分布的计算。我们假定用语料库中的单词序列的频率来估计它的概率。即,

P(w1,?wi-1) = Count(w1,?wi-1)

P(w1,?wi) = Count(w1,?wi)

以下比率称为相对频率(relative frequency):

 

注意: 正如我们所看到的,n


推荐阅读
author-avatar
王琰杰昔凛
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有