热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

字符串匹配(BF算法和KMP算法)

看了老师的录频,感觉还是得自己动手写写,不然估计可能不太懂,哈哈,那我们就先来看一下BF算法:我们先来看一个例子:现有这样的一个字符串“ababcabcdabcde”和“abcd”;
看了老师的录频,感觉还是得自己动手写写,不然估计可能不太懂,哈哈,那我们就先来看一下BF算法:

我们先来看一个例子:现有这样的一个字符串“ababcabcdabcde”和“abcd”;

BF算法应该是这样的:


不知道大家看懂了没,没关系,我们再来看一下代码再捋捋。

int BF(const char *s,const char *sub,int pos)
{
	int i = pos;
	int j = 0;
	int lens = strlen(s);
	int lensub = strlen(sub);
	while(i=lensub)
	{
		return i-j;
	}
	else
	{
		return -1;
	}
}
int main()
{
	char *s = "ababcdabe";
	char *sub = "abcd";
	cout< 
 

结果:


总结:不知道大家发现没有,i每次都需要回退到i-j+1处,但是就拿第一次匹配失败来说,i指向b,j指向a,b和a明显不相同,i就没有必要回退了。

那我们现在来看一下KMP算法,这个还不怎么好解释,画图先看看。

我们先来举一个例子s:abcababcabc        sub:abcabc

此时i指向s串的a,j指向sub的a,开始匹配,一直到:i指向s的第三个a,j指向sub的最后一个c,发现此刻不匹配,但是我们现在不需要将i回退,我们只需要将j回退到适当的k的位置上,


那么现在,最起码我们不用再将i回退,j也不用回退到原来的0的位置上了。

但是现在,我们最重要的是,怎么才能找到这个合适的k呢????????

我们再来看图:


这样我们就会轻易的发现,红色下划线的两个字符串相等,由于我们是在a和c的时候匹配失败的,所以我们取之前他的子集也是匹配的,所以蓝色下划线的两个字符串也是相等的,那么我们自然也可以推出在sub串中,红色下划线的字符串和蓝色下划线的字符串是相等的

那我们用表达式把它表达出来:

从P0......Pk-1  =  Px.......Pj-1;(x的位置我们现在还不知道)

那么就又有了:k-1-0 = j-1-x;那么就可以推出x = j-k;

那么也就有了:P0......Pk-1 = Pj-k......Pj-1;

那么其实我们也可以换种方式说:我们要找到匹配成功部分的两个相等的真字串,一个以0下标开头,一个以j-1下标结尾。

那么我要做的是将sub每一个可能出现失配的所有的k值next数组来保存。

现在我们来求一下每一个下标的k值:

以a  b  a  b  c  a  b  c  d  a  b  c  d  e

next[0] 我们初始为-1;

next[1]:a         b  a  b  c  a  b  c  d  a  b  c  d  e,真字串长度为0,  next[1] = 0;

next[2]:a  b         a  b  c  a  b  c  d  a  b  c  d  e,真字串长度为0,next[2] = 0;

next[3]:        b  c  a  b  c  d  a  b  c  d  e,真字串长度为1,next[3] = 1;

next[4]:a  b  a  b         c  a  b  c  d  a  b  c  d  e,真字串长度为2,next[4] = 2;

next[5]:a  b  a  b  c         a  b  c  d  a  b  c  d  e,真字串长度为0,  next[5] = 0;

next[6]:a  b  a  b  c  a        b   c  d  a  b  c  d  e,真字串长度为1,  next[6] = 1;

next[7]:a  b  a  b  c  a  b         c  d  a  b  c  d  e,真字串长度为2,  next[7] = 2;

next[8]:a  b  a  b  c  a  b  c         d  a  b  c  d  e,真字串长度为0,  next[8] = 0;

next[9]:a  b  a  b  c  a  b  c  d         a  b  c  d  e,真字串长度为0,  next[9] = 0;

next[10]:b a  b  c  a  b  c  d  a        b  c  d  e,真字串长度为1,  next[10] = 1;

next[11]:a  b   a  b  c  a  b  c  d a  b       c  d  e,真字串长度为0,  next[11] = 2;

next[12]:a  b  a  b  c  a  b  c  d  a  b  c       d  e,真字串长度为0,  next[12] = 0;

next[13]:a  b  a  b  c  a  b  c  d  a  b  c   d       e,真字串长度为0,  next[13] = 0;

哇,打的我快吐血了

那我们怎么用代码来求这个next数组呢(上面是我们手动求的):

首先,不管是怎么样的字符串,我们都有next[0] = -1,next[1] = 0;那么如果我们能通过next[i]的值来推出next[i+1]的值,那我们就万事大吉了,那么我们就要找next[i]和next[i+1]d的关系:

那我们不妨先假设next[j] = k;那么就有:P0.....Pk-1   =   Pj-k.....j-1.

如果Pk = Pj;我们就能推出:P0.......Pk =  Pj-k........Pj  =>  next[i+1] = k+1;

例如:

next[6]:a  b  a  b  c  a        b   c  d  a  b  c  d  e, next[6] = 1;//k等于1,

next[7]:a  b  a  b  c  a  b         c  d  a  b  c  d  e, next[7] = 2;//此时k= 1,j =6:P0.....P1  =  P5......P6(P0....Pk = Pj-1......Pj) ,那么next[7] = k+1 = 2;

qi其实说白了就是新增的两个字符是相等的。。。。

那么还有第二种可能就是Pj != Pk

我们重新举个例子:



注意是:k = next[k];我们刚刚是在2的位置上失配的。。。。。。

那我们现在看一下代码的实现:

void GetNext(int *next,const char *sub)
{
	int lensub = strlen(sub);
	next[0] = -1;
	next[1] = 0;
	int i = 2;//i已经加1了
	int k = 0;
	while(i=lensub)//找到了
		return i-j;
	else
		return -1;
}
int main()
{
	char *s = "ababcdabe";
	char *sub = "abcd";
	cout< 
 



推荐阅读
  • 动态规划算法的基本步骤及最长递增子序列问题详解
    本文详细介绍了动态规划算法的基本步骤,包括划分阶段、选择状态、决策和状态转移方程,并以最长递增子序列问题为例进行了详细解析。动态规划算法的有效性依赖于问题本身所具有的最优子结构性质和子问题重叠性质。通过将子问题的解保存在一个表中,在以后尽可能多地利用这些子问题的解,从而提高算法的效率。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • Linux环境变量函数getenv、putenv、setenv和unsetenv详解
    本文详细解释了Linux中的环境变量函数getenv、putenv、setenv和unsetenv的用法和功能。通过使用这些函数,可以获取、设置和删除环境变量的值。同时给出了相应的函数原型、参数说明和返回值。通过示例代码演示了如何使用getenv函数获取环境变量的值,并打印出来。 ... [详细]
  • Java太阳系小游戏分析和源码详解
    本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践,作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构,包括工具类、常量、图片加载、面板等。通过这个小游戏的制作,读者可以巩固和应用所学的知识,如类的继承、方法的重载与重写、多态和封装等。 ... [详细]
  • 本文详细介绍了GetModuleFileName函数的用法,该函数可以用于获取当前模块所在的路径,方便进行文件操作和读取配置信息。文章通过示例代码和详细的解释,帮助读者理解和使用该函数。同时,还提供了相关的API函数声明和说明。 ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • 本文介绍了如何在给定的有序字符序列中插入新字符,并保持序列的有序性。通过示例代码演示了插入过程,以及插入后的字符序列。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 本文介绍了P1651题目的描述和要求,以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术,将问题转化为求解差值的问题,并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • 本文介绍了汉诺塔问题的迭代算法实现,通过递归的方式将盘子从一个地方搬到另一个地方,并打印出移动的顺序。详细介绍了算法的思路和步骤,以及示例代码的运行结果。 ... [详细]
  • 猜字母游戏
    猜字母游戏猜字母游戏——设计数据结构猜字母游戏——设计程序结构猜字母游戏——实现字母生成方法猜字母游戏——实现字母检测方法猜字母游戏——实现主方法1猜字母游戏——设计数据结构1.1 ... [详细]
author-avatar
三星anycall
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有