第4章学习小结_串(BF&KMP算法)、数组（三元组）

作者：无情的有情人家_834 | 来源：互联网 | 2023-06-08 21:58

这一章学习之后，我想对串这个部分写一下我的总结体会。串也有顺序和链式两种存储结构，但大多采用顺序存储结构比较方便。字符串定义可以用字符数组比如：charc[10];也可以用C++中

　　这一章学习之后，我想对串这个部分写一下我的总结体会。

　　串也有顺序和链式两种存储结构，但大多采用顺序存储结构比较方便。字符串定义可以用字符数组比如：char c[10];也可以用C++中定义一个字符串string a;这就需要根据具体场景来选择合适方便操作的方法。还有空串和空格串是不同的，空串字符长度为0（符号‘∅’），空格串包含一个或多个空格。这一章学习了两个串的模式匹配算法，特别是KMP算法，从中受益匪浅。

一、串

1、BF（Brute-Force）算法

　　这个模式匹配算法简单直观，被人们称为暴力算法。它就是将模式串跟主串从开头一个一个比较，如果匹配失败，又从模式串第二个字符一次比较，以此类推，逻辑思维不高，所以简单，容易理解，现在用途还很大。

i	0	1	2	3	4
主串	a	b	c	a	b
模式串j(第1次比较)	c	a	b
(第2次比较)		c	a	b
(第3次比较)			c	a	b

这里我是用字符串下标，从0开始，可以看出每次比较模式串都从j=0开始，而i就是上次初始比较的下一个就是i=i-j+1，比如上面的第一次比较后i=0,j=0;下一次i=0-0+1,即从i=1进行匹配。

现在以题目为例，写一下我的解题过程。

7-1 串的模式匹配

　　给定一个主串S（长度<=10^6）和一个模式T（长度<=10^5），要求在主串S中找出与模式T相匹配的子串，返回相匹配的子串中的第一个字符在主串S中出现的位置。

输入格式: 输入有两行：第一行是主串S；第二行是模式T.

输出格式: 输出相匹配的子串中的第一个字符在主串S中出现的位置。若匹配失败，输出0.

输入样例:

在这里给出一组输入。例如：

aaaaaba
ba

输出样例:

在这里给出相应的输出。例如：6

int BF(string A,string B)//这里算法是从下标为0开始，所以跟书里有点不同
{
    int i=0,j=0;
    while(iB.length())
    {
        if(A[i]==B[j])
        {
            ++i;++j;
        }
        else 
        {
            i=i-j+1;j=0;//根据上面分析，下标后退进行比较
        }
    }
    if(j>=B.length()) return i-j+1; //返回匹配成功第一个位置
    return 0;
}

View Code

我感觉用下标比较容易操作，只需要改一下相应的位置，然后直接用C++定义字符串string，再输入字符串，相对也比较简洁。

主函数如下：

int main()
{
    string a,b;
    getline(cin,a);//输入一个串之后回车就可以输入下一个串
    getline(cin,b);
    //int num=BF(a,b);
        //int num=KMP(a,b);这里两个选一个，下面KMP算法的主函数一样
    cout<<num;
    return 0;
 }

View Code

这道题用BF算法可以简单就解决了，那为啥还要有KMP算法呢？

　　一般情况下，BF算法时间复杂度为O（m*n），数据量不大时候，执行时间近似为O（m+n）,但如果是庞大数据，那它的效率就很低了，我们老师专门设了一个测试点主串长度100万，模式长度10万，而且是那种主串为aaaaaaaa...,模式串是ba......。所以，从第一个字符比较一直不匹配，而模式串一直回溯到j=0,这样工作量超大，所以上面BF算法提交之后在这个测试点是运行超时的。

这样，才有优化算法KMP,第一次看的时候一脸懵，无法理解三个大牛的逻辑思维。所以我搜索了几篇博客认真学习，试图融入大牛的思维世界。

（链接：https://blog.csdn.net/henuyx/article/details/44653799、https://www.cnblogs.com/tangzhengyue/p/4315393.html）

2、KMP算法

这种改进算法是由D.E.Knuth、J.H.Morris、V.R.Pratt三位大牛同时设计实现的。下面我就捋一下我入门的思路方法。

　　KMP最让人难以理解就是它的next数组是如何得到的，开始我觉得很神奇，next数组居然实现了字符匹配的“跳转”。举个例子，看看是如何算出next数组的。

模式串 a b a a b c a c

下标 j 0 1 2 3 4 5 6 7

推荐阅读

string
Java实现大数乘法（分治算法）

本文介绍了使用Java实现大数乘法的分治算法，包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]

蜡笔小新 2023-12-14 15:43:50
get
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
string
lua语言闭包、模式匹配、日期、编译、模块的特性及应用

本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值，函数可以作为变量自由传递，也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性，为程序开发带来了便利。 ... [详细]

蜡笔小新 2023-12-14 18:18:21
string
Python高级之网络编程及TCP/IP协议簇的OSI七层模型介绍

本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容，主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]

蜡笔小新 2023-12-14 18:16:27
format
C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享

本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]

蜡笔小新 2023-12-14 15:56:00
format
PHP设置MySQL字符集的方法及使用mysqli_set_charset函数

本文介绍了PHP设置MySQL字符集的方法，详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]

蜡笔小新 2023-12-14 15:30:33
format
Android中高级面试必知必会，积累总结

本文介绍了Android中高级面试的必知必会内容，并总结了相关经验。文章指出，如今的Android市场对开发人员的要求更高，需要更专业的人才。同时，文章还给出了针对Android岗位的职责和要求，并提供了简历突出的建议。 ... [详细]

蜡笔小新 2023-12-14 14:53:02
string
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
string
力扣leetcode 1584. 连接所有点的最小费用

给定一个二维平面上的一些点，通过计算曼哈顿距离，求连接所有点的最小总费用。只有任意两点之间有且仅有一条简单路径时，才认为所有点都已连接。给出了几个示例并给出了对应的输出。 ... [详细]

蜡笔小新 2023-12-14 12:55:48
string
PHP URL处理的三个函数详解

本文详细介绍了PHP中与URL处理相关的三个函数：http_build_query、parse_str和查询字符串的解析。通过示例和语法说明，讲解了这些函数的使用方法和作用，帮助读者更好地理解和应用。 ... [详细]

蜡笔小新 2023-12-14 12:32:13
format
C#学习教程：解析CIM_DateTime为.Net DateTime

本文介绍了如何将CIM_DateTime解析为.Net DateTime，并分享了解析过程中可能遇到的问题和解决方法。通过使用DateTime.ParseExact方法和适当的格式字符串，可以成功解析CIM_DateTime字符串。同时还提供了关于WMI和字符串格式的相关信息。 ... [详细]

蜡笔小新 2023-12-14 12:19:34
case
C语言注释工具及快捷键，删除C语言注释工具的实现思路

本文介绍了C语言中注释的两种方式以及注释的作用，提供了删除C语言注释的工具实现思路，并分享了C语言中注释的快捷键操作方法。 ... [详细]

蜡笔小新 2023-12-14 11:22:08
case
如何在有序字符序列中插入新字符并保持有序

本文介绍了如何在给定的有序字符序列中插入新字符，并保持序列的有序性。通过示例代码演示了插入过程，以及插入后的字符序列。 ... [详细]

蜡笔小新 2023-12-14 11:16:33
case
游戏开发中的人工智能技术及分类介绍

本文介绍了游戏开发中的人工智能技术，包括定性行为和非定性行为的分类。定性行为是指特定且可预测的行为，而非定性行为则具有一定程度的不确定性。其中，追逐算法是定性行为的具体实例。 ... [详细]

蜡笔小新 2023-12-14 10:22:59
string
java 线程死锁模拟

1，关于死锁的理解死锁，我们可以简单的理解为是两个线程同时使用同一资源，两个线程又得不到相应的资源而造成永无相互等待的情况。 2，模拟死锁背景介绍：我们创建一个朋友 ... [详细]

蜡笔小新 2023-12-13 19:12:25

无情的有情人家_834

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章