BF 算法

server/2024/10/19 17:39:10/

目录

BF算法

算法思路

完整代码

时间复杂度

查找所有起始位置


BF算法

BF算法:即暴力(Brute Force)算法,是一种模式匹配算法,将目标串 S 的第一个字符与模式串 T 的第一个字符进行匹配,若相等,则继续比较 S 的第二个字符和 T 的第二个字符;若不相等,则比较 S 的第二个字符和 T 的第一个字符,依次比较下去,直到得出最后的匹配结果

例如:

给定字符串S :"abcdef" 作为主串,给定字符串T: "cd" 作为子串,此时,就需要在主串中查找是否出现子串,若出现,则返回主串中第一个匹配字符的下标;若未出现,则返回 -1

接下来,我们就来看 BF 算法是如何在主串中查找子串的,也就是 BF 算法的思路

算法思路

我们通过一个具体的例子来看:

定义 i 指向主串的 0 下标,j 指向子串的 0 下标

以主串的 0 下标位置作为起始位置开始匹配:

判断 i 位置的字符是否和 j 位置的字符相等, i 位置和 j 位置字符都为 a,相等,则这两个字符匹配成功,i 和 j 向后移动,继续匹配

继续判断 i 位置字符 是否与 j 位置字符相等, i 位置和 j 位置字符都为 b,相等,这两个字符也匹配成功,i 和 j 继续向后移动,进行匹配

继续判断 i 位置字符 是否与 j 位置字符相等,i 位置字符为 c,j 位置字符为 e,不相等,说明以 a(0 下标位置) 为起始位置匹配子串匹配失败

此时,需要将 i 进行回退,由于 a(0下标)作为起始位置匹配失败,因此,继续以 b (1下标)作为起始位置开始尝试匹配,也就是以 原起始位置 + 1 作为新的起始位置开始重新匹配

同样,j 也需要回退,需要将 j 回退到 0 下标位置,与下一个起始位置重新开始匹配

 由于 i 向前移动,当匹配失败时,我们该如何确定起始位置呢?

 由于当 i 和 j 匹配成功时,两者会同时向后移动,因此,通过 j 就可以知道 i 向前移动了多少步

 i - j 就是本次匹配的起始位置,而 i - j + 1 也就是新的起始位置

以 1 下标为起始位置继续匹配:

 i 位置字符为 b,j 位置字符为 a,不相等,说明以 b 为起始位置匹配子串匹配失败,再次回退,由于 i = 1,j = 0,因此,新的起始位置为 2,j 的位置为 0 

继续匹配,  i 位置字符为 c,j 位置字符为 a,不相等,说明以 c 为起始位置匹配子串匹配失败,再次回退,由于 i = 2,j = 0,因此,新的起始位置为 3,j 的位置为 0 

继续匹配, i 位置和 j 位置字符都为 a,相等,这两个字符匹配成功,i 和 j 向后移动

继续匹配, i 位置和 j 位置字符都为 b,相等,这两个字符也匹配成功,i 和 j 向后移动

 继续匹配, i 位置和 j 位置字符都为 e,相等,这两个字符也匹配成功,i 和 j 向后移动 

此时,子串已经遍历完了,也就说明 子串 中的所有字符都与 主串 中的字符相匹配,在主串中找到了子串,此时,就可以直接返回主串中本次匹配的起始位置,也就是 i - j

而若是主串先遍历完成,也就说明 主串 中没有与 子串 中字符完全匹配的字符串,找不到,此时,就需要返回 -1

总结一下上述过程:

1. 定义 i 指向主串的 0 下标,j 指向子串的 0 下标

2. 判断 i 位置字符与 j 位置字符是否相同,若相同,i 和 j 同时向后移动(i++ 且 j++);若不同,则i 和 j 都需要进行回退(i = i - j + 1,j = 0)

3. 重复 2 过程,直到遍历完 主串 或 子串,若子串先遍历完,说明在主串中找到了子串,匹配成功,返回起始位置(i - j);若主串先遍历完,说明主串中找不到子串,匹配失败,返回 -1

在分析了 BF 算法的思路之后,我们就来尝试编写代码

完整代码

java">    /*** 判断主串中是否含有子串* @param str 主串* @param target 子串* @return 主串中含有子串,返回主串中子串第一次出现的起始下标;若不含有,返回 -1*/public int BF(String str, String target) {// 处理特殊情况if (str == null || target == null) {return -1;}int strLen = str.length();int targetLen = target.length();if (strLen == 0 || strLen < targetLen) {return -1;}// 开始判断int i = 0, j = 0;while (i < strLen && j < targetLen) {// 判断 str 中 i 位置字符是否与 target 中j 位置字符相同if (str.charAt(i) == target.charAt(j)) {// 相同,i 和 j 都向后移动i++;j++;} else {// 不相同,i 和 j 都进行回退i = i - j + 1;j = 0;}}// 子串先遍历完if (j >= targetLen) {return i - j;} else {// 主串先遍历完return -1;}}

接下来,我们来分析 BF 算法时间复杂度

时间复杂度

假设主串长度为 M,子串长度为 N

在最坏情况下,

在主串的前 M - N 个位置,每一次匹配时,都要比较到子串的最后一个字符(比较 N 次),才发现匹配不成功,然后再将 i 和 j 退回,继续比较,一共比较了 (M - N) * N

在 主串的最后 N 个位置,也分别匹配了 N、N - 1、N - 2...次,也就是 (N + 1)(N) / 2

因此,时间复杂度为 O(M*N)

上述我们查找的是主串中子串第一次出现时的起始位置,那么, 若我们想要查找主串中与子串相同的字符串的所有起始位置,该如何实现呢?

查找所有起始位置

与查找 主串中子串第一次出现的起始位置 思路相同

但是,当我们找到第一个起始位置(也就是 j 第一次遍历完子串时)时,不能直接返回,而是要继续在主串中查找

例如:

j 第一次遍历完子串:

以 0 下标为起始的字符串与子串匹配成功,将 0 下标存储起来,然后继续查找 

此时,以 i + 1 为起始位置的字符串可能与字符相同,因此需要将 i 进行回退,继续查找

同时,也需要将 j 回退到 0 下标位置,重新开始匹配

 

总结一下上述过程:

1. 定义 i 指向主串的 0 下标,j 指向子串的 0 下标

2. 判断 i 位置字符与 j 位置字符是否相同,若相同,i 和 j 同时向后移动(i++ 且 j++);若不同,则i 和 j 都需要进行回退(i = i - j + 1,j = 0)

3. 判断 j 是否遍历完子串,若遍历完,则存储起始位置(i - j),再将 i 和 j 进行回退(i = i - j + 1,j = 0)

4. 重复 2、3 直到主串遍历完成

 代码实现:

java">    /*** 查找主串中与子串相同的字符串的所有起始位置* @param str 主串* @param target 子串* @return 查询结果集*/public List<Integer> BF(String str, String target) {List<Integer> ret = new ArrayList<>();// 处理特殊情况if (str == null || target == null) {return ret;}int strLen = str.length();int targetLen = target.length();if (strLen == 0 || strLen < targetLen) {return ret;}// 开始判断int i = 0, j = 0;while (i < strLen) {// 判断 str 中 i 位置字符是否与 target 中j 位置字符相同if (str.charAt(i) == target.charAt(j)) {// 相同,i 和 j 都向后移动i++;j++;} else {// 不相同,i 和 j 都进行回退i = i - j + 1;j = 0;}// 判断子串是否遍历完成if (j >= targetLen) {ret.add(i - j);i = i - j + 1;j = 0;}}return ret;}

http://www.ppmy.cn/server/133117.html

相关文章

云开发 | 如何往云数据库中添加一条新数据

1.事件绑定 2.事件处理 我的数据类型&#xff1a; addUser(){db.collection("userList").add({// data 字段表示需新增的 JSON 数据data:{"age":20,"class":"软件工程","grade":2020,"name":"阿敏呐"}…

基于卡尔曼滤波算法处理感知车道线系数

在工程实践中&#xff0c;由于感知识别到的车道线偶尔存在较大的跳变&#xff0c;导致后端控制算法计算出的控制角度也存在较大的跳变&#xff0c;所以我们需要对感知输入的车道线系数进行平滑处理。卡尔曼滤波算法的基本原理见上一篇文章https://mp.csdn.net/mp_blog/creation…

编程实战:利用API接口轻松获取商品数据

在数字化时代&#xff0c;电商数据的实时获取对于市场分析、库存管理、价格比较等业务至关重要。API&#xff08;应用程序编程接口&#xff09;提供了一种便捷的方式来访问这些数据。本文将向你展示如何在编程中利用API接口获取商品数据&#xff0c;并提供一个简单的代码示例。…

R语言对矩阵的列进行标准化处理|解锁数据分析中的核心步骤|如何提升机器学习模型的表现?|机器学习|标准化|数据处理|R语言|矩阵...

标准化是数据分析与机器学习中的重要步骤&#xff0c;尤其是在处理不同量纲的特征时&#xff0c;标准化有助于消除不同尺度带来的影响&#xff0c;使得算法在处理数据时更加高效且稳定。在R语言中&#xff0c;对矩阵的列进行标准化处理是一个常见的需求&#xff0c;本文将深入探…

小白学大模型 RAG:GraphRAG 概念、组成和流程,看完这一篇你就懂了!!

unset什么是GraphRAG&#xff1f;unsetunset GraphRAG是一种结合了检索&#xff08;Retrieval&#xff09;和生成&#xff08;Generation&#xff09;的技术&#xff0c;它通过利用外部知识库来增强大型语言模型&#xff08;LLMs&#xff09;的性能&#xff0c;有效解决了模型…

【机器学习】聚类算法|KMeans实现流程|SSE误差平法和|SC轮廓系数法|顾客数据聚类分析案例

文章目录 聚类算法聚类算法简介聚类算法分类 聚类算法API案例 使用KMeans模型数据探索聚类 KMeans实现流程***模型评估方法误差平方和 SSE(The sum of squares due to error)“肘”方法 (Elbow method) - K值确定 SC轮廓系数法&#xff08;Silhouette Coefficient&#xff09;聚…

关于WPF(Windows Presentation Foundation)中Grid控件

本文将从Grid控件的基础概念开始&#xff0c;逐步深入探讨其特性、用法、实例代码&#xff0c;以及最佳实践。 1. WPF和布局简介 WPF是一种用于构建Windows桌面应用程序的UI框架&#xff0c;它通过XAML&#xff08;Extensible Application Markup Language&#xff09;使开…

高效生鲜配送系统:为餐饮店、饭店配送蔬菜专用软件

在竞争激烈的餐饮行业中&#xff0c;新鲜优质的食材是打造美味佳肴的基础。而一个高效可靠的万象生鲜食材批发配送系统&#xff0c;能够为餐饮店和饭店提供稳定、及时的生鲜供应&#xff0c;助力餐饮企业在市场中脱颖而出。 一、精准对接餐饮需求我们的生鲜配送系统专为餐饮店和…