BF 和RK 算法

举报
毛利 发表于 2021/07/15 06:36:03 2021/07/15
【摘要】 BF算法 BF算法,即暴风(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法。 从字符串A虫查找B 首先S[1]和T[1]比较...

BF算法

BF算法,即暴风(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法。

从字符串A虫查找B

在这里插入图片描述

首先S[1]和T[1]比较,若相等,则再比较S[2]和T[2],一直到T[M]为止;若S[1]和T[1]不等,则S向右移动一个字符的位置,再依次进行比较。如果存在k,1≤k≤N,且S[k+1…k+M]=T[1…M],则匹配成功;否则失败。

该算法最坏情况下要进行M*(N-M+1)次比较,时间复杂度为O(M*N)。

模式串长度为m,主串长度为n,在主串,就会有n-m+1 个长度为m的子串,然后暴力对比n-m+1 个子串于模式串,找出对应配对的子串

RK 算法

在BF算法引进哈希算法

RK算法思想

假设我们有某个hash函数可以将字符串转换为一个整数,则hash结果不同的字符串肯定不同,但hash结果相同的字符串则很有可能相同(存在小概率不同的可能)。

算法每次从S中取长度为m的子串,将其hash结果与P的hash结果进行比较,若相等,则有可能匹配成功,若不相等,则继续从S中选新的子串进行比较。

在这里插入图片描述
假设要匹配的字符串的字符集值包含K个字符
,就可以用一个K进制来表示子串,这个K进制转化成十进制

比如包含a~z26个小写字母,映射到0 ~ 25个数字,a 表示 0,z 表示 25

在这里插入图片描述

在这里插入图片描述

相邻两个子串s [ i-1] 和 s[i] ( i 表示子串在主串的其实位置,子串的长度都为m),对应的哈希值计算公式有交集。使用s [i-1] 的哈希值 很快计算出s [i ]的哈希值
在这里插入图片描述
RF算法比BF 算法要高

模式串哈希值于每一个哈希值之间的比较时间复杂度是 O ( 1 ) O(1) O(1),总需要n-m+1给子串的哈希值,所以 时间复杂度是 O ( n ) O(n) O(n)

文章来源: maoli.blog.csdn.net,作者:刘润森!,版权归原作者所有,如需转载,请联系作者。

原文链接:maoli.blog.csdn.net/article/details/90680468

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。