2025-04-27:统计重新排列后包含另一个字符串的子字符串数目Ⅱ。用go语言,给定两个字符串 word1 和 word2,
【摘要】 2025-04-27:统计重新排列后包含另一个字符串的子字符串数目Ⅱ。用go语言,给定两个字符串 word1 和 word2,如果存在一个字符串 x,将 x 重排后,word2 恰好是该重排字符串的前缀,我们就称这个字符串 x 是“合法的”。现在需要计算在 word1 中,有多少个子字符串满足“合法”的条件。此外,因为本题对内存使用有较严要求,解法必须保证时间复杂度为线性,即 O(n)。1 ...
2025-04-27:统计重新排列后包含另一个字符串的子字符串数目Ⅱ。用go语言,给定两个字符串 word1 和 word2,
如果存在一个字符串 x,将 x 重排后,word2 恰好是该重排字符串的前缀,我们就称这个字符串 x 是“合法的”。
现在需要计算在 word1 中,有多少个子字符串满足“合法”的条件。
此外,因为本题对内存使用有较严要求,解法必须保证时间复杂度为线性,即 O(n)。
1 <= word1.length <= 1000000。
1 <= word2.length <= 10000。
word1 和 word2 都只包含小写英文字母。
输入:word1 = “bcca”, word2 = “abc”。
输出:1。
解释:
唯一合法的子字符串是 “bcca” ,可以重新排列得到 “abcc” ,“abc” 是它的前缀。
题目来自leetcode3298。
详细步骤说明:
1. 统计 word2 的字符需求
-
创建一个长度为26的数组
diff
,代表26个小写字母的计数差异。 -
遍历 word2 中的每个字符,将对应位置的计数减1(即
diff[c - 'a']--
),表示我们对这些字符的需求。 -
例如 word2 是 “abc”,
diff['a'-'a'] = -1
,diff['b'-'a'] = -1
,diff['c'-'a'] = -1
,其余为0,表示这三个字符是必须出现的。
2. 统计字符需求未满足的数量
-
统计 diff 数组中小于0的元素个数,记为
cnt
。 -
这个
cnt
表示还有多少种字符的需求尚未被满足。 -
开始时,
cnt
就是 word2 有多少种不同字符,因为它们在 diff 中是负数。
3. 采用滑动窗口遍历 word1,动态调整 diff 和 cnt
-
设置两个指针,
l
(左边界)和r
(右边界),初始均指向字串起点。 -
定义一个窗口即子字符串 word1[l:r]。
-
通过移动指针,动态更新 diff 和 cnt 来判断当前窗口内字符是否满足条件。
-
更新规则:
-
当右指针 r 指向的字符加入窗口时,更新该字符计数在 diff 中增加1。
-
若某字符的计数由负变零,说明该字符需求得到满足,
cnt
减1。 -
当左指针 l 移出一个字符时,把对应字符计数减少1。
-
若某字符计数由零变负了,说明需求被破坏,
cnt
增1。
-
4. 通过移动右指针满足字符需求
-
循环让右指针往右移动,直到
cnt
为0,说明当前窗口满足 word2 字符需求(即子串字符集包含 word2所有要求的字符数)。 -
注意,右指针可能移动到子串末尾。
5. 统计满足条件的子串数
-
当
cnt
为0时:-
代表从当前位置 l 开始的子串,任意以 r 或更右边作为结束位置的子串,均满足条件。
-
由于以 r 结尾的窗口是最小满足条件的窗口,从 r 到 word1 末尾,共有
len(word1) - r + 1
个子串以 l 为左边界满足条件。 -
将这些子串数累加到结果
res
中。
-
6. 左指针右移,继续查找其它满足条件的子串
-
左指针右移一位,弹出最左字符,更新 diff 和 cnt,再重复上述过程。
-
持续执行直到 l 指向 word1 结尾。
总结
通过滑动窗口,维护 diff 和 cnt,实现以线性方式找到所有满足合法条件的子串。
代码中 update
函数负责维护 diff 和 cnt 的值,使得计算更加高效。
时间复杂度
-
滑动窗口中左、右指针均在字符串上只移动一遍,整体指针移动次数不超过 O(len(word1))。
-
更新 diff 和 cnt 的操作为常数时间。
-
整体时间复杂度为 O(n),n = word1 长度。
空间复杂度
-
需要一个固定长度为26的数组
diff
,用于存储字符差异计数,无论输入多大,空间固定。 -
额外空间约为 O(1)。
结论
该方法在保证线性时间复杂度 O(n) 的基础上,实现了对字符需求的快速更新和判断,空间复杂度为常量级,符合题目对性能和内存限制的要求。
Go完整代码如下:
package main
import (
"fmt"
)
func validSubstringCount(word1 string, word2 string) int64 {
diff := make([]int, 26)
for _, c := range word2 {
diff[c-'a']--
}
cnt := 0
for _, c := range diff {
if c < 0 {
cnt++
}
}
var res int64
l, r := 0, 0
for l < len(word1) {
for r < len(word1) && cnt > 0 {
update(diff, int(word1[r]-'a'), 1, &cnt)
r++
}
if cnt == 0 {
res += int64(len(word1) - r + 1)
}
update(diff, int(word1[l]-'a'), -1, &cnt)
l++
}
return res
}
func update(diff []int, c, add int, cnt *int) {
diff[c] += add
if add == 1 && diff[c] == 0 {
// 表明 diff[c] 由 -1 变为 0
*cnt--
} else if add == -1 && diff[c] == -1 {
// 表明 diff[c] 由 0 变为 -1
*cnt++
}
}
func main() {
word1 := "bcca"
word2 := "abc"
result := validSubstringCount(word1, word2)
fmt.Println(result)
}
Python完整代码如下:
# -*-coding:utf-8-*-
def valid_substring_count(word1: str, word2: str) -> int:
diff = [0] * 26
for c in word2:
diff[ord(c) - ord('a')] -= 1
cnt = sum(1 for x in diff if x < 0)
def update(diff, c, add):
nonlocal cnt
diff[c] += add
if add == 1 and diff[c] == 0:
# diff[c] 从 -1 变成 0
cnt -= 1
elif add == -1 and diff[c] == -1:
# diff[c] 从 0 变成 -1
cnt += 1
res = 0
l = 0
r = 0
n = len(word1)
while l < n:
while r < n and cnt > 0:
update(diff, ord(word1[r]) - ord('a'), 1)
r += 1
if cnt == 0:
# 符合条件的子字符串数量
res += n - r + 1
update(diff, ord(word1[l]) - ord('a'), -1)
l += 1
return res
if __name__ == "__main__":
word1 = "bcca"
word2 = "abc"
result = valid_substring_count(word1, word2)
print(result)
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
作者其他文章
- 2025-06-17:移除边之后的权重最大和。用go语言,给定一棵包含 n 个节点(编号 0 到 n-1)的无向树,边的信息由一
- 2025-06-16:最小数组和。用go语言,你有一个整数数组 nums 和三个整数 k、op1、op2。 你可以对数组进行以下
- 2025-06-15:重排子字符串以形成目标字符串。用go语言,给定两个字符串 s 和 t,它们是字母异位词(即包含完全相同的字
- 2025-06-14:最小正和子数组。用go语言,给定一个整数数组 nums 和两个整数 l 与 r,要求在数组中找到长度介于
- 2025-06-13:最多可收集的水果数目。用go语言,有一个由 n x n 格子组成的游戏地图,每个格子代表一个房间。给定一个
评论(0)