2.7 滑动窗口专题:串联所有单词的子串

devtools/2025/3/17 11:30:26/

LeetCode 30. 串联所有单词的子串算法对比分析


1. 题目链接

LeetCode 30. 串联所有单词的子串


2. 题目描述

给定一个字符串 s 和一个字符串数组 wordswords 中所有单词长度相同。要求找到 s 中所有起始索引,使得从该位置开始的连续子串包含 words 中所有单词的某种排列(不限制顺序)。
示例
输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9](子串 "barfoo""foobar" 符合条件)。


3. 算法思路

滑动窗口

  1. 问题转化:将 words 的排列匹配问题转化为固定窗口长度的滑动窗口问题。
  2. 哈希表统计:用 hash1 记录 words 中单词的出现次数,hash2 记录当前窗口内单词的出现次数。
  3. 多起点遍历:由于单词长度固定为 nwSub,需遍历 nwSub 种可能的起始偏移(0 ≤ i < nwSub)。
  4. 窗口动态调整
    • 右指针扩展:每次截取一个单词加入窗口,更新哈希表。
    • 左指针收缩:当窗口内单词数量超过 nw 时,移动左指针。
  5. 结果判断:当窗口内单词数量等于 nw 且所有单词频率匹配时,记录起始索引。

暴力枚举法

  1. 遍历所有子串:枚举所有长度为 nw * nwSub 的子串。
  2. 分割统计:将子串分割为 nw 个单词,统计频率是否与 words 一致。

4. 示例分析

输入:s = "barfoothefoobarman", words = ["foo","bar"]

  1. 暴力枚举法

    • 枚举所有长度为 6 的子串,例如 "barfoo", "arfoot", "rfooth" 等。
    • 对每个子串分割为 ["bar","foo"]["arf","oot"],检查是否与 words 匹配。
  2. 滑动窗口

    • i=0 时,窗口从 left=0 开始,截取 "bar""foo"count=2,记录索引 0。
    • i=9 时,窗口从 left=9 开始,截取 "foo""bar"count=2,记录索引 9。

5. 边界条件与注意事项
  1. 单词长度相同words 中所有单词长度必须一致。
  2. 空输入处理:若 words 为空或 s 长度不足,直接返回空。
  3. 哈希表更新:需在收缩窗口时及时减少 hash2 的计数,避免无效单词干扰。

6. 代码实现
class Solution 
{
public:vector<int> findSubstring(string s, vector<string>& words) {vector<int> ret;int ns = s.size(), nw = words.size(), nwSub = words[0].size();if (ns < nwSub * nw) return ret;unordered_map<string, int> hash1;for (auto& word : words) hash1[word]++;for (int i = 0; i < nwSub; i++) { // 遍历所有可能的起始偏移unordered_map<string, int> hash2;int left = i, count = 0; // left为窗口左边界for (int right = i; right + nwSub <= ns; right += nwSub) {// 截取当前单词string in = s.substr(right, nwSub);hash2[in]++;// 更新有效计数:仅在当前单词属于hash1且未超过次数时增加countif (hash1.count(in) && hash2[in] <= hash1[in]) count++;// 当窗口内的单词数量超过nw时,收缩左边界while ((right - left) / nwSub + 1 > nw) {string out = s.substr(left, nwSub);if (hash1.count(out) && hash2[out] <= hash1[out]) count--;hash2[out]--;left += nwSub; // 左指针移动一个单词长度}// 若有效计数等于nw,记录起始索引if (count == nw) ret.push_back(left);}}return ret;}
};

在这里插入图片描述


7.暴力枚举法与滑动窗口法对比图表
对比维度暴力枚举法滑动窗口
核心思想枚举所有长度为 nw * nwSub 的子串,分割后比较单词频率。维护固定窗口长度,动态调整窗口内的单词频率。
时间复杂度O(ns * nw * nwSub)(每个子串需分割并统计频率)。O(ns * nwSub)(每个单词被处理一次)。
空间复杂度O(nw)(存储 words哈希表)。O(nw)(存储两个哈希表)。
实现方式双重循环遍历子串,内层循环分割并统计。单层循环扩展右指针,动态调整左指针。
适用场景小规模数据(ns ≤ 1e3, nw ≤ 10)。大规模数据(ns ≤ 1e5)。
优点逻辑简单,直接穷举所有可能性。时间复杂度低,适用于大规模数据。
缺点数据规模大时性能极差(例如 ns=1e4 时需 1e8 次操作)。需处理哈希表的动态更新和边界条件。

http://www.ppmy.cn/devtools/167805.html

相关文章

requests请求返回压缩内容,进行解压

requests请求返回压缩内容&#xff0c;进行解压 import gzip import io import brotli import zstandard encoding res.headers.get(Content-Encoding) if encoding gzip:try:print("---------is gzip-------------")compressed_data io.BytesIO(res.content)dec…

Python在数据处理中的应用:从入门到精通

活动发起人小虚竹 想对你说&#xff1a; 这是一个以写作博客为目的的创作活动&#xff0c;旨在鼓励大学生博主们挖掘自己的创作潜能&#xff0c;展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴&#xff0c;那么&#xff0c;快来参加吧&#xff01…

C语言_数据结构总结9:树的基础知识介绍

1. 树的基本术语 - 祖先&#xff1a;考虑结点K&#xff0c;从根A到结点K的唯一路径上的所有其它结点&#xff0c;称为结点K的祖先。 - 子孙&#xff1a;结点B是结点K的祖先&#xff0c;结点K是B的子孙。结点B的子孙包括&#xff1a;E,F,K,L。 - 双亲&#xff1a;路径上…

【mysql】centOS7安装mysql详细操作步骤!—通过tar包方式

【mysql】centOS7安装mysql详细操作步骤&#xff01; linux系统安装mysql版本 需要 root 权限&#xff0c;使用 root 用户进行命令操作。使用tar文件包&#xff0c;安装&#xff0c;gz包也可以但是还需要配置用户&#xff0c;tar包虽然大&#xff0c;但是全啊&#xff01; 1. …

2023年蓝桥杯 省赛 ————特殊日期

2.特殊日期 - 蓝桥云课 错误原因&#xff1a; 分不清大小月&#xff0c;将闰年的2月天数当成了28天&#xff0c;非闰年当成了27天&#xff0c;因此出错 错误代码如下&#xff1a; package Lanqiao;import java.util.Scanner;/*** author zb* date2025/3/16 13:22*/ public …

深入浅出TCP与UDP:三次握手、四次挥手及面试通关指南

深入浅出TCP与UDP&#xff1a;三次握手、四次挥手及面试通关指南 一、TCP三次握手&#xff1a;像租房签约的严谨流程 &#x1f3e0; ‌情景模拟‌&#xff1a;客户端&#xff08;租客&#xff09;与服务器&#xff08;房东&#xff09;建立信任关系 ‌抓包关键字段‌&#xff…

【USTC 计算机网络】第一章:计算机网络概述 - Internet、网络边缘、网络核心、接入网与物理媒体

本文开坑中科大计算机网络课程的学习记录&#xff0c;所用教材为《计算机网络&#xff1a;自顶向下方法》。第一章概述计算机网络&#xff0c;内容非常重要&#xff0c;介绍了很多计算机网络中的概念与定义。本文介绍了什么是互联网&#xff08;Internet&#xff09;&#xff0…

软件测试之单元测试unittest库使用、参数化、unittestteport

文章目录 前言什么是单元测试什么是单元测试框架Unittest 测试框架Unittest核心要素TestCaseFixtureTestSuiteTextTestRunnerreport Unittest 断言 Unittest 框架使用编写TestCase&#xff08;测试用例&#xff09;在测试用例中添加Fixture&#xff08;测试夹具&#xff09;将测…