【状态压缩 并集查找 图论】2157. 字符串分组

news/2024/10/20 20:13:30/

本文涉及知识点

状态压缩 并集查找 图论

LeetCode2157. 字符串分组

给你一个下标从 0 开始的字符串数组 words 。每个字符串都只包含 小写英文字母 。words 中任意一个子串中,每个字母都至多只出现一次。
如果通过以下操作之一,我们可以从 s1 的字母集合得到 s2 的字母集合,那么我们称这两个字符串为 关联的 :
往 s1 的字母集合中添加一个字母。
从 s1 的字母集合中删去一个字母。
将 s1 中的一个字母替换成另外任意一个字母(也可以替换为这个字母本身)。
数组 words 可以分为一个或者多个无交集的 组 。如果一个字符串与另一个字符串关联,那么它们应当属于同一个组。
注意,你需要确保分好组后,一个组内的任一字符串与其他组的字符串都不关联。可以证明在这个条件下,分组方案是唯一的。
请你返回一个长度为 2 的数组 ans :
ans[0] 是 words 分组后的 总组数 。
ans[1] 是字符串数目最多的组所包含的字符串数目。
示例 1:
输入:words = [“a”,“b”,“ab”,“cde”]
输出:[2,3]
解释:

  • words[0] 可以得到 words[1] (将 ‘a’ 替换为 ‘b’)和 words[2] (添加 ‘b’)。所以 words[0] 与 words[1] 和 words[2] 关联。
  • words[1] 可以得到 words[0] (将 ‘b’ 替换为 ‘a’)和 words[2] (添加 ‘a’)。所以 words[1] 与 words[0] 和 words[2] 关联。
  • words[2] 可以得到 words[0] (删去 ‘b’)和 words[1] (删去 ‘a’)。所以 words[2] 与 words[0] 和 words[1] 关联。
  • words[3] 与 words 中其他字符串都不关联。
    所以,words 可以分成 2 个组 [“a”,“b”,“ab”] 和 [“cde”] 。最大的组大小为 3 。
    示例 2:
    输入:words = [“a”,“ab”,“abc”]
    输出:[1,3]
    解释:
  • words[0] 与 words[1] 关联。
  • words[1] 与 words[0] 和 words[2] 关联。
  • words[2] 与 words[1] 关联。
    由于所有字符串与其他字符串都关联,所以它们全部在同一个组内。
    所以最大的组大小为 3 。
    提示:

1 <= words.length <= 2 * 104
1 <= words[i].length <= 26
words[i] 只包含小写英文字母。
words[i] 中每个字母最多只出现一次。

状态压缩

由于本题words[i] 只包括小写字母,且没有重复字母,我们可以对字母集合进行状态压缩, maks&(1<<j) 表示 字母集合存在 ‘a’+j 。
mMask,key 表示某个字母集合 value是一个vector 记录words[i]的下标i。key和words[i]关联。

然后通过 key value建立 并集查找
注意
一,key 必须是words中存在的字母集合。
二,(mask | (1 << j1)) ^ ( 1 << j2) 括号不能省略
三,建立并集查找时,只需要v[i]和v[i-1]连接,不需要两两连接。前者时间复杂度是O(n),后者时间复杂度是O(nn)。

代码

核心代码

class CUnionFind
{
public:CUnionFind(int iSize) :m_vNodeToRegion(iSize){for (int i = 0; i < iSize; i++){m_vNodeToRegion[i] = i;}m_iConnetRegionCount = iSize;}	CUnionFind(vector<vector<int>>& vNeiBo):CUnionFind(vNeiBo.size()){for (int i = 0; i < vNeiBo.size(); i++) {for (const auto& n : vNeiBo[i]) {Union(i, n);}}}int GetConnectRegionIndex(int iNode){int& iConnectNO = m_vNodeToRegion[iNode];if (iNode == iConnectNO){return iNode;}return iConnectNO = GetConnectRegionIndex(iConnectNO);}void Union(int iNode1, int iNode2){const int iConnectNO1 = GetConnectRegionIndex(iNode1);const int iConnectNO2 = GetConnectRegionIndex(iNode2);if (iConnectNO1 == iConnectNO2){return;}m_iConnetRegionCount--;if (iConnectNO1 > iConnectNO2){UnionConnect(iConnectNO1, iConnectNO2);}else{UnionConnect(iConnectNO2, iConnectNO1);}}bool IsConnect(int iNode1, int iNode2){return GetConnectRegionIndex(iNode1) == GetConnectRegionIndex(iNode2);}int GetConnetRegionCount()const{return m_iConnetRegionCount;}vector<int> GetNodeCountOfRegion()//各联通区域的节点数量{const int iNodeSize = m_vNodeToRegion.size();vector<int> vRet(iNodeSize);for (int i = 0; i < iNodeSize; i++){vRet[GetConnectRegionIndex(i)]++;}return vRet;}std::unordered_map<int, vector<int>> GetNodeOfRegion(){std::unordered_map<int, vector<int>> ret;const int iNodeSize = m_vNodeToRegion.size();for (int i = 0; i < iNodeSize; i++){ret[GetConnectRegionIndex(i)].emplace_back(i);}return ret;}
private:void UnionConnect(int iFrom, int iTo){m_vNodeToRegion[iFrom] = iTo;}vector<int> m_vNodeToRegion;//各点所在联通区域的索引,本联通区域任意一点的索引,为了增加可理解性,用最小索引int m_iConnetRegionCount;
};class Solution {
public:vector<int> groupStrings(vector<string>& words) {unordered_map<int, vector<int>> mMask;for (int i = 0; i < words.size(); i++) {int iMask = 0;for (const auto& ch : words[i]) {iMask |= (1 << (ch - 'a'));}mMask[iMask].emplace_back(i);}		for (const auto& [mask, tmp] : mMask) {auto AddNewMask = [&](int mask,const int iMask) {if (!mMask.count(iMask)) { return; }mMask[mask].emplace_back(mMask[iMask][0]);};for (int j = 0; j < 26; j++) {if (mask & (1 << j)) {AddNewMask(mask, mask ^ (1 << j));}else {AddNewMask(mask, mask | (1 << j));}}for (int j1 = 0; j1 < 26; j1++) {if (mask & (1 << j1)) { continue; }for (int j2 = 0; j2 < 26; j2++) {if (!(mask & (1 << j2))) { continue; }AddNewMask(mask, (mask | (1 << j1)) ^ ( 1 << j2));}}}CUnionFind uf(words.size());for (const auto& [mask, v] : mMask) {for (int i = 1; i < v.size(); i++) {uf.Union(v[i], v[i - 1]);}}auto m = uf.GetNodeOfRegion();vector<int> vRet = { (int)m.size() };int iMax = 0;for (const auto& [tmp, v] : m) {iMax = max(iMax, (int)v.size());}vRet.emplace_back(iMax);return vRet;}
};

测试用例

class CUnionFind
{
public:CUnionFind(int iSize) :m_vNodeToRegion(iSize){for (int i = 0; i < iSize; i++){m_vNodeToRegion[i] = i;}m_iConnetRegionCount = iSize;}	CUnionFind(vector<vector<int>>& vNeiBo):CUnionFind(vNeiBo.size()){for (int i = 0; i < vNeiBo.size(); i++) {for (const auto& n : vNeiBo[i]) {Union(i, n);}}}int GetConnectRegionIndex(int iNode){int& iConnectNO = m_vNodeToRegion[iNode];if (iNode == iConnectNO){return iNode;}return iConnectNO = GetConnectRegionIndex(iConnectNO);}void Union(int iNode1, int iNode2){const int iConnectNO1 = GetConnectRegionIndex(iNode1);const int iConnectNO2 = GetConnectRegionIndex(iNode2);if (iConnectNO1 == iConnectNO2){return;}m_iConnetRegionCount--;if (iConnectNO1 > iConnectNO2){UnionConnect(iConnectNO1, iConnectNO2);}else{UnionConnect(iConnectNO2, iConnectNO1);}}bool IsConnect(int iNode1, int iNode2){return GetConnectRegionIndex(iNode1) == GetConnectRegionIndex(iNode2);}int GetConnetRegionCount()const{return m_iConnetRegionCount;}vector<int> GetNodeCountOfRegion()//各联通区域的节点数量{const int iNodeSize = m_vNodeToRegion.size();vector<int> vRet(iNodeSize);for (int i = 0; i < iNodeSize; i++){vRet[GetConnectRegionIndex(i)]++;}return vRet;}std::unordered_map<int, vector<int>> GetNodeOfRegion(){std::unordered_map<int, vector<int>> ret;const int iNodeSize = m_vNodeToRegion.size();for (int i = 0; i < iNodeSize; i++){ret[GetConnectRegionIndex(i)].emplace_back(i);}return ret;}
private:void UnionConnect(int iFrom, int iTo){m_vNodeToRegion[iFrom] = iTo;}vector<int> m_vNodeToRegion;//各点所在联通区域的索引,本联通区域任意一点的索引,为了增加可理解性,用最小索引int m_iConnetRegionCount;
};class Solution {
public:vector<int> groupStrings(vector<string>& words) {unordered_map<int, vector<int>> mMask;for (int i = 0; i < words.size(); i++) {int iMask = 0;for (const auto& ch : words[i]) {iMask |= (1 << (ch - 'a'));}mMask[iMask].emplace_back(i);}		for (const auto& [mask, tmp] : mMask) {auto AddNewMask = [&](int mask,const int iMask) {if (!mMask.count(iMask)) { return; }mMask[mask].emplace_back(mMask[iMask][0]);};for (int j = 0; j < 26; j++) {if (mask & (1 << j)) {AddNewMask(mask, mask ^ (1 << j));}else {AddNewMask(mask, mask | (1 << j));}}for (int j1 = 0; j1 < 26; j1++) {if (mask & (1 << j1)) { continue; }for (int j2 = 0; j2 < 26; j2++) {if (!(mask & (1 << j2))) { continue; }AddNewMask(mask, (mask | (1 << j1)) ^ ( 1 << j2));}}}CUnionFind uf(words.size());for (const auto& [mask, v] : mMask) {for (int i = 1; i < v.size(); i++) {uf.Union(v[i], v[i - 1]);}}auto m = uf.GetNodeOfRegion();vector<int> vRet = { (int)m.size() };int iMax = 0;for (const auto& [tmp, v] : m) {iMax = max(iMax, (int)v.size());}vRet.emplace_back(iMax);return vRet;}
};

测试用例

template<class T>
void Assert(const T& t1, const T& t2)
{assert(t1 == t2);
}template<class T>
void Assert(const vector<T>& v1, const vector<T>& v2)
{if (v1.size() != v2.size()){assert(false);return;}for (int i = 0; i < v1.size(); i++){Assert(v1[i], v2[i]);}}int main()
{vector<string> words;{Solution sln;words = { "a", "b" };auto res = sln.groupStrings(words);Assert({ 1,2 }, res);}{Solution sln;words = { "a", "b", "ab", "cde" };auto res = sln.groupStrings(words);Assert({ 2,3 }, res);}{Solution sln;words = { "a","ab","abc" };auto res = sln.groupStrings(words);Assert({ 1,3 }, res);}
}

扩展阅读

视频课程

有效学习:明确的目标 及时的反馈 拉伸区(难度合适),可以先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

相关下载

想高屋建瓴的学习算法,请下载《喜缺全书算法册》doc版
https://download.csdn.net/download/he_zhidan/88348653

我想对大家说的话
闻缺陷则喜是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛

测试环境

操作系统:win7 开发环境: VS2019 C++17
或者 操作系统:win10 开发环境: VS2022 C++17
如无特殊说明,本算法用**C++**实现。


http://www.ppmy.cn/news/1427701.html

相关文章

2024年4月份微软安全通告

文章目录 一、漏洞概要二、漏洞数据分析1、2024年漏洞数量趋势2、历史微软补丁日4月漏洞对比三、重要漏洞分析1、漏洞分析2、影响范围四、解决方案一、漏洞概要 2024年4月10日(北京时间),微软发布了安全更新,共发布了155个CVE的补丁程序,同比上月增加了91个。 在漏洞安全…

Mac电池管理软件 Batteries for Mac v2.2.9直装版

Batteries for Mac&#xff0c;作为一款专为Mac用户设计的电池管理软件&#xff0c;以其强大的功能和智能的监测机制&#xff0c;为用户提供了便捷、高效的电池使用体验。 Batteries for Mac(Mac电池)v2.2.9直装版下载 首先&#xff0c;Batteries for Mac具备实时电池监测功能&…

Oracle数据库Bug:相关子查询多层嵌套报错:标识符无效

Oracle Bug? 一、案例描述二、解决方案<一>、升级版本<二>、改写语句 一、案例描述 在Mysql中常常有如下写法用相关子查询 order by desc limit 1来完成需求 select code,date,(select value from test t1 where t.code t1.code and t1.date between date_su…

修复vite中使用react提示Fast refresh only works when a file only exports components.

前言 我通过 vite 构建了一个 react 应用并使用 react.lazy 来懒加载组件&#xff0c;但是在使用过程中 一直提示 Fast refresh only works when a file only exports components. Move your component(s) to a separate file.eslint(react-refresh/only-export-components)。…

何时使用 GraphQL、gRPC 和 REST?

构建 API 是现代工程中开发人员的最重要任务之一。这些 API 允许不同的系统进行通信和数据交换。虽然 REST 多年来一直是实现 API 的事实标准&#xff0c;但今天也有新兴的标准&#xff0c;如 gRPC 和 GraphQL。 什么是 API&#xff1f; “应用程序编程接口”&#xff08;API&a…

mybatis 调用修改SQL时 出现了一个问题 没有修改成功也没有报错

文章目录 问题描述 问题描述 今天遇到的这个问题到最后真的是怕我自己给气哭了&#xff0c;唉&#xff0c;大致如下&#xff1a; 这是controller层代码&#xff0c;前端传的值都有&#xff0c;但是去调用updateWechatBulkNotification时&#xff0c;修改失败&#xff0c;也不报…

009 springboot整合mybatis-plus 增删改查 ajax 登录退出accessToken

文章目录 ConfigRegistCenter.javaMybatisplusConfig.javaCustomerController.javaReceiveAddressJsonController.javaCustomer.javaLoginCustomer.javaReceiveAddress.javaJwtInterceptor.javaCustomerMapper.javaReceiveAddressMapper.javaCustomerServiceImpl.javaReceiveAd…

车载以太网DoIP 协议,万字长文详解

&#x1f345; 我是蚂蚁小兵&#xff0c;专注于车载诊断领域&#xff0c;尤其擅长于对CANoe工具的使用&#x1f345; 寻找组织 &#xff0c;答疑解惑&#xff0c;摸鱼聊天&#xff0c;博客源码&#xff0c;点击加入&#x1f449;【相亲相爱一家人】&#x1f345; 玩转CANoe&…