【C++】unordered_map unordered_set 练习题

news/2024/11/9 0:30:19/

文章目录

  • unordered系列关联式容器
  • unordered_map
    • unordered_map的文档介绍
    • unordered_map的构造
    • 接口使用:
  • unordered_multimap
  • unorder_map&&unorder_multimap对比:
  • unordered_set
    • unordered_set的文档介绍
    • unordered_set的构造
    • 接口使用
  • unordered_multiset
  • OJ练习
    • 961.在长度2N的数组中找出重复N次的元素
    • 349. 两个数组的交集
    • 350. 两个数组的交集 II
    • 217. 存在重复元素
    • 884. 两句话中的不常见单词
  • 总结:
  • map/set与unordered_map/unordered_set的区别

unordered系列关联式容器

在C++98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到 ,即最差情况下需要比较红黑树的高度次,当树中的节点非常多时,查询效率也不理想,最好的查询是,进行很少的比较次数就能够将元素找到,因此在C++11中,STL又提供了4个unordered系列的关联式容器,这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同


unordered_map

unordered_map的文档介绍

http://www.cplusplus.com/reference/unordered_map/unordered_map/?kw=unordered_map

  1. unordered_map是存储<key, value>键值对的关联式容器,其允许通过keys快速的索引到与其对应的value
  2. 在unordered_map中,键值通常用于唯一地标识元素,不允许重复键值,而映射值是一个对象,其内容与此键关联键和映射值的类型可能不同
  3. 在内部,unordered_map没有对<kye, value>按照任何特定的顺序排序, 为了能在常数范围内找到key所对应的value,unordered_map将相同哈希值的键值对放在相同的桶中
  4. unordered_map容器通过key访问单个元素要比map快,但它通常在遍历元素子集的范围迭代方面效率较低
  5. unordered_maps实现了直接访问操作符**(operator[]),**它允许使用key作为参数直接访问value
  6. 它的迭代器至少是前向迭代器

需要引用头文件:#include<unordered_map>


unordered_map的构造

  • 直接构造一个空容器
  • 拷贝构造
  • 使用迭代器构造
void test_UnMap()
{unordered_map<int, int> um1;//构造一个键值对为<int,int>的空容器unordered_map<int, int> um2(um1);//用um1拷贝构造um2unordered_map<int, int> um3(um2begin(), um2.end());//使用迭代器拷贝构造um3//构造的时候可以顺便初始化unordered_map<int, int> um4{ {1,1},{2,2} ,{3,3} };//um4相当于有3个成员
}

接口使用:

常用接口:

函数声明功能介绍
容量相关:
bool empty() const检测unordered_map是否为空
size_t size() const获取unordered_map的有效元素个数
迭代器:注意:没有反向迭代器
begin()返回unordered_map第一个元素的迭代器
end()返回unordered_map最后一个元素下一个位置的迭代器
cbegin()返回unordered_map第一个元素的const迭代器
cend()返回unordered_map最后一个元素下一个位置的const迭代器
元素访问:
operator[]返回与key对应的value,没有一个默认值
查询
iterator find(const K& key)返回key在哈希桶中的位置,返回该位置的迭代器
size_t count(const K& key)返回哈希桶中键为key的键值对的个数
修改
insert向容器中插入键值对
erase删除容器中的键值对 可以按key删除,也可以按迭代器删除,也可以删除一段迭代器区间
void clear()清空容器中有效元素个数
void swap(unordered_map&)交换两个容器中的元素
桶操作
size_t bucket_count() const返回哈希桶中桶的总个数
size_t bucket_size(size_t n) const返回n号桶中有效元素的总个数
size_t bucket(const K& key)返回元素key所在的桶号

针对operator[]需要注意的是:

opeartor[key]:

注意:该函数中实际调用哈希桶的插入操作,用参数key与V()构造一个默认值往底层哈希桶中插入,如果key不在哈希桶中,插入成功,返回V(),插入失败,说明key已经在哈希桶中,将key对应的value返回

  • 若当前容器中已有键值为key的键值对,则返回该键值对value的引用
  • 若当前容器中没有键值为key的键值对,则先插入键值对<key, value()>,然后再返回该键值对中value的引用

针对count函数:unordered_map中key是不能重复的,因此count函数的返回值最大为1


上述函数可以归结为:

成员函数功能
insert插入键值对,可以通过{key,value} make_pair(key,value)构造匿名函数, 或者pair<key,value>插入
erase删除指定key值的键值对,可以按值删除,也可以按迭代器删除,也可以删除一段迭代器区间
find查找指定key值的键值对,找到了返回该位置的迭代器,找不到返回end()位置的迭代器
size获取容器中元素的个数
empty判断容器是否为空
clear清空容器的内容
swap交换两个容器中的数据
count获取容器中指定key值的元素个数
begin获取容器中第一个元素的正向迭代器
end获取容器中最后一个元素下一个位置的正向迭代器

实例:

#include<iostream>
#include<unordered_map>
using namespace std;
int main()
{unordered_map<string, string> um;//key:string value:string//1.插入/*可以插入的方式:1.pair插入 2.make_pair函数模板构造匿名函数插入 3.使用{}插入 4.[]插入 ->底层是调用insert.如果有就不处理*/um.insert(pair<string, string>("sort", "排序"));um.insert(make_pair("Mango", "芒果"));um.insert({ "Lemon","柠檬" }); //c++11的写法um["Orange"] = "橙子";um["Orange"] = "橙色";//只能有一个key值,不允许重复//2.范围for遍历for (auto& km : um){//km是um的成员,是pair对象cout << km.first << " " << km.second << endl;}//sort 排序  Mango 芒果  Lemon 柠檬  Orange 橙色cout << endl;//3.迭代器遍历unordered_map<string, string>::iterator it = um.begin();//推荐直接使用auto auto it = um.begin();while (it != um.end()){//it是迭代器,调用operator->得到pair对象的指针,再通过指针访问成员,优化为迭代器->成员cout << it->first << " " << it->second << endl;it++;}//sort 排序  Mango 芒果  Lemon 柠檬  Orange 橙色cout << endl;//4.删除erase  //case1:按key键值删除um.erase("Orange");//删除键值为Orange的元素//case2:按迭代器删除->常搭配find函数使用,先找到了再删除auto pos = um.find("sort");//找到键值为sort的元素if (pos != um.end()){um.erase(pos);//找到了,就删除}for (auto& kv : um){cout << kv.first << " " << kv.second << endl;}//Mango 芒果  Lemon 柠檬cout << endl;//5.修改键对应的内容//case1:通过find找到元素,然后再通过迭代器修改pos = um.find("Lemon");if (pos != um.end()){pos->second = "大柠檬";//找到了就修改}//case2:利用[]进行修改um["Mango"] = "大芒果";for (auto& kv : um){cout << kv.first << " " << kv.second << endl;}//Mango 大芒果   Lemon 大柠檬cout << endl;//6.容器相关//count:统计键值为key的出现多少次//size:容器的有效元素个数//clear:清空容器//empty:判断容器是否为空//swap:交换两个容器的内容cout << um.count("Mango") << endl;//1cout << um.count("sort") << endl;//0cout << um.size() << endl;//2um.clear();unordered_map<string, string> tmp{ {"test","测试"},{"Run","运行"} };um.swap(tmp);for (auto& kv : um){cout << kv.first << " " << kv.second << endl;}	//test 测试  Run 运行cout << endl;return 0;
}

unordered_multimap

unordered_multimap容器与unordered_map容器的底层数据结构是一样的,都是哈希表

其次,它们所提供的成员函数的接口都是基本一致的,这两种容器唯一的区别就是,unordered_multimap容器允许键值冗余,即unordered_multimap容器当中存储的键值对的key值是可以重复的

举例子:

#include<string>
#include<iostream>
#include<unordered_map>
using namespace std;
int main()
{unordered_multimap<string, string> umm;umm.insert(make_pair("sort", "排序"));umm.insert({ "Run","运行" });umm.insert(pair<string, string>("run", "跑步"));for (auto& km : umm){cout << km.first << " " << km.second << endl;}//sort 排序  run 跑步  Run 运行cout << endl;return 0;
}

unorder_map&&unorder_multimap对比:

由于unordered_multimap容器允许键值对的数据冗余,所以find函数和count函数返回的值就有不同的含义

成员函数find功能
unordered_map返回键值为key的键值对应的迭代器
unordered_multimap返回底层哈希表中第一个找到的键值为key的键值对的迭代器

举例子:

int main()
{unordered_multimap<string, string> umm;umm.insert({ "world","世界" });umm.insert({ "test","测试1" });umm.insert({ "Hello","你好" });umm.insert({ "test","测试2" });umm.insert({ "test","测试" });unordered_multimap<string, string>::iterator pos = umm.find("test");//找键为key对应的元素//返回的是第一个找到的键值为key的键值对的迭代器if (pos != umm.end()){cout << pos->first << " " << pos->second << endl;}	//test 测试1cout << endl;return 0;
}

成员函数count功能
unordered_map容器键值为key的键值对存在则返回1,不存在则返回0(find成员函数可替代,find函数找到了,说明存在键为key的元素)
unordered_multimap容器返回键值为key的键值对的个数(find成员函数不可替代)
int main()
{unordered_multimap<string, string> umm;umm.insert({ "world","世界" });umm.insert({ "test","测试1" });umm.insert({ "Hello","你好" });umm.insert({ "test","测试2" });umm.insert({ "test","测试" });cout << umm.count("test") << endl;		//3return 0;
}

注意:unordered_multimap容器不支持operator[]重载

  • 原因: 如果允许键值对的键值冗余,调用operator[]运算符重载函数时,返回时存在歧义,因为不知道返回键值为key的哪个元素

unordered_set

unordered_set的文档介绍

http://www.cplusplus.com/reference/unordered_set/unordered_set/?kw=unordered_set

  1. unordered_set是不按特定顺序存储键值的关联式容器,其允许通过键值快速的索引到对应的元素
  2. 在unordered_set中,元素的值同时也是唯一地标识它的key ,unordered_set有去重操作!!插入相同的key不起作用 unordered_set可以认为是<key,key>类型的键值对
  3. 在内部,unordered_set中的元素没有按照任何特定的顺序排序,为了能在常数范围内找到指定的key, unordered_set将相同哈希值的键值放在相同的桶中
  4. unordered_set容器通过key访问单个元素要比set快,但它通常在遍历元素子集的范围迭代方面效率较低
  5. 它的迭代器至少是前向迭代器

unordered_set的构造

  • 直接构造一个空容器
  • 拷贝构造
  • 使用迭代器构造
void test_UnSet()
{unordered_set<int>  us1; //直接构造一个空容器unordered_set<int> us2;//用us1拷贝构造us2string tmp("Mango");unordered_set<char> us3(tmp.begin(), tmp.end());//用迭代器拷贝构造us3//同样可以构造的时候直接初始化unordered_set<int> us4{ 1,2,3}; //内含3个成员//也可以写成:unordered_set<int> us5{ {1},{2},{3} };//内含3个成员
}

接口使用

这里直接给出常用的成员函数

成员函数功能
insert插入指定元素
erase删除指定元素,可以按值删除,也可以按迭代器删除,也可以按迭代器区间删除
find查找指定元素,找到了返回该位置的迭代器,如果找不到,返回end()迭代器位置
size获取容器中元素的个数
empty判断容器是否为空
clear清空容器的内容
swap交换两个容器中的数据
count获取容器中指定元素值的元素个数

迭代器相关函数: 注意unorderde_set也没有反向迭代器!

成员函数功能
begin获取容器中第一个元素的正向迭代器
end获取容器中最后一个元素下一个位置的正向迭代器

例子:

#include<unordered_set>
int main()
{unordered_set<char> us;//1.插入元素 (会去重)us.insert('a');us.insert('a');us.insert('z');us.insert('x');us.insert('y');us.insert('z');//2.遍历:迭代器  /范围forunordered_set<char>::iterator it = us.begin();//可以直接使用auto推导类型更方便  auto it = us.begin()while (it != us.end()){cout << *it << " ";it++;} //y a z xcout << endl;for (auto& e : us) //e就是us的每一个成员{cout << e << " ";} //y a z xcout << endl;//3.删除元素 ->常搭配find函数使用us.erase('z');//按值删除auto pos = us.find('a');us.erase(pos);//按迭代器位置删除for (auto& e : us) //e就是us的每一个成员{cout << e << " ";}//y xcout << endl;//统计容器中值为y的元素个数cout << us.count('y') << endl;//1//返回容器的大小cout << us.size() << endl;//2//清空容器的内容us.clear();//判断容器是否为空cout << us.empty() << endl;//1//交换两个容器的内容unordered_set<char> tmp{ 'a','b','c' };us.swap(tmp);for (auto& e : us){cout << e << " ";}//a b ccout << endl;return 0;
}

unordered_multiset

unordered_multiset容器与unordered_set容器的底层数据结构是一样的,都是哈希表

它们所提供的成员函数的接口都是基本一致的,这两种容器唯一的区别就是:unordered_multiset容器允许键值冗余 即unordered_multiset容器当中存储的元素是可以重复的

例子:

#include<unordered_set>
int main()
{unordered_multiset<int> ums;//插入元素允许重复ums.insert(1);ums.insert(1);ums.insert(1);ums.insert(2);ums.insert(3);for (auto& e : ums){cout << e << " ";}// 1 1 1 2 3cout << endl;return 0;
}

unordered_multiset容器允许键值冗余 因此成员函数find和count的意义与unordered_set容器中的含义也不同

成员函数find功能
unordered_set容器返回键值为val的元素的迭代器
unordered_multiset容器返回底层哈希表中第一个找到的键值为val的元素的迭代器
成员函数count功能
unordered_set容器键值为val的元素存在则返回1,不存在则返回0(find成员函数可替代)要么为1要么为0
unordered_multiset容器返回键值为val的元素个数(find成员函数不可替代)

OJ练习

961.在长度2N的数组中找出重复N次的元素

https://leetcode.cn/problems/n-repeated-element-in-size-2n-array/

image-20220524172150849

方法1:排序之后取中间元素

既然某个数字出现次数为数组长度一半,那么排序后,中间的俩数肯定某一个就为所求

注意:直接排序之后取中间值是会出错的!

为什么会出错呢? 原因:因为这里重复的次数只出现了一半的次数,并没有超过一半

解决方法:判断中间值和其下一个值是否相同,如果相同,则返回中间值,否则返回中间值的前一个值

class Solution {
public:int repeatedNTimes(vector<int>& nums) {sort(nums.begin(),nums.end());//排序int mid = nums.size()/2;//取中间位置//判断中间值和下一个值的关系返回答案return nums[mid] == nums[mid+1] ?nums[mid]:nums[mid-1];}
};

方法2:使用unordered_map 或者map 记录元素出现的次数

class Solution {
public:int repeatedNTimes(vector<int>& nums) {map<int,int> m; //元素 - 出现次数//遍历原数组for(auto& x:nums){m[x]++;} int times = nums.size()/2;//找出现次数为nums的元素//遍历map,找出现次数为times的元素for(auto& kv:m){//kv :pair对象,<元素,出现次数>if(kv.second == times){return kv.first;}}return 0;}
};

方法3:摩尔投票法

err版本:

注意:这里元素个数为2N个 只有一个元素重复出现N次,所以不能直接使用摩尔投票法,否则就会出错!必须元素个数超过数组长度的一般才能稳妥使用摩尔投票法

例如:[1,2,5,2,3,2]的情况, 此时ans = 3,而出现次数为N的元素是2,导致出错!本质是抵消的时候,可能出现次数为N的元素分散开,导致答案错误,所以解决办法1就是先排序

class Solution {
public:int repeatedNTimes(vector<int>& nums) {//摩尔投票法int ans = 0;int times = 0;for(int i = 0;i<nums.size();i++){if(times == 0){ans = nums[i];times = 1;}else if(nums[i] == ans){times++;}else{times--;}}return ans;}
};

解决办法1:先排序然后进行摩尔投票,这样会保证出现次数为N次的元素连在一起,然后再和其它数抵消

class Solution {
public:int repeatedNTimes(vector<int>& nums) {sort(nums.begin(),nums.end());//摩尔投票法int ans = 0;int times = 0;for(int i = 0;i<nums.size();i++){if(times == 0){ans = nums[i];times = 1;}else if(nums[i] == ans){times++;}else{times--;}}return ans;}
};

方法2:先舍弃一些数

摩尔投票要求一个种类的数量必须多于一半,但是这题刚好只有一半

因此考虑怎么能让一个种类的数量变得多余一半 -> 舍弃一些数

取前三个数,如果存在重复,则直接返回 去除前三个数,对后面的数进行摩尔投票!

class Solution {public:int repeatedNTimes(vector<int>& nums) {int n = nums.size();if(nums[0] == nums[1] || nums[0] == nums[2]) return nums[0];if(nums[1] == nums[2]) return nums[1];int ans = 0;int times = 0;for(int i = 3;i<nums.size();i++){if(times == 0){ans = nums[i];times = 1;}else if(nums[i] == ans){times++;}else{times--;}}return ans;}
};

349. 两个数组的交集

https://leetcode.cn/problems/intersection-of-two-arrays/submissions/

image-20220524175000047

方法1:使用两个容器s1和s2 对两个数组进行去重 ,这里可以用set 或者unordered_set然后遍历容器s1, 如果s1的元素在s2也出现过,就是交集元素

class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {//使用set分别对nums1和nums2进行去重,遍历两个容器,找到二者的相同部分set<int> s1;set<int> s2;//遍历nums1,进行去重for(auto& x:nums1){s1.insert(x);}//遍历nums2进行去重for(auto& x:nums2){s2.insert(x);}//遍历s1,如果s1中某个元素在s2中出现过,即为交集vector<int> v;for(auto& e:s1){if(s2.find(e) != s2.end()){// s1的元素在s2出现过,这个元素就是交集元素v.push_back(e);}}return v;}
};

方法2:用set:排序+去重

遍历两个set,取交集:

  • 1.二者指向的值谁小谁就++往后走
  • 2.相等就是交集的一个元素,放到容器中,然后同时++

如果要求的是差集: 做法: 1.谁小就是差集中的一个元素, 然后++ 2.相等就同时往后走

class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {//利用set:排序+去重set<int> s1;for(auto& x:nums1){s1.insert(x);}set<int> s2;for(auto& x:nums2){s2.insert(x);}//遍历两个容器取交集//如果二者指向的元素相同:就是交集的一个元素,然后二者一起走//如果不相同,小的那个往后走vector<int> v;auto it1 = s1.begin();auto it2 = s2.begin();//当其中一个遍历到结束,就停止while(it1 != s1.end() && it2!=s2.end()){if(*it1 < *it2){it1++;}else if(*it1>*it2){it2++;}else{v.push_back(*it1);it1++;it2++;}}return v;}
};

350. 两个数组的交集 II

https://leetcode.cn/problems/intersection-of-two-arrays-ii/

image-20221009215338030

由于同一个数字在两个数组中都可能出现多次,因此需要用哈希表存储每个数字出现的次数,对于一个数字,其在交集中出现的次数等于该数字在两个数组中出现次数的最小值

首先遍历第一个数组,并在哈希表中记录第一个数组中的每个数字以及对应出现的次数,然后遍历第二个数组,对于第二个数组中的每个数字,如果在哈希表中存在这个数字,则将该数字放入容器中,并减少哈希表中该数字出现的次数

为了降低空间复杂度,首先遍历较短的数组并在哈希表中记录每个数字以及对应出现的次数,然后遍历较长的数组得到交集

class Solution {
public:vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {//选择短的数组统计元素出现次数map<int,int> m;//元素-出现次数int n1 = nums1.size();int n2 = nums2.size();vector<int> large; vector<int> small;if(n1>n2){large = nums1;small = nums2;            }else{large = nums2;small = nums1;}//统计短数组的元素出现次数for(auto& x:small){m[x]++;}vector<int> ans;//记录交集//遍历长数组for(auto& x:large){//也可以用 m.count(x) 代替if(m.find(x) != m.end()){ans.push_back(x);m[x]--;//次数--}//如果x的出现次数为0了,就在map中删除掉,if(m[x] == 0){m.erase(x);}}return ans;}
};

优化:再次调用自己,让nums1是长数组 nums2是短数组

class Solution {
public:vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {if (nums1.size() > nums2.size()) {return intersect(nums2, nums1);//再调用自己,然后nums1自然就成了长数组!}unordered_map <int, int> m;for (auto num : nums1) {++m[num];}vector<int> ans;for (auto num : nums2) {if (m.count(num)) {ans.push_back(num);--m[num];if (m[num] == 0) {m.erase(num);}}}return auto;}
};

方法2:利用multiset 不去重+排序

遍历两个multiset,取交集:

  • 1.二者指向的值谁小谁就++往后走
  • 2.相等就是交集的一个元素,放到容器中,然后同时++
class Solution {
public:vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {//排序+不去重multiset<int> s1;multiset<int> s2;for(auto& x:nums1){s1.insert(x);}for(auto& x:nums2){s2.insert(x);}vector<int> ans;auto it1 = s1.begin();auto it2 = s2.begin();//当其中一个遍历到结束,就停止while(it1 != s1.end() && it2!=s2.end()){if(*it1 < *it2){it1++;}else if(*it1>*it2){it2++;}else{ans.push_back(*it1);it1++;it2++;}}return ans;}
};

217. 存在重复元素

https://leetcode.cn/problems/contains-duplicate/

image-20220525224928496

方法1:暴力双层循环 -> 过不了 超时!

class Solution {
public:bool containsDuplicate(vector<int>& nums) {//方法1:排序,前后元素sort(nums.begin(),nums.end());for(int i = 0;i<nums.size();i++){//j从i+1位置开始查找for(int j = i+1;j<nums.size();j++){if(nums[i] == nums[j]){return true;}}}return false;}
};

优化:一层循环,前后元素比较

class Solution {
public:bool containsDuplicate(vector<int>& nums) {sort(nums.begin(), nums.end());int n = nums.size();for (int i = 0; i < n - 1; i++) {//i:[0,n-2]  i+1:[1,n-1]//前后元素比较if (nums[i] == nums[i + 1]) {return true;}}return false;}
};

方法2:使用map统计次数

class Solution {
public:bool containsDuplicate(vector<int>& nums) {map<int,int> m; //元素 - 出现次数for(auto& x:nums){m[x]++;}for(auto x:m){cout << x.first<<  " " << x.second<< " ";}//遍历mapfor(auto& kv:m){//kv是pair对象//如果某一个元素出现次数>=两次就返回trueif(kv.second >= 2){return true;}}return false;}
};

优化:使用unordered_set ,遍历原数组插入元素,如果发现该元素曾经出现过 -> 返回true

class Solution {
public:bool containsDuplicate(vector<int>& nums) {unordered_set<int> s;for (int x: nums) {//这个元素曾经出现过if (s.find(x) != s.end()) {return true;}s.insert(x);//插入当前元素}return false;}
};

当然我们也可以这样做:因为unordered_set :去重+排序 ,所以如果全部元素插入到set之后,和原数组进行长度比较

长度不变 -> 说明没有重复的元素, 长度变短 -> 说明有重复的元素 返回true

class Solution {
public:bool containsDuplicate(vector<int>& nums) {unordered_set<int> s;for (int x: nums) {s.insert(x);//插入当前元素}//如果长度变短 -> 说明有重复的元素return s.size() < nums.size();}
};

884. 两句话中的不常见单词

https://leetcode.cn/problems/uncommon-words-from-two-sentences/

题目含义:即返回两个句子中只出现过一次的单词

image-20220525230621255

因此我们可以把两个句子拼接成一个, 然后使用map映射统计句子中单词出现的次数

对于map映射中的每个键值对,键表示一个单词,值表示该单词出现的次数

在统计完成后,我们再对map映射进行一次遍历,把所有值为 1 的键放入容器中

注意点:字符串拼接要用空格间隔开!

class Solution {
public:vector<string> uncommonFromSentences(string s1, string s2) {//string tmp = s1+s2;//err因为会导致s1的最后一个单词和s2的第一个单词连起来!!!要用空格区分//1.将s1和s2拼接  注意空格间隔开!!!string tmp = s1 +" ";tmp+=s2;//2.利用map统计字符串出现次数map<string,int> m;//字符串 - 出现次数//在stringstream中会自动断开空格并停止抽出值,所以用两个while分别作两个字符串,抽出单词次数加1stringstream  str;str << tmp;string s;while(str >> s) //以空格抽出一个单词{m[s]++;//出现次数++}//遍历map,找次数为1的字符串vector<string> ans;for(auto& kv:m){//kv是pair对象if(kv.second == 1){ans.push_back(kv.first);}}return ans;}
};

如果不会使用stringstream 我们可以遍历拼接后的字符串, 把每个单词提取出来,放到容器中,然后遍历该容器用map统计次数!

class Solution {
public:vector<string> uncommonFromSentences(string s1, string s2) {//string tmp = s1+s2;//err因为会导致s1的最后一个单词和s2的第一个单词连起来!!!要用空格区分//1.将s1和s2拼接  注意空格间隔开!!!string tmp = s1 +" ";tmp+=s2;//2.遍历拼接后的字符串,把每个单词放到vector中vector<string> ans;for(int i = 0; i < tmp.size(); ++i){string ret;//以空格区分每个单词while(i < tmp.size() && tmp[i] != ' '){ret += tmp[i];++i;}   ans.push_back(ret);}//3.遍历容器ans,利用map统计字符串出现次数map<string,int> m;//字符串 - 出现次数for(auto& e : ans){++m[e];}//4.遍历map,找次数为1的字符串ans.clear();//先清空容器,存放答案for(auto& kv:m){//kv是pair对象if(kv.second == 1){ans.push_back(kv.first);}}return ans;}
};

总结:

unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构

map/set与unordered_map/unordered_set的区别

map/set 的底层是红黑树 unordered_map和unordered_set的底层是哈希表 (C++11添加的)

但是他们的功能是一样的,我们用一个表格区分:

容器名称底层结构内部是否有序CRUD效率迭代器类型
unordered_map/unordered_set哈希表无序O(1)单向迭代器(只有正向无反向)
map/set红黑树有序O(logN)双向迭代器(有正向有反向)

区别:

1.unordered_xxx 遍历不按key排序,命名就体现了 unordered:无序的

2.unordered_xxx 单向迭代器

3.unordered_xxx 综合效率高于map和set

验证: 我们可以通过下列代码测试set容器和unordered_set容器增删查的效率,

#include <iostream>
#include <set>
#include <unordered_set>
#include <time.h>
using namespace std;int main()
{int N = 1000;//控制数据个数为N个vector<int> v;v.reserve(N);srand((unsigned int)time(NULL));//随即数种子//随机生成N个数字for (int i = 0; i < N; i++){v.push_back(rand());//生成随机数插入}//测试插入效率://将这N个数插入set容器set<int> s;clock_t begin1 = clock();//记录插入set的开始时间for (auto e : v){s.insert(e);}clock_t end1 = clock();//记录插入set的结束时间//将这N个数插入unordered_set容器unordered_set<int> us;clock_t begin2 = clock();//记录插入unordered_set的开始时间for (auto e : v){us.insert(e);}clock_t end2 = clock();//记录插入unordered_set的结束时间//分别输出插入set容器和unordered_set容器所用的时间cout << "set insert: " << end1 - begin1 << endl;cout << "unordered_set insert: " << end2 - begin2 << endl;//测试查找效率//在set容器中查找这N个数clock_t begin3 = clock();for (auto e : v){s.find(e);}clock_t end3 = clock();//在unordered_set容器中查找这N个数clock_t begin4 = clock();for (auto e : v){us.find(e);}clock_t end4 = clock();//分别输出在set容器和unordered_set容器中查找这N个数所用的时间cout << "set find: " << end3 - begin3 << endl;cout << "unordered_set find: " << end4 - begin4 << endl;//测试删除效率//将这N个数从set容器中删除clock_t begin5 = clock();for (auto e : v){s.erase(e);}clock_t end5 = clock();//将这N个数从unordered_set容器中删除clock_t begin6 = clock();for (auto e : v){us.erase(e);}clock_t end6 = clock();//分别输出将这N个数从set容器和unordered_set容器中删除所用的时间cout << "set erase: " << end5 - begin5 << endl;cout << "unordered_set erase: " << end6 - begin6 << endl;return 0;
}

测试结论:

  • 当处理数据量小时,map/set容器与unordered_map/unordered_set容器增删查改的效率差异不大
  • 当处理数据量大时,map/set容器与unordered_map/unordered_set容器增删查改的效率相比,unordered系列容器的效率更高
  • 因此,当处理数据量较小时,选用xxx容器与unordered_xxx容器的差异不大;当处理数据量较大时,建议选用对应的unordered_xxx容器

当需要存储的序列为有序时,应该选用map/set容器



http://www.ppmy.cn/news/93296.html

相关文章

13. InnoDB引擎底层原理及Mysql 8.0 新增特性详解

MySQL性能调优 一、InnoDB引擎底层原理1. 深入理解Redolog日志底层原理1.1 innodb引擎底层事务原理1.1.1 WAL 2. redolog日志文件2.1 为什么要redolog日志文件2.2 redolog的内部结构2.3 redolog的刷盘时机2.4 Log Sequence Number2.5 innodb_flush_log_at_trx_commit 3. undolo…

【Leetcode -643.子数组最大平均值Ⅰ -645.错误的集合】

Leetcode Leetcode -643.子数组最大平均值ⅠLeetcode -645.错误的集合 Leetcode -643.子数组最大平均值Ⅰ 题目&#xff1a;给你一个由 n 个元素组成的整数数组 nums 和一个整数 k 。 请你找出平均数最大且长度为 k 的连续子数组&#xff0c;并输出该最大平均数。 任何误差小…

RK3568平台开发系列讲解(环境篇)10min带你获取、了解与编译U-Boot源代码

🚀返回专栏总目录 文章目录 一、U-Boot获取二、U-Boot根目录2.1 api/2.2 arch/2.3 board/2.4 cmd/2.5 common/2.6 config/2.7 disk/2.8 drivers/2.9 dts/2.10 env/2.11 fs/2.12 Makefile、Kbuild、Kconfig、config.mk2.13 mak

【Linux之进程间通信】04.Linux进程间的信号通信

【Linux之进程间通信】 项目代码获取&#xff1a;https://gitee.com/chenshao777/linux-processes.git &#xff08;麻烦点个免费的Star哦&#xff0c;您的Star就是我的写作动力&#xff01;&#xff09; 04.Linux进程间的信号通信 【目录】 一、进程间信号发送方式 二、…

Kubernetes高可用集群二进制部署(Runtime Docker)v1.21版本

Kubernetes高可用集群二进制部署&#xff08;Runtime Docker&#xff09; Kubernetes&#xff08;简称为&#xff1a;k8s&#xff09;是Google在2014年6月开源的一个容器集群管理系统&#xff0c;使用Go语言开发&#xff0c;用于管理云平台中多个主机上的容器化的应用&#xf…

鸿蒙Hi3861学习十八-DevEco Device Tool环境搭建

一、简介 在之前的文章中&#xff0c;我们是通过在windows下烧录&#xff0c;在ubuntu下编译的方式进行开发。今天我们同样是采用windowsubuntu混合环境进行开发。为什么要采用这种方式呢&#xff1f;因为就目前而言&#xff0c;大部分的开发板还不支持在Windows环境下进行编译…

【Python】使用百度AI能力

知识目录 一、写在前面✨二、百度AI能力介绍三、植物识别四、总结撒花&#x1f60a; 一、写在前面✨ 大家好&#xff01;我是初心&#xff0c;希望我们一路走来能坚守初心&#xff01; 今天跟大家分享的文章是 Python调用百度AI能力进行植物识别。 &#xff0c;希望能帮助到大…

代码随想录训练营Day53| 1143.最长公共子序列 1035.不相交的线 53. 最大子序和 动态规划

目录 学习目标 学习内容 1143.最长公共子序列 1035.不相交的线 53. 最大子序和 动态规划 学习目标 1143.最长公共子序列 1035.不相交的线 53. 最大子序和 动态规划 学习内容 1143.最长公共子序列 1143. 最长公共子序列 - 力扣&#xff08;LeetCode&#xff09;ht…