C++——string容器模拟实现

news/2024/12/1 13:54:29/

目录

1. 基本成员变量

2. 默认成员函数

2.1 构造函数

2.2 析构函数

2.3 拷贝构造函数

2.4 赋值运算符重载

3. 容量与大小相关函数

3.1 size

3.2 capacity

4. 字符串访问相关函数

4.1 operator[ ]重载

4.2 迭代器

5.  增加函数接口

5.1 reserve

5.2 resize

5.3 push_back

5.4 append追加字符串 

5.5 operator+=

5.6 insert插入

6. 删除相关接口

6.1 erase

6.2 clear清楚数据

7. find查找函数

8. c_str

9. swap交换函数

10. 非成员函数

10.1 关系运算符号重载

10.2 流插运算符重载

10.3 getline函数

1. 基本成员变量

namespace cpp
{//使用命名空间防止定义的string类与库里的string类冲突class string{public://……private:char* _str;       //存储字符串size_t _size;	  //有效字符个数size_t _capacity; //实际存储有效字符的空间,不包含'\0'const static size_t npos;};const size_t string::npos = -1;
}

2. 默认成员函数

2.1 构造函数

这里的构造函数最好写成全缺省函数,与标准库里的构造函数相一致。

//全缺省的默认构造函数
string(const char* str = "")//标准库里string定义对象的默认值为空串""//按声明的顺序进行初始化:_size(strlen(str)), _capacity(_size)
{_str = new char[_capacity + 1];//在堆上为_str开空间,+1是给'\0'留的strcpy(_str, str);//把常量字符串的内容拷贝过去
}

2.2 析构函数

这里string类里的_str是动态开辟建立在堆中的,堆区的空间不能自动销毁因此需要我们手动去销毁。

//析构函数
~string()
{if (_str){delete[] _str;_str = nullptr;_size = _capacity = 0;}
}

2.3 拷贝构造函数

首先,我们不写,编译器会默认生成一个拷贝构造函数,不过是值拷贝或者浅拷贝,按字节拷贝的。

浅拷贝:两个对象指向同一块空间,析构时导致同一块空间析构两次。

浅拷贝针对于日期类这种是非常适合的,不过对于string类这样_str是动态开辟到堆上的,如果使用值拷贝会导致1、析构两次 2、一个对象修改会影响另外一个。因此我们需要写深拷贝。深拷贝的核心要点在于我和你的有一样的值,但是使用的不是同一块空间。

深拷贝有两种写法:传统写法和现代写法。

  • (1)传统写法

传统写法就是先开辟一块能够容纳原字符串大小的空间,最后把拷贝的对象的字符串数据拷贝到新开的空间里头即可。

//拷贝构造函数
//不能用浅拷贝,原因如下:1、析构两次 2、一个对象修改会影响另外一个
//传统写法
//s2(s1);
string(const string& s):_size(strlen(s._str)),_capacity(_size)
{_str = new char[_capacity + 1];strcpy(_str, s._str);
}
  • (2)现代方法

传统写法是本分的自己开空间,然后再拷贝数据,而现代方法就是剥削,要完成深拷贝,自己不想干活就安排别人干活,然后窃取别人的劳动成果。

假如拿s1去拷贝s2、s2(s1),现代方法就是我设定了一个tmp对象,拿s1._str的字符串作为参数去给tmp对象完成构造函数,再利用swap函数把tmp对象的_str、_size、_capacity全部与s1的交换即可完成现代方法的深拷贝。但是在这之前注意把s1的数据置空,避免交换后tmp调用析构函数出现析构随机值的错误现象。

/*现代写法*/
string(const string& s):_str(nullptr), _size(0), _capacity(0)
{string tmp(s._str);//调用构造函数,构造一个字符串作为s.c_str的对象swap(tmp);
}

2.4 赋值运算符重载

这里和上述拷贝构造函数一样,我们不写编译器会自动生成,不过对于string类的_str来说,在堆上申请的空间需要自己去释放,否则会导致同一块空间析构两次。此深拷贝依旧有传统写法和现代写法。

  • 思路:

如若把s1=s3,这里不能直接进行赋值。要考虑两个问题。

  1. 如若s1的空间小于s3,此时直接拷贝过去会导致越界
  2. 如若s1的空间过分大于s3的空间,又会导致直接拷贝后空间过渡浪费。只有在我s1和s3的空间差不多大时,才可以直接进行拷贝。

综上:先把s1原先指向的空间delete释放掉,再把s1重新开辟和s3一样大的空间,记得多开一个字节,因为还有'\0'。再利用strcpy把s3的内容拷贝给s1即可。不过要避免一种特殊情况:自己给自己赋值,如若自己赋值给自己,直接返回,所以加个if条件判断即可。

如果我new开空间失败了,那么就要抛异常,而先前我依旧释放了s1,此时就把s1给破坏了。为了避免这一点,我们可以先开空间再拷贝数据最后再释放从而进行优化,具体见下文。

  • 1、传统写法:
//赋值运算符重载 --> 深拷贝
//s1 = s3  s1.operator=(&s1, s3);
string& operator=(const string& s)
{//防止自己给自己赋值if (this != &s){/*	
//法一://先删除原先s1的所有空间,防止赋值后s1过大导致空间浪费,s1过小导致空间不够delete[] _str;//给s1开辟与s3等价的空间大小,要多开一字节给'\0'_str = new char[strlen(s._str) + 1];strcpy(_str, s._str);*/
//法二优化//先开辟空间char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);delete[] _str;_str = tmp;_size = s._size;_capacity = s._capacity;}return *this;
}

C语言的动态开辟内存malloc需要检查合法性,而C++的new不需要,new失败的话需要抛异常捕获:

int main()
{try{//C++new失败要抛异常捕获//test_string1();test_string2();}catch (const exception& e){cout << e.what() << endl;}return 0;
}
  • 2、现代写法:
//现代写法1:
string& operator=(const string& s)
{if (this != &s)//避免自己给自己赋值{string tmp(s._str);swap(tmp);}return *this;
}

这里还有另一种更加简洁的现代方法,上述写法是引用传参,这里我们可以直接传值传参,让编译器自动调用拷贝构造函数,再把拷贝出来的对象作为右值与左值交换即可

//法二:简洁版	
//s1 = s3;
string& operator=(string s)//传值传参调用拷贝构造,s就是s3的深拷贝结果
{swap(s);//交换这俩对象return *this;
}

不过这种简洁的版本无法避免自己给自己赋值,但很少会出现自己给自己赋值的行为,除非你有啥癖好。所以上述两种方法都可使用。

3. 容量与大小相关函数

3.1 size

直接返回隐含this指针指向的_size即为字符串长度。

//返回字符串的长度
size_t size() const //不改变内部成员,最好加上const
{return _size;
}

3.2 capacity

直接返回隐含this指针指向的_capacity即可。

//返回字符串容量
size_t capacity() const //不改变内部成员,最好加上const
{return _capacity;
}

4. 字符串访问相关函数

4.1 operator[ ]重载

有了operator[ ]运算符重载,便可以直接用下标+[ ]进行元素访问,不过这里还应提供一个const版本的operator[ ]运算符重载,以便于普通对象和const对象均可调用而不会出现权限放大的问题。

//版本1:
char& operator[](size_t pos)//引用返回,便于后续修改返回的字符
{assert(pos < _size);//记得确保pos位置的合法性,不能超过字符串return _str[pos]; //返回pos位置字符的引用
}
//版本2:
const char& operator[](size_t pos) const//引用返回,便于后续修改返回的字符
{assert(pos < _size);return _str[pos]; //返回pos位置字符的引用
}

4.2 迭代器

string类的迭代器就是像字符指针一样的东西

  1. begin函数的作用就是返回字符串中第一个字符的地址。
  2. end函数的作用就是返回字符串最后一个字符的后一个位置的地址,即'\0'的地址。
//版本1:
typedef char* iterator;
iterator begin()
{return _str;//返回第一个有效字符的指针
}
iterator end()
{return _str + _size;//返回最后一个字符后一个位置的地址,即'\0'的地址
}

和上文的operator[ ]重载一样,这里也要写一个const版本的迭代器,以便于后续的const对象也能够调用。

//版本2:只读,const对象可调用
typedef const char* const_iterator;
const_iterator begin() const
{return _str;//返回第一个有效字符的指针
}
const_iterator end() const
{return _str + _size;//返回最后一个字符后一个位置的地址,即'\0'的地址
}

这里还有一种基于迭代器的遍历方式:范围for

范围for的底层实现原理和迭代器没两样,只不过写法看着很高端。

void test_string()
{cpp::string s1("hello world");//迭代器cpp::string::iterator it = s1.begin();while (it != s1.end()){cout << *it << " "; //h e l l o   w o r l dit++;}cout << endl;//范围forfor (auto& ch : s1) //加上引用,相当于是每个字符的别名,便于修改{ch -= 1;}for (auto& ch : s1){cout << ch << " "; //g d k k n  v n q k c}
}

5.  增加函数接口

5.1 reserve

reserve扩容只影响_capacity空间,不影响_size,其有以下两点规则

  1. 当n大于对象当前的capacity时,将capacity扩大到n或大于n。
  2. 当n小于对象当前的capacity时,无需操作。
//reserve扩容
void reserve(size_t n)
{if (n > _capacity){char* tmp = new char[n + 1];//每次开空间一定要多给一个字节给'\0'strcpy(tmp, _str);//释放旧空间delete[] _str;//把新空间赋给_str_str = tmp;//更新容量_capacity_capacity = n;}
}

5.2 resize

resize是将字符串调整为n个字符的长度,不仅会改变_size,还会改变_capacity空间。规则如下:

  1. 如果n小于当前的_size长度,将_size缩小到n。
  2. 如果n大于当前的_size长度,将_size扩大到n,扩大的字符默认为'\0'。

//resize调整大小
void resize(size_t n, char ch = '\0')
{//如果n < _size,就保留前n个字符即可,把下标n置为'\0'if (n < _size){_size = n;_str[_size] = '\0';}else{//如果n > _capacity,就要扩容了if (n > _capacity){reserve(n);}for (size_t i = _size; i < n; i++){//把剩余的字符置为ch_str[i] = ch;}_size = n;_str[_size] = '\0';}
}

5.3 push_back

首先要考虑需不需要扩容,如若需要,直接复用reserve函数进行增容,追加字符后,记得把最后一个下标_size对应的值置为'\0'。

//push_back
void push_back(char ch)
{
/*法一*///先检查是否需要扩容if (_size == _capacity){//复用reserve进行扩容,如果一开始容量为0,记得处理,否则容量*2依旧为0reserve(_capacity == 0 ? 4 : _capacity * 2);}_str[_size] = ch;_size++;_str[_size] = '\0'; //注意最后一个值恒为'\0'以确保字符串的完整性
}

这里我们还可使用后文写好的insert尾插字符,因为当insert函数中的pos为_size时即为尾插:

//push_back尾插字符
void push_back(char ch)
{//法二:复用insert尾插入字符insert(_size, ch);
}

5.4 append追加字符串 

使用append追加字符串首先要判断是否需要扩容,扩容后利用strcpy函数把追加的字符串拷贝到原字符串末尾即可,不需要额外处理'\0',因为strcpy默认把'\0'拷贝过去。

//append
void append(const char* str)
{//统计追加字符串后的长度size_t len = _size + strlen(str);//判断是否需要扩容if (len > _capacity){reserve(len);}//把字符串追加到末尾strcpy(_str + _size, str);_size = len;
}

这里也可以使用后文的insert追加字符串来完成,因为当pos为_size时,就是在尾部追加字符串。

void append(const char* str)
{//法二:复用insert函数insert(_size, str);
}

5.5 operator+=

operator+=可以追加字符、字符串、对象。因此我们可以分开来讨论:

  • 追加字符:直接复用push_back
//operator+=字符
string& operator+=(char ch)
{//复用push_backpush_back(ch);return *this;
}
  • 追加字符串:直接复用append
//operator+=字符串
string& operator+=(const char* str)
{//复用appendappend(str);return *this;
}

5.6 insert插入

insert的作用是在指定pos位置往后插入字符或字符串。

  • insert在pos位置插入字符

这里首先要判断pos的合法性,接下来就要挪动数据了,这里我们优先考虑从最后一个'\0'位置的下一个位置(_size + 1)开始往前挪动。因此定义end指向'\0'后一个位置,当end挪到与pos位置重合时停止,最后把插入的字符ch挪到下标pos处。记得最后更新_size++。

 

//insert插入字符
string& insert(size_t pos, char ch)
{assert(pos <= _size);if (_size == _capacity){//复用reserve进行扩容,如果一开始容量为0,记得处理,否则容量*2依旧为0reserve(_capacity == 0 ? 4 : _capacity * 2);}size_t end = _size + 1; //最好把end放到_size + 1的位置,防止后续出现整型提升等问题while (end > pos){_str[end] = _str[end - 1];end--;}//当end挪动到pos的位置时停止挪动,并把ch赋到pos的下标处_str[pos] = ch;_size += 1;return *this;
}

测试插入功能:

void test_string()
{cpp::string s("hello world");s.insert(6, '@');s += '@';cout << s.c_str() << endl; //hello @world@for (auto& ch : s){cout << ch << " "; }cout << "#" << endl; //h e l l o   @ w o r l d @ #s += '\0';for (auto& ch : s){cout << ch << " "; }cout << "#" << endl; //h e l l o   @ w o r l d @  #s.insert(0, '@');cout << s.c_str() << endl;//@hello @world@
}
  • insert在pos位置插入字符串

首先判断是否需要扩容,接下来挪动数据。定义变量end为_size + len的位置,把pos处往后的字符串整体往后挪动直至空出插入字符串的长度。利用循环+ _str[end] = _str[end - len];来完成。当end挪动到pos + len - 1时结束循环,再利用strncpy函数把插入的字符串拷贝过去即可。

 

//insert插入字符串
string& insert(size_t pos, const char* str)
{assert(pos <= _size);size_t len = strlen(str);if (len == 0){//如果传进来的字符串为空,直接返回即可return *this;}if (_size + len > _capacity){//判断是否扩容reserve(_size + len);}size_t end = _size + len;//当end >= pos + len时都不结束循环while (end >= pos + len){_str[end] = _str[end - len];end--;}//不能使用strcpy,因为会把\0也拷过去,就会出错strncpy(_str + pos, str, len);_size += len;return *this;
}
//insert插入字符串
string& insert(size_t pos, const char* str)
{assert(pos <= _size);size_t len = strlen(str);if (len == 0){//如果传进来的字符串为空,直接返回即可return *this;}if (_size + len > _capacity){//判断是否扩容reserve(_size + len);}size_t end = _size + len;//当end >= pos + len时都不结束循环while (end >= pos + len){_str[end] = _str[end - len];end--;}//不能使用strcpy,因为会把\0也拷过去,就会出错strncpy(_str + pos, str, len);_size += len;return *this;
}

测试:

void test_string()
{cpp::string s("hello world");s.insert(0, "xxx");cout << s.c_str() << endl;//xxxhello world
}

6. 删除相关接口

6.1 erase

如果给定删除的长度len为npos无符号值,或者说len + pos的长度>=_size,那么直接把pos位置的值设定为'\0\即可,因为此时就是把pos后的所有数据全部删除。出去这种特殊情况,其余的就是从pos + len处开始先前挪动到_size + 1为止。pos后的数据往前覆盖即可。

 

//erase删除
void erase(size_t pos, size_t len = npos)
{assert(pos < _size);if (len == npos || pos + len >= _size){//这种情况是删除pos后的所有数据,直接把pos处设定为'\0'即可_str[pos] = '\0';_size = pos;}else{size_t begin = pos + len;while (begin <= _size){_str[begin - len] = _str[begin];++begin;}_size -= len;}
}

测试如下:

void test_string9()
{cpp::string s("hello world");s.insert(0, "xxx");cout << s.c_str() << endl;//xxxhello worlds.erase(0, 3);cout << s.c_str() << endl;//hellow world
}

6.2 clear清楚数据

 clear函数是用来清除原字符串的所有数据,并不是连空间一并清除了,所以我们只需要把下标0置为'\0',并把有效字符个数_size置为0即可。

//clear清除数据
void clear()
{_str[0] = '\0';_size = 0;
}

7. find查找函数

find函数也分查找字符和字符串.

  • find查找字符:

直接遍历即可:

//find查找字符	
size_t find(char ch, size_t pos = 0)
{for (; pos < _size; pos++){if (_str[pos] == ch)return pos;}//没找到就返回npos,-1return npos; //-1
}
  • find查找字符串:

这里可以直接复用C语言的strstr函数进行查找,不过该函数返回的是地址,想要获得最终的下标直接利用地址相减即可,p - _str。

size_t find(const char* str, size_t pos = 0)
{//直接复用C语言库函数strstr即可,strstr函数返回的是地址const char* p = strstr(_str + pos, str);if (p == nullptr){return npos;}else{//返回下标直接用p - str即可return p - _str;}
}

8. c_str

c_str用于获取c类型的字符串,直接返回字符串即可.

//c_str  获取c形式的字符串
const char* c_str() const //最好加上const,便于普通及const对象均可调用
{return _str;
}

9. swap交换函数

swap函数用于交换两个对象的数据,我们可以通过复用库里的swap函数来完成,但是要在前面加上作用域限定符"::"。让编译器在全局域的库里调用swap函数。

//swap交换函数
void swap(string& s)
{std::swap(_str, s._str);std::swap(_size, s._size);std::swap(_capacity, s._capacity);
}

10. 非成员函数

10.1 关系运算符号重载

  • 1、operator<

直接借用库函数strcmp进行字符串大小比较即可。此外,和日期类一样,写好了<和==的重载,剩下的4个关系运算符直接复用即可。

//1、operator<
bool operator<(const string& s1, const string& s2)
{return strcmp(s1.c_str(), s2.c_str()) < 0;
}	
//2、operator==
bool operator==(const string& s1, const string& s2)
{return strcmp(s1.c_str(), s2.c_str()) == 0;
}

剩下4个关系运算符复用上面两个:

//3、operator<=
bool operator<=(const string& s1, const string& s2)
{return s1 < s2 || s1 == s2;
}
//4、operator>
bool operator>(const string& s1, const string& s2)
{return !(s1 <= s2);
}
//5、operator>=
bool operator>=(const string& s1, const string& s2)
{return !(s1 < s2);
}
//6、operator!=
bool operator!=(const string& s1, const string& s2)
{return !(s1 == s2);
}

10.2 流插运算符重载

  • <<流插入运算符重载

这里我们可以通过范围for来完成<<运算符的重载。

//<<流插入运算符重载
ostream& operator<<(ostream& out, const string& s)
{for (auto ch : s){out << ch;}return out;
}
  • >>提取入运算符重载

这里实现的过程种要注意当遇到空格或换行符时就要停止读取了。此外,在一开始要记得调用clear函数把原字符串的所有数据给清空,然后才能正常往后输入新的数据,否则新数据会累加到原数据后面,就不是>>预期的效果了。

//>>流提取运算符重载
istream& operator>>(istream& in, string& s)
{法一://要先把原字符串的所有数据给清空才可以输入新的数据,否则会累加到原数据后面,出错s.clear();char ch;ch = in.get();//使用get()函数才能获取空格或者换行字符while (ch != ' ' && ch != '\n'){s += ch;ch = in.get();}return in;
}

这里有个缺陷,如若频繁输入大量字符,那么就会多次扩容,扩容也会在效率上有所损耗,因此我们可以提前开辟一个128字节大小的数组,把每次输进的字符放到数组里头,最后当遇到停止的符号时,+=到字符串s上,如若下标加到127,把数组的字符+=到字符串s上,并充值数组为'\0',更新下标为0即可。以此类推。
 

//>>流提取运算符重载
istream& operator>>(istream& in, string& s)
{//法二://要先把原字符串的所有数据给清空才可以输入新的数据,否则会累加到原数据后面,出错s.clear();char ch;ch = in.get();//使用get()函数才能获取空格或者换行字符char buff[128] = { '\0' };size_t i = 0;while (ch != ' ' && ch != '\n'){buff[i++] = ch;if (i == 127){s += buff;memset(buff, '\0', 128);i = 0;}ch = in.get();}s += buff;return in;
}

10.3 getline函数

getline函数与上述写的<<流提取运算符重载非常相似,唯一不同的地方在于getline只有在遇到换行符才停止读取,而<<在遇到换行符停止外,遇到空格也会停止读取,因此,在<<的基础上改变下if种的判断条件即可:

//getline函数
istream& getline(istream& in, string& s)
{s.clear();char ch;ch = in.get();//getline函数只有在遇到换行符才会停止while (ch != '\n'){s += ch;ch = in.get();}return in;
}

 

 


http://www.ppmy.cn/news/493993.html

相关文章

C++虚函数表指针在内存中的位置

C虚函数表指针在内存中的位置 多态就是多种形态&#xff0c;C的多态分为静态多态与动态多态。 静态多态就是编译器根据函数实参的类型判断出要调用哪个函数。比如函数重载和函数模板。动态多态依靠的是虚函数表和动态绑定机制&#xff0c;因为是在运行时根据对象的类型在虚函…

智能开关面板行业概览

智能开关产品在全球市场的渗透率在2018年首次突破1%&#xff0c;并在之后的几年保持稳定的攀升态势。中国精装房自2019年开始逐步配置智能开关&#xff0c;直至2021年中国精装房智能开关配套率已达15%&#xff0c;作为智能家居最重要的交互入口之一&#xff0c;智能开关在未来的…

浅谈(零火)智能开关和(单火)智能开关的工作原理和优势区别

本文我们将浅谈(零火)智能开关和(单火)智能开关的工作原理和优势区别。在探讨这两类产品之前&#xff0c;小编先带大家了解一下"什么是智能开关?" 智能开关是指利用控制板和电子元器件的组合及编程&#xff0c;以实现电路智能开关控制的单元。在电子墙壁开关的基础上…

智能开关设计设计

智能插座设计方案 一、硬件 WIFI模块&#xff08;ESP8266&#xff09;、单片机&#xff08;stc12c5a60s2&#xff09;、4路5V继电器、插线板 二、技术 串口通信、android、C语言 三、实现方案 1、模块初始化 (1)、设置wifi模块为APStation模式&#xff08;设置模块作为路由…

el-switch开关

el-switch开关在表格中调用 效果图 注意&#xff1a;avue-switch在表格中用change事件可能会出现自动加载情况&#xff0c;用el-switch不会 1.加入el-switch标签并设置change事件 代码 <template slot"status" slot-scope"scope" > <el-…

HALL开关介绍

一、HALL开关原理及手机应用 手机中用来控制线路通断的器件主要有三种类型&#xff1a;开关、干簧管和霍尔元件。不同的是开关一般是由人工 手动控制&#xff0c;而干簧管和霍尔元件则通过磁信号来控制线路的通与断。霍尔&#xff08;HALL&#xff09;传感器是一种电子元件&…

智能家居Homekit系列一智能触摸开关

触摸开关&#xff0c;即通过触摸方式控制的墙壁开关&#xff0c;其感官场景如同我们的触屏手机&#xff0c;只需手指轻轻一点即可达到控制电器的目的&#xff0c;随着人们生活品质的提高&#xff0c;触摸开关将逐渐将换代传统机械按键开关。 触摸开关控制原理 触摸开关我们把…

Aqara 2021发布会:万物互联的家庭智慧全景

5月25日下午&#xff0c;全屋智能代表品牌Aqara在北京751DPARK时尚设计广场79罐举办了成立11年以来的首场品牌发布会。会上正式发布了一系列新技术、新场景与系统新能力&#xff0c;其中&#xff0c;Aqara智能管家——小乔首次亮相并充当发布会主持人角色&#xff0c;别开生面。…