一、C语言中的string类
C语言中,字符串是以‘\0’结尾的一些字符集合,为了操作方便,C标准库中提供了一些str系列的库函数,但这些库函数与字符串是分离的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会访问越界。
二、C++中的string类
1、string类
string类的文档介绍:cplusplus.com/reference/string/string/?kw=string
①字符串是表示字符序列的类。
②标准的字符串提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符串的设计特性。
③string类是basic_string模板的一个实例,它使用的char来实例化basic_string类模板,并用char_traits和allocator作为basic_stirng的默认参数。
④这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员以及它的迭代器,将按照字节(而不是实际编码的字符)来操作。
2、string类的常用接口说明
①string类对象的常见构造
函数名称 | 功能说明 |
string() | 构造空的string类对象,即空字符串 |
string(const char* s) | 用一个C语言的字符串来构造string类对象 |
string(size_t n, char c) | 用n个字符c来构造string类对象 |
string(const string&s) | 拷贝构造函数 |
②string类对象的容器操作
函数名称 | 功能说明 |
返回字符串有效字符的长度 | |
返回字符串有效字符的长度 | |
返回空间总大小 | |
检测字符串是否为空串,是返回true,否则返回false | |
清空有效字符 | |
改变字符串容量 | |
将有效字符的个数改为n个,多出的空间用字符c填充 |
注意:
- size()与length()方法底层实现原理完全相同 ,引入size()的原因是为了与其它容器的接口保持一致,一般情况下都是使用size()。
- clear()只是将string中的有效字符清空,不改变容量的大小
- resize(size_t n)与resize(size_t n,char c)都是将字符串中的有效字符改变到n个,不同的是当字符个数增多时:resize(size_t n)用'\0'来填充多出来的元素空间,resize(size_t n,char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果元素个数增多,可能会改变容量,如果元素个数减少,容量不会改变。
- reserve(size_t n):改变字符串的容量,不改变字符串的有效个数,放reserve的参数小于string的容量时,reserve不会改变容量的大小。
③string类对象的访问及遍历操作
返回pos位置的字符 | |
begin获取一个字符的迭代器+end获得最后一个字符下一个 位置的迭代器 | |
范围for | C++11支持更简洁的范围for的新遍历方式 |
④string对象的修改操作
函数名称 | 功能说明 |
在字符串后尾插字符c | |
在字符串后追加一个字符串 | |
在字符串后追加一个字符串 | |
返回C语言格式字符串 | |
查找字符c第一次出现的位置 | |
查找字符c最后一次出现的位置 | |
从字符串中pos位置开始,截取n个字符串返回 | |
任意位置删除 | |
任意位置插入 |
⑤string非成员函数
函数名称 | 功能说明 |
字符串相加,尽量少用,因为传值返回效率低 | |
输入运算符重载 | |
输出运算符重载 | |
获取一行字符串 |
3、VS和G++下string结构说明
注意:下属结构是在32位平台下验证的,32位平台下指针占4个字节。
①VS下string的结构
string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:
- 当字符串长度小于16时,使用内部固定的字符数组来存放。
- 当字符串长度大于等于16时,从堆上开辟空间。
union _Bxty
{ // storage for small buffer or pointer to larger one
value_type _Buf[_BUF_SIZE];
pointer _Ptr;
char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;
这种设计也是有一定道理的,大多数情况下字符串的长度都是小于16的,那string对象创建好后,内部已经有了16个字符数组的固定空间,不需要通过对创建,效率高。
其次:还有一个size_t字段保存字符串长度,一个size_t字段保存从堆上开辟空间总的容量
最后:还有一个指针做一些其他事情。
故总共占16+4+4+4=28个字节。
②G++下string的结构
G++下,string是通过写时拷贝实现的,string对象总共占4个字节,内部只包含了一个指针,该指针将来指向一块堆空间,内部包含了如下字段:
- 容量
- 字符串有效长度
- 引用计数
struct _Rep_base
{
size_type _M_length;
size_type _M_capacity;
_Atomic_word _M_refcount;
};
- 指向堆空间的指针,用来存储字符串。
三、string类的模拟实现
1、成员变量
//string.h
namespace lsx
{
typedef char* iterator;//迭代器
typedef const char* const_iterator;//const迭代器
//我们在这里实现的迭代器其实就是指针
class string
{
public:
private:
size_t _size;//有效字符的长度
size_t _capacity;//字符串容量
char* _str;//指向存储字符串的空间
public:
const static size_t npos;//用来表示不能存的位置
//一般在.cpp文件里定义
};
}
//string.cpp
const size_t lsx::string::string::npos = -1;
//表示size_t类型的最大值
2、构造函数
声明:
string(const char* str = "");//构造函数
使用了缺省值。
定义:
lsx::string::string(const char* str)//构造函数
:_size(strlen(str))//计算str的长度
,_capacity(_size)
{
_str = new char[_capacity + 1];//用new开空间
strncpy(_str, str, _capacity + 1);//把str的内容拷贝到_str
}
使用了初始化列表。
3、析构函数
声明:
~string();//析构函数
定义:
lsx::string::~string()//析构函数
{
delete[]_str;//释放空间
_str = nullptr;//指针置空
_size = _capacity = 0;
}
4、拷贝构造函数
声明:
string(const string& str);//拷贝构造函数
定义:
lsx::string::string(const string& str)//拷贝构造函数
{
_str = new char[str._capacity+1];//开辟一样大的空间
//复制内容
strncpy(_str, str._str, str._size);
_size = str._size;
_capacity = str._capacity;
}
5、赋值重载函数
声明:
string& operator=(const string& str);//赋值重载
定义:
lsx::string& lsx::string:: operator=(const string& str)//赋值重载
{
if (this != &str)//防止自己给自己赋值
{
delete[]_str;//释放掉原来的空间
_str = new char[str._capacity + 1];//开辟和str一样大的空间
strncpy(_str, str._str, str._capacity + 1);//拷贝
_size = str._size;
_capacity = str._capacity;
}
return *this;
}
6、迭代器
声明:
iterator begin();//开始
const_iterator begin()const;//开始
iterator end();//结束
const_iterator end()const;//结束
定义:
lsx::iterator lsx::string::begin()//开始
{
return _str;
}
lsx::const_iterator lsx::string::begin()const//开始
{
return _str;
}
lsx::iterator lsx::string::end()//结束
{
return _str + _size;
}
lsx::const_iterator lsx::string::end()const//结束
{
return _str + _size;
}
7、reserve函数
声明:
void reserve(size_t n);//修改容量
定义:
void lsx::string::reserve(size_t n)//修改容量
{
if (n > _capacity)//只有n大于_capacity时才修改
{
char* tmp = new char[n + 1];//开辟新空间
strncpy(tmp, _str,_size+1);//拷贝数据
delete[]_str;//释放旧空间
_str = tmp;
_capacity = n;
}
}
8、resize函数
声明:
void resize(size_t n, const char& c = '\0');//修改有效长度
使用缺省值
定义:
void lsx::string::resize(size_t n, const char& c)//修改有效长度
{
if (n > _size)//如果n大于当前有效长度
{
reserve(n);
for (int i = _size;i < n;++i)//拿字符c填充
{
_str[i] = c;
}
}
_str[n] = '\0';
_size = n;
}
9、empty函数
声明:
bool empty()const;//判空
定义:
bool lsx::string::empty()const//判空
{
return _size == 0;
}
10、erase函数
声明:
string& erase(size_t pos, size_t len = npos);//删除
定义:
lsx::string& lsx::string::erase(size_t pos, size_t len)//删除
{
//如果len不传参,就默认从pos开始删完
assert(pos < _size);
if (len == npos || pos + len > _size)//直接从pos开始删完
{
_str[pos] = '\0';
_size = pos;
}
else//从pos删len个
{
//挪动数据覆盖
for (int i = pos + len, j = pos;i <= _size;i++, j++)//
{
_str[j] = _str[i];
}
_size -= len;
}
return *this;
}
11、clear函数
声明:
void clear();//清空
定义:
void lsx::string::clear()//清空
{
_str[0] = '\0';
_size = 0;
}
12、swap函数
声明:
void swap(string& str);//交换
定义:
void lsx::string::swap(string& str)//交换
{
std::swap(_size, str._size);
std::swap(_capacity, str._capacity);
std::swap(_str,str._str);
}
13、insert函数
声明:
string& insert(size_t pos, const char& c);//插入
string& insert(size_t pos, const char* str);//插入字符串
定义:
lsx::string& lsx::string::insert(size_t pos, const char& c)//插入
{
assert(pos <= _size);
if (_size == _capacity)
{//扩容
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
for (int i = _size + 1;i > pos;i--)//挪数据
{
_str[i] = _str[i - 1];
}
_str[pos] = c;//插入c
_size++;
return *this;
}
lsx::string& lsx::string::insert(size_t pos, const char* str)//插入字符串
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{//扩容
reserve(_size + len);
}
for (int i = _size;i >= (int)pos;i--)//挪数据
{
_str[i + len] = _str[i];
}
strncpy(_str + pos, str, len);//插入str
_size += len;
return *this;
}
14、push_back函数与append函数
声明:
void push_back(const char c);//尾插字符
void append(const char* str);//尾插字符串
定义:
void lsx::string::push_back(const char c)//尾插字符
{
insert(size(), c);
}
void lsx::string::append(const char* str)//尾插字符串
{
assert(str);
insert(size(), str);
}
15、operator+=函数
声明:
string& operator+=(const char c);//string+=char
string& operator+=(const char* str);//string+=char*
string& operator+=(const string& str);//string+=string
定义:
lsx::string& lsx::string::operator+=(const char c)//string+=char
{
push_back(c);
return *this;
}
lsx::string& lsx::string::operator+=(const char* str)//string+=char*
{
append(str);
return *this;
}
lsx::string& lsx::string::operator+=(const string& str)//string+=string
{
append(str._str);
return *this;
}
16、operator[]函数
声明:
char& operator[](size_t i);//随机访问
const char& operator[](size_t i)const;//随机访问
定义:
char& lsx::string::operator[](size_t i)//随机访问
{
assert(i <= _size);
return _str[i];
}
const char& lsx::string::operator[](size_t i)const//随机访问
{
assert(i <= _size);
return _str[i];
}
17、c_str函数、size函数与capacity函数
声明:
const char* c_str()const;//返回_str
size_t size()const;//返回_size
size_t capacity()const;//返回_capacity
定义:
const char* lsx::string::c_str()const//返回_str
{
return _str;
}
size_t lsx::string::size()const//返回_size
{
return _size;
}
size_t lsx::string::capacity()const//返回_capacity
{
return _capacity;
}
18、比较运算符重载
声明:
bool operator<(const string& str)const;//string<string
bool operator==(const string& str)const;//string==string
bool operator<=(const string& str)const;//string<=string
bool operator>(const string& str)const;//string>string
bool operator>=(const string& str)const;//string>=string
bool operator!=(const string& str)const;//string!=string
定义:
bool lsx::string::operator<(const string& str)const//string<string
{
return strcmp(_str, str._str) < 0;
}
bool lsx::string::operator==(const string& str)const//string==string
{
return strcmp(_str, str._str) == 0;
}
bool lsx::string::operator<=(const string& str)const//string<=string
{
return *this < str || *this == str;
}
bool lsx::string::operator>(const string& str)const//string>string
{
return !(*this <= str);
}
bool lsx::string::operator>=(const string& str)const//string>=string
{
return !(*this < str);
}
bool lsx::string::operator!=(const string& str)const//string!=string
{
return !(*this == str);
}
19、find函数
声明:
size_t find(const char& c, size_t pos = 0);//找c第一次出现的位置
size_t find(const char* str, size_t pos = 0);//找str第一次出现的位置
定义:
size_t lsx::string::find(const char& c, size_t pos)//找c第一次出现的位置
{
assert(pos < _size);
for (int i = pos;i < _size;i++)
{
if (_str[i] == c)
{
return i;
}
}
return npos;
}
size_t lsx::string::find(const char* str, size_t pos)//找str第一次出现的位置
{
assert(pos < _size);
char* tmp = strstr(_str + pos, str);
if (tmp == nullptr)
{
return npos;
}
return tmp - _str;
}
20、operator<<函数
声明:
ostream& operator<<(ostream& cout, const string& str);//cout<<string
定义:
ostream& lsx::operator<<(ostream& cout, const string& str)//cout<<string
{
for (auto a : str)
{
cout << a;
}
return cout;
}
21、operator>>函数
声明:
istream& operator>>(istream& in, string& str);//cin>>string
定义:
istream& lsx::operator>>(istream& in, string& str)//cin>>string
{
char buff[129];
size_t i = 0;
char ch=cin.get();//只有用get()才能读到空字符或者换行字符
while (ch != ' ' && ch != '\n')//读到空字符或者换行符为止
{
buff[i++] = ch;
if (i == 128)//满128个再放入字符串,避免多次开辟空间
{
buff[129] = '\0';
str += buff;
i = 0;
}
ch = cin.get();
}
if (i != 0)//把buff里剩余的全部放入字符串
{
buff[i] = '\0';
str += buff;
}
return cin;
}
如有错误,欢迎指正,谢谢。
完结。。
标签:const,string,实现,char,lsx,str,模拟,size From: https://blog.51cto.com/u_15855358/7113021