一.C语言中的字符串
C 语言中,字符串是以 '\0' 结尾的一些字符的集合,为了操作方便, C 标准库中提供了一些 str 系列的库函数, 但是这些库函数与字符串是分离开的,不太符合OOP 的思想,而且底层空间需要用户自己管理,稍不留神可 能还会越界访问。二、标准库中的string类 (了解)
2.1 string类(了解)
1. 字符串是表示字符序列的类 2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。 3. string 类是使用 char( 即作为它的字符类型,使用它的默认 char_traits 和分配器类型 ( 关于模板的更多信息,请参阅basic_string) 。 4. string 类是 basic_string 模板类的一个实例,它使用 char 来实例化 basic_string 模板类,用 char_traits 和allocator 作为 basic_string 的默认参数 ( 根于更多的模板信息请参考 basic_string) 。 5. 注意,这个类独立于所使用的编码来处理字节 : 如果用来处理多字节或变长字符 ( 如 UTF-8) 的序列,这个类的所有成员( 如长度或大小 ) 以及它的迭代器,将仍然按照字节 ( 而不是实际编码的字符 ) 来操作。C++中对于string的定义是:typedef basic_string string;
- 使用
typedef
关键字将basic_string
类定义为一个新的类型string
。 - 这意味着,以后在代码中提到
string
时,其实是在引用basic_string
类。
也就是说C++中的string类是一个泛型类,由模板而实例化的一个标准类,本质上不是一个标准数据类型。
至于为什么不直接用String标准数据类型而用类是因为编码
每个国家的语言不同 比如说英语使用26个英文字母基本就能表述所有的单词 但是对于中文的字符呢?就要用其他编码方式啊(比如说utf-8)
总结:
- string是表示字符串的字符串类
- 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
- string在底层实际是:basic_string模板类的别名,typedef basic_string<char, char_traits, allocator> string;
- 不能操作多字节或者变长字符的序列。
- 在使用string类时,必须包含#include头文件以及using namespace std
2.2 帮助文档阅读
(1) empty string constructor (default constructor)
Constructs an empty string, with a length of zero characters.
(2) copy constructor
Constructs a copy of str.
(3) substring constructor
Copies the portion of str that begins at the character position pos and spans len characters (or until the end of str, if either str is too short or if len is string::npos).
(4) from c-string
Copies the null-terminated character sequence (C-string) pointed by s.
(5) from buffer
Copies the first n characters from the array of characters pointed by s.
(6) fill constructor
Fills the string with n consecutive copies of character c.
(7) range constructor
Copies the sequence of characters in the range [first,last), in the same order.
(1) 空字符串构造函数(默认构造函数)
构造一个空字符串,长度为零个字符。
(2) 拷贝构造函数
构造一个 str 的副本。
(3) 子字符串构造函数
复制 str 从字符位置 pos 开始并跨越 len 个字符的部分
(如果 str 太短或 len 是 string::npos,则复制到 str 的末尾)。
(4) 从 C 风格字符串构造
复制由 s 指向的以 null 结尾的字符序列(C 字符串)。
(5) 从字符串序列构造
复制由 s 指向的字符数组中的前 n 个字符。
(6) 填充构造函数
用 n 个字符 c 的连续副本填充字符串。
(7) 范围构造函数
复制范围 [first,last) 中的字符序列,顺序保持不变。
三、 string类的常用接口说明
3.1 string类对象的常见构造
构造函数 | 函数名称 | 功能说明 |
---|---|---|
string() | 空字符串构造函数(重点) | 构造空的 string 类对象,即空字符串 |
string(const char* s) | 从 C-string 构造(重点) | 用 C-string 来构造 string 类对象 |
string(size_t n, char c) | 填充构造函数 | string 类对象中包含 n 个字符 c |
string(const string& s) | 拷贝构造函数(重点) | 用一个已有的 string 对象 s 构造新的 string 对象 |
void test01()
{
// 常用
string s1;
string s2("hello world");
string s3(s2);
// 不常用, 了解
string s4(s2, 3, 5);
string s5(s2, 3);
string s6(s2, 3, 30);
string s7("hello world", 5);
string s8(10, 'x');
cout << s1 << endl;
cout << s2 << endl;
cout << s3 << endl;
cout << s4 << endl;
cout << s5 << endl;
cout << s6 << endl;
cout << s7 << endl;
cout << s8 << endl;
cin >> s1;
cout << s1 << endl;
}
3.2 string类对象的容量操作
函数名称 | 功能说明 |
---|---|
size (重点) | 返回字符串有效字符长度 |
length | 返回字符串有效字符长度 |
capacity | 返回空间总大小 |
empty (重点) | 检测字符串是否为空串,若为空返回 true ,否则返回 false |
clear (重点) | 清空有效字符 |
reserve (重点) | 为字符串预留空间 |
resize (重点) | 将有效字符的个数改为 n 个,多出的空间用指定字符填充 |
3.3 string类对象的访问及遍历操作
函数名称 | 功能说明 |
---|---|
operator[] (重点) | 返回 pos 位置的字符,用于 const string 类对象的调用 |
begin 和 end | begin 获取一个字符的迭代器,end 获取最后一个字符下一个位置的迭代器 |
rbegin 和 rend | rbegin 获取一个反向迭代器指向最后一个字符,rend 获取一个反向迭代器指向第一个字符前一个位置 |
范围 for | C++11 支持更简洁的范围 for 新遍历方式 |
字符串类的简单实现
class String
{
public:
// 引用返回
// 1.减少拷贝
// 2.修改返回对象
char& operator[](size_t i)
{
assert(i < _size)
return _str[i];
}
private:
char* _str;
size_t _size;
size_t _capacity;
};
其中operator[]
操作符重载允许通过下标访问和修改字符串中的字符。通过返回字符的引用,可以避免不必要的拷贝并直接修改字符串内容,同时通过assert
保证了安全性。
void test02()
{
string s1("hello world");
cout << s1.size() << endl;// 不计算'\0'
// cout << s1.length() << endl;
// 访问每个字符并令其++
for (size_t i = 0; i < s1.size(); i++)
{
s1[i]++;
}
cout << endl;
s1[0] = 'x';
// 越界会被检查
// s1[20];
// 访问每个字符
for (size_t i = 0; i < s1.size(); i++)
{
cout << s1.operator[](i) << " ";
cout << s1[i] << " ";
}
cout << endl;
const string s2("hello world");
// const 不能修改
// s2[0] = 'x';
}
通过重载的 operator[]
访问和修改字符串中的字符,同时也演示了对常量字符串对象进行修改时的限制。代码还包含了越界访问检查,通过 assert
保证安全性。
3.4 string类对象的修改操作
函数名称 | 功能说明 |
---|---|
push_back | 在字符串末尾插入字符 c |
append | 在字符串末尾追加一个字符串 |
operator+= | 在字符串末尾追加字符串 str (重点) |
c_str | 返回 C 格式字符串(重点),用于与其他 C/C++ 函数交互,返回的字符串是临时的,不应被修改 |
find + npos | 从字符串 pos 位置开始往后找字符 c ,返回该字符在字符串中的位置,找不到时返回 string::npos (重点) |
rfind | 从字符串 pos 位置开始往前找字符 c ,返回该字符在字符串中的位置(注意:rfind 通常用于查找子字符串,而非单个字符 c 的向前查找,对于单个字符,直接使用 find 从末尾开始查找即可) |
substr | 在字符串中从 pos 位置开始,截取 n 个字符,然后将其返回 |
void test03()
{
// 构造
string s1("hello world");
// 隐式类型转换
string s2 = "hello world";
const string& s3 = "hello world";
// 引用的临时对象, 临时对象具有常性
string s4("hello world");
push_back(s4);
push_back("hello world");
}
3.5 string类非成员函数
函数/运算符 | 功能说明 |
---|---|
operator+ | 字符串连接运算符,但尽量少用,因为传值返回导致深拷贝,效率低 |
operator>> (重点) | 输入运算符重载,用于从输入流中提取字符串到字符串对象中 |
operator<< (重点) | 输出运算符重载,用于将字符串对象的内容发送到输出流中 |
getline (重点) | 从输入流中获取一行字符串,直到遇到换行符('\n'),不包括换行符 |
relational operators (重点) | 大小比较运算符重载,包括 < 、<= 、> 、>= 、== 、!= ,用于比较两个字符串对象的大小 |
3.6 vs和g++下string结构的说明
注意:下述结构是在 32 位平台下进行验证, 32 位平台下指针占 4 个字节。 vs 下 string 的结构 string 总共占 28 个字节 ,内部结构稍微复杂一点,先是 有一个联合体,联合体用来定义 string 中字 符串的存储空间 :- 当字符串长度小于16时,使用内部固定的字符数组来存放
- 当字符串长度大于等于16时,从堆上开辟空间
union _Bxty
{
// storage for small buffer or pointer to larger one
value_type _Buf[_BUF_SIZE];
pointer _Ptr;
char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;
这种设计也是有一定道理的,大多数情况下字符串的长度都小于
16
,那
string
对象创建好之后,内
部已经有了
16
个字符数组的固定空间,不需要通过堆创建,效率高。
其次:还有
一个
size_t
字段保存字符串长度,一个
size_t
字段保存从堆上开辟空间总的容量
最后:还
有一个指针
做一些其他事情。
故总共占
16+4+4+4=28
个字节。
g++
下
string
的结构
G++
下,
string
是通过写时拷贝实现的,
string
对象总共占
4
个字节,内部只包含了一个指针,该指
针将来指向一块堆空间,内部包含了如下字段:
- 空间总大小
- 字符串有效长度
- 引用计数
struct _Rep_base
{
size_type _M_length;
size_type _M_capacity;
_Atomic_word _M_refcount;
};
- 指向堆空间的指针,用来存储字符串。
四、string操作的代码示例
void test04()
{
string s1("hello world");
// 遍历方式1: 下标 + []
for (size_t i = 0; i < s1.size(); i++)
{
cout << s1[i] << " ";
}
cout << endl;
// 遍历方式2: 迭代器
string::iterator it1 = s1.begin();
while (it1 != s1.end())
{
*it1 += 3;
cout << *it1 << " ";
++it1;
}
cout << endl;
// 遍历方式3: 范围for
// 底层实现方式都是迭代器实现
for (auto e : s1)
{
e++;
cout << e << " ";
}
cout << endl;
//cout << typeid(it1).name() << endl;
/*list<int> lt1;
lt1.push_back(1);
lt1.push_back(2);
lt1.push_back(3);
list<int>::iterator it = lt1.begin();
while (it != lt1.end())
{
cout << *it << " ";
++it;
}
cout << endl;
for (auto e : lt1)
{
cout << e << " ";
}
cout << endl;*/
}
//template<class T>
//struct ListNode
//{
// ListNode <T>* _next;
// ListNode <T>* _prev;
// T _data;
//};
//
//template<class T>
//class list
//{
//private:
// ListNode<T>* _head;
//};
void test05()
{
const string s1("hello world");
//string::const_iterator it1 = s1.begin();
auto it1 = s1.begin();
while (it1 != s1.end())
{
// 指向的内容不能修改
// *it1 += 3;
cout << *it1 << " ";
++it1;
// const_iterator 本身可以++
}
cout << endl;
/*string::iterator it1 = s1.begin();
while (it1 != s1.end())
{
*it1 += 3;
cout << *it1 << " ";
++it1;
}
cout << endl;*/
}
void test06()
{
const string s1("hello world");
//string::const_iterator it1 = s1.begin();
auto it1 = s1.begin();
while (it1 != s1.end())
{
// 不能修改
//*it1 += 3;
cout << *it1 << " ";
++it1;
}
cout << endl;
//string::const_reverse_iterator cit1 = s1.rbegin();
auto cit1 = s1.rbegin();
while (cit1 != s1.rend())
{
// 不能修改
//*cit1 += 3;
cout << *cit1 << " ";
++cit1;
}
cout << endl;
string s2("hello world");
string::reverse_iterator it2 = s2.rbegin();
//auto it2 = s2.rbegin();
while (it2 != s2.rend())
{
//*it2 += 3;
cout << *it2 << " ";
++it2;
}
cout << endl;
}
void test07()
{
string s1("hello world");
cout << s1 << endl;
// s1按字典序排序
// 排序一部分
sort(s1.begin(), s1.end());
// 第一个和最后一个参与排序
sort(++s1.begin(), --s1.end());
// 前五个排序 [0, 5)
// sort(s1.begin(), s1.begin() + 5);
cout << s1 << endl;
}
void test08()
{
string s1("hello world");
cout << s1 << endl;
s1.push_back('x');
cout << s1 << endl;
s1.append(" yyyy!!");
cout << s1 << endl;
s1 += 'y';
s1 += "zzzzz";
cout << s1 << endl;
}
void test09()
{
string s1("hello world");
cout << s1 << endl;
s1.assign("111111");
cout << s1 << endl;
// 慎用, 因为效率不高 -> O(N)
// 实践中需求也不高
string s2("hello world");
s2.insert(0, "xxxx");
cout << s2 << endl;
char ch = 'z';
s2.insert(0, 1, ch);
s2.insert(0, 1, 'y');
cout << s2 << endl;
// 没有这个版本的头插
// s2.insert(0, 'y');
// cout << s2 << endl;
s2.insert(s2.begin(), 'y');
cout << s2 << endl;
s2.insert(s2.begin(), s1.begin(), s1.end());
cout << s2 << endl;
}
void test10()
{
string s1("hello world");
cout << s1 << endl;
// 效率不高, 慎用, 和inset类似
s1.erase(0,1);// 头删
cout << s1 << endl;
// s1.erase(5);
s1.erase(5,100);
cout << s1 << endl;
string s2("hello world");
s2.replace(5, 1, "%20");
// 字符串的替换
cout << s2 << endl;
// 不建议这样使用,因为要挪动数据
string s3("hello world hello char");
for (size_t i = 0; i < s3.size();)
{
if (s3[i] == ' ')
{
s3.replace(i, 1, "%20");
i += 3;
}
else
{
i++;
}
}
cout << s3 << endl;
string s4("hello world hello double");
string s5;
for (auto ch : s4)
{
if (ch != ' ')
{
s5 += ch;
}
else {
s5 += "%20";
}
}
cout << s5 << endl;
}
今天就先到这了!!!、
看到这里了还不给博主扣个:
⛳️ 点赞☀️收藏 ⭐️ 关注!
你们的点赞就是博主更新最大的动力!
有问题可以评论或者私信呢秒回哦。