首页 > 编程语言 >【C++修行之道】string

【C++修行之道】string

时间:2024-07-08 23:56:48浏览次数:24  
标签:字符 修行 string s1 C++ 字符串 world size

一.C语言中的字符串

C 语言中,字符串是以 '\0' 结尾的一些字符的集合,为了操作方便, C 标准库中提供了一些 str 系列的库函数, 但是这些库函数与字符串是分离开的,不太符合OOP 的思想,而且底层空间需要用户自己管理,稍不留神可 能还会越界访问。

二、标准库中的string(了解)

2.1 string(了解)

1. 字符串是表示字符序列的类 2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。 3. string 类是使用 char( 即作为它的字符类型,使用它的默认 char_traits 和分配器类型 ( 关于模板的更多信息,请参阅basic_string) 。 4. string 类是 basic_string 模板类的一个实例,它使用 char 来实例化 basic_string 模板类,用 char_traits 和allocator 作为 basic_string 的默认参数 ( 根于更多的模板信息请参考 basic_string) 。 5. 注意,这个类独立于所使用的编码来处理字节 : 如果用来处理多字节或变长字符 ( 如 UTF-8) 的序列,这个类的所有成员( 如长度或大小 ) 以及它的迭代器,将仍然按照字节 ( 而不是实际编码的字符 ) 来操作。

C++中对于string的定义是:typedef basic_string string;

  • 使用 typedef 关键字将 basic_string 类定义为一个新的类型 string
  • 这意味着,以后在代码中提到 string 时,其实是在引用 basic_string 类。

也就是说C++中的string类是一个泛型类,由模板而实例化的一个标准类,本质上不是一个标准数据类型。

至于为什么不直接用String标准数据类型而用类是因为编码

每个国家的语言不同 比如说英语使用26个英文字母基本就能表述所有的单词 但是对于中文的字符呢?就要用其他编码方式啊(比如说utf-8)

总结:

  1. string是表示字符串的字符串类
  2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
  3. string在底层实际是:basic_string模板类的别名,typedef basic_string<char, char_traits, allocator> string;
  4. 不能操作多字节或者变长字符的序列。
  5. 在使用string类时,必须包含#include头文件以及using namespace std

2.2 帮助文档阅读

(1) empty string constructor (default constructor)

        Constructs an empty string, with a length of zero characters.

(2) copy constructor

        Constructs a copy of str.

(3) substring constructor

        Copies the portion of str that begins at the character position pos and spans len characters         (or until the end of str, if either str is too short or if len is string::npos).

(4) from c-string

        Copies the null-terminated character sequence (C-string) pointed by s.

(5) from buffer

        Copies the first n characters from the array of characters pointed by s.

(6) fill constructor

        Fills the string with n consecutive copies of character c.

(7) range constructor

        Copies the sequence of characters in the range [first,last), in the same order.

(1) 空字符串构造函数(默认构造函数)       

        构造一个空字符串,长度为零个字符。

(2) 拷贝构造函数         

        构造一个 str 的副本。

(3) 子字符串构造函数         

        复制 str 从字符位置 pos 开始并跨越 len 个字符的部分

        (如果 str 太短或 len 是 string::npos,则复制到 str 的末尾)。

(4) 从 C 风格字符串构造         

        复制由 s 指向的以 null 结尾的字符序列(C 字符串)。

(5) 从字符串序列构造         

        复制由 s 指向的字符数组中的前 n 个字符。 

(6) 填充构造函数        

        用 n 个字符 c 的连续副本填充字符串。

(7) 范围构造函数         

        复制范围 [first,last) 中的字符序列,顺序保持不变。

三、 string类的常用接口说明

3.1 string类对象的常见构造 

构造函数函数名称功能说明
string()空字符串构造函数(重点)构造空的 string 类对象,即空字符串
string(const char* s)从 C-string 构造(重点)用 C-string 来构造 string 类对象
string(size_t n, char c)填充构造函数string 类对象中包含 n 个字符 c
string(const string& s)拷贝构造函数(重点)用一个已有的 string 对象 s 构造新的 string 对象
void test01()
{
	// 常用
	string s1;
	string s2("hello world");
	string s3(s2);
	
	// 不常用, 了解
	string s4(s2, 3, 5);
	string s5(s2, 3);
	string s6(s2, 3, 30);
	string s7("hello world", 5);
	string s8(10, 'x');
	
	cout << s1 << endl;
	cout << s2 << endl;
	cout << s3 << endl;
	cout << s4 << endl;
	cout << s5 << endl;
	cout << s6 << endl;
	cout << s7 << endl;
	cout << s8 << endl;
	
	cin >> s1;
	cout << s1 << endl;
}

3.2 string类对象的容量操作

函数名称功能说明
size(重点)返回字符串有效字符长度
length返回字符串有效字符长度
capacity返回空间总大小
empty(重点)检测字符串是否为空串,若为空返回 true,否则返回 false
clear(重点)清空有效字符
reserve(重点)为字符串预留空间
resize(重点)将有效字符的个数改为 n 个,多出的空间用指定字符填充
注意: 1. size() 与 length() 方法底层实现原理完全相同,引入 size() 的原因是为了与其他容器的接口保持一 致,一般情况下基本都是用 size() 。 2. clear() 只是将 string 中有效字符清空,不改变底层空间大小。 3. resize(size_t n) 与 resize(size_t n, char c) 都是将字符串中有效字符个数改变到 n 个,不同的是当字 符个数增多时:resize(n) 用 0 来填充多出的元素空间, resize(size_t n, char c) 用字符 c 来填充多出的 元素空间。注意:resize 在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。 4. reserve(size_t res_arg=0) :为 string 预留空间,不改变有效元素个数,当 reserve 的参数小于 string的底层空间总大小时, reserver 不会改变容量大小。

3.3 string类对象的访问及遍历操作

函数名称功能说明
operator[](重点)返回 pos 位置的字符,用于 const string 类对象的调用
beginendbegin 获取一个字符的迭代器,end 获取最后一个字符下一个位置的迭代器
rbeginrendrbegin 获取一个反向迭代器指向最后一个字符,rend 获取一个反向迭代器指向第一个字符前一个位置
范围 forC++11 支持更简洁的范围 for 新遍历方式

字符串类的简单实现

class String
{
public:
	// 引用返回
	// 1.减少拷贝
	// 2.修改返回对象
	char& operator[](size_t i)
	{
		assert(i < _size)
		return _str[i];
	}
private:
	char* _str;
	size_t _size;
	size_t _capacity;
};

其中operator[]操作符重载允许通过下标访问和修改字符串中的字符。通过返回字符的引用,可以避免不必要的拷贝并直接修改字符串内容,同时通过assert保证了安全性。

void test02()
{
	string s1("hello world");
	cout << s1.size() << endl;// 不计算'\0'
	// cout << s1.length() << endl;

	// 访问每个字符并令其++
	for (size_t i = 0; i < s1.size(); i++)
	{
		s1[i]++;
	}
	cout << endl;
	s1[0] = 'x';

	// 越界会被检查
	// s1[20];

	// 访问每个字符
	for (size_t i = 0; i < s1.size(); i++)
	{
		cout << s1.operator[](i) << " ";
		cout << s1[i] << " ";
	}
	cout << endl;

	const string s2("hello world");
	// const 不能修改
	// s2[0] = 'x';
}

通过重载的 operator[] 访问和修改字符串中的字符,同时也演示了对常量字符串对象进行修改时的限制。代码还包含了越界访问检查,通过 assert 保证安全性。

3.4 string类对象的修改操作

函数名称功能说明
push_back在字符串末尾插入字符 c
append在字符串末尾追加一个字符串
operator+=在字符串末尾追加字符串 str(重点)
c_str返回 C 格式字符串(重点),用于与其他 C/C++ 函数交互,返回的字符串是临时的,不应被修改
find + npos从字符串 pos 位置开始往后找字符 c,返回该字符在字符串中的位置,找不到时返回 string::npos(重点)
rfind从字符串 pos 位置开始往前找字符 c,返回该字符在字符串中的位置(注意:rfind 通常用于查找子字符串,而非单个字符 c 的向前查找,对于单个字符,直接使用 find 从末尾开始查找即可)
substr在字符串中从 pos 位置开始,截取 n 个字符,然后将其返回
注意: 1. 在 string 尾部追加字符时, s.push_back(c) / s.append(1, c) / s += 'c' 三种的实现方式差不多,一般情况下string 类的 += 操作用的比较多, += 操作不仅可以连接单个字符,还可以连接字符串。 2. 对 string 操作时,如果能够大概预估到放多少字符,可以先通过 reserve 把空间预留好。
void test03()
{
	// 构造
	string s1("hello world");

	// 隐式类型转换
	string s2 = "hello world";

	const string& s3 = "hello world";
	// 引用的临时对象, 临时对象具有常性

	string s4("hello world");
	push_back(s4);
	push_back("hello world");
}

3.5 string类非成员函数

函数/运算符功能说明
operator+字符串连接运算符,但尽量少用,因为传值返回导致深拷贝,效率低
operator>> (重点)输入运算符重载,用于从输入流中提取字符串到字符串对象中
operator<< (重点)输出运算符重载,用于将字符串对象的内容发送到输出流中
getline (重点)从输入流中获取一行字符串,直到遇到换行符('\n'),不包括换行符
relational operators (重点)大小比较运算符重载,包括 <<=>>===!=,用于比较两个字符串对象的大小
上面的几个接口大家了解一下,下面的 OJ 题目中会有一些体现他们的使用。 string 类中还有一些其他的 操作,这里不一一列举,大家在需要用到时不明白了查文档即可。

3.6 vs和g++下string结构的说明

注意:下述结构是在 32 位平台下进行验证, 32 位平台下指针占 4 个字节。 vs string 的结构 string 总共占 28 个字节 ,内部结构稍微复杂一点,先是 有一个联合体,联合体用来定义 string 中字 符串的存储空间
  • 当字符串长度小于16时,使用内部固定的字符数组来存放
  • 当字符串长度大于等于16时,从堆上开辟空间
union _Bxty
{ 
  // storage for small buffer or pointer to larger one
  value_type _Buf[_BUF_SIZE];
  pointer _Ptr;
  char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;
这种设计也是有一定道理的,大多数情况下字符串的长度都小于 16 ,那 string 对象创建好之后,内 部已经有了 16 个字符数组的固定空间,不需要通过堆创建,效率高。 其次:还有 一个 size_t 字段保存字符串长度,一个 size_t 字段保存从堆上开辟空间总的容量 最后:还 有一个指针 做一些其他事情。 故总共占 16+4+4+4=28 个字节。 g++ string 的结构 G++ 下, string 是通过写时拷贝实现的, string 对象总共占 4 个字节,内部只包含了一个指针,该指 针将来指向一块堆空间,内部包含了如下字段:
  • 空间总大小
  • 字符串有效长度
  • 引用计数
struct _Rep_base
{
 size_type _M_length;
 size_type _M_capacity;
 _Atomic_word _M_refcount;
};
  • 指向堆空间的指针,用来存储字符串。

四、string操作的代码示例

void test04()
{
	string s1("hello world");

	// 遍历方式1: 下标 + []
	for (size_t i = 0; i < s1.size(); i++)
	{
		cout << s1[i] << " ";
	}
	cout << endl;

	// 遍历方式2: 迭代器
	string::iterator it1 = s1.begin();
	while (it1 != s1.end())
	{
		*it1 += 3;
		cout << *it1 << " ";
		++it1;
	}
	cout << endl;

	// 遍历方式3: 范围for
	// 底层实现方式都是迭代器实现
	for (auto e : s1)
	{
		e++;
		cout << e << " ";
	}
	cout << endl;

	//cout << typeid(it1).name() << endl;

	/*list<int> lt1;
	lt1.push_back(1);
	lt1.push_back(2);
	lt1.push_back(3);

	list<int>::iterator it = lt1.begin();
	while (it != lt1.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

	for (auto e : lt1)
	{
		cout << e << " ";
	}
	cout << endl;*/
}

//template<class T>
//struct ListNode
//{
//	ListNode <T>* _next;
//	ListNode <T>* _prev;
//	T _data;
//};
//
//template<class T>
//class list
//{
//private:
//	ListNode<T>* _head;
//};


void test05()
{
	const string s1("hello world");
	//string::const_iterator it1 = s1.begin();
	auto it1 = s1.begin();
	while (it1 != s1.end())
	{
		// 指向的内容不能修改
		// *it1 += 3;

		cout << *it1 << " ";
		++it1;
		// const_iterator 本身可以++
	}
	cout << endl;
	/*string::iterator it1 = s1.begin();
	while (it1 != s1.end())
	{
		*it1 += 3;
		cout << *it1 << " ";
		++it1;
	}
	cout << endl;*/
}

void test06()
{
	const string s1("hello world");
	//string::const_iterator it1 = s1.begin();
	auto it1 = s1.begin();
	while (it1 != s1.end())
	{
		// 不能修改
		//*it1 += 3;

		cout << *it1 << " ";
		++it1;
	}
	cout << endl;

	//string::const_reverse_iterator cit1 = s1.rbegin();
	auto cit1 = s1.rbegin();
	while (cit1 != s1.rend())
	{
		// 不能修改
		//*cit1 += 3;

		cout << *cit1 << " ";
		++cit1;
	}
	cout << endl;

	string s2("hello world");
	string::reverse_iterator it2 = s2.rbegin();
	//auto it2 = s2.rbegin();
	while (it2 != s2.rend())
	{
		//*it2 += 3;

		cout << *it2 << " ";
		++it2;
	}
	cout << endl;
}

void test07()
{
	string s1("hello world");
	cout << s1 << endl;
	// s1按字典序排序

	// 排序一部分
	sort(s1.begin(), s1.end());

	// 第一个和最后一个参与排序
	sort(++s1.begin(), --s1.end());

	// 前五个排序  [0, 5)
	// sort(s1.begin(), s1.begin() + 5);

	cout << s1 << endl;
}

void test08()
{
	string s1("hello world");
	cout << s1 << endl;

	s1.push_back('x');
	cout << s1 << endl;

	s1.append(" yyyy!!");
	cout << s1 << endl;

	s1 += 'y';
	s1 += "zzzzz";
	cout << s1 << endl;
}

void test09()
{
	string s1("hello world");
	cout << s1 << endl;

	s1.assign("111111");
	cout << s1 << endl;
	
	// 慎用, 因为效率不高 -> O(N)
	// 实践中需求也不高
	string s2("hello world");
	s2.insert(0, "xxxx");
	cout << s2 << endl;
	
	char ch = 'z';
	s2.insert(0, 1, ch);
	s2.insert(0, 1, 'y');
	cout << s2 << endl;

	// 没有这个版本的头插
	// s2.insert(0, 'y');
	// cout << s2 << endl;

	s2.insert(s2.begin(), 'y');
	cout << s2 << endl;

	s2.insert(s2.begin(), s1.begin(), s1.end());
	cout << s2 << endl;
}

void test10()
{
	string s1("hello world");
	cout << s1 << endl;

	// 效率不高, 慎用, 和inset类似
	s1.erase(0,1);// 头删
	cout << s1 << endl;

	// s1.erase(5);
	s1.erase(5,100);
	cout << s1 << endl;

	string s2("hello world");
	s2.replace(5, 1, "%20");
	// 字符串的替换
	cout << s2 << endl;

	// 不建议这样使用,因为要挪动数据
	string s3("hello world hello char");
	for (size_t i = 0; i < s3.size();)
	{
		if (s3[i] == ' ')
		{
			s3.replace(i, 1, "%20");
			i += 3;
		}
		else 
		{
			i++;
		}
	}
	cout << s3 << endl;

	string s4("hello world hello double");
	string s5;
	for (auto ch : s4)
	{
		if (ch != ' ')
		{
			s5 += ch;
		}
		else {
			s5 += "%20";
		}
	}
	cout << s5 << endl;
}

今天就先到这了!!!、

看到这里了还不给博主扣个:
⛳️ 点赞☀️收藏 ⭐️ 关注!

你们的点赞就是博主更新最大的动力!
有问题可以评论或者私信呢秒回哦。

标签:字符,修行,string,s1,C++,字符串,world,size
From: https://blog.csdn.net/2301_79558858/article/details/140211053

相关文章

  • C++入门(C语言过渡)
    文章目录前言一、C++关键字二、命名空间三、C++输入&输出四、缺省参数五、函数重载六、引用七、inline八、nullptr总结前言C++是一种通用的、高级的、静态类型的编程语言,它在20世纪80年代由丹尼斯·里奇创建的C语言基础上发展而来。以下是C++发展的一些重要里程碑。......
  • C++中的类
    class认识class//一个简单的类的创建#include<iostream>usingnamespacestd;classstu{public: stringname; intyear; voidset_value(stringname,intyear); voidshow(){ cout<<'姓名:'<<name<<'年龄:'<&......
  • 【C++深度探索】继承机制详解(二)
    hellohello~,这里是大耳朵土土垚~......
  • 深入理解C++线程池的实现
    深入理解C++线程池的实现在多线程编程中,线程池是一种重要的工具,用于管理和执行多个任务,有效地利用系统资源和提升程序性能。一、线程池的了解1.理解线程池的基本概念与作用线程池由任务队列和一组工作线程组成,任务队列用于存储待执行的任务,工作线程则负责从队列中取出......
  • C++ 项目目录结构
    project_root/├──src/#源代码目录│├──main.cpp#主函数文件│├──MyClass.cpp#类的实现文件│└──...#其他源文件│├──include/#头文件目录│├──MyClass.h#类的头......
  • 将C++ DLL文件输出设置到项目调试目录
    将C++DLL文件输出设置到项目调试目录在项目开发过程中,有时需要边开发DLL代码,边开发项目,将DLL文件输出设置到解决方案的项目调试目录,调试过程中可一键生成解决方案,省去重新更换DLL文件的过程。前提:在同一解决方案下添加项目工程与DLL工程。前文提示:关于C++DLL的封装可参......
  • C++基础入门语法--代码基础框架
    文章内容概括:了解学习导入头文件、使用usingnamespacestd简化代码、创建程序基础框架、学习使用return(如需要直接复制请到文章最末尾)正文:1.学习导入头文件:    在Dev-C++编辑器中新建文件,在文件的第一行中输入:#include<iostream>    以上代码为C++导入......
  • c++ primer plus 第15章友,异常和其他:异常,15.3.5 异常规范和 C++11
    c++primerplus第15章友,异常和其他:异常,15.3.5异常规范和C++1115.3.5异常规范和C++11文章目录c++primerplus第15章友,异常和其他:异常,15.3.5异常规范和C++1115.3.5异常规范和C++1115.3.5异常规范和C++11有时候,一种理念看似有前途,但实际的使用效果并......
  • c++ primer plus 第15章友,异常和其他:15.3.1 调用abort()02
    c++primerplus第15章友,异常和其他:15.3.1调用abort()02调用abort()02文章目录c++primerplus第15章友,异常和其他:15.3.1调用abort()0215.3.1调用abort()15.3.1调用abort()对于这种问题,处理方式之一是,如果其中一个参数是另一个参数的负值,则调用abort(......
  • c++ primer plus 第15章友,异常和其他:异常,15.3.3 异常机制
    #c++primerplus第15章友,异常和其他:异常,15.3.3异常机制异常,15.3.3异常机制文章目录15.3.3异常机制15.3.3异常机制程序清单15.9error3.cpp程序清单15.10excmean.h程序清单15.11error4.cpp15.3.3异常机制15.3.3异常机制下面介绍如何使用异常机制来处......