首页 > 编程语言 >C++面试八股文:std::string是如何实现的?

C++面试八股文:std::string是如何实现的?

时间:2023-06-18 19:32:04浏览次数:50  
标签:std capacity string C++ 字符串 师兄 size

某日二师兄参加XXX科技公司的C++工程师开发岗位第18面:

面试官:std::string用过吧?

二师兄:当然用过(废话,C++程序员就没有没用过std::string的)。

面试官:std::string("hello")+"world""hello"+std::string("world")std::string("hello")+std::string("world")的结果是什么?为什么?

二师兄:前者和后者的结果都是std::string的对象,内容是“helloworld\0”,而中间的这个表达式无法通过编译。原因是std::string重载了operator+(const char*)operator+(const std::string&),但是const char* 却没有重载operator+运算符。

面试官:std::string 有两个APIresizereserve,你知道它们之间的区别吗?

二师兄:resize对应的是sizeresize可以改变字符串的大小。reserve对应的是capacityreserve只能改变capacity的大小。

二师兄:当resize传入的参数小于字符串的szie时,多余的字符串会被截取。当reserve传入的参数小于capacity时,reserve什么也不会做。

二师兄:当resize传入的参数大于字符串的szie时,增加的字符串会被默认初始化。当reserve传入的参数大于capacity时,capacity会被扩容。

面试官:好的。可以通过下标访问std::string实例的内容吗?

二师兄:可以的,std::string重载了下标运算符,可以像数组一样通过下标运算取出某个字符。

面试官:你知道std::stringat成员方法吗?

二师兄: 嗯,和下标运算功能相似,不过不用担心越界问题。可以安全的访问字符串中的字符。

面试官:既然有at方法了,为什么还要重载下标运算符呢?

二师兄:主要是因为性能上的考量。at虽然保证了不会超出字符串范围(超出范围抛出异常),但是性能低于下标操作。这就是有舍有得。为了安全使用at,为了性能使用下标操作。C++给了你多个选择,如何选择看你的需求。

面试官:那你知道std::string是如何实现的吗?

二师兄:在string内部维护一个指针,这个指针指向真正的字符串的位置。

面试官:能简单的写一下实现代码吗?

二师兄:好的。

class string
{
public: 
    string():size_(0),data_(nullptr){}
    explicit string(const char* c)
    {
        size_ = strlen(c);
        data_ = (char*)malloc(size_+1);
        memset(data_,0,size_+1);
        memcpy(data_,c,size_);
    }
    size_t size() const {return size_;}
	const char* c_str() const {return data_;}
private:
    size_t size_;
    char* data_;
};

二师兄:在实现append或者+=的时候,需要把当前字符的长度加上append的内容的长度,以此长度申请一块新内存,然后把当前字符串的内存和append 的内容考入新申请的内存中。free掉之前data_指向的内存,然后把data_指针指向新申请的内存。

面试官:好的。这样的实现有一些弊端。如果频繁的对一个std::string对象append内容,会发生什么?

二师兄:是的,因为频繁的mallocfree,会有性能问题。因所以编译器在实现std::string的时候一般会预先申请一块大的内存,这块内存的长度是capacity,当添加的字符串的长度加上当前的字符串长度小于capacity时,直接添加到当前的块上即可。

面试官:好的。针对字符串比较少的情况,一般编译器会做一些优化,你知道如何优化的吗?

二师兄:这个好像在哪看过,不记得额。。。

面试官:好的,今天的面试结束了,请回去等通知吧。

今天二师兄的表现不错,除了最后一个问题,基本上都答上来了。让我们来看下这个问题:

针对字符串比较少的情况,一般编译器会做一些优化,你知道如何优化的吗?

我们可以看看GCC中std::string的实现:

 typedef basic_string<char>    string;   
_Alloc_hider	_M_dataplus;
size_type		_M_string_length;
enum { _S_local_capacity = 15 / sizeof(_CharT) };
union
{
    _CharT           _M_local_buf[_S_local_capacity + 1];
    size_type        _M_allocated_capacity;
};

这里的_CharT就是char,所以_S_local_capacity等于15。当字符串的长度小于等于15时,直接存在_M_local_buf中,而不需要在堆中申请内存。当字符串长度大于15时,在内存中申请一块内存,这块内存的起始地址保存在_M_dataplus中,这块内存的容量保存在_M_allocated_capacity 中,而字符串的真实长度保存在_M_string_length中。当向字符串中添加字符时,如果添加字符的长度大于 _M_allocated_capacity - _M_string_length,则需要resize,否则直接追加到_M_dataplus保存的内存块中即可。

好了,今天的面试到这里就结束了。感谢小伙伴们的耐心阅读,咱们明天继续二师兄的面试之旅!

关注我,带你21天“精通”C++!(狗头)

标签:std,capacity,string,C++,字符串,师兄,size
From: https://blog.51cto.com/binarch/6509308

相关文章

  • C++构造函数
    RAIIResourceAcquisitionIsInitialization,资源获取即初始化这是一种解决资源管理问题的方法,将资源的有效期与持有资源的对象的生命期严格绑定,由对象的构造函数完成资源的分配,由析构函数完成资源的释放C++借助构造函数和析构函数,解决了传统的malloc&free和new&de......
  • C++创建对象的4种方式对比
    三种方式分别为等号,圆括号,大括号,最后一种是等号和大括号一起使用等号和圆括号是以前就存在的,大括号是新的语法,其具有2个优点:防止变窄转换:大括号不支持变窄转换,等号和圆括号为了向下兼容支持变窄转换免疫C++最令人头疼的解析:C++规定任何可以被解析为一个声明的东西必......
  • Python和C++之间的主要区别点?
    Python和C++之间的区别可以简洁地概括如下:编程范式:Python是一种解释型、面向对象的动态语言,更注重代码的简洁性和可读性,适合快速开发和原型设计。C++是一种编译型、多范式语言,支持面向对象、过程式和泛型编程,更注重底层的控制和性能优化。语法复杂性:C++具有较为复杂的语法和......
  • C++家谱管理系统[2023-06-18]
    C++家谱管理系统[2023-06-18]小组项目二实验题目:家谱管理系统实验目的:1、掌握树以及二叉树的定义;2、掌握树以及二叉树的基本操作,如建立、查找、插入和删除等。实验要求:小组合作方式,共同讨论完成该任务。实验内容:家谱管理系统是查询家谱信息必不可少的一部分,利用家谱管理系......
  • 【详解C++中的引用】
    @TOC一、什么是引用引用就是给一个变量取别名。注意:这个引用不会新开辟一块空间,而是和原来的变量公用一块空间。举个例子:李逵,在家称为"铁牛",江湖上人称"黑旋风"。二、引用规则引用规则:引用实体类型+&+引用别名=引用实体。比如下面:intmain(){ inta=10; //引用 int&ba=a......
  • mysql:报错Incorrect string value:’\xF0\x9F\x94\xA6\xF0\x9F…’
     一,报错信息:1,报错:Incorrectstringvalue:'\xF0\x9F\x94\xA6\xF0\x9F...'forcolumn'content'atrow1报错的原因:字符串中包含了emoji表情:如:......
  • dremio 24.1 zstd 支持的的处理
    以前我简单介绍过关于dremio如何自己编译支持zstd压缩,目前官方24.1直接支持了,通过查看源码实际上处理思路以及方法与我介绍的是一致的,具体可以参考我写过的博客参考资料https://www.cnblogs.com/rongfengliang/p/16823130.html......
  • Licensecc-C++ License Manager
    [email protected] Licensecc:aC++softwarelicensemanager。使用Licensecc可以给开发的软件加上保护,限制软件的使用。通过授权控制来限制软件的使用,也可以限制软件的使用时间,及限制软件在指定机器上运行。Licensecc是基于BSD协议开源的软件授权......
  • request超出了配置的maxQueryStringLength
    整个URL的长度为966个字符,经过研究,似乎maxQueryStringLength的默认值是2048<security><requestFiltering><requestLimitsmaxQueryString="2048"></requestLimits></requestFiltering></security>在项目的根web.config中的system.web节点下:&......
  • C++ STL(algorithm)
    1字符和整数排序#include<iostream>#include<algorithm>usingnamespacestd;voidstl1(){inta[]={-1,9,-34,100,45,2,98,32};intlen=sizeof(a)/sizeof(int);sort(a,a+len);//由小到大排列sort(a,a+len,greater<int>());//由大到小排列}vo......