首页 > 编程语言 >【C++ STL】vector

【C++ STL】vector

时间:2024-08-04 11:53:36浏览次数:14  
标签:iterator 迭代 STL 元素 C++ start vector size

文章目录


vector

vector是动态空间,随着元素的加入它内部机制会自行空充空间以容纳新元素。vector维护了一个连续的线性空间,普通指针就可以满足要求作为vector的迭代器,随机访问迭代器。vector里面其实有三个迭代器,分别是指向空间头部的iterator,指向空间尾部的iterator和指向可用空间的iterator。当有新的元素插入时,如果当前容量够就直接插入,如果容量不够则扩容至两倍或1.5倍,如果两倍不足,则扩容至足够大的空间。由于扩充过程不是在原有的空间后面追加,而是重新申请一块新的连续内存,所以所有迭代器都会失效。

template < 
	class T, // 元素类型
	class Alloc = allocator<T> > // 空间配置器类型

class vector; // 类模板声明

1. vector的接口

1.1 默认成员函数

接口声明解释
vector()默认构造
vecotr(size_type n, const_value_type& val=value_type())填充构造,填充n个元素
vector(InputIter first, InputIter last)范围构造,迭代器区间初始化
vector(const vector& v)拷贝构造
vector& operator=(const vector& x)赋值重载

1.2 容量操作

容量操作解释
size_type size()元素个数
size_type capacity()容量大小
size_type max_size()最大能存储的元素个数(无意义)
void resize(size_type n, value_type val = value_type());增减有效元素个数
v.reserve(100);   // 扩容到100
v.resize(100, 1); // 有效元素个数变为100,新增元素初始化为1
v.resize(10);     // 有效元素个数变为10

在这里插入图片描述

由图可知,vs下vector按1.5倍增容。

1.3 访问操作

接口声明解释
reference operator[](size_type n)返回下标位置的引用
const_reference operator[] (size_type n) const
reference at(size_type n)
const_reference at (size_type n) const

[]重载和at的区别是,[]越界会断言报错,at是抛异常。

迭代器接口解释
begin起始位置的迭代器
end末尾元素的下一个位置的迭代器
rbegin反向起始位置的迭代器
rend反向末尾元素的下一个位置的迭代器
cbegin,cendbegin 和 end 的 const 版本

[]重载就已经能方便的访问 vector,但并不意味着放弃迭代器。大部分容器都支持迭代器访问,且迭代器使用简单规范统一。

STL 中容器的迭代器区间都是采用 [ f i r s t , l a s t ) [first,last) [first,last) 左闭右开的方式。

//[]
for (size_t i = 0; i < v.size(); i++) {
    v1[i] += 1;
}

//iterator
vector<int>::iterator it = v.begin();
while (it != v.end()) {
    cout << *it << " ";
    it++;
}

for (auto e : v) {
    cout << e << " ";
}

1.4 修改操作

接口声明解释
void push_back (const value_type& val)尾插
void pop_back()尾删
iterator insert (iterator pos, const value_type& val)迭代器位置插入
void insert (iterator pos, size_type n, const value_type& val);迭代器位置插入
void insert (iterator pos, InputIter first, InputIter last)迭代器位置插入一段区间
iterator erase (iterator pos)迭代器位置删除
iterator erase (iterator first, iterator last)删除一段迭代器区间
void assign (size_type n, const value_type& val)覆盖数据
v.insert(ret, 30);
v.insert(ret, 2, 30);
v.insert(ret, v2.begin(), v2.end());
v1.erase(pos);
v1.erase(v1.begin(), v1.end());
#include <algorithm>
// 查找接口
template <class InputIter, class T>
   InputIter find (InputIter first, InputIter last, const T& val);

1.5 vector与常见的数据结构的对比

大伙们看看它们的主要特性和区别如下:

以下是 vectorarray对比表格:

特性vectorarray
动态大小可以动态增长或缩小大小固定,定义时确定
内存管理自动管理内存,大小动态调整静态分配,大小不变
容量管理size()capacity()reserve() 方法可以使用 size() 方法获取大小
初始化可以使用初始化列表或复制其他 vector可以使用初始化列表或逐个赋值
存储元素类型可以存储任意类型的数据只能存储相同类型的数据
访问元素通过 at()[] 或迭代器访问通过 [] 或指针访问
插入与删除插入和删除元素会自动调整内存不支持直接插入或删除元素
复制与传递复制时会复制所有元素传递时通常是指针或引用
原始数组特性无法访问指针指向的连续内存块可以直接操作指向的连续内存块
标准库支持提供丰富的算法和方法操作支持的操作有限,主要依赖于指针操作

以下是 vectorlist 的对比表格:

特性vectorlist
内部结构底层基于动态数组底层基于双向链表
访问元素随机访问([]at()),时间复杂度 O(1)顺序访问(只能通过迭代器),时间复杂度 O(n)
内存管理自动管理内存,大小动态调整自动管理内存,节点动态分配和释放
插入与删除插入和删除元素可能需要调整内存插入和删除元素对内存影响较小
容器大小可以动态增长或缩小可以动态增长或缩小
迭代器稳定性操作过程中不会使迭代器失效插入或删除元素后,迭代器可能失效
内存占用在大多数情况下比较节省内存每个元素都有额外的指针开销
性能分析随机访问性能好,适合需要频繁访问的场景插入和删除性能好,适合需要频繁插入和删除的场景
使用场景适合需要频繁访问元素的场景适合需要频繁插入和删除元素的场景

以下是 vectorlist 在常见操作的时间复杂度对比:

操作vectorlist
访问元素O(1)O(n)
在末尾插入/删除平均 O(1),最坏情况 O(n)平均 O(1)
在开头插入/删除平均 O(n),最坏情况 O(n)平均 O(1)
在中间插入/删除平均 O(n),最坏情况 O(n)平均 O(1)
容量调整O(n)不适用,链表不需要调整容量
迭代器操作随机访问迭代器 O(1)迭代器无法直接访问元素,需要遍历链表 O(n)

2. vector的模拟实现

vector底层是一个动态数组,包含三个迭代器,start和finish之间是已经被使用的空间范围,end_of_storage是整块连续空间包括备用空间的尾部。如图:

img

2.1 类的定义

template <class T, class Alloc = alloc>
class vector {
public:
    typedef T* iterator;
    // ...
private:
    iterator start;
    iterator finish;
    iterator end_of_storage;
}

这个结构和顺序表结构稍有不同,但本质是一样的。只是将容量和元素个数的变量用指向对应位置的迭代器代替。

class Seqlist {
    T* _a;            /* start */
    size_t _size;     /* finish - start */
    size_t _capacity; /* end_of_storage - start */
}

2.2 默认成员函数

//default constructor
vector()
    : _start(nullptr)
    , _finish(nullptr)
    , _end_of_storage(nullptr)
{}
//fill constructor
vector(size_t n, const T& val = T()) // 引用临时对象可延长其声明周期
    : _start(nullptr)
    , _finish(nullptr)
    , _end_of_storage(nullptr)
{
    resize(n, val);  
}
//copy constructor
vector(const vector<T>& v)
    : _start(nullptr)
    , _finish(nullptr)
    , _end_of_storage(nullptr)
{
    _start = new T[v.capacity()];
    for (size_t i = 0; i < v.capacity(); i++)
    {
        _start[i] = v._start[i];
    }
    _finish = _start + v.size();
    _end_of_storage = _start + v.capacity();
}
//range constructor
template <class InputIterator>
vector(InputIterator first, InputIterator last) 
    : _start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	while (first != last) 
	{
		push_back(*first++);
    }
}
//destructor
~vector() 
{
    delete[] _start;
    _start = _finish = _end_of_storage = nullptr;
}

// 现代写法
//copy constructor
vector(const vector<T>& v) 
    : _start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
    vector<T> tmp(v.begin(), v.end());
    swap(tmp);
}
//operator=
vector<T>& operator=(vector<T> v)  /* pass by value */
{
    swap(v);
    return *this;
}

从范围构造可以看出类模板中的函数也可以是函数模板。

迭代器的分类

函数模板的模板参数要传迭代器区间时,命名是有规定的,范围构造中的InputIterator就是一种指定的迭代器类型。因容器的结构各有不同,迭代器分为五种类型:

名称特性适用容器
输入/输出迭代器只读迭代器只能读取,只写迭代器可以写入无实际容器
单向迭代器++,读写forward_list
双向迭代器++,––,读写list, map, set
随机迭代器++,––,+,–,读写deque, vector, string

可以看出,下方的迭代器类型是上方的父类,也就是说下方迭代器满足上方的所有要求

在这里插入图片描述

划分出不同的迭代器类型,是为了限制传入的迭代器,因为其必须满足要求才能完成接下来的函数。

函数指明迭代器为InputIterator,意味着满足要求的迭代器都可以传入,起提示的作用。

当然,模版不区分类型,语法上所有迭代器都可以传入,但可能无法完成编译。

2.3 容量接口

memcpy 浅拷贝问题
vector<string> v;
v.push_back("11111111111111");
v.push_back("11111111111111");
v.push_back("11111111111111");
v.push_back("11111111111111");
v.push_back("11111111111111"); // 增容浅拷贝

出现问题是因为正好数组需要增容。模拟实现的reserve函数使用memcpy将原空间的内容按字节拷贝至新空间。

  1. 若 vector 存储的是内置类型,则浅拷贝没问题。
  2. 若 vector 存储的是自定义类型,浅拷贝使得新旧变量指向同一块空间。深拷贝调用拷贝构造或者赋值重载。

在这里插入图片描述

内存增长机制

当空间不足以容纳数据时(例如使用 vec.push_back(val)),std::vector 会自动申请更大的内存空间,通常是当前大小的1.5倍或2倍(具体取决于编译器,例如GCC通常是2倍,而在VS下的MinGW是1.5倍)。然后,它会将原有数据拷贝到新的内存空间中,并释放原来的内存空间

当你释放或清空数据(使用 vec.clear())时,std::vector存储空间不会被释放,只是清空了数据元素。因此,对 std::vector 的任何操作,一旦触发了内存重新配置,会导致指向原 vector 的所有迭代器失效。

void reserve(size_t n) 
{
    if (n > capacity()) 
    {
        T* tmp = new T[n];
        size_t oldSize = size();
        
        if (_start) 
        {
            //memcpy(tmp, _start, size() * sizeof(T)); // err
            for (int i = 0; i < size(); i++) 
            {
                tmp[i] = _start[i];//_start指向的空间存任意类型都能完成深拷贝
            }
            
            delete[] _start;
        }
        
        _start = tmp;
        _finish = _start + oldSize;
        _end_of_storage = _start + n;
    }
}
void resize(size_t n, T val = T())
{
    if (n > size())
    {
        reserve(n);
        while (_finish != _start + n)
        {
            *_finish = val;
            ++_finish;
        }
    }
    else
    {
        _finish = _start + n;
    }
}


reserve和resize的区别

reserve 是直接扩充到已经确定的大小,可以减少多次开辟、释放空间的问题(优化 push_back),可以提高效率,其次还可以减少多次要拷贝数据的问题。reserve 只是保证 vector 中的空间大小(capacity)最少达到参数所指定的大小 n,预留空间。

resize 可以改变有效空间的大小,也有改变默认值的功能。capacity 的大小也会随着改变。resize() 可以有多个参数。 resize() 改变了 vector 的 capacity 同时也增加了它的 size!

原因如下:

  1. reserve 是容器预留空间,但在空间内不真正创建元素对象,所以在没有添加新的对象之前,不能引用容器内的元素。加入新的元素时,要调用 push_back()/insert() 函数。

  2. resize 是改变容器的大小,且在创建对象,因此,调用这个函数之后,就可以引用容器内的对象了,因此当加入新的元素时,用 operator[] 操作符,或者用迭代器来引用元素对象。此时再调用 push_back() 函数,是加在这个新的空间后面的。

可能大家平时用 reserve() 比较多,顾名思义,reserve 就是预留内存。为的是避免内存重新申请以及容器内对象的拷贝。说白了,reserve() 是给 push_back() 准备的!而 resize 除了预留内存以外,还会调用容器元素的构造函数,不仅分配了 N 个对象的内存,还会构造 N 个对象

从这个层面上来说, resize() 在时间效率上是比 reserve() 低的。但是在多线程的场景下,用 resize 再合适不过。

2.4 修改接口

iterator insert(iterator pos, const T& val)
{
    assert(_start <= pos && pos <= _finish); // 检查pos位置是否合法
    // 增容
    if (_finish == _end_of_storage) 
    {
        size_t sz = pos - _start;
        reserve(capacity() == 0 ? 4 : capacity() * 2); //增容会导致迭代器失效,迭代器位置陈旧
        pos = _start + sz; //增容后更新pos
    }
    
    // 后移 [pos,_finish)
    for (iterator end = _finish; end > pos; --end)
    {
        *end = *(end - 1);
    }
    
    // 插入
    *pos = val;
    ++_finish;
    return pos; //返回迭代器最新位置
}
  • 增容改变_start,但迭代器pos并没有跟着改变,仍然指向原空间,也就是迭代器失效。
  • 迭代器pos实参并没有改变仍然指向错误位置,故函数返回更新的pos

iterator erase(iterator pos)
{
    assert(_start <= pos && pos < _finish);

    for (iterator begin = pos + 1; begin < _finish; begin++)
    {
        *(begin - 1) = *begin;
    }
    
    _finish--;
    return pos; //返回删除数据的下一个位置
}

在这里插入图片描述

  • erase 挪动数据后 pos 指向元素会发生变化,同样会导致迭代器失效。
  • 返回删除数据的下一个位置,通过返回值更新迭代器。
迭代器失效问题

1. 插入操作导致迭代器失效

当向 vector 中插入元素时,如果当前容量不足,vector 会重新分配内存,并将现有元素复制到新的内存空间中。这种内存重分配会导致所有之前获取的迭代器失效,因为它们仍然指向旧的内存地址,而不是新分配的地址。例如:

std::vector<int> vec = {1, 2, 3};
auto it = vec.begin();  // 获取迭代器指向 vec 的第一个元素

vec.push_back(4);  // 插入元素导致内存重分配,it 指向的地址已经无效
// it 现在是一个悬空指针,不能再安全地使用

解决方法是,在插入操作之后重新获取迭代器,或者使用返回的插入位置迭代器。

2. 删除操作导致迭代器失效

删除 vector 中的元素会导致迭代器失效,特别是被删除元素之后的所有元素的位置都会向前移动。如果使用的是被删除元素的迭代器,那么在调用删除操作后,该迭代器就变得无效。例如:

std::vector<int> vec = {1, 2, 3, 4, 5};
auto it = vec.begin() + 2;  // it 指向 vec 的第三个元素,值为 3

vec.erase(it);  // 删除元素 3

// 现在 it 指向的位置已经是无效的,应该重新赋值或者使用 erase 返回的迭代器

为了安全地进行删除操作,可以使用 erase 方法返回的迭代器,它指向被删除元素之后的下一个有效位置:

std::vector<int> vec = {1, 2, 3, 4, 5};
auto it = vec.begin() + 2;  // it 指向 vec 的第三个元素,值为 3

it = vec.erase(it);  // 删除元素 3,并更新 it 为下一个有效迭代器

 

3. vector的oj题

题目题解
只出现一次的数字【简洁明了】只出现一次的数字 I
杨辉三角【简洁明了】cpp 杨辉三角
删除有序数组中的重复项【双指针 简单明了】数组去重
只出现一次的数字 II【简单明了 注释】只出现一次的数字
只出现一次的数字 III【详细解析】只出现一次的数字 系列 I II III
多数元素【哈希 排序 投票】三种解法 简洁明了
连续子数组的最大和【动归】连续子数组的最大和
电话号码的字母组合【注释解析 回溯】电话号码字母组合

标签:iterator,迭代,STL,元素,C++,start,vector,size
From: https://blog.csdn.net/Z1tai/article/details/140904185

相关文章

  • 基于OpenCV C++的网络实时视频流传输——Windows下使用TCP/IP编程原理
    1.TCP/IP编程1.1概念IP是英文InternetProtocol(网络之间互连的协议)的缩写,也就是为计算机网络相互连接进行通信而设计的协议。任一系统,只要遵守IP协议就可以与因特网互连互通。所谓IP地址就是给每个遵循tcp/ip协议连接在Internet上的主机分配的一个32bit地址。按照TC......
  • 【leetcode详解】另一棵树的子树 (C++递归:思路精析&& 过程反思)
    思路详解:总体框架:对root树进行先序遍历,如果当前结点(记为cur)的值和subRoot的根节点值相等时,就开始判断 以cur为根节点的树和子树是否结构一样?如何判断两棵树是否结构完全相同?分析:一提到“树”结构,很容易想到在(先/中/后序)遍历上做文章,请教了AI后笔者得知,如果两棵树......
  • c++中的迭代器
    前言hello大家好,我是文宇。正文C++中的迭代器是一种访问容器中元素的对象。它可以看作是一种抽象的指针,通过迭代器可以便捷地遍历和操作容器中的元素,无需了解容器内部的数据结构和实现细节。迭代器提供了一组操作,包括指向容器中的元素、移动到下一个元素、访问当前元素等功......
  • 【每日一题】【并查集】【力扣】695.岛屿的最大面积 C++
    力扣695.岛屿的最大面积695.岛屿的最大面积题目描述给你一个大小为m×nm\timesnm×n的二进制矩阵......
  • C++ //练习 16.27 对下面每条带标签的语句,解释发生了什么样的实例化(如果有的话)。如果
    C++Primer(第5版)练习16.27练习16.27对下面每条带标签的语句,解释发生了什么样的实例化(如果有的话)。如果一个模板被实例化,解释为什么;如果未实例化,解释为什么没有。template<typenameT>classStack{};voidf1(Stack<char>); //(a)classExercise{ Stack<dou......
  • c动态加载c/c++ so并调用其中的函数或者子类实现
    在不少服务器应用中,会采用插件化或者模块化的体系实现具体的业务功能,比如mysql支持插件化体系,nginx采用模块化体系。总得来说,很多时候,因为扩展性,系统会采用动态加载so的方式扩展业务功能,而主框架不需要每次新增功能就不得不重新编译,很多时候,对于二进制发行的应用来说,不可能这......
  • C++ //练习 15.31 已知s1、s2、s3和s4都是string,判断下面的表达式分别创建了什么样的
    C++Primer(第5版)练习15.31练习15.31已知s1、s2、s3和s4都是string,判断下面的表达式分别创建了什么样的对象:(a)Query(s1)|Query(s2)&~Query(s3);(b)Query(s1)|(Query(s2)&~Query(s3));(c)(Query(s1)&(Query(s2))|(Query(s3)&Query(s4)));......
  • C++ //练习 16.14 编写Screen类模板,用非类型参数定义Screen的高和宽。
    C++Primer(第5版)练习16.14练习16.14编写Screen类模板,用非类型参数定义Screen的高和宽。环境:LinuxUbuntu(云服务器)工具:vim 代码块template<intH,intW>classScreen{public:usingpos=string::size_type;Screen()=default;Screen(cha......
  • C++ //练习 16.16 将StrVec类(参见13.5节,第465页)重写为模板,命名为Vec。
    C++Primer(第5版)练习16.16练习16.16将StrVec类(参见13.5节,第465页)重写为模板,命名为Vec。环境:LinuxUbuntu(云服务器)工具:vim 代码块#include<iostream>#include<memory>#include<utility>usingnamespacestd;template<typenameT>classVec{ public:......
  • 【C++】多态 - 含3个案例
    目录一、多态分类二、多态区别三、多态基本语法四、多态原理五、案例1:计算机类六、纯虚函数和抽象类七、案例2:制作饮品八、虚析构和纯虚析构九、案例3:电脑组装需求分析及实现多态是C++面向对象三大特性之一一、多态分类①静态多态:函数重载、运算符重载、复用函......