Skip to content

C++ 标准模板库 (STL, Standard Template Library):包含一些常用数据结构与算法的模板的 C++ 软件库。其包含四个组件——算法 (Algorithms)、容器 (Containers)、仿函数 (Functors)、迭代器 (Iterators).

示例:

  • 算法:sort(a.begin(), a.end())
  • 容器:priority_queue<int> pque
  • 仿函数:greater<int>()
  • 迭代器:vector<int>::iterator it = a.begin()

1 前言

STL 作为一个封装良好,性能合格的 C++ 标准库,在算法竞赛中运用极其常见。灵活且正确使用 STL 可以节省非常多解题时间,这一点不仅是由于可以直接调用,还是因为它封装良好,可以让代码的可读性变高,解题思路更清晰,调试过程 往往 更顺利。

不过 STL 毕竟使用了很多复杂的结构来实现丰富的功能,它的效率往往是比不上自己手搓针对特定题目的数据结构与算法的。因此,STL 的使用相当于使用更长的运行时间换取更高的编程效率。因此,在实际比赛中要权衡 STL 的利弊,不过这一点就得靠经验了。

接下来,我会分享在算法竞赛中常用的 STL 容器和算法,对于函数和迭代器,就不着重展开讲了。

2 常用容器

2.1 内容总览

打勾的是本次将会详细讲解的,加粗的是算法竞赛中有必要学习的。

  • 顺序容器

    • [ ] array

    • [x] vector

    • [ ] deque

    • [ ] forward_list

    • [ ] list

  • 关联容器

    • [x] set
    • [x] map
    • [ ] multiset
    • [ ] multimap
  • 无序关联容器

    • [ ] unordered_set
    • [ ] unordered_map
    • [ ] unordered_multiset
    • [ ] unordered_multimap
  • 容器适配器

    • [x] stack
    • [x] queue
    • [x] priority_queue
    • [ ] flat_set
    • [ ] flat_map
    • [ ] flat_multiset
    • [ ] flat_multimap
  • 字符串

    • [x] string (basic_string<char>)
  • 对与元组

    • [x] pair
    • [ ] tuple

2.2 向量 vector

#include <vector>

连续的顺序的储存结构(和数组一样的类别),但是有长度可变的特性。

2.2.1 常用方法

构造

vector<类型> arr(长度, [初值])

时间复杂度:$O(n)$

常用的一维和二维数组构造示例,高维也是一样的(就是会有点长).

cpp
vector<int> arr;         // 构造int数组
vector<int> arr(100);    // 构造初始长100的int数组
vector<int> arr(100, 1); // 构造初始长100的int数组,初值为1

vector<vector<int>> mat(100, vector<int> ());       // 构造初始100行,不指定列数的二维数组
vector<vector<int>> mat(100, vector<int> (666, -1)) // 构造初始100行,初始666列的二维数组,初值为-1

构造二维数组的奇葩写法,千万别用:

cpp
vector<int> arr[100];         // 正确,构造初始100行,不指定列数的二维数组,可用于链式前向星存图
vector<int> arr[100](100, 1); // 语法错误!
vector<int> arr(100, 1)[100]; // 语法错误!
vector<int> arr[100] {{100, 1}, 这里省略98个 ,{100, 1}}; // 正确但奇葩,使用列表初始化

尾接 & 尾删

  • .push_back(元素):在 vector 尾接一个元素,数组长度 $+1$.
  • .pop_back():删除 vector 尾部的一个元素,数组长度 $-1$

时间复杂度:均摊 $O(1)$

cpp
// init: arr = []
arr.push_back(1);
// after: arr = [1]
arr.push_back(2);
// after: arr = [1, 2]
arr.pop_back();
// after: arr = [1]
arr.pop_back();
// after: arr = []

中括号运算符

和一般数组一样的作用

时间复杂度:$O(1)$

获取长度

.size()

获取当前 vector 的长度

时间复杂度:$O(1)$

cpp
for (int i = 0; i < arr.size(); i++)
    cout << a[i] << endl;

清空

.clear()

清空 vector

时间复杂度:$O(n)$

判空

.empty()

如果是空返回 true 反之返回 false.

时间复杂度:$O(1)$

改变长度

.resize(新长度, [默认值])

修改 vector 的长度

  • 如果是缩短,则删除多余的值
  • 如果是扩大,且指定了默认值,则新元素均为默认值 (旧元素不变)

时间复杂度:$O(n)$

2.2.2 适用情形

一般情况 vector 可以替换掉普通数组,除非该题卡常。

有些情况普通数组没法解决:$n\times m$ 的矩阵,$1\leq n,m\leq 10^6$ 且 $n\times m \leq 10^6$

  • 如果用普通数组 int mat[1000010][1000010],浪费内存,会导致 MLE。
  • 如果使用 vector<vector<int>> mat(n + 10, vector<int> (m + 10)),完美解决该问题。

另外,vector 的数据储存在堆空间中,不会爆栈。

2.2.3 注意事项

提前指定长度

如果长度已经确定,那么应当直接在构造函数指定长度,而不是一个一个 .push_back(). 因为 vector 额外内存耗尽后的重分配是有时间开销的,直接指定长度就不会出现重分配了。

cpp
// 优化前: 522ms
vector<int> a;
for (int i = 0; i < 1e8; i++)
    a.push_back(i);
// 优化后: 259ms
vector<int> a(1e8);
for (int i = 0; i < a.size(); i++)
    a[i] = i;

当心 size_t 溢出

vector 获取长度的方法 .size() 返回值类型为 size_t,通常 OJ 平台使用的是 32 位编译器(有些平台例如 cf 可选 64 位),那么该类型范围为 $[0,2^{32})$.

cpp
vector<int> a(65536);
long long a = a.size() * a.size(); // 直接溢出变成0了

2.3 栈 stack

#include <stack>

通过二次封装双端队列 (deque) 容器,实现先进后出的栈数据结构。

2.3.1 常用方法

作用用法示例
构造stack<类型> stkstack<int> stk;
进栈.push(元素)stk.push(1);
出栈.pop()stk.pop();
取栈顶.top()int a = stk.top();
查看大小 / 清空 / 判空

2.3.2 适用情形

如果不卡常的话,就可以直接用它而不需要手写栈了。

另外,vector 也可以当栈用,vector 的 .back() 取尾部元素,就相当于取栈顶,.push_back() 相当于进栈,.pop_back() 相当于出栈。

2.3.3 注意事项

不可访问内部元素!下面都是错误用法

cpp
for (int i = 0; i < stk.size(); i++)
    cout << stk[i] << endl;
for (auto ele : stk)
    cout << stk << endl;

2.4 队列 queue

#include <queue>

通过二次封装双端队列 (deque) 容器,实现先进先出的队列数据结构。

2.4.1 常用方法

作用用法示例
构造queue<类型> quequeue<int> que;
进队.push(元素)que.push(1);
出队.pop()que.pop();
取队首.front()int a = que.front();
取队尾.back()int a = que.back();
查看大小 / 清空 / 判空

2.4.2 适用情形

如果不卡常的话,就可以直接用它而不需要手写队列了。

2.4.3 注意事项

不可访问内部元素!下面都是错误用法

cpp
for (int i = 0; i < que.size(); i++)
    cout << que[i] << endl;
for (auto ele : que)
    cout << ele << endl;

2.5 优先队列 priority_queue

#include <queue>

提供常数时间的最大元素查找,对数时间的插入与提取,底层原理是二叉堆。

2.5.1 常用方法

构造

priority_queue<类型, 容器, 比较器> pque

  • 类型:要储存的数据类型
  • 容器:储存数据的底层容器,默认为 vector<类型>,竞赛中保持默认即可
  • 比较器:比较大小使用的比较器,默认为 less<类型>,可自定义
cpp
priority_queue<int> pque1;                            // 储存int的大顶堆
priority_queue<int, vector<int>, greater<int>> pque2; // 储存int的小顶堆

对于需要自定义比较器的情况,涉及一些初学时容易看迷糊的语法(重载小括号运算符 / lambda 表达式),在此就不展开讲了。如果想要了解,可以查阅 cppreference 中的代码示例。

其他

作用用法示例
进堆.push(元素)que.push(1);
出堆.pop()que.pop();
取堆顶.top()int a = que.top();
查看大小 / 判空

进出队复杂度 $O(\log n)$,取堆顶 $O(1)$.

2.5.2 适用情形

持续维护元素的有序性:每次向队列插入大小不定的元素,或者每次从队列里取出大小最小/最大的元素,元素数量 $n$,插入操作数量 $k$.

  • 每次插入后进行快速排序:$k\cdot n\log n$
  • 使用优先队列维护:$k\cdot\log n$

2.5.3 注意事项

仅堆顶可读

只可访问堆顶,其他元素都无法读取到。下面是错误用法:

cpp
cout << pque[1] << endl;

所有元素不可写

堆中所有元素是不可修改的。下面是错误用法:

cpp
pque[1] = 2;
pque.top() = 1;

如果你恰好要修改的是堆顶元素,那么是可以完成的:

cpp
int tp = pque.top();
pque.pop();
pque.push(tp + 1);

2.6 集合 set

#include <set>

提供对数时间的插入、删除、查找的集合数据结构。底层原理是红黑树。

集合三要素解释setmultisetunordered_set
确定性一个元素要么在集合中,要么不在
互异性一个元素仅可以在集合中出现一次❌(任意次)
无序性集合中的元素是没有顺序的❌(从小到大)❌(从小到大)

2.6.1 常用方法

构造

set<类型, 比较器> st

  • 类型:要储存的数据类型
  • 比较器:比较大小使用的比较器,默认为 less<类型>,可自定义
cpp
set<int> st1;               // 储存int的集合(从小到大)
set<int, greater<int>> st2; // 储存int的集合(从大到小)

对于需要自定义比较器的情况,涉及一些初学时容易看迷糊的语法(重载小括号运算符 / lambda 表达式),在此就不展开讲了。

查找

cpp
if (st.find(val) != st.end()){};
//还可以用count(val)返回有几个val,根据互异性,只可能有0,1两种返回值;
if(st.count(2)){};

遍历

可使用迭代器进行遍历:

cpp
for (set<int>::iterator it = st.begin(); it != st.end(); ++it)
    cout << *it << endl;

基于范围的循环(C++ 11):

cpp
for (auto &ele : st)
    cout << ele << endl;

其他

作用用法示例
插入元素.insert(元素)st.insert(1);
删除元素.erase(元素)st.erase(2);
查找元素.find(元素)auto it = st.find(1);
判断元素是否存在.count(元素)st.count(3);
查看大小 / 清空 / 判空

增删查时间复杂度均为 $O(\log n)$

2.6.2 适用情形

  • 元素去重:$[1,1,3,2,4,4]\to[1,2,3,4]$
  • 维护顺序:$[1,5,3,7,9]\to[1,3,5,7,9]$
  • 元素是否出现过:元素大小 $[-10^{18},10^{18}]$,元素数量 $10^6$,vis 数组无法实现,通过 set 可以完成。

2.6.3 注意事项

不存在下标索引

set 虽说可遍历,但仅可使用迭代器进行遍历,它不存在下标这一概念,无法通过下标访问到数据。下面是错误用法:

cpp
cout << st[0] << endl;

元素只读

set 的迭代器取到的元素是只读的(因为是 const 迭代器),不可修改其值。如果要改,需要先 erase 再 insert. 下面是错误用法:

cpp
cout << *st.begin() << endl; // 正确。可读。
*st.begin() = 1;             // 错误!不可写!

不可用迭代器计算下标

set 的迭代器不能像 vector 一样相减得到下标。下面是错误用法:

cpp
auto it = st.find(2);      // 正确,返回2所在位置的迭代器。
int idx = it - st.begin(); // 错误!不可相减得到下标。

2.7 映射 map

#include <map>

提供对数时间的有序键值对结构。底层原理是红黑树。

映射: $$ \begin{matrix} 1&\to&2\ 2&\to&2\ 3&\to&1\ 4&\to&5\ &\vdots \end{matrix} $$

性质解释mapmultimapunordered_map
互异性一个键仅可以在映射中出现一次❌(任意次)
无序性键是没有顺序的❌(从小到大)❌(从小到大)

2.7.1 常用方法

构造

map<键类型, 值类型, 比较器> mp

  • 键类型:要储存键的数据类型
  • 值类型:要储存值的数据类型
  • 比较器:键比较大小使用的比较器,默认为 less<类型>,可自定义
cpp
map<int, int> mp1;               // int->int 的映射(键从小到大)
map<int, int, greater<int>> st2; // int->int 的映射(键从大到小)

对于需要自定义比较器的情况,涉及一些初学时容易看迷糊的语法(重载小括号运算符 / lambda 表达式),在此就不展开讲了。

遍历

可使用迭代器进行遍历:

cpp
for (map<int, int>::iterator it = mp.begin(); it != mp.end(); ++it)
    cout << it->first << ' ' << it->second << endl;

基于范围的循环(C++ 11):

cpp
for (auto &pr : mp)
    cout << pr.first << ' ' << pr.second << endl;

结构化绑定 + 基于范围的循环(C++17):

cpp
for (auto &[key, val] : mp)
    cout << key << ' ' << val << endl;

其他

作用用法示例
增 / 改 / 查元素中括号mp[1] = 2;
查元素(返回迭代器).find(元素)auto it = mp.find(1);
删除元素.erase(元素)mp.erase(2);
判断元素是否存在.count(元素)mp.count(3);
查看大小 / 清空 / 判空

增删改查时间复杂度均为 $O(\log n)$

2.7.2 适用情形

需要维护映射的场景可以使用:输入若干字符串,统计每种字符串的出现次数。(map<string, int> mp)

2.7.3 注意事项

中括号访问时默认值

如果使用中括号访问 map 时对应的键不存在,那么会新增这个键,并且值为默认值,因此中括号会影响键的存在性。

cpp
map<char, int> mp;
cout << mp.count('a') << endl; // 0
mp['a'];                       // 即使什么都没做,此时mp['a']=0已经插入了
cout << mp.count('a') << endl; // 1
cout << mp['a'] << endl;       // 0

不可用迭代器计算下标

map 的迭代器不能像 vector 一样相减得到下标。下面是错误用法:

cpp
auto it = mp.find('a');      // 正确,返回2所在位置的迭代器。
int idx = it - mp.begin();   // 错误!不可相减得到下标。

2.8 字符串 string

#include <string>

顾名思义,就是储存字符串的。

2.8.1 常用方法

构造

构造函数:string(长度, 初值)

cpp
string s1;           // 构造字符串,为空
string s2 = "awa!";  // 构造字符串,并赋值awa!
string s3(10, '6');  // 构造字符串,通过构造函数构造为6666666666

输入输出

C++

cpp
string s;
cin >> s;
cout << s;

C

cpp
string s;
char buf[100];
scanf("%s", &buf);
s = buf;
printf("%s", s.c_str());

其他

作用用法示例
修改、查询指定下标字符[]s[1] = 'a';
是否相同==if (s1 == s2) ...
字符串连接+string s = s1 + s2;
尾接字符串+=s += "awa";
取子串.substr(起始下标, 子串长度)string sub = s.substr(2, 10);
查找字符串.find(字符串, 起始下标)int pos = s.find("awa");

数值与字符串互转(C++11)

目的函数
int / long long / float / double / long doublestringto_string()
stringintstoi()
stringlong longstoll()
stringfloatstof()
stringdoublestod()
stringlong doublestold()

2.8.2 适用情形

非常好用!建议直接把字符数组扔了,赶快投入 string 的怀抱。

2.8.3 注意事项

尾接字符串一定要用 +=

string 的 += 运算符,将会在原字符串原地尾接字符串。而 + 了再 = 赋值,会先生成一个临时变量,在复制给 string.

通常字符串长度可以很长,如果使用 + 字符串很容易就 TLE 了。

cpp
// 优化前: 15139ms
string s;
for (int i = 0; i < 5e5; i++)
    s = s + "a";

// 优化后: < 1ms (计时器显示0)
string s;
for (int i = 0; i < 5e5; i++)
    s += "a";

.substr() 方法的奇葩参数

一定要注意,C++ string 的取子串的第一个参数是子串起点下标,第二个参数是子串长度

第二个参数不是子串终点!不是子串终点!要与 java 等其他语言区分开来。

.find() 方法的复杂度

该方法实现为暴力实现,时间复杂度为 $O(n^2)$.

不要幻想 STL 内置了个 $O(n)$ 的 KMP 算法

2.9 二元组 pair

#include <utility>

顾名思义,就是储存二元组的。

2.9.1 常用方法

构造

pair<第一个值类型, 第二个值类型> pr

  • 第一个值类型:要储存的第一个值的数据类型
  • 第二个值类型:要储存的第二个值的数据类型
cpp
pair<int, int> p1;
pair<int, long long> p2;
pair<char, int> p3;
// ...

赋值

老式

cpp
pair<int, char> pr = make_pair(1, 'a');

列表构造 C++11

cpp
pair<int, char> pr = {1, 'a'};

取值

直接取值

  • 取第一个值:.first
  • 取第二个值:.second
cpp
pair<int, char> pr = {1, 'a'};
int awa = pr.first;
char bwb = pr.second;

结构化绑定 C++17

cpp
pair<int, char> pr = {1, 'a'};
auto &[awa, bwb] = pr;

判同

直接用 == 运算符

cpp
pair<int, int> p1 = {1, 2};
pair<int, int> p2 = {1, 3};
if (p1 == p2) { ... } // false

2.9.2 适用场景

所有需要二元组的场景均可使用,效率和自己定义结构体差不多。

2.9.3 注意事项

3 迭代器简介

3.1 迭代器是什么?

不搞抽象,直接举例。

对于一个 vector,我们可以用下标遍历:

cpp
for (int i = 0; i < a.size(); i++)
    cout << a[i] << endl;

我们同时也可以用迭代器来遍历:

cpp
for (vector<int>::iterator it = a.begin(); it != a.end(); ++it)
    cout << *it << endl;
  • a.begin() 是一个迭代器,指向的是第一个元素
  • a.end() 是一个迭代器,指向的是最后一个元素再后面一位
  • 上述迭代器具有自增运算符,自增则迭代器向下一个元素移动
  • 迭代器与指针相似,如果对它使用解引用运算符,即 *it,就能取到对应值了

3.2 为何需要迭代器?

很多数据结构并不是线性的(例如红黑树),对于非线性数据结构,下标是无意义的。无法使用下标来遍历整个数据结构。

迭代器的作用就是定义某个数据结构的遍历方式,通过迭代器的增减,代表遍历到的位置,通过迭代器便能成功遍历非线性结构了。

例如,set 的实现是红黑树,我们是没法用下标来访问元素的。但是通过迭代器,我们就能遍历 set 中的元素了:

cpp
for (set<int>::iterator it = st.begin(); it != st.end(); ++it)
    cout << *it << endl;

3.3 迭代器用法

对于 vector 容器,它的迭代器功能比较完整,以它举例:

  • .begin():头迭代器
  • .end():尾迭代器
  • .rbegin():反向头迭代器
  • .rend():反向尾迭代器
  • 迭代器 + 整型:将迭代器向后移动
  • 迭代器 - 整型:将迭代器向前移动
  • 迭代器 ++:将迭代器向后移动 1 位
  • 迭代器 --:将迭代器向前移动 1 位
  • 迭代器 - 迭代器:两个迭代器的距离
  • prev(it):返回 it 的前一个迭代器
  • next(it):返回 it 的后一个迭代器

对于其他容器,由于其结构特性,上面的功能不一定都有(例如 set 的迭代器是不能相减求距离的)

3.4 常见问题

.end().rend() 指向的位置是无意义的值

对于一个长度为 10 的数组:for (int i = 0; i < 10; i++),第 10 位是不可访问的

对于一个长度为 10 的容器:for (auto it = a.begin(); it != a.end(); ++it),.end 是不可访问的

不同容器的迭代器功能可能不一样

迭代器细化的话有正向、反向、双向,每个容器的迭代器支持的运算符也可能不同,因此不同容器的迭代器细节很有可能是不一样的。

删除操作时需要警惕

为什么 3 没删掉?

cpp
vector<int> a{1, 2, 3, 4};
for (auto it = a.begin(); it != a.end(); ++it)
    if (*it == 2 || *it == 3)
        a.erase(it);
// a = [1, 3, 4]

为啥 RE 了?

cpp
vector<int> a{1, 2, 3, 4};
for (auto it = a.begin(); it != a.end(); ++it)
    if (*it == 4)
        a.erase(it);
    //删了4,前移一位,it = a.end(),然后自增后越界

4 常用算法

4.1 内容总览

打勾的是本次将会详细讲解的,其他的是算法竞赛中建议学习的,不在下表列出的在比赛中基本用不到。

(很多函数的功能很简单,自己都能快速写出来,但是使用函数可以让代码可读性变得更高,这在比赛中是至关紧要的)

  • 算法库 Algorithm

  • 数学函数 cmath

  • 数值算法 numeric

    • [ ] iota() C++11
    • [ ] accumulate()
    • [x] gcd() C++17
    • [x] lcm() C++17
  • 伪随机数生成 random

    • [ ] mt19937
    • [ ] random_device()

4.2 swap()

交换两个变量的值

用法示例

cpp
template< class T >
void swap( T& a, T& b );
cpp
int a = 0, b = 1;
swap(a, b);
// now a = 1, b = 0

int arr[10] {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};
swap(arr[4], arr[6]);
// now arr = {0, 1, 2, 3, 6, 5, 4, 7, 8, 9}

注意事项

这个 swap 参数是引用的,不需要像 C 语言一样取地址。

4.3 sort()

使用快速排序给一个可迭代对象排序

用法示例

cpp
template< class RandomIt, class Compare >
void sort( RandomIt first, RandomIt last, Compare comp );

默认排序从小到大

cpp
vector<int> arr{1, 9, 1, 9, 8, 1, 0};
sort(arr.begin(), arr.end());
// arr = [0, 1, 1, 1, 8, 9, 9]

如果要从大到小,则需要传比较器进去。

cpp
vector<int> arr{1, 9, 1, 9, 8, 1, 0};
sort(arr.begin(), arr.end(), greater<int>());
// arr = [9, 9, 8, 1, 1, 1, 0]

如果需要完成特殊比较,则需要手写比较器。

比较器函数返回值是 bool 类型,传参是需要比较的两个元素。记我们定义的该比较操作为 $\star$:

  • 若 $a\star b$,则比较器函数应当返回 true
  • 若 $a\not\star b$,则比较器函数应当返回 false

**注意:**如果 $a=b$,比较器函数必须返回 false

例: 要求对多个二元组进行如下排序:按照第二个数从小到大排;如果第二个数相同,则按照第一个数从大到小排;

cpp
bool cmp(pair<int, int> a, pair<int, int> b)
{
    if (a.second != b.second)
        return a.second < b.second;
    return a.first > b.first;
}

int main()
{
    vector<pair<int, int>> arr{{1, 9}, {2, 9}, {8, 1}, {0, 0}};
	sort(arr.begin(), arr.end(), cmp);
    // arr = [(0, 0), (8, 1), (2, 9), (1, 9)]
}

4.4 lower_bound() / upper_bound()

已升序排序的元素中,应用二分查找检索指定元素,返回对应元素迭代器位置。找不到则返回尾迭代器。

  • lower_bound(): 寻找 $\geq x$ 的第一个元素的位置
  • upper_bound(): 寻找 $>x$ 的第一个元素的位置

怎么找 $\leq x$ / $< x$ 的第一个元素呢?

  • $>x$ 的第一个元素的前一个元素(如果有)便是 $\leq x$ 的第一个元素
  • $\geq x$ 的第一个元素的前一个元素(如果有)便是 $<x$ 的第一个元素

返回的是迭代器,如何转成下标索引呢?减去头迭代器即可。

示例

cpp
template< class ForwardIt, class T >
ForwardIt lower_bound( ForwardIt first, ForwardIt last, const T& value );
cpp
vector<int> arr{0, 1, 1, 1, 8, 9, 9};
vector<int>::iterator it = lower_bound(arr.begin(), arr.end(), 7);
int idx = it - arr.begin();
// idx = 4

我们通常写成一行:

cpp
vector<int> arr{0, 1, 1, 1, 8, 9, 9};
idx = lower_bound(arr.begin(), arr.end(), 7) - arr.begin(); // 4
idx = lower_bound(arr.begin(), arr.end(), 8) - arr.begin(); // 4
idx = upper_bound(arr.begin(), arr.end(), 7) - arr.begin(); // 4
idx = upper_bound(arr.begin(), arr.end(), 8) - arr.begin(); // 5

4.5 reverse()

反转一个可迭代对象的元素顺序

用法示例

cpp
template< class BidirIt >
void reverse( BidirIt first, BidirIt last );
cpp
vector<int> arr(10);
iota(arr.begin(), arr.end(), 1);
// 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
reverse(arr.begin(), arr.end());
// 10, 9, 8, 7, 6, 5, 4, 3, 2, 1

4.6 max() / min()

返回最大值 / 最小值的数值

用法示例

cpp
int mx = max(1, 2); // 2
int mn = min(1, 2); // 1

在 C++11 之后,可以使用列表构造语法传入一个列表,这样就能一次性给多个元素找最大值而不用套娃了:

cpp
// Before C++11
int mx = max(max(1, 2), max(3, 4)); // 4
int mn = min(min(1, 2), min(3, 4)); // 1

// After C++11
int mx = max({1, 2, 3, 4}); // 4
int mn = min({1, 2, 3, 4}); // 1

4.7 unique()

消除数组的重复相邻元素,数组长度不变,但是有效数据缩短,返回的是有效数据位置的结尾迭代器。

例如:$[1,1,4,5,1,4]\to[1,4,5,1,4,\underline?]$,下划线位置为返回的迭代器指向。

cpp
template< class ForwardIt >
ForwardIt unique( ForwardIt first, ForwardIt last );

用法示例

单独使用 unique 并不能达成去重效果,因为它只消除相邻的重复元素。但是如果序列有序,那么它就能去重了。

但是它去重后,序列尾部会产生一些无效数据:$[1,1,2,4,4,4,5]\to[1,2,4,5,\underline?,?,?]$,为了删掉这些无效数据,我们需要结合 erase.

最终,给 vector 去重的写法便是:

cpp
vector<int> arr{1, 2, 1, 4, 5, 4, 4};
sort(arr.begin(), arr.end());
// sort 后  1 1 2 4 4 4 5
//unique后  1 2 4 5 指向->4 4 5 
arr.erase(unique(arr.begin(), arr.end()), arr.end());
//unique返回的是指向去重后容器中不重复序列末尾的下一个位置的迭代器。

4.8 数学函数

所有函数参数均支持 int / long long / float / double / long double

公式示例
$f(x)=\lvert x\rvert$abs(-1.0)
$f(x)=e^x$exp(2)
$f(x)=\ln x$log(3)
$f(x,y)=x^y$pow(2, 3)
$f(x)=\sqrt x$sqrt(2)
$f(x)=\lceil x\rceil$ceil(2.1)
$f(x)=\lfloor x\rfloor$floor(2.1)
$f(x)=\left<x\right>$round(2.1)

注意事项

浮点数误差问题

在《算法竞赛入门经典》第二章例题2-1中提到,浮点数运算存在精度误差。例如,整数 1 可能因为误差变成 0.999999999,此时 floor 的结果会是 0 而非预期的 1。为避免这类问题,可以使用四舍五入:floor(sqrt(x) + 0.5)

更重要的是:当操作数都是整型时,应当避免使用浮点数运算,直接使用整数运算更加稳妥和精确,可以避免因浮点误差导致的 WA(Wrong Answer)。

参考:https://codeforces.com/blog/entry/107717

推荐的整数运算写法

1. 向下取整除法 $\lfloor\frac{a}{b}\rfloor$

  • ❌ 别用:floor(1.0 * a / b)
  • ✅ 要用:a / b
  • 示例:
cpp
int a = 7, b = 3;
int result = a / b;  // 结果为 2

2. 向上取整除法 $\lceil\frac{a}{b}\rceil$

  • ❌ 别用:ceil(1.0 * a / b)
  • ✅ 要用:(a + b - 1) / b(基于公式:$\lceil\frac{a}{b}\rceil=\lfloor\frac{a+b-1}{b}\rfloor$)
  • 示例:
cpp
int a = 7, b = 3;
int result = (a + b - 1) / b;  // 结果为 3

3. 平方根向下取整 $\lfloor\sqrt a\rfloor$

  • ❌ 别用:(int) sqrt(a)
  • ✅ 要用:二分查找
  • 示例:
cpp
// 二分查找计算 floor(sqrt(n))
int isqrt(int n) {
    int l = 0, r = n;
    while (l < r) {
        int mid = l + (r - l + 1) / 2;
        if (mid <= n / mid) l = mid;  // 避免 mid * mid 溢出
        else r = mid - 1;
    }
    return l;
}

4. 整数幂运算 $a^b$

  • ❌ 别用:pow(a, b)
  • ✅ 要用:快速幂
  • 示例:
cpp
// 快速幂计算 a^b
long long qpow(long long a, long long b) {
    long long res = 1;
    while (b) {
        if (b & 1) res *= a;
        a *= a;
        b >>= 1;
    }
    return res;
}

5. 以2为底的对数向下取整 $\lfloor\log_2 a\rfloor$

  • ❌ 别用:log2(a)
  • ✅ 要用:__lg(a)bit_width(a) - 1(C++20)
  • 示例:
cpp
int a = 15;
int result = __lg(a);  // 结果为 3,因为 log2(15) ≈ 3.9
// C++20: int result = std::bit_width((unsigned)a) - 1;

4.9 gcd() / lcm()

(C++17)返回最大公因数 / 最小公倍数

cpp
int x = gcd(8, 12); // 4
int y = lcm(8, 12); // 24

如果不是 C++17,但是是 GNU 编译器(g++),那么可以用内置函数 __gcd().

当然,gcd / lcm 函数也挺好写,直接写也行(欧几里得算法):

cpp
int gcd(int a, int b)
{
    if (!b)
        return a;
    return gcd(b, a % b);
}

int lcm(int a, int b)
{
    return a / gcd(a, b) * b;
}

5 其他常用容器

本章节补充了一些在算法竞赛中也较为常用的容器,虽然使用频率不如前面章节的容器,但在特定场景下非常有用。

5.1 数组 array

#include <array>

固定长度的顺序容器,在编译期就确定大小,性能接近原生数组,但提供了 STL 容器的接口。

5.1.1 常用方法

构造

array<类型, 长度> arr

注意:长度必须是编译期常量。

时间复杂度:$O(1)$

cpp
array<int, 5> arr1;              // 构造长度为5的int数组,未初始化
array<int, 5> arr2 = {1, 2, 3};  // 构造并初始化前3个元素,后2个为0
array<int, 5> arr3{};            // 构造并全部初始化为0

访问元素

中括号运算符 [].at()

时间复杂度:$O(1)$

cpp
array<int, 5> arr = {1, 2, 3, 4, 5};
cout << arr[0] << endl;     // 1, 不检查越界
cout << arr.at(0) << endl;  // 1, 检查越界,越界会抛出异常

获取首尾元素

  • .front():返回第一个元素
  • .back():返回最后一个元素

时间复杂度:$O(1)$

获取长度

.size()

时间复杂度:$O(1)$

填充

.fill(值)

将所有元素设置为指定值

时间复杂度:$O(n)$

cpp
array<int, 5> arr;
arr.fill(0);  // 所有元素设为0

5.1.2 适用情形

  • 长度在编译期已知且固定的场景
  • 需要 STL 接口但又追求性能的场景
  • 相比普通数组,array 可以作为函数返回值、支持赋值操作

5.1.3 注意事项

长度必须是常量

cpp
int n = 10;
array<int, n> arr;       // 错误!n不是编译期常量
array<int, 10> arr;      // 正确
const int N = 10;
array<int, N> arr;       // 正确

不能动态改变大小

array 的大小在编译期确定,无法像 vector 那样动态增长。

5.2 双端队列 deque

#include <deque>

双端队列(double-ended queue),支持在头尾两端高效插入和删除的顺序容器。

5.2.1 常用方法

构造

deque<类型> dq

cpp
deque<int> dq;          // 构造空双端队列
deque<int> dq(10);      // 构造长度为10的双端队列
deque<int> dq(10, 1);   // 构造长度为10,初值为1的双端队列

头尾操作

  • .push_front(元素):在头部插入元素
  • .push_back(元素):在尾部插入元素
  • .pop_front():删除头部元素
  • .pop_back():删除尾部元素
  • .front():访问头部元素
  • .back():访问尾部元素

时间复杂度:均为 $O(1)$

cpp
deque<int> dq;
dq.push_back(1);   // dq = [1]
dq.push_front(2);  // dq = [2, 1]
dq.push_back(3);   // dq = [2, 1, 3]
int x = dq.front(); // x = 2
dq.pop_front();    // dq = [1, 3]

随机访问

中括号运算符 []

时间复杂度:$O(1)$

其他

  • .size():获取长度
  • .empty():判空
  • .clear():清空

5.2.2 适用情形

  • 需要在两端进行插入删除操作的场景
  • 单调队列的实现
  • 滑动窗口问题

5.2.3 注意事项

性能不如 vector

deque 虽然支持随机访问,但性能不如 vector,因为其内存不是完全连续的。如果只需要尾部操作,优先使用 vector。

5.3 链表 list

#include <list>

双向链表,支持在任意位置快速插入和删除,但不支持随机访问。

5.3.1 常用方法

构造

list<类型> lst

cpp
list<int> lst;          // 构造空链表
list<int> lst(10);      // 构造10个元素的链表
list<int> lst(10, 1);   // 构造10个元素,初值为1

头尾操作

  • .push_front(元素):在头部插入
  • .push_back(元素):在尾部插入
  • .pop_front():删除头部元素
  • .pop_back():删除尾部元素
  • .front():访问头部元素
  • .back():访问尾部元素

时间复杂度:均为 $O(1)$

插入和删除

  • .insert(迭代器, 元素):在指定位置前插入
  • .erase(迭代器):删除指定位置元素

时间复杂度:$O(1)$(需要先通过遍历找到位置)

其他操作

  • .sort():对链表排序
  • .reverse():反转链表
  • .unique():去除相邻重复元素
  • .merge(另一个list):合并两个有序链表

5.3.2 适用情形

  • 频繁在中间位置插入删除的场景
  • 不需要随机访问的场景
  • 实际竞赛中很少使用,一般用 vector 或 deque 代替

5.3.3 注意事项

不支持随机访问

cpp
list<int> lst = {1, 2, 3, 4, 5};
cout << lst[2] << endl;  // 错误!不支持下标访问

性能开销

链表的节点不连续,缓存性能差,在竞赛中一般不推荐使用。

5.4 多重集合 multiset

#include <set>

与 set 类似,但允许元素重复出现。底层原理是红黑树。

5.4.1 常用方法

构造

multiset<类型, 比较器> mst

cpp
multiset<int> mst;               // 从小到大
multiset<int, greater<int>> mst; // 从大到小

插入和删除

  • .insert(元素):插入元素(允许重复)
  • .erase(元素):删除所有等于该元素的值
  • .erase(迭代器):删除迭代器指向的单个元素

时间复杂度:$O(\log n)$

cpp
multiset<int> mst;
mst.insert(1);  // [1]
mst.insert(1);  // [1, 1]
mst.insert(2);  // [1, 1, 2]
mst.erase(1);   // [2],删除了所有的1

// 如果只想删除一个1:
multiset<int> mst = {1, 1, 2};
mst.erase(mst.find(1));  // [1, 2],只删除一个1

查找和计数

  • .find(元素):返回任意一个等于该元素的迭代器
  • .count(元素):返回元素出现的次数

时间复杂度:$O(\log n)$(count 为 $O(\log n + k)$,$k$ 为元素个数)

其他

  • .size().empty().clear()

5.4.2 适用情形

  • 需要维护有序序列且允许重复的场景
  • 动态维护中位数
  • 对顶堆的实现

5.4.3 注意事项

删除时注意是删除所有还是单个

cpp
multiset<int> mst = {1, 1, 1, 2};
mst.erase(1);              // 删除所有1,结果:[2]
mst.erase(mst.find(1));    // 只删除一个1,结果:[1, 1, 2]

5.5 多重映射 multimap

#include <map>

与 map 类似,但允许键重复出现。底层原理是红黑树。

5.5.1 常用方法

构造

multimap<键类型, 值类型, 比较器> mmp

cpp
multimap<int, int> mmp;               // 键从小到大
multimap<int, int, greater<int>> mmp; // 键从大到小

插入

  • .insert({键, 值}).insert(make_pair(键, 值))

时间复杂度:$O(\log n)$

cpp
multimap<int, int> mmp;
mmp.insert({1, 100});
mmp.insert({1, 200});  // 允许键重复
mmp.insert({2, 300});

查找

  • .find(键):返回任意一个该键的迭代器
  • .count(键):返回该键出现的次数
  • .equal_range(键):返回包含所有该键元素的迭代器范围

时间复杂度:$O(\log n)$

cpp
multimap<int, int> mmp = {{1, 100}, {1, 200}, {2, 300}};
cout << mmp.count(1) << endl;  // 2

auto range = mmp.equal_range(1);
for (auto it = range.first; it != range.second; ++it)
    cout << it->second << endl;  // 输出 100 200

删除

  • .erase(键):删除所有该键的元素
  • .erase(迭代器):删除单个元素

时间复杂度:$O(\log n)$

5.5.2 适用情形

  • 需要一对多映射的场景
  • 实际竞赛中较少使用,一般用 map<键, vector<值>> 代替

5.5.3 注意事项

不能使用中括号访问

cpp
multimap<int, int> mmp;
mmp[1] = 100;  // 错误!multimap不支持[]运算符

5.6 无序集合 unordered_set

#include <unordered_set>

基于哈希表实现的集合,元素无序但查找速度快。

5.6.1 常用方法

构造

unordered_set<类型> ust

cpp
unordered_set<int> ust;

插入和删除

  • .insert(元素):插入元素
  • .erase(元素):删除元素

平均时间复杂度:$O(1)$,最坏 $O(n)$

查找

  • .find(元素):返回元素迭代器
  • .count(元素):判断元素是否存在(返回0或1)

平均时间复杂度:$O(1)$,最坏 $O(n)$

cpp
unordered_set<int> ust = {1, 3, 5, 7};
if (ust.count(3))  // 判断3是否存在
    cout << "exists" << endl;

其他

  • .size().empty().clear()

5.6.2 适用情形

  • 只需要判断元素是否存在,不需要有序性
  • 对查找性能要求高的场景
  • 元素去重但不需要排序

5.6.3 注意事项

元素无序

unordered_set 的元素是无序的,遍历时的顺序不确定。

最坏情况性能退化

当哈希冲突严重时,时间复杂度会退化到 $O(n)$。竞赛中如果被卡哈希,可以使用 set 代替。

不支持自定义类型

对于自定义类型,需要提供哈希函数,比较麻烦。

5.7 无序映射 unordered_map

#include <unordered_map>

基于哈希表实现的键值对容器,键无序但查找速度快。

5.7.1 常用方法

构造

unordered_map<键类型, 值类型> ump

cpp
unordered_map<int, int> ump;
unordered_map<string, int> ump;  // 常用于字符串映射

增删改查

  • 中括号 []:访问或插入
  • .insert({键, 值}):插入
  • .erase(键):删除
  • .find(键):查找
  • .count(键):判断键是否存在

平均时间复杂度:$O(1)$,最坏 $O(n)$

cpp
unordered_map<string, int> ump;
ump["apple"] = 5;
ump["banana"] = 3;

if (ump.count("apple"))
    cout << ump["apple"] << endl;  // 5

其他

  • .size().empty().clear()

5.7.2 适用情形

  • 只需要键值映射,不需要键的有序性
  • 对查找性能要求高的场景
  • 字符串哈希、计数等场景

5.7.3 注意事项

键无序

遍历时键的顺序不确定。

可能被卡哈希

竞赛中如果被卡哈希,使用 map 代替或自定义哈希函数。

中括号的副作用

与 map 相同,使用 [] 访问不存在的键会创建该键。

5.8 无序多重集合 unordered_multiset

#include <unordered_set>

基于哈希表的 multiset,允许元素重复且无序。

5.8.1 常用方法

与 multiset 类似,但元素无序,操作的平均时间复杂度为 $O(1)$。

cpp
unordered_multiset<int> umst;
umst.insert(1);
umst.insert(1);
umst.insert(2);
cout << umst.count(1) << endl;  // 2

5.8.2 适用情形

需要允许重复元素,且不需要有序性,追求查找性能。

5.8.3 注意事项

实际竞赛中很少使用,一般用 unordered_map 配合计数实现。

5.9 无序多重映射 unordered_multimap

#include <unordered_map>

基于哈希表的 multimap,允许键重复且无序。

5.9.1 常用方法

与 multimap 类似,但键无序,操作的平均时间复杂度为 $O(1)$。

cpp
unordered_multimap<int, int> ummp;
ummp.insert({1, 100});
ummp.insert({1, 200});
cout << ummp.count(1) << endl;  // 2

5.9.2 适用情形

需要一对多映射,且不需要键的有序性。

5.9.3 注意事项

实际竞赛中很少使用,一般用 unordered_map<键, vector<值>> 代替。

5.10 元组 tuple

#include <tuple>

可以存储任意数量、任意类型元素的容器,是 pair 的扩展版本。

5.10.1 常用方法

构造

tuple<类型1, 类型2, ...> tup

cpp
tuple<int, double, string> t1;
tuple<int, int, int> t2;

赋值

老式写法:

cpp
tuple<int, double, string> t = make_tuple(1, 3.14, "hello");

列表构造(C++11):

cpp
tuple<int, double, string> t = {1, 3.14, "hello"};

取值

使用 get<索引>(tuple) 获取元素(索引从0开始):

cpp
tuple<int, double, string> t = {1, 3.14, "hello"};
int a = get<0>(t);        // 1
double b = get<1>(t);     // 3.14
string c = get<2>(t);     // "hello"

结构化绑定(C++17):

cpp
tuple<int, double, string> t = {1, 3.14, "hello"};
auto [a, b, c] = t;
cout << a << ' ' << b << ' ' << c << endl;  // 1 3.14 hello

获取元组大小

cpp
tuple<int, double, string> t;
constexpr size_t size = tuple_size<decltype(t)>::value;  // 3

5.10.2 适用情形

  • 需要返回多个值的函数
  • 存储三元组、四元组等多元数据
  • 在 map 中使用复合键:map<tuple<int, int, int>, int>

5.10.3 注意事项

访问语法较繁琐

相比 pair 的 .first.second,tuple 的 get<0>() 语法较为冗长,建议配合 C++17 的结构化绑定使用。

可读性问题

对于元素较多的 tuple,建议定义结构体以提高代码可读性:

cpp
// 不推荐
tuple<int, int, string, double> student;

// 推荐
struct Student {
    int id;
    int age;
    string name;
    double score;
};

补充:

初始化构造

STL 大多数容器都支持 区间构造函数,方便从别的容器快速拷贝数据:

CPP
vector<int> v2(v1.begin(), v1.end());
set<int> s(v.begin(), v.end());
unordered_set<int> s(nums.begin(), nums.end());
map<int,int> m(v.begin(), v.end());//(前提 pair 类型兼容)

随机访问方式

讲了区间构造,自然而然涉及到区间访问,我们已经学过迭代器,访问差异见下表:

容器迭代器类型能否用 it + n说明
vector / string / deque随机访问迭代器✔ 可以 it + n支持加减整数
list / forward_list双向 / 单向迭代器❌ 不可以必须用 next(it, n)
set / map / unordered_set / unordered_map双向迭代器❌ 不可以必须用 next(it, n)
为什么不能给 set / map 直接加数字?

因为它们底层是 红黑树,不是连续内存 → 迭代器不能“跳 n 格”。 必须一个个走,所以需要 std::next()。

而 vector/string 底层是数组 → 随便跳:it + n 合法。

; unordered_set 可以 it + n 吗?

❌ 绝对不行。

unordered_set 底层是哈希桶列表,不连续,不支持随机访问。

你必须用:

auto it = next(s.begin(), k);

📝 总结一句话记住

➡ 连续容器(vector/string/deque)用 it + n ➡ 非连续容器(set/map/unordered_系列/list)用 next(it, n)

关于map和set的初始化

在 C++ 里,mapset 看起来很像,都是基于红黑树实现的关联容器,但它们的行为有一个关键差别:map 在访问不存在的 key 时会自动创建一个元素,而 set 完全不会。 如果set为空,就用解引用迭代器的方式访问,会导致未定义行为UB 原因很简单: map 提供了下标操作符 operator[]。当你写 mp[key] 时,如果 key 不存在,map 会自动插入一条记录 {key, mapped_type()}。对于 int,默认值就是 0,所以 mp[x] 会产生一个新元素。

set 的元素只有 key,没有 value,也没有提供 operator[]。它只支持 insertfind 这类查找与插入操作。访问不存在的元素只会得到 end(),绝不会自动创建。

同理,unordered_map 也会自动插入,unordered_set 则不会。

一句话总结:

  • map / unordered_map:访问不存在的 key → 自动创建,值为默认初始化
  • set / unordered_set:绝不自动创建,只能显式 insert

这就是它们在使用上的核心差别。

容器是否会自动创建 key说明
map✔ 会operator[] 插入 {key, value=0}
unordered_map✔ 会同样插入 {key, 0}
set❌ 不会没有 operator[],不能自动创建
unordered_set❌ 不会“查不到”不会插入任何东西

易混成员函数

成员函数返回类型能否解引用说明
begin()迭代器✔️(解引用后)指向第一个元素
cbegin()const迭代器✔️常量开始迭代器
end()迭代器不能解引用!指向尾后位置(不存在的元素)
cend()const迭代器尾后位置
成员函数返回类型能否解引用说明
---------------------------------
front()元素引用✔️第一个元素
back()元素引用✔️最后一个元素
operator[]元素引用✔️访问任意位置,不检查越界
at()元素引用✔️越界会抛异常