基本概念
重载操作符是具有特殊名字的函数:关键字operator后面跟着需要被定义的操作符的符号。像其它函数一样,重载操作符有返回值,参数列表和函数体。
重载操作符的参数和操作符的操作数一样多。除了函数调用操作符(operator()),重载操作符没有默认实参。
注意
当重载操作符是成员函数时,this绑定到左操作数。因此,成员操作符函数少一个操作数。
操作符函数必须为类的成员或至少有一个类类型参数:
1
2
|
// error: cannot redefine the built-in operator for ints
int operator+(int, int);
|
我们可以重载大多数操作符,而且只能重载已经存在的操作符:
1
2
3
4
5
6
7
8
9
10
|
//可以重载的操作符
+ - * / % ^
& | ~ ! , =
< > <= >= ++ --
<< >> == != && ||
+= -= /= %= ^= &=
|= *= <<= >>= [] ()
-> ->* new new[] delete delete[]
//不能重载的操作符
:: .* . ?:
|
重载操作符和相应的内置操作符有相同的优先级和结合性。
直接调用重载操作符函数
1
2
3
4
|
data1 + data2; // 表达式调用
operator+(data1, data2); // 等价的函数调用
data1 += data2; // 表达式调用
data1.operator+=(data2); // 等价的成员函数调用
|
有些操作符不应该重载
重载操作符不保留求值顺序或短路求值。
最佳实践
通常,逗号(,),取地址(&),逻辑与(&&)和逻辑或(||)不应该重载。
使用和内置操作符意思一致的定义
- 如果类使用IO,定义与内置类型IO操作一致的shift操作符
- 如果类有测试相等的操作,定义operator==。如果类有operator==,通常也应该定义operator!=。
- 如果类有单一的自然顺序的操作,定义operator<。如果类有operator<,通常也应该定义其它关系操作符。
- 重载操作符的返回类型应该和内置操作符的返回类型兼容:逻辑操作符和关系操作符应该返回bool,算术操作符应该返回类的值,赋值操作符应该返回左操作数的引用。
注意:明智地使用操作符重载
当内置操作符和类的操作有逻辑映射的时候,操作符重载最有用。
选择成员或非成员实现
以下指导方针能够帮助我们决定是否将一个操作符定义为成员函数或普通的非成员函数:
- 赋值操作符(=),下标操作符([]),调用操作符(()),成员访问操作符(->)必须定义为成员。
- 复合赋值操作符通常应该定义为成员,但是没有要求一定这样。
- 改变对象状态或与类对象联系紧密的操作符,通常应该定义为成员。比如++,–和解引用(*)。
- 那些可能转换操作数的对称的操作符,比如算术操作符,关系操作符,位操作符,通常应该定义为非成员。
输入输出操作符
重载输出操作符 «
1
2
3
4
5
6
|
ostream &operator<<(ostream &os, const Sales_data &item)
{
os << item.isbn() << " " << item.units_sold << " "
<< item.revenue << " " << item.avg_price();
return os;
}
|
最佳实践
通常输出操作符应该最小格式化输出对象的内容,不应该打印换行。
IO操作符必须是非成员函数
输入输出操作符遵循库iostream的惯例必须为普通的非成员函数。
1
2
|
Sales_data data;
data << cout; // 如果operator<<是Sales_data的一个成员
|
如果这些操作符是任意一个类的成员,那它们应该是istream或ostream的成员,但是我们无法给标准库添加成员。输入输出操作符通常需要读或写非公开的数据成员。因此,IO操作符通常必须声明为friend。
重载输入操作符 »
1
2
3
4
5
6
7
8
9
10
|
istream &operator>>(istream &is, Sales_data &item)
{
double price;
is >> item.bookNo >> item.units_sold >> price;
if (is) // 检查输入是否成功
item.revenue = item.units_sold * price;
else
item = Sales_data(); // 输入失败:给对象一个默认值
return is;
}
|
注意
输入操作符必须处理输入失败的可能性。输出操作符通常没有这个困扰。
我们选择在读取了所有数据之后,使用数据之前来检查流状态。
最佳实践
输入操作符应该决定做什么错误恢复。当错误发生时,使对象处于一个合法状态尤其重要,因为对象可能被部分修改。
通常输入操作符应该只设置failbit。eofbit和badbit最好是留给IO库去指示。
算术和关系操作符
通常我们将算术和关系操作符定义为非成员函数,以允许转换左右操作符中的一个。这些操作符不需要修改操作数的状态,所以参数通常为**const
**引用。定义了算术操作符的类通常也要定义相应的复合赋值操作符。
1
2
3
4
5
6
7
|
Sales_data
operator+(const Sales_data &lhs, const Sales_data &rhs)
{
Sales_data sum = lhs;
sum += rhs;
return sum;
}
|
提示
定义了算术操作符和相应的复合赋值操作符的类,应该使用复合赋值操作符来实现算术操作符。
相等操作符
1
2
3
4
5
6
7
8
9
10
|
bool operator==(const Sales_data &lhs, const Sales_data &rhs)
{
return lhs.isbn() == rhs.isbn() &&
lhs.units_sold == rhs.units_sold &&
lhs.revenue == rhs.revenue;
}
bool operator!=(const Sales_data &lhs, const Sales_data &rhs)
{
return !(lhs == rhs);
}
|
相等操作符的设计原理:
- 如果一个类有一个确定2个对象是否相等的操作,那么该类应该定义operator==,而不是命名函数,而且可以容易使用标准库容器和算法。
- 如果一个类定义了operator==,这个操作符通常应该确定给定的对象是否包含相同的数据。
- 通常地,相等操作符应该是可传递的, 比如如果a == b, b == c, 则a == c。
- 如果一个类定义了operator==,那也应该定义operator!=,反之也一样。
- 相等或不等操作符应该将实际工作委托给另一个。
最佳实践
相等性具有逻辑意义的类通常应该定义operator==,定义了**operator==**的类使得用户容易使用标准库算法。
关系操作符
定义了相等操作符的类通常(不总是)也会定义关系操作符。特别地,关系容器和有些算法使用**<操作符,定义operator<**会很有用。
通常关系操作符应该:
- 定义一个顺序关系和关联容器的key的需求一致。
- 定义一个关系和**==一致,如果类2种操作符都定义了。特别地,如果2个对象!=,则其中一个应该<**另一个。
最佳实践
如果只有一个逻辑定义**<存在,类通常应该定义<操作符。然而,如果类也有==,只有当<和==产生的结果一致时,定义<**。
赋值操作符
除了**copy-和move-**赋值操作符之外,类还可以定义其它的赋值操作符允许其它类型作为右操作数。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
vector<string> v;
v = {"a", "an", "the"};
class StrVec {
public:
StrVec &operator=(std::initializer_list<std::string>);
};
StrVec &StrVec::operator=(initializer_list<string> il)
{
auto data = alloc_n_copy(il.begin(), il.end());
free();
elements = data.first;
first_free = cap = data.second;
return *this;
}
|
不像**copy-和move-**赋值操作符,这个操作符不需要检查自我赋值。
注意
赋值操作符可以被重载。不管参数类型是什么,赋值操作符必须定义为成员函数。
复合赋值操作符不需要是类成员。然而,我们倾向于定义所有的赋值操作符,包括复合赋值操作符为类成员。
1
2
3
4
5
6
|
Sales_data& Sales_data::operator+=(const Sales_data &rhs)
{
units_sold += rhs.units_sold;
revenue += rhs.revenue;
return *this;
}
|
最佳实践
赋值操作符必须,而且通常复合赋值操作符应该,定义为成员。这些操作符应该返回左操作数的引用。
下标操作符
可以通过位置来获取元素的代表容器的类,通常定义下标操作符,operater[]。
注意
下标操作符必须为成员函数。
最佳实践
如果一个类有下标操作符,它通常应该定义2个版本:一个返回普通引用,一个返回const引用。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
class StrVec {
public:
std::string& operator[](std::size_t n)
{ return elements[n]; }
const std::string& operator[](std::size_t n) const
{ return elements[n]; }
private:
std::string *elements; // 指向数组第一个元素
};
const StrVec cvec = svec;
if (svec.size() && svec[0].empty()) {
svec[0] = "zero"; // ok: 返回一个普通引用
cvec[0] = "Zip"; // error: 返回一个const引用
}
|
自增和自减操作符
自增和自减操作符最常被迭代器类实现。语言并没要要求这些操作符是成员,但是由于这些操作符改变它们操作的对象的状态,我们选择将它们定义为成员。
最佳实践
定义自增或自减操作符的类应该定义prefix和postfix版本。这些操作符应该定义为成员。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
class StrBlobPtr {
public:
StrBlobPtr& operator++(); // 前自增操作符
StrBlobPtr& operator--(); // 前自减操作符
};
StrBlobPtr& StrBlobPtr::operator++()
{
check(curr, "increment past end of StrBlobPtr");
++curr;
return *this;
}
StrBlobPtr& StrBlobPtr::operator--()
{
--curr;
check(-1, "decrement past begin of StrBlobPtr");
return *this;
}
|
最佳实践
为了和内置操作符一致,前置操作符应该返回自增过或自减过的对象的引用。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
class StrBlobPtr {
public:
StrBlobPtr operator++(int); // 后置操作符
StrBlobPtr operator--(int);
};
StrBlobPtr StrBlobPtr::operator++(int)
{
StrBlobPtr ret = *this;
++*this;
return ret;
}
StrBlobPtr StrBlobPtr::operator--(int)
{
StrBlobPtr ret = *this;
--*this;
return ret;
}
|
最佳实践
为了和内置操作符一致,后置操作符应该返回旧的(未自增或自减)值,而不是引用。
注意
int参数没有用到,所以没有给它一个名字。
1
2
3
|
StrBlobPtr p(a1);
p.operator++(0); // 调用后自增操作符
p.operator++(); // 调用前自增操作符
|
成员访问操作符
解引用(*)和箭头(->)操作符经常使用在迭代器类和智能指针类中。
1
2
3
4
5
6
7
8
9
10
11
12
|
class StrBlobPtr {
public:
std::string& operator*() const
{
auto p = check(curr, "dereference past end");
return (*p)[curr]; // (*p)是这个对象指向的vector
}
std::string* operator->() const
{
return & this->operator*(); // 将实际工作委托给解引用操作符
}
};
|
注意
箭头操作符必须定义为成员,没有要求解引用为成员但通常也应该为成员。
值得注意的是我们定义这些操作符为const成员,获取一个元素不会改变这个对象的状态。
1
2
3
4
5
|
StrBlob a1 = {"hi", "bye", "now"};
StrBlobPtr p(a1); // p指向a1里面的vector
*p = "okay"; // 给a1中第一个元素赋值
cout << p->size() << endl; // 第一个元素的size()
cout << (*p).size() << endl; // 等价于p->size()
|
当我们写point->mem时,point必须是指向一个类对象的指针或是一个重载了operator->的类的对象。取决于point的类型,point->mem等价于:
1
2
|
(*point).mem; // point是一个内置指针类型
point.operator()->mem; // point是一个类的对象
|
注意
箭头操作符必须返回一个指向类类型的指针或一个定义了自己的箭头操作符的类类型的对象。
函数调用操作符
重载了函数调用操作符的类允许它的对象像函数一样使用。因为这种类可以保存状态,它们比普通函数更灵活。
1
2
3
4
5
|
struct absInt {
int operator()(int val) const {
return val < 0 ? -val : val;
}
};
|
定义了函数调用操作符的类的对象被称为函数对象,我们可以像函数调用一样提供一个参数列表给函数对象:
1
2
3
|
int i = -42;
absInt absObj;
int ui = absObj(i);
|
注意
函数调用操作符必须是成员函数。一个类可以定义多个版本的调用操作符,每一个参数类型或数量必须不一样。
和其他类一样,一个函数对象类除了operator(),还可以有其它成员。函数对象类通常包含其它成员用来调整函数调用操作符的操作。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
class PrintString {
public:
PrintString(ostream &o = cout, char c = ' '):
os(o), sep(c) { }
void operator()(const string &s) const { os << s << sep;}
private:
ostream &os; // stream on which to write
char sep; // character to print after each output
};
PrintString printer; // uses the defaults; prints to cout
printer(s); // prints s followed by a space on cout
PrintString errors(cerr, '\n');
errors(s); // prints s followed by a newline on cerr
|
函数对象最常用于泛型算法的参数:
1
|
for_each(vs.begin(), vs.end(), PrintString(cerr, '\n'));
|
Lambdas是函数对象
当我们写一个lambda时,编译器将表达式翻译成一个匿名类的匿名对象。由lambda生成的类包含了一个重载的函数调用操作符。
1
2
3
|
stable_sort(words.begin(), words.end(),
[](const string &a, const string &b)
{ return a.size() < b.size();});
|
行为就像一个匿名对象的类,看起来像:
1
2
3
4
5
6
7
|
class ShorterString {
public:
bool operator()(const string &s1, const string &s2) const
{ return s1.size() < s2.size(); }
};
stable_sort(words.begin(), words.end(), ShorterString());
|
类表示Lambdas带捕获成员
1
2
|
auto wc = find_if(words.begin(), words.end(),
[sz](const string &a){ return a.size() >= sz;});
|
会生成像这样的类:
1
2
3
4
5
6
7
8
9
10
|
class SizeComp {
public:
SizeComp(size_t n): sz(n) { } // parameter for each captured variable
bool operator()(const string &s) const
{ return s.size() >= sz; }
private:
size_t sz; // a data member for each variable captured by value
};
auto wc = find_if(words.begin(), words.end(), SizeComp(sz));
|
由lambda表达式生成的类有一个deleted默认构造函数,deleted赋值操作符和一个默认析构函数。是否有deleted或默认的copy/move构造函数取决于捕获的数据成员。
标准库定义的函数对象
标准库定义了一个类集合,表示算术,关系和逻辑运算符。
plus类有一个函数调用操作符,应用**+操作符。
modulus类有一个函数调用操作符,应用%操作符。
equal_to类有一个函数调用操作符,应用==**操作符。
1
2
3
4
5
|
plus<int> intAdd; // function object that can add two int values
negate<int> intNegate; // function object that can negate an int value
int sum = intAdd(10, 20); // sum = 30
sum = intNegate(intAdd(10, 20)); // sum = -30
sum = intAdd(10, intNegate(10)); // sum = 0
|
算法中使用标准库函数对象
1
2
|
// passes a temporary function object that applies the < operator to two strings
sort(svec.begin(), svec.end(), greater<string>());
|
标准库函数对象保证对指针也有作用。
1
2
3
4
5
6
|
vector<string *> nameTable; // vector of pointers
// error: the pointers in nameTable are unrelated, so < is undefined
sort(nameTable.begin(), nameTable.end(),
[](string *a, string *b) { return a < b; });
// ok: library guarantees that less on pointer types is well defined
sort(nameTable.begin(), nameTable.end(), less<string*>());
|
值得注意的是关联容器使用less<key_type>排序它们的元素。因此,我们能定义一个指针集合,或者使用一个指针作为key的map容器而不用直接指定less。
可调用对象和函数
C++有几种可调用对象:函数和函数指针,lambdas,由bind创建的对象和重载了函数调用操作符的类。
不同类型可以有相同的调用签名:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
int add(int i, int j) { return i + j; } // 普通函数
auto mod = [](int i, int j) { return i % j; }; // 匿名函数
// 函数对象类
struct div {
int operator()(int denominator, int divisor) {
return denominator / divisor;
}
};
map<string, int(*)(int,int)> binops;
binops.insert({"+", add}); // ok: add是一个指向合适类型的函数指针
binops.insert({"%", mod}); // error: mod不是一个指向函数的指针
|
标准库function类型
function定义在头文件functional里面。
1
2
3
4
5
6
7
8
9
10
11
|
function<T> f; //空函数对象。
function<T> f(nullptr); //显式构造空函数对象。
function<T> f(obj); //保存一个obj的副本。
f //true当f拥有一个可调用对象,否则false。
f(args) //传递参数args,调用函数。
//定义为function<T>的成员的类型
result_type //可调用对象的返回类型。
argument_type //当参数为1个或2个时的类型。
first_argument_type
second_argument_type
|
function是一个模板。和其它模板一样,我们必须指定function的函数类型。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
function<int(int, int)> f1 = add; // 函数指针
function<int(int, int)> f2 = div(); // 函数对象
function<int(int, int)> f3 = [](int i, int j) { return i * j;}; // 匿名函数
cout << f1(4,2) << endl; // prints 6
cout << f2(4,2) << endl; // prints 2
cout << f3(4,2) << endl; // prints 8
map<string, function<int(int, int)>> binops = {
{"+", add}, // function pointer
{"-", std::minus<int>()}, // library function object
{"/", div()}, // user-defined function object
{"*", [](int i, int j) { return i * j; }}, // unnamed lambda
{"%", mod} }; // named lambda object
binops["+"](10, 5); // calls add(10, 5)
binops["-"](10, 5); // uses the call operator of the minus<int> object
binops["/"](10, 5); // uses the call operator of the div object
binops["*"](10, 5); // calls the lambda function object
binops["%"](10, 5); // calls the lambda function object
|
重载函数和function
我们不能直接保存一个重载函数的函数名:
1
2
3
4
|
int add(int i, int j) { return i + j; }
Sales_data add(const Sales_data&, const Sales_data&);
map<string, function<int(int, int)>> binops;
binops.insert({"+", add}); // error: which add?
|
解决二义性的一个方法是存储函数指针:
1
2
|
int (*fp)(int,int) = add;
binops.insert({"+", fp});
|
或者使用lambda消除歧义:
1
|
binops.insert({"+", [](int a, int b) {return add(a, b);}});
|
重载,转换和操作符
转换构造函数和转换操作符定义了类类型的转换。这种转换又叫做用户定义的转换。
转换操作符
转换操作符是一种特殊的成员函数,将一个类类型的值转换为其它类型的值。一个典型的转换函数具有形式:
转换操作符可以为任意(除了void)函数返回的类型定义转换。不允许转换为数组或函数类型。允许转换为指针(数据指针和函数指针)和引用。
注意
转换函数必须是一个成员函数,不能指定返回类型,参数列表必须为空,通常为const。
定义一个具有转换操作符的类
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
class SmallInt {
public:
SmallInt(int i = 0): val(i)
{
if (i < 0 || i > 255)
throw std::out_of_range("Bad SmallInt value");
}
operator int() const { return val; }
private:
std::size_t val;
};
SmallInt si;
si = 4; // implicitly converts 4 to SmallInt then calls SmallInt::operator=
si + 3; // implicitly converts si to int followed by integer addition
|
尽管编译器每次只应用一个用户定义的转换操作,隐式调用用户定义的转换可以在之前或之后跟着一个标准转换。
1
2
|
SmallInt si = 3.14;
si + 3.14;
|
因为转换操作符是隐式调用的,没有办法给它们传递参数。因此,转换操作符不带参数。尽管转换函数没有指定返回值,每一个转换函数必须返回相应的转换类型。
1
2
3
4
5
6
7
|
class SmallInt {
public:
int operator int() const; // error: return type
operator int(int = 0) const; // error: parameter list
operator int*() const { return 42; } // error: 42 is not a pointer
};
operator int(SmallInt&); // error: nonmember
|
警告
避免滥用转换函数。
转换操作符可以产生惊人的结果
实际上,类很少定义转换操作符。然而一个例外是:类定义转换为bool类型并不罕见。
1
2
|
int i = 42;
cin << i; // this code would be legal if the conversion to bool were not explicit!
|
explicit转换操作符
为了防止前面的问题,新标准引入explicit转换。
1
2
3
4
5
6
7
8
9
|
class SmallInt {
public:
// the compiler won't automatically apply this conversion
explicit operator int() const { return val; }
};
SmallInt si = 3; // ok: the SmallInt constructor is not explicit
si + 3; // error: implicit conversion is required, but operator int is explicit
static_cast<int>(si) + 3; // ok: explicitly request the conversion
|
如果转换操作符是explicit
的,我们只能通过cast来显式转换。一个例外是编译器会在条件测试中应用显式转换:
if
,while
或do while
条件测试
for
的条件表达式
- 逻辑非
!
,逻辑与&&
或逻辑或||
的操作数
- 条件运算符
?:
条件测试
转换为bool类型
当我们在条件测试中使用流对象,我们使用定义在IO类型里面的operator bool转换操作:
1
|
while (std::cin >> value)
|
最佳实践
通常转换为bool是有意用于条件测试的。因此,operator bool通常应该定义为explicit。
避免歧义的转换
有两种方法会发生多个转换路径的情况。第一个就是当2个类提供了相互的转换。第二个就是定义了多个转换,其转换类型之间也可以转换。
警告
通常,类定义相互转换或定义了多个从算术类型或到算术类型的转换是个坏主意。
参数匹配和相互转换
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
struct B;
struct A {
A() = default;
A(const B&); // converts a B to an A
};
struct B {
operator A() const; // also converts a B to an A
};
A f(const A&);
B b;
A a = f(b); // error ambiguous: f(B::operator A())
// or f(A::A(const B&))
A a1 = f(b.operator A()); // ok: use B's conversion operator
A a2 = f(A(b)); // ok: use A's constructor
|
需要注意的是我们不能通过cast来解决这个二义性,因为cast有着一样的歧义。
内置类型的多个转换和歧义
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
struct A {
A(int = 0); // usually a bad idea to have two
A(double); // conversions from arithmetic types
operator int() const; // usually a bad idea to have two
operator double() const; // conversions to arithmetic types
};
void f2(long double);
A a;
f2(a); // error ambiguous: f(A::operator int())
// or f(A::operator double())
long lg;
A a2(lg); // error ambiguous: A::A(int) or A::A(double)
short s = 42;
// promoting short to int is better than converting short to double
A a3(s); // uses A::A(int)
|
注意
当使用2个用户定义的转换时,如果有标准转换,使用标准转换的级别来选择最佳匹配。
转换和操作符:
- 不要定义类之间的相互转换
- 避免定义多个到内置算术类型的转换。
最简单的规则就是:除了显式转换为bool类型外,避免定义转换函数和限制那些看起来对的隐式构造函数。
重载函数和转换构造函数
1
2
3
4
5
6
7
8
9
10
11
12
|
struct C {
C(int);
};
struct D {
D(int);
};
void manip(const C&);
void manip(const D&);
manip(10); // error ambiguous: manip(C(10)) or manip(D(10))
manip(C(10)); // ok: calls manip(const C&)
|
警告
需要频繁地在函数调用中使用构造函数或强制转换来转换参数一个坏设计的表现。
重载函数和用户定义的转换
在重载函数调用中,如果有2个或更多用户定义的转换提供可行的匹配,转换被认为是一样好。
1
2
3
4
5
6
7
|
struct E {
E(double);
};
void manip2(const C&);
void manip2(const E&);
// error ambiguous: two different user-defined conversions could be used
manip2(10); // manip2(C(10) or manip2(E(double(10)))
|
注意
在重载函数调用中,附加的标准转换级别有作用仅当可行函数是同一个用户定义的转换。如果是不同的用户定义的转换,则调用有歧义。
函数匹配和操作符重载
如果a是一个类类型,a sym b表达式可能是:
1
2
|
a.operatorsym(b); // a has operatorsym as a member function
operatorsym(a, b); // operatorsym is an ordinary function
|
注意
在候选函数集中表达式中的操作符可以是成员或非成员函数。
1
2
3
4
5
6
7
8
9
10
11
12
|
class SmallInt {
friend SmallInt operator+(const SmallInt&, const SmallInt&);
public:
SmallInt(int = 0); // conversion from int
operator int() const { return val; } // conversion to int
private:
std::size_t val;
};
SmallInt s1, s2;
SmallInt s3 = s1 + s2; // uses overloaded operator+
int i = s3 + 0; // error: ambiguous
|
警告
既提供了到算术类型的转换,又重载了相应的算术操作符,可能会导致二义性