C++ new与delete
思考由来:关于c++内delete[]原理的探索
1.地址、字节、位
-
位(bit)是电子计算机中最小的数据单位。每一位的状态只能是0或1。
-
字节(Byte)是用于计量存储容量的一种单位,每一个字节由8位组成(1Byte = 8bit)。
-
地址可以理解为在一片内存中,每个字节(Byte)的编号。
他们在内存中的关系可以比作,内存是一栋大楼,字节(Byte)是大楼中的每一层,地址是楼层编号,位(bit)是每一层中的房间,每一层有8个房间。
2.变量的内存
编译器根据变量的类型,在内存中申请一块空间。例如32位与64位中 int 类型申请到4字节的空间,可理解为编译器申请了4层楼,作为”办公区域“。
3.指针变量
指针是指程序数据在内存中的地址。在C++语言当中,允许用一个变量来存放指针,这种变量称为指针变量。
1 int a; |
以上程序中,”&“操作符取出了变量 a 在内存空间中的首地址,而后通过 “ * ” 操作符取出首地址所在内存空间的数据。
前面我们提到,存储变量的内存,是由多个字节组成。而指针变量在只知道首地址(第一个字节的地址)的情况下,就能找到a的内存区域。它是怎么做到的?先来看看指针变量的声明。
我们在声明一个指针变量的时候,会根据它将要指向的变量类型,声明对应的类型,例如:
1 int a; |
不管是什么类型的指针变量,所存的值都是地址(int类型的值)。
那么声明不同类型的作用是什么?答案是规定指针在内存中每次移动的字节数。
例如定义int *pa = &a
,取值时,int
类型占4个字节,指针就从首地址开始移动,读取4个字节。同理,short
类型占2字节,指针就移动2字节。通过声明指针类型,告诉指针每次移动多少字节,来获取变量的值。
4.值相同的两个指针所指向的变量的值可以不同
“值相同的两个指针变量”,意思是两个指针变量指向同一个首地址。但是如果指针变量的类型不同,因为指针移动的字节数量不同,就可能读取出不同的数据。
要实现不同类型指针变量指向同一个地址,需要使用指针类型转换。
#include <iostream> |
以上例子将一个每次移动读取2字节的 short 类型指针变量,转化为一个每次读取4字节的int型指针变量。因此很显然,p1能读取到正确的结果,而p2会多读取两个字节的数据,最终算出来的数据错误。
接下来,我们通过指针类型转换,用同一个首地址,取出不同的值。
1#include <iostream> |
对应结果为:
p1指向:000000000062FE30
p2指向:000000000062FE30
p1取出:1
p2取出:65537
根据二进制转换得,10000000000000001
为 65537。由此可验证强制转换前指针读取2字节,转化后读取4字节。两个指针指向的首地址相同,但是读出了不同的结果。
5. 关于c++内delete[]原理的探索
本文转载自重庆大学于卓浩同学写的文章:(https://puluter.cn/20200331/delete/)
在面向对象编程中,我们经常会用到这样的动态分配数组:
Person* a = new Person[100]; |
在上述申请数组的过程中,我们使用到了new []
这个表达式来完成,它会调用类的构造函数初始化这个数组的所有对象,有多少对象,就会执行多少次构造函数。如果我们用完了这个数组,想要释放空间,就需要调用:
delete[] a; |
在这个过程中,我们使用了delete[]
操作符来完成对象释放。
但是两个问题出现了:
- 如何知道a数组的内存空间大小?
- 如何知道要调用几次析构函数(a数组的元素个数)?
显然,想要知道数组有多长,我们必然要存下这个数组的长度。C++中也正是这么做的。本文讨论具体工作原理。
5.1. 结合代码的分析
注:本文适用于64位mingw。在32位mingw下后文内8字节应为4字节,long long应为int。 |
---|
我们先定义一个自定义的类。
class Yu { |
同时,在main中声明一个长度为len
(20194134)的Yu
类型的数组,再获取该数组开头的地址并打印。
const long long len = 20194134; |
输出为:Address for the Array: 0x2670048
理论上,20194134个Yu对象,总共需要 20194134 x sizeof(Yu) = 80776536字节的空间。实际申请的堆(自由内存区)空间稍有出入,我们可以通过重载new [ ]操作符来研究。
我们重载new[]
了操作符:
void* operator new[](size_t sz){ |
在这个过程中,我们打印四个关键数值:
- 数组的长度(len)
new[]
过程中实际申请的内存空间大小(sz)- 数组理论上需要的内存空间 (数组长度 x sizeof(Yu) = len x 4 )
- 实际空间与理论空间的差 ( sz - len x 4)
上述程序的执行结果为:
|Length: 20194134 |
这里会发现,编译器传递给new [ ]操作符的空间大小比实际需要多8个字节。而8个字节,恰好是一个long long
变量的大小,实践中,这8个字节用于存储动态数组的元素个数。
为了弄清楚这8个字节的具体位置,我们重载了delete [ ]函数:
void operator delete[](void *o){ |
int main(){ |
最后几行的输出为:
Address for the Array: 0x2670048 |
成了!我们发现,解构时得到的地址(0x2670040)恰好是数组的地址(0x2670048)减8。
即:0x2670048 = 0x2670040 + 8
接下来,我们更进一步,取出数组地址-8
对应地址的一个long long
变量,看一下它的值会是什么.
接下来获取该数组前的8字节,识别为long long
并打印。
int main(){ |
输出为:
Address for the Array: 0x2670048 |
代码给出的结果证明了前述的猜想:自定义类数组前的8个字节,是一个long long类型的变量,储存了该数组的长度。
5.2. 结论
我们以Yu\* a = new Yu\[2\]
为例进行说明。表面上,我们需要sizeof(Yu) x 2
共8个字节的空间,但事实上,new [ ]操作符会从堆里申请8 + 8 = 16个字节的空间。其中,前8个字节用于存储数组的元素个数,后续空间用于存放数组元素。具体到本例,变量a得到的是数组首元素的地址,它事实上等于真实的堆空间地址 + 8!
当delete [ ]a被执行时:
delete []
操作符会把a值 - 8,获得真实的堆空间首地址;- 从堆空间首地址获得数组的元素个数(本例为2);
- 依据元素个数及a值逐个执行全部数组元素的析构函数;
- 最后,以堆空间首地址为依据,通过free( )函数向操作系统归还堆空间。
本例中,如果执行delete a
而不是delete []a
,可能导致两个后果:
- 仅有数组的首元素被正确析构;
- 释放堆空间时向操作系统提供的地址是不正确的,后果未知。
正是基于上述理由,书里反复强调,new/delete, new [] /delete []
要配对使用。
5.3. 完整实验代码
|
完整输出:
Size of long long: 8 |