在iOS4出来后,苹果公司在OC中推出了block机制(也许更早就有了)。并且在后续的版本中大量的推广和使用了这项技术,比如对视图动画API的改版,比如GCD技术等等。block技术并不是什么新技术,他的本质就是闭包功能在iOS上的实现而已。而闭包功能在其他很多语言中都有实现,比如JAVA中接口的匿名实现。用闭包可以解决那些执行逻辑和上下文环境解耦的场景,如果从设计模式的角度来考虑的话闭包就是一种策略模式(Strategy)的实现。
本文并不探讨如何应用block,而是探讨OC的block机制是如何实现的。从代码的角度来说block的出现和我们平时基于函数和类方法的编程方式不太一致,有时候甚至不好去理解,因为他可以在我们的代码块中定义代码块,而且新定义的代码块又不会按函数内的指令顺序去执行。我们可以大胆的设想,如果是要你去实现一套block机制,你会怎么去做?这也是本文要探讨的东西,只有你知道了OC实现block的内幕,你才能够更好的利用他。
写这篇文章来分析原理时我隐去了一些细节,而且有些结构体的定义也和真实的有差异,但是总体是正确的,目的是为了更好的了解到本质的东西。我们先来看下面一段含有block的OC代码:
1 | //文件test.m |
上面的代码片段中,我们分别定义了:
- 不带修饰符的基本类型变量a
- 带
__block
修饰符的block变量b和blockStr - 默认带
__strong
修饰符的变量strongStr - 带
__weak
修饰符的变量weakStr
这些修饰符关键字的使用会对block块内的代码在运行时产生不同的影响。就上面的代码片段而言当我们在编译时,编译器到底做了什么处理?如果能够了解到编译器的编译过程,那么对我们掌握其实现机制就非常有帮助。幸好我们可以借助命令来看到这个中间的过程,您可以打开终端控制台,并到test.m文件所在的路径下执行如下的命令:
clang -rewrite-objc test.m
clang
这个命令会在相同目录下产生一个test.cpp
的文件。这个文件是OC代码的C++实现版本,因为我们知道C++是不支持闭包技术的,因此您可以通过查看test.cpp这个文件来了解到OC中的闭包技术到底是如何用函数和结构体来实现的。(注意上面的命令执行时会报错,提示不支持__weak
类型的定义,我目前没有找到解决方法,暂时是把__weak
修饰符去掉)。我们可以先来看看test.cpp的部分实现:
1 | struct __Block_byref_b_0 { |
上面的代码对于某些同学来说也许太过晦涩了! 不过没有关系, 我把上面的代码进行简化和处理, 并去掉了一些次要的东西, 然后简化为如下的代码:
1 | // 每个block变量都会生成一个和OC类内存结构兼容的结构体。下面是_block int b 的结构体定义: |
先看函数test内的实现部分,我们发现所有带 __block
修饰符的变量的定义由:
1 | __block int b = 20; |
变为了:
1 | Block_b b = {nil, &b, 0, sizeof(struct Block_b), 20}; |
也就是说所有定义为__block
类型的变量,在编译时都会变为一个个block对象变量。在编译时系统会为每个带__block
修饰的变量生成一个和OC类内存结构兼容的结构体:
1 | // 每个block变量都会生成一个和OC类内存结构兼容的结构体。下面是__block int b 的结构体定义: |
上面的两个结构体都有固定的格式,而且也和OC类的内存结构匹配。也就是说当定义__block
修饰的变量时,系统会把他转化为一个OC对象。 为什么要把__block
定义的变量转变为OC对象呢?这个是和__block
这个关键字所表达的意思是一致的,也就是定义为__block
类型的变量是不会在block代码块内产生副本的,而是保持唯一性。每个block对象变量的isa都固定设置为nil; 而forwarding则是指向真正操作的block对象变量,如果某个block对象变量只是在一个栈block对象里面被使用则这时候forwarding是指向block对象变量自己,而如果这个block对象变量在一个堆block对象里面被使用则这时候forwarding则是指向一个堆block对象变量的地址。
再来看test函数中的block块的定义部分。从代码中可以发现原先在代码中定义的block块,被拆分为了block对象和全局函数两部分来实现。因此可以看出在iOS内所有定义的block代码块系统在编译时都会转化为个OC对象(NSBlock类是用来描述block代码块的OC类,系统一共支持栈block:NSStackBlock,堆block:NSMallocBlock,全局block:NSGlobalBlock三种类型的block。具体的细节和差异不在本文展开,请大家自行查找相关的资料)。因此在编译时我们会为每个block代码块都生成一个和OC类兼容的结构体,在我们的例子里面的结构体定义如下:
1 | //每个block块都会生成一个和OC类兼容的结构体。 |
可以看出我们定义的block代码块都会生成2个结构体:
Block_testBlock
用来保存block的信息以及block内部要用到的所有数据。所有block对象结构体的前5个数据成员都是一致的,也就是和OC类的内存结构是兼容的。其中的isa用来保存block的类信息,这里面的类信息会根据block所处的位置的不同而不同。而后面的5个数据成员就是在block代码块内使用外部对象的副本。正是因为每个block对象在编译时保存了代码块内使用代码块外的对象的副本,所以我们才能在后续代码执行时能够访问到这些信息。Block_testBlock_Desc
用来描述这个block的size以及block方法的参数的签名信息。
下面就是Block_testBlock 实例的构造方法:
1 | //每个在代码中的block块都会生成对应的OC block对象,这里面构造函数初始化这个block对象。 |
上面可以看出,一旦在代码中出现了block代码块,编译时就会建立一个block对象,然后将block对象关联的函数代码地址、以及使用的外面的数据作为block对象的构造函数的参数来创建这个block对象。
最后我们再来考察block代码的全局函数的实现:
1 | //这部分是block代码函数体的定义部分,可以看见函数默认增加一个隐藏的__cself参数。 |
上面的代码片段中,可以看出block块全局函数除了定义的int类型参数外,还增加了一个隐藏的参数__cself用来指向block对象。然后在函数体的开始位置把使用的外部数据的副本还原到函数的栈内。这也是为什么我们能在block代码块内用到外面的数据的原因了。这里我们需要进一步考察这几个副本的意义:
- 对于基本类型a的副本来说就是完全的内存拷贝,因此在block代码块内更新这些数据是不会影响到外面,同时外面的更新也不会影响到里面了。
- 对于对象类型的strongStr和weakStr而言这个副本只是指针的拷贝而不是所指对象的拷贝,因此在block代码块内能够读取最新的属性和设置新的属性值。
- 对于
__block
类型的对象来说,你会发现他也是指针的拷贝,所以也不会产生多份内存副本,同时可以看出对__block
类型数据的读取和设置我们都是间接来完成的,因此这里代码块内更新数据能影响外面,同时外面的更新也能影响里面。
好了,所有我要介绍的内容就到这里了,上面就是iOS的block的内部实现机制。我相信通过我上面的介绍能够让你了解到了block在编译时所做的事情,以及能够了解到__block
, __weak
, __strong
各种修饰符的意义和差别。