ObjC 类的加载和初始化(+load 和 +initialize 方法)

2015年7月18日 · 9 years ago

本文译自:https://www.mikeash.com/pyblog/friday-qa-2009-05-22-objective-c-class-loading-and-initialization.html

作为一个程序员,绝大多数时候你都不需要关心一个类是怎么被加载进内存的。这里面 runtime linker 在你的代码还没跑起来之前就已经做了很多复杂的工作。

对于大多类来说,知道这一点就已经相当足够了。但是,有一些类可能需要做一些特殊的准备工作。比如初始化一个全局的表,从 UserDefaults 里面读取配置并缓存起来,又或者做一些其他的准备工作。

ObjC 提供了两种方法来实现这些事情:

+ initialize 
+ load

+load

如果你的类实现了 +load 方法,这个方法就会在类被加载的时候调用。这个调用时机是很早的。如果你是在被其他应用引用的应用(Application)或框架(Framework)里实现了这个方法,它甚至会比 main() 函数还早被触发。如果你是在一个可以被加载的 bundle 里面实现这个方法,那当 bundle 被加载的时候这个方法就会被调用。

因为 +load 方法过早被调用,所以应用起来会有点困难。很多时候有些类是要比别人更早被加载的,这样你无法判断别人是不是早就被调用过 +load 方法了。更糟糕的时候,你的应用中包含的 C++ 静态初始化函数在这个时机点是还没被调用的,如果你在 +load 里面调用了相关的代码,就很有可能会 crash。好消息是你链接的 frameworks 是保证在 +load 调用前就加载过了的,所以在这里使用 framewroks 是安全的。还有父类也是保证完全加载过了,所以使用父类也是没问题的。

+load 这个方法有一个有意思的特性,就是 runtime 会把所有 category 里面实现了 +load 的方法全部调一遍。也就是说如果你在多个 category 里面都实现了 +load 方法,这些方法都会被调用一次。这种设计可能跟你认识到 category 的机制完全相反,不过你要知道 +load 方法不是一个普通的方法。这个特性决定了 +load 是一个干坏事的绝佳场所,比如 swizzling。

+initialize

相比而言,+initialize 方法就要正常的多了,通常也是一个更好的安置代码的地方。+initialize 有意思的地方在于它会很晚才被调用,甚至它有可能完全不会被调用。当一个类被加载的时候,+initialize 不会被调用,当一个消息发送给这个类的时候(译者注:ObjC 的方法调用都是通过 runtime 的消息机制,objc_sendMsg 方法),runtime 就会检查这个方法有没有被调用过,如果没有就调用之。大概可以认为是这样的:

id objc_msgSend(id self, SEL _cmd, …)
{
    if(!self->class->initialized)
        [self->class initialize];
    …send the message…
}

当然真正的实现不会这么简单,还要解决线程安全之类的问题,不过大概就是这么个意思吧。每个类知会调用一次 +initialize 方法,而且只会在这个类收到第一个消息的时候被调用。跟 +load 方法一样,+initialize 会先调用这个类所有的父类,最后才调到自己的 +initialize 方法。

这就使得 +initialize 用起来要比 +load 方法更安全,因为调用时机的环境要安全得多。当然这时候的环境还要取决于第一条消息发送的结果,不过可以保证调用的时机一定比 NSApplicationMain() 要晚。

由于 +initialize 是 lazily run 的,所以这里就不是做注册事件的好地方。比如说,NSValueTransformer 和 NSURLProtocol 就不能用 +initialize 来注册自己,因为这就成了一个先有鸡还是先有蛋的问题。

这个方法适合用来做需要在类被加载后做的事情。由于这个方法运行的时候环境容错性更好,所以你可以使用的方法也就比 +load 自由得多,也因为这个方法是 lazy 调用的,所以你在这个方法中使用的资源就不会事先申请而造成浪费。

+initialize 的使用还有个小伎俩,我上面的伪代码里提到 runtime 会调用:

    [self->class initialize]

这就导致 ObjC 做 selector 实现的检查,如果当前类没有实现这个方法,那么父类的方法就会被调用。不只在伪代码里,实际上也是这样的。所以,你的 +initialize 就得写成下面这样:

+ (void)initialize
{
    if(self == [WhateverClass class])
    {
        …perform initialization…
    }
}

如果没有做这个检查,如果你有没实现 +initialize 的子类,你的代码就会被调用两次。就算你没有任何子类,Apple 的 KVO 也会动态创建没有实现 +initialize 的子类。

结论

ObjC 提供了两种自动运行类初始化代码的方法。+load 方法保证了会在 class 被加载的时候调用,这个时机很早,所以对于需要很早被执行的代码来说是很有用的。但是在这个时机跑的代码也可以是很危险的,毕竟这个时候的环境比较恶劣。

由于 +initialize 方法是 lazy 触发的,所以对于初始化设置的环境就要友好得多。只要不是在类接收第一条消息之前一定要做的事情,都可以在这个方法里面做。