在操作系统中我们学过进程和线程的区别,比较官方的话讲就是进程是操作系统分配资源的最小单位,而线程是操作系统调度的最小单位。线程附属于进程上,一个进程也最少要包含一个线程,进程与进程之间是相互独立的,但是一个进程的各个线程是共享进程资源的。
如果我们想要给每个线程维护私有数据,则有两种实现方式
第一种方式有个明显的弊端,就是多线程共享问题,多线程同时访问变量表时如何保证同步,如何尽量减少同步所带来的性能损耗都是需要考虑的问题。第二种方式由于是每个线程的私有变量表都是独立的,所以不存在同步问题。我们今天的主角ThreadLocal也正是通过第二种方式实现的
创建ThreadLocal,ThreadLocal支持泛型,所以可以创建任何对象的ThreadLocal。创建ThreadLocal有两种方式,一种就是直接 new 一个ThreadLocal对象,另一个种则是调用静态方法 withInitial
// 第一种方式
ThreadLocal<String> local1 = new ThreadLocal<>();
// 第二种方式
ThreadLocal<String> local2 = ThreadLocal.withInitial(new Supplier<String>() {
@Override
public String get() {
return "initial value2";
}
});
复制代码
从名字我们也可以才到,withInitial为ThreadLocal提供了一个初始值,当我们分别打印出local1和local2的值时,第一个是null,第二个则是初始值initial value2
除了withInitial方法外,还有一个方法可以设置ThreadLocal的初始值,就是匿名内部类
ThreadLocal<String> local1 = new ThreadLocal<String>(){
@Override
protected String initialValue() {
return "initial value1";
}
};
复制代码
三个方法set,get,remove。ThreadLocal对外的方法只有这三个,从名字也容易知道这三个方法的含义
ThreadLocal<String> local = new ThreadLocal<>();
System.out.println(local.get()); // null
local.set("111");
System.out.println(local.get()); // 111
local.set("222");
System.out.println(local.get()); // 222
local.remove();
System.out.println(local.get()); // null
复制代码
ThreadLocal有哪些使用场景呢,在ThreadLocal源码注释里有一个简单的例子
public class ThreadId {
// Atomic integer containing the next thread ID to be assigned
private static final AtomicInteger nextId = new AtomicInteger(0);
// Thread local variable containing each thread's ID
private static final ThreadLocal<Integer> threadId =
new ThreadLocal<Integer>() {
@Override
protected Integer initialValue() {
return nextId.getAndIncrement();
}
};
// Returns the current thread's unique ID, assigning it if necessary
public static int get() {
return threadId.get();
}
public static void main(String[] args) {
for (int i = 0; i < 10; i++) {
new Thread(new Runnable() {
@Override
public void run() {
System.out.println(ThreadId.get());
}
}).start();
}
}
}
复制代码
按照正常我们的理解,threadId是静态变量,静态变量是属于类的,跟new出来的对象是无关的,但是运行结果如下
说明每个线程去调用ThreadId的get方法的时候获取到的值都是不同的。ThreadLocal在Android中也有非常重要的应用,Android的Handler机制中的Looper就是保存的ThreadLocal中。
ThreadLocal对外的方法只有三个:set,get和remove。所以我们可以从这三个方法入手研究下其实现原理。
public void set(T value) {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
}
ThreadLocalMap getMap(Thread t) {
return t.threadLocals;
}
void createMap(Thread t, T firstValue) {
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
复制代码
在Thread类中有一个threadLocals变量,初始值为null,在第一次调用ThreadLocal的set或者get方法时,会创建一个ThreadLocalMap对象并赋值给threadLocals,ThreadLocalMap我们可以把它暂时当做HashMap,可以保存key-value,后面会细讲ThreadLocalMap的实现。
public T get() {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null) {
ThreadLocalMap.Entry e = map.getEntry(this);
if (e != null) {
@SuppressWarnings("unchecked")
T result = (T)e.value;
return result;
}
}
return setInitialValue();
}
private T setInitialValue() {
T value = initialValue();
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
return value;
}
复制代码
通过查看get的源码我们就可以知道为什么之前的例子里每个线程调用ThreadId的get方法会获取到不同的id。因为调用get的时候map为null,所以最后会走到initialValue方法。
public void remove() {
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null)
m.remove(this);
}
复制代码
这个方法很简单,就是调用了ThreadLocalMap的remove方法而已。
ThreadLocalMap是一种自定义的散列表,与我们常用的HashMap相似但是也有些不同,ThreadLocalMap并没有实现Map接口,而且它的key只能是ThreadLocal对象。如果熟悉HashMap的源码实现的话很容易理解ThreadLocalMap原理,我之前写过HashMap源码解析,不熟悉的同学可以看一下。
static class Entry extends WeakReference<ThreadLocal<?>> {
/** The value associated with this ThreadLocal. */
Object value;
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
}
复制代码
Entry类是WeakReference的子类,弱引用是Java四种引用之一,弱引用指向的内存只能存活到下次GC前。关于为什么要使用弱引用作为Map的key我们放到最后讲,Entry还包含一个Object类型的value,这个value就是我们实际保存的值。
ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
table = new Entry[INITIAL_CAPACITY];
int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
table[i] = new Entry(firstKey, firstValue);
size = 1;
setThreshold(INITIAL_CAPACITY);
}
复制代码
这个构造函数有两个参数,表示Map中第一个Entry的key和value,在之前的分析中我们知道,当ThreadLocal第一次调用get或者set方法时会触发createMap方法,createMap就是调用的这个构造函数。 table是一个Entry数组,首先初始化了这个数组,默认数组大小为INITIAL_CAPACITY=16。然后就是计算数组下标,这里的firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1)就是取threadLocalHashCode的二进制的前四位,算法和HashMap中一致就不在这里多讲。这里的关键点是threadLocalHashCode是如何计算的
private static final int HASH_INCREMENT = 0x61c88647;
private static AtomicInteger nextHashCode = new AtomicInteger();
private static int nextHashCode() {
return nextHashCode.getAndAdd(HASH_INCREMENT);
}
private final int threadLocalHashCode = nextHashCode();
复制代码
这段代码与我们开头的例子非常相似,只不过那个例子中的id是连续的,这里生成hashcode用到了一个魔数0x61c88647,网上查资料得知这个magic number可以使得生成的hashcode更加均匀。
回到之前的构造函数,在计算出数组下标index后,就新建一个Entry类放在table[index]处,最后设置了size和threshold。size就是这个map的大小,threshold和HashMap中的一样,表示触发resize的阈值,看下setThreshold
private void setThreshold(int len) {
threshold = len * 2 / 3;
}
复制代码
ThreadLocalMap的负载因子是写死的,固定为2/3,也就是当ThreadLocalMap中的元素个数超过总容量的2/3时,就会触发resize
private void set(ThreadLocal<?> key, Object value) {
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
ThreadLocal<?> k = e.get();
if (k == key) {
e.value = value;
return;
}
if (k == null) {
replaceStaleEntry(key, value, i);
return;
}
}
tab[i] = new Entry(key, value);
int sz = ++size;
if (!cleanSomeSlots(i, sz) && sz >= threshold)
rehash();
}
private static int nextIndex(int i, int len) {
return ((i + 1 < len) ? i + 1 : 0);
}
复制代码
上面描述了set的主流程,从上面代码我们知道在ThreadLocalMap发生hash冲突的时候,ThreadLocalMap所做的是顺序查找下一个可用的位置,这种解决hash冲突的方法叫做线性嗅探,与HashMap相比,这确实是个简陋的方式,好处在于不需要额外的空间。
set除了赋值外还做了一些额外的操作,这些操作主要是为了找到过期的entry然后清理掉它们。这些方法同样非常重要,下面我们分别研究下这些方法
private void replaceStaleEntry(ThreadLocal<?> key, Object value,
int staleSlot) {
Entry[] tab = table;
int len = tab.length;
Entry e;
int slotToExpunge = staleSlot;
// 向前遍历,找出第一个过期的entry
for (int i = prevIndex(staleSlot, len);
(e = tab[i]) != null;
i = prevIndex(i, len))
if (e.get() == null)
slotToExpunge = i;
for (int i = nextIndex(staleSlot, len);
(e = tab[i]) != null;
i = nextIndex(i, len)) {
ThreadLocal<?> k = e.get();
// 找到了匹配的key
if (k == key) {
e.value = value;
// 交换i和staleSlot的位置
tab[i] = tab[staleSlot];
tab[staleSlot] = e;
// 交换位置后,i处已经是过期的entry了,所以如果向前遍历没找到过期的entry,就把slotToExpunge指向i的位置
if (slotToExpunge == staleSlot)
slotToExpunge = i;
cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
return;
}
if (k == null && slotToExpunge == staleSlot)
slotToExpunge = i;
}
// If key not found, put new entry in stale slot
tab[staleSlot].value = null;
tab[staleSlot] = new Entry(key, value);
// If there are any other stale entries in run, expunge them
if (slotToExpunge != staleSlot)
cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
}
复制代码
这个方法的名字很好的诠释了它的作用:替换掉过期的Entry。从调用语境我们知道,在set方法中,只有entry不为null并且entry的key为null才会执行到这个方法,entry的key为null说明key已经被GC回收了,entry中保存的value对外再也访问不到了,所以这个entry是一个过期的entry。除了替换过期的entry,这个方法还有个功能就是监测是否存在其它过期的entry,如果有就会触发cleanSomeSlot方法,slotToExpunge就是保存着clean方法的开始位置,下面是这个方法的主要逻辑
private int expungeStaleEntry(int staleSlot) {
Entry[] tab = table;
int len = tab.length;
// expunge entry at staleSlot
tab[staleSlot].value = null;
tab[staleSlot] = null;
size--;
// Rehash until we encounter null
Entry e;
int i;
for (i = nextIndex(staleSlot, len);
(e = tab[i]) != null;
i = nextIndex(i, len)) {
ThreadLocal<?> k = e.get();
if (k == null) {
e.value = null;
tab[i] = null;
size--;
} else {
int h = k.threadLocalHashCode & (len - 1);
if (h != i) {
tab[i] = null;
// Unlike Knuth 6.4 Algorithm R, we must scan until
// null because multiple entries could have been stale.
while (tab[h] != null)
h = nextIndex(h, len);
tab[h] = e;
}
}
}
return i;
}
复制代码
这个方法的参数staleSlot就是replaceStaleEntry方法中我们一直在记录的slotToExpunge,这个方法主要做了两件事,第一就是把table数组中key为null的位置清空,第二就是重新排列entry的位置。因为在清空的过程中会有一些位置空余出来,之前发生hash冲突导致位置偏移的entry有可能现在没有冲突了,所以要进行重新排列。这个方法还有一个返回值,返回的是从staleSlot开始下一个entry == null的位置。
private boolean cleanSomeSlots(int i, int n) {
boolean removed = false;
Entry[] tab = table;
int len = tab.length;
do {
i = nextIndex(i, len);
Entry e = tab[i];
if (e != null && e.get() == null) {
n = len;
removed = true;
i = expungeStaleEntry(i);
}
} while ( (n >>>= 1) != 0);
return removed;
}
复制代码
重新看下set和replaceStaleEntry方法,发现cleanSomeSlots在那两个方法中都有调用,不过参数是有区别的。
无论上面那种情况,i处的entry一定不是过期的entry。这个方法很有意思,它并没有进行一次全量遍历清理,而是向后遍历的log2(n)个元素,如果这几个元素都没有问题,就不执行清理。反之,如果有一个元素是过期的entry,就重置循环条件,同时执行一次局部清理
private Entry getEntry(ThreadLocal<?> key) {
int i = key.threadLocalHashCode & (table.length - 1);
Entry e = table[i];
if (e != null && e.get() == key)
return e;
else
return getEntryAfterMiss(key, i, e);
}
private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
Entry[] tab = table;
int len = tab.length;
while (e != null) {
ThreadLocal<?> k = e.get();
if (k == key)
return e;
if (k == null)
expungeStaleEntry(i);
else
i = nextIndex(i, len);
e = tab[i];
}
return null;
}
复制代码
分析完set方法的逻辑,get就相对比较简单了
private void remove(ThreadLocal<?> key) {
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
if (e.get() == key) {
e.clear();
expungeStaleEntry(i);
return;
}
}
}
复制代码
remove方法和get方法的流程都是一样的,都是查找对应的entry,只不过get命中后会将结果返回,remove方法命中后会把entry的key和value都清空
private void rehash() {
expungeStaleEntries();
// Use lower threshold for doubling to avoid hysteresis
if (size >= threshold - threshold / 4)
resize();
}
private void expungeStaleEntries() {
Entry[] tab = table;
int len = tab.length;
for (int j = 0; j < len; j++) {
Entry e = tab[j];
if (e != null && e.get() == null)
expungeStaleEntry(j);
}
}
private void resize() {
Entry[] oldTab = table;
int oldLen = oldTab.length;
// 容量扩充为原来的2倍
int newLen = oldLen * 2;
Entry[] newTab = new Entry[newLen];
int count = 0;
for (int j = 0; j < oldLen; ++j) {
Entry e = oldTab[j];
if (e != null) {
ThreadLocal<?> k = e.get();
if (k == null) {
e.value = null; // Help the GC
} else {
// 重新计算位置
int h = k.threadLocalHashCode & (newLen - 1);
while (newTab[h] != null)
h = nextIndex(h, newLen);
newTab[h] = e;
count++;
}
}
}
setThreshold(newLen);
size = count;
table = newTab;
}
复制代码
在ThreadLocalMap的size大于threshold时,就会执行rehash。rehash做了两件事,expungeStaleEntries方法的作用是全量清理,如果清理后的ThreadLocalMap的size依然大于threshold的75%,就会执行resize。 ThreadLocalMap的resize方法和HashMap中的resize还是比较像的,都是扩充为原来的2倍,但是ThreadLocalMap并没有给容量设置上限,可能也是出于正常情况下的ThreadLocalMap的size不可能那么大的想法考虑的。容量扩大2倍必然要对table进行重排序。遍历oldTab,然后根据 k.threadLocalHashCode & (newLen - 1)重新计算位置,最后重新设置size和threshold。
ThreadLocal的源码分析已全部完成,原理并不复杂只是细节比较多,最后放一张图片帮助大家更好的理解吧
这个问题可以用下图解释
当给当前线程添加ThreadLocal的值的时候,有两条引用指向ThreadLocal,第一个是创建返回的ThreadLocal强引用ThreadLocalRef,另一个就是ThreadLocalMap的key是弱引用。我们在线程中正常使用都是用的强引用ThreadLocalRef,当ThreadLocalRef不再使用后,即ThreadLocalRef==null,这时候GC应该回收ThreadLocal所占的空间,回收的时候发现弱引用key依然指向ThreadLocal,但是这并影响GC回收ThreadLocal。我们假设key是强引用,那即便ThreadLocalRef==null的时候,仍然有key这个强引用指向ThreadLocal,ThreadLocal就不会被回收导致内存泄露
首先我们要搞清楚为什么会内存泄露,从问题1我们知道,在ThreadLocalMap中key是弱引用指向ThreadLocal,所以ThreadLocal在不使用后会被GC回收,但是Entry中的value是强引用,如果没有触发ThreadLocalMap的清理操作,这个value会一直存在到线程结束。这个问题在Android中尤为明显,因为Android的主线程会一直持续到应用退出,所以会造成长时间的内存泄露。 有兴趣的可以用下面的类做下测试
public class TestTLObject {
private static final String TAG = TestTLObject.class.getSimpleName();
public int[] arr = new int[1024 * 1024 * 10];
@Override
protected void finalize() throws Throwable {
super.finalize();
Log.e(TAG, " 垃圾收集执行");
}
}
ThreadLocal<TestTLObject> threadLocal = new ThreadLocal<>();
threadLocal.set(new TestTLObject());
// threadLocal.remove();
threadLocal = null;
复制代码