生产者/消费者模型相信各位都不陌生,是一种很常见的分布式资源调度模型。在这个模型中,至少有两个对象:生产者和消费者。生产者只负责创建资源,消费者只负责使用资源。如果自己实现一个简单的生产者/消费者模型也很容易,无非就是通过一个队列来做,但是这种方式有很多隐藏的缺陷:
所以Java已经提前为我们封装好了接口和实现,接下来我们就要针对BlockingQueue接口和它的常用的实现类LinkedBlockingQueue进行简要的分析
BlockingQueue,含义为阻塞队列,我们可以从类定义看出,其继承了Queue接口,所以可以当作队列来使用:
既然叫做阻塞队列,也就是说这个队列的操作是以阻塞方式进行的,体现在如下两个方面:
通过这种方式,可以方便地协调生产者和消费者之间的关系
在BlockingQueue中,定义了以下6个接口:
public interface BlockingQueue<E> extends Queue<E> {
boolean add(E e);
boolean offer(E e);
void put(E e) throws InterruptedException;
boolean offer(E e, long timeout, TimeUnit unit) throws InterruptedException;
E take() throws InterruptedException;
E poll(long timeout, TimeUnit unit) throws InterruptedException;
int remainingCapacity();
boolean remove(Object o);
public boolean contains(Object o);
int drainTo(Collection<? super E> c);
int drainTo(Collection<? super E> c, int maxElements);
}
复制代码
这些接口方法按功能可以分为三类:
一般地,我们也将添加元素叫做 put 操作(即使使用的是 offer 方法而不是 put 方法),移除元素的叫做 take 操作
对于前两类,可以按照异常处理方式再次分为以下几类:
这几种处理方式我就不多解释了,字面意义已经很显然了
JDK8提供了以下BlockQueue的实现类:
我们常用的基本有以下几种:
其余的实现感兴趣的可以自行了解,我们这里就以LinkedBlockingQueue为例,介绍一下Java是如何实现阻塞队列的
除了BlockingQueue提供的接口方法之外,LinkedBlockingQueue还提供了一个方法 peek ,用于获取队首节点
至此,我们常用的阻塞队列方法都已说明完毕,这里用一张表来总结一下:
| 方法/处理方式 | 抛出异常 | 返回特殊值 | 阻塞 | 超时退出 |
|---|---|---|---|---|
| 插入元素 | add(e) | offer(e) | put(e) | offer(e, timeout, unit) |
| 移除元素 | remove() | poll() | take() | poll(timeout, unit) |
| 获取元素 | element() | peek() | / | / |
其中 element 方法和 peek 方法功能是相同的
BlockingQueue仅仅定义了接口规范,真正的实现还是由具体的实现类来完成,我们暂且略过中间的AbstractQueue,直接来研究LinkedBlockingQueue,其中定义了几个重要的域对象:
/** 元素个数 */
private final AtomicInteger count = new AtomicInteger();
/** 队首节点 */
transient Node<E> head;
/** 队尾节点 */
private transient Node<E> last;
/** take、poll等方法持有的锁,这里叫做take锁或出锁 */
private final ReentrantLock takeLock = new ReentrantLock();
/** take方法的等待队列 */
private final Condition notEmpty = takeLock.newCondition();
/** put、offer等方法持有的锁,这里叫做put锁或入锁 */
private final ReentrantLock putLock = new ReentrantLock();
/** put方法的等待队列 */
private final Condition notFull = putLock.newCondition();
复制代码
Node节点就是普通的队列节点,和LinkedList一样,我们主要关注后面的4个域对象,可以分为两类:用于插入元素的,和用于移除元素的。其中每类都有两个属性: ReentranLock 和 Condition 。其中 ReentranLock 是基于AQS实现的一个可重入锁(不理解可重入概念的可以当作普通的锁), Condition 是一个等待/通知模式的具体实现(可以理解为一种提供了功能更强大的 wait 和 notify 的类)
count 属性自然不用说, head 和 last 很显然是用于维护存储元素的队列,相信也不用细说了。阻塞队列和普通队列的区分点是在于后面的 ReentrantLock 和 Condition 类型的四个属性,关于这四个属性的意义,在接下来的几个模块会进行深入的分析
不过我们为了接下来讲解方便,先来简单介绍一下 Condition 这个类。实际上, Condition 是一个接口,具体的实现类是在AQS中。对于本篇文章来说,你只需要清楚3个方法: await() 、 signal() ,还有 singalAll() 。这三个方法完全就可以类比 wait() 、 notify() 和 notifyAll() ,它们之间的区别可以模糊地理解为, wait/notify 这些方法管理的是 对象锁和类锁 ,它们操控的是等待这些锁的线程队列;而 await/signal 这些方法管理的是 基于AQS的锁 ,操控的自然也是AQS中的线程等待队列
所以这里的 notEmpty 维护了等待 take锁 的线程队列, notFull 维护了等待 put锁 的线程队列。从字面意义上也很好理解, notEmpty 表示“队列还没空”,所以可以取元素,同理, notFull 就表示“队列还没满”,可以往里插入元素
先来看 offer(e) 方法,源码如下:
public boolean offer(E e) {
if (e == null) throw new NullPointerException();
final AtomicInteger count = this.count;
// 如果容量达到上限会返回false
if (count.get() == capacity)
return false;
int c = -1;
Node<E> node = new Node<E>(e);
final ReentrantLock putLock = this.putLock;
// 获取put锁
putLock.lock();
try {
if (count.get() < capacity) {
// 入队并自增元素个数
enqueue(node);
// 注意,这里c返回的是增加前的值
c = count.getAndIncrement();
// 如果容量没到上限,就唤醒一个put操作
if (c + 1 < capacity)
notFull.signal();
}
} finally {
// 解锁
putLock.unlock();
}
if (c == 0)
// 如果队列之前为空,会唤醒一个take操作
signalNotEmpty();
return c >= 0;
}
复制代码
这个方法大部分操作都很好理解,当添加元素的操作不允许时, offer 方法会给用户返回 false ,类似于非阻塞的通信方式。 offer 方法的线程安全性是通过 put锁 来保证的
这里有一个很有意思的地方,我们看最后判断如果 c == 0 ,那么就会唤醒一个 take 操作。可能很多人疑惑这里为什么要加一条判断,是这样的,整个方法中, c 的初值是 -1 ,修改其值的唯一地方就是 c = count.getAndIncrement() 这条语句。也就是说,如果判定 c == 0 ,那么这条语句的返回值就是 0 ,即在插入元素之前,队列是空的。所以,如果一开始队列为空,当插入第一个元素之后,会立刻唤醒一个 take 操作
至此,整个方法流程可以归纳为:
put锁 count put take
趁热打铁,我们接着来看带有超时机制的 offer 方法:
public boolean offer(E e, long timeout, TimeUnit unit) throws InterruptedException {
if (e == null) throw new NullPointerException();
long nanos = unit.toNanos(timeout);
int c = -1;
final ReentrantLock putLock = this.putLock;
final AtomicInteger count = this.count;
// 可被中断地获取put锁
putLock.lockInterruptibly();
try {
// 重复执行while循环体,直到队列不满,或到了超时时间
while (count.get() == capacity) {
// 到了超时时间后就返回false
if (nanos <= 0)
return false;
// 会将当前线程添加到notFull等待队列中,
// 返回的是剩余可用的等待时间
nanos = notFull.awaitNanos(nanos);
}
enqueue(new Node<E>(e));
c = count.getAndIncrement();
if (c + 1 < capacity)
notFull.signal();
} finally {
putLock.unlock();
}
if (c == 0)
signalNotEmpty();
return true;
}
复制代码
整个方法大体上和 offer(e) 方法相同,不同的点有两处:
putLock.lockInterruptibly() notFull.awaitNanos(nanos) 操作来将当前线程添加到 notFull 等待队列中(等待 put 操作的执行) 其余部分和 offer(e) 完全一致,在这里就不赘述了
add 方法与 offer 方法相比,当操作不允许时,会抛出异常而不是返回一个特殊值,如下:
public boolean add(E e) {
if (offer(e))
return true;
else
throw new IllegalStateException("Queue full");
}
复制代码
单纯地就是对 offer(e) 做了二次封装,没什么好说的,需要提一点的就是这个方法的实现是在 AbstractQueue 中
put(e) 方法当操作不允许时会阻塞线程,我们来看其是如何实现的:
public void put(E e) throws InterruptedException {
if (e == null) throw new NullPointerException();
int c = -1;
Node<E> node = new Node<E>(e);
final ReentrantLock putLock = this.putLock;
final AtomicInteger count = this.count;
// 以可中断的形式获取put锁
putLock.lockInterruptibly();
try {
// 与offer(e, timeout, unit)相比,采用了无限等待的方式
while (count.get() == capacity) {
// 当执行了移除元素操作后,会通过signal操作来唤醒notFull队列中的一个线程
notFull.await();
}
enqueue(node);
c = count.getAndIncrement();
if (c + 1 < capacity)
notFull.signal();
} finally {
putLock.unlock();
}
if (c == 0)
signalNotEmpty();
}
复制代码
果然方法之间都是大同小异的, put(e) 操作可以类比我们之前讲的 offer(e, timeout, unit) ,只有一个不同的地方,就是当队列满时, await 操作不再有超时时间,也就是说,只能等待 take 操作来调用 signal 方法唤醒该线程
poll() 方法用于移除并返回队首节点,下面是方法的具体实现:
public E poll() {
final AtomicInteger count = this.count;
if (count.get() == 0)
return null;
E x = null;
int c = -1;
final ReentrantLock takeLock = this.takeLock;
// 获取take锁
takeLock.lock();
try {
if (count.get() > 0) {
// 出队,并自减
x = dequeue();
c = count.getAndDecrement();
if (c > 1)
// 只要队列还有元素,就唤醒一个take操作
notEmpty.signal();
}
} finally {
takeLock.unlock();
}
// 如果在队列满的情况下移除一个元素,会唤醒一个put操作
if (c == capacity)
signalNotFull();
return x;
}
复制代码
如果你认真看了 offer(e) 方法之后, poll() 方法就没什么好讲的了,完全就是 offer(e) 的翻版(我也想讲点东西,但是 poll() 方法完全和 offer(e) 流程一模一样...)
poll(timeout, unit)/take()/remove() 方法分别是 offer(e, timeout, unit)/put()/add() 方法的翻版,没有什么特殊的地方,这里就一笔略过了
peek() 方法是用于获取队首元素,其实现如下:
public E peek() {
if (count.get() == 0)
return null;
final ReentrantLock takeLock = this.takeLock;
// 获取take锁
takeLock.lock();
try {
Node<E> first = head.next;
if (first == null)
return null;
else
return first.item;
} finally {
takeLock.unlock();
}
}
复制代码
流程没什么好说的,需要注意的是该方法需要获取 take锁 ,也就是说在 peek() 方法执行时,是不能执行移除元素的操作的
element() 方法的实现是在 AbstractQueue 中:
public E element() {
E x = peek();
if (x != null)
return x;
else
throw new NoSuchElementException();
}
复制代码
还是同样的二次封装操作
本来说的是 BlockingQueue ,结果说了半天 LinkedBlockingQueue 。不过作为阻塞队列的一种经典实现, LinkedBlockingQueue 中的方法实现思路也是对于理解阻塞队列来说也是很重要的。想要理解阻塞队列的理念,最重要的就是理解锁的概念,比如 LinkedBlockingQueue 通过 生产者锁/put锁 和 消费者锁/take锁 ,以及锁对应的 Condition 对象来实现线程安全。理解了这一点,才能理解整个 生产者/消费者模型