Await.result与async/await是否阻塞当前线程的示例

在另一篇文章中提到，Await.result会阻塞当前线程，而async/await不会。虽然我们从实现原理上有一些解释，但是没有可运行的实例代码，还是觉得不够放心。这里将会以一些代码实例来说明。

Await.result

线程数为1的线程池

Await.result(future, ...)会阻塞当前线程。下面我将设计一段代码来证明它：

package myawait

import java.util.concurrent.Executors

import scala.concurrent.duration._
import scala.concurrent.{Await, ExecutionContext, Future}
import scala.language.postfixOps
import scala.util.{Failure, Success}

object MyAwaitResult extends App {

  implicit val ec = ExecutionContext.fromExecutor(Executors.newFixedThreadPool(1))

  val allStart = System.currentTimeMillis()

  log("start")

  val future = Future {
    val f1 = Future {log("f1 running"); true}
    val f2 = Future {log("f2 running: "); 42}
    if (Await.result(f1, 3 seconds)) {
      Await.result(f2, 3 seconds)
    } else {
      log("oh, no")
    }
  }

  log("started future")

  future.onComplete {
    case Success(v) => log("value: " + v)
    case Failure(e) => log(e.toString)
  }

  def log(str: String) = {
    println("### " + str + ", " + (System.currentTimeMillis() - allStart) + "ms, " + Thread.currentThread().getName)
  }

}

运行结果如下：

### start, 81ms, main
### started future, 125ms, main
### f1 running, 3151ms, pool-1-thread-1
### f2 running: , 3152ms, pool-1-thread-1
### java.util.concurrent.TimeoutException: Futures timed out after [3 seconds], 3152ms, pool-1-thread-1

可见它并没有打印出value: 42，而是抛出了一个Futures timed out after [3 seconds]的异常。

原因是，当我们创建了一个线程数为1的ExecutionContext并设为implicit后，后面的Future {}都会把新建的任务追加到这唯一的线程中。当创建future后，里面的代码就占据了第一个任务中。在这个任务中创建的f1和f2，都会追加到这个线程中，变成第2个和第3个任务。如果第1个任务不执行完，它们是没有机会执行的。

但是在第一个任务中，有Await.result(f1, 3 seconds)，它在等待这个没有机会执行的f1完成，所以只会超时抛出异常。之后f1和f2才有机会得到执行（可以看到它们的执行时间都在3秒以后），但期待中的future的值42就再也没有机会打印出来了。

线程数为2的线程池

如果我们仅仅把上面代码的线程数变成2，它的结果就不一样了。

implicit val ec = ExecutionContext.fromExecutor(Executors.newFixedThreadPool(2))

将打印出结果：

### start, 79ms, main
### started future, 117ms, main
### f1 running, 118ms, pool-1-thread-2
### f2 running: , 120ms, pool-1-thread-2
### value: 42, 134ms, pool-1-thread-1

可见由于多了一条线程，f1和f2有机会快速执行，所以Await.result(f1, 3 seconds)就可以及时的拿到值，打印出最终结果。

由些可以证明，Await.result的确会阻塞当前线程。如果我们在生产代码中使用了它，很有可能很快把我们的线程池占光，导致其它任务没有机会执行。

async/await

如果我们用async/await改写之后，看看会怎么样。依然保持池子的线程数为1：

package myawait

import java.util.concurrent.Executors

import scala.async.Async.{async, await}
import scala.concurrent.ExecutionContext
import scala.language.postfixOps
import scala.util.{Failure, Success}

object MyAsyncAwait extends App {

  implicit val ec = ExecutionContext.fromExecutor(Executors.newFixedThreadPool(1))

  val allStart = System.currentTimeMillis()

  log("start")

  val future = async {
    val f1 = async {log("f1 running"); true}
    val f2 = async {log("f2 running: "); 42}
    if (await(f1)) {
      await(f2)
    } else {
      log("oh, no")
    }
  }

  log("started future")

  future.onComplete {
    case Success(v) => log("value: " + v)
    case Failure(e) => log(e.toString)
  }

  def log(str: String) = {
    println("### " + str + ", " + (System.currentTimeMillis() - allStart) + "ms, " + Thread.currentThread().getName)
  }

}

执行后打印结果：

### start, 83ms, main
### started future, 123ms, main
### f1 running, 125ms, pool-1-thread-1
### f2 running: , 125ms, pool-1-thread-1
### value: 42, 125ms, pool-1-thread-1

可以看到，就算只有一个线程，依然很快的打印出了结果，并没有阻塞。由此可以证明，Await.result的确会阻塞线程，而async/await不会，这样我们就可以放心大胆的使用async/await了。

Await.result的实现原理

Await.result方法的实现如下：

def result[T](awaitable: Awaitable[T], atMost: Duration): T =
      blocking(awaitable.result(atMost)(AwaitPermission))

它里面实际上有两个地方，可以用来等待结果及阻塞当前线程：

awaitable.result(...)
blocking(...)

对于前面使用的例子来说，实际上起作用的是awaitable.result(...)

`awaitable.result(future, atMost)`

大致作法是创建了一个CompletionLatch锁，这个锁默认是锁上的，直到future完成时，才给它解锁。而当前线程，就会在atMost时间内，尝试拿锁，因为拿不到，所以就阻塞起来，直到超时或者拿到锁。

在阻塞前，其实也进行了几种不同的尝试。首先尝试拿一下；如果拿不到，则看看等待的剩余时间是否极短（小于1000纳秒），如果是的话，则用while(true)轮询，会消耗cpu的；否则使用LockSupport.park方法阻塞当前线程（类似于obj.wait()），不消耗CPU，等待其它线程调用LockSupport.unpark（类似于obj.notify()）把它唤醒。

`blocking(...)`

blocking的实现如下：

def blocking[T](body: =>T): T = BlockContext.current.blockOn(body)(scala.concurrent.AwaitPermission)

BlockContext.current实现如下：

def current: BlockContext = contextLocal.get match {
    case null => Thread.currentThread match {
      case ctx: BlockContext => ctx
      case _ => DefaultBlockContext
    }
    case some => some
  }

而DefaultBlockContext实现如下：

private object DefaultBlockContext extends BlockContext {
    override def blockOn[T](thunk: =>T)(implicit permission: CanAwait): T = thunk
  }

也就是说，默认情况下，如果某个任务在普通的线程中执行，这个blocking将走到DefaultBlockContext.blockOn，而它实际上什么也没做。在前面的例子中，就是这么走的，所以对于此例来说，真正起作用的还是awaitable.result(...).

但是，如果我们的任务是运行在一个实现了BlockContext的特殊线程中，那么这个blocking就会起作用。比如在Scala中的某处，就有一个用ForkJoinPool实现的blocking。

blocking

据说在一个任务中，如果有一段很耗时的代码，最好放在blocking中，如：

blocking {
  Thread.sleep(100000)
}

开始不太明白为什么要这么做，后来发现，它其实是为了规避一个问题。

考虑一下这种情况：开了一个线程池，里面有若干个线程，然后提交了一些任务，这些任务中有一些耗时代码。

第一种情况：线程池中的线程个数是固定的。那么如果我们提交了多个含有耗时代码的任务，把所有的线程都占住了，后面提交的任务就会卡住，等待空闲线程。这样程序的运行效率就下来了。

第二种情况：线程池中的线程个数是无限的，自动增长的。那么我们提交了多个含有耗时代码的任务后，就会占住一批线程，后面新提交的任务就会创建新线程，当线程太多的时候，程序效率也下来了。

所以对于blocking，有一种实现是避开当前的线程池，而另开一个ForkJoinPool，专门处理它。这样原有线程池的线程就不会被阻塞，可以很快被其它任务使用。而在ForkJoinPool中，会另开线程来处理blocking中的代码。粗看起来，这跟“无限的线程池”似乎没什么区别，不同之处在于，ForkJoinPool通过特殊的机制，让线程间可以互相取出其它任务的子任务，从而可以利用较少的线程处理较多的任务，节省了线程的创建。

参看：http://stackoverflow.com/a/13099594/342235

另：关于ForkJoinPool的资料：

(2015-05-01) Await.result与async/await是否阻塞当前线程的示例