转载

Java 8怎么了:局部套用vs闭包

【编者按】本文作者为专注于自然语言处理多年的 Pierre-Yves Saumont ,Pierre-Yves 著有30多本主讲Java 软件开发的书籍,自2008开始供职于 Alcatel-Lucent 公司,担任软件研发工程师。

本文主要介绍了 Java 8 中的闭包与局部套用功能,由国内ITOM 管理平台OneAPM 编译呈现。

关于Java 8,存在着许多错误观念。譬如,认为Java 8给Java带来了闭包特性就是其中之一。这个想法是错的,因为闭包特性从Java诞生之初就已经存在了。然而闭包是有缺陷的。尽管Java 8似乎倾向于函数式编程,我们仍应尽力避免使用Java闭包。但是,Java 8并没有在此方面提供过多帮助。

我们知道,参数求值时间是使用方法和使用函数时的一个重大区别。在Java中,我们可以写一个带参数且有返回值的方法。但是,这可以被称作函数吗?当然不能。方法只可以通过调用进行操纵,这表示它的参数会在该方法执行前取值。这是Java中参数按值传递的结果。

函数则与之不同。操作函数时我们可以不计算参数,且对参数何时取值有绝对的控制权。而且,如果一个函数有多个参数,它们可以不同时取值。这一点通过局部套用就可以做到。但是首先,我们将考虑如何利用闭包进行实现。

闭包举例

对函数而言,闭包能够在封装的上下文中获取内容。在函数式编程中,一个函数的结果应当仅由其参数决定。很显然,闭包打破了这一准则。

请看Java 5/6/7中的示例:

private Integer b = 2;     List list = Arrays.asList(1, 2, 3, 4, 5);     System.out.println(calculate(list.stream(), 3).collect(toList()));    private Stream calculate(Stream stream, Integer a) {      return stream.map(new Function() {        @Override        public Integer apply(Integer t) {          return t * a + b;         }       });     }    public interface Function<T, U> {       U apply(T t);     }

以上代码将产生如下结果:

[5, 8, 11, 14, 17]

所得结果是函数 f(x) = x * 3 + 2 对于列 [1, 2, 3, 4, 5] 的映射。到这一步都没什么问题。但是3和2可以用其他值替换吗?换句话说,它难道不是函数f(x, a, b) = x * a + b 对于该列的映射吗?

是,也不是。不是的原因在于a和b都被隐性定义了 final 关键词,因此它们在函数取值时作为常数参与计算。但是当然,它们的值也会有变动。它们的 final 属性(在Java 8中隐性定义,在之前版本中则显性定义)只是编译器优化编译过程的一种方式。编译器并不在乎任何潜在的变动值。它只在乎引用有没有发生变动,也就是说,它想要确保 Integer 整数对象 ab 的引用不发生变化,但并不在意它们的取值。这个特性在以下代码中可以看出:

private Integer b = 2;     private Integer getB() {      return this.b;     }     List list = Arrays.asList(1, 2, 3, 4, 5);     System.out.println(calculator.calculate(list.stream(), new Int(3)).collect(toList()));         private Stream<Integer> calculate00(Stream<Integer> stream, final Int a) {      return stream.map(new Function<Integer, Integer>() {        @Override        public Integer apply(Integer t) {          return t * a.value + getB();         }       });      }     -    static private class Int {      public int value;      public Int(int value) {        this.value = value;       }      }

在这里,我们使用了可变对象 a (属于 Int 类,而不是不可变的 Integer 类),以及一个方法来获取 b 。现在,我们来模拟一个有三个变量的函数,但是仍旧使用仅有一个变量的函数,同时使用闭包来代替其他两个变量。很显然,这是非函数性的,因为它打破了仅依赖于函数参数的准则。

结果之一是,尽管有需要,我们也不能在别的地方重用这个函数,因为它依赖于上下文而不仅仅依赖于参数。我们要复制这些代码才能实现重用。另一个结果是,由于它需要上下文才能运行,我们也不能单独进行函数测试。

那么,我们应该使用带有三个参数的函数吗?我们可能会认为,这不可能实现。因为具体的实现过程与三个参数何时取值相关。它们都在不同的地方取值。如果我们刚才使用的是带有三个参数的函数,它们就必须同时取值。而映射方法只会映射带一个参数的函数到流,不可能映射带有三个参数的函数。因此,其余两个参数在函数绑定时(也即传递给映射时)必须已经取值。解决方法是先对其余两个参数取值。

我们也可以用闭包来实现这一功能,但是所得代码是不可测试的,且可能存在重叠。

使用Java 8 的句法(lambdas)也无法改变这一状况:

private Integer b = 2;    private Stream<Integer> calculate(Stream<Integer> stream, Integer a) {      return stream.map(t -> t * a + b);      }

我们需要的是一种在不同时间获取三个参数的方法——Currying(局部套用,也称柯里化函数,尽管它其实是Moses Shönfinkel发明的)。

使用局部闭包

局部闭包就是逐一对函数参数取值,每一步都生成少一个参数的新函数。举例来看,如果我们有如下函数:

f(x, y, z) = x * y + z

我们可以同时取参数值为2,4,5,得到以下方程:

f(3, 4, 5) = 3 * 4 + 5 = 17

我们也可以只取一个参数为3,得到以下方程:

f(3, y, z) = g(y, z) = 3 * y + z

现在,我们得到了只有两个参数的新函数g。再对该函数进行局部套用,将4赋值给y:

g(4, z) = h(z) = 3 * 4 + z

给参数赋值的顺序对计算结果并无影响。此处,我们并不是在局部相加,(如果是局部相加,我们还得考虑运算符优先级。)而是在进行对函数的局部应用。

那么,我们如何在Java中实现这种方法呢?以下是在Java5/6/7中的应用:

private static List<Integer> calculate(List<Integer> list, Integer a) {      return list.map(new Function<Integer, Function<Integer, Function<Integer, Integer>>>() {        @Override        public Function<Integer, Function<Integer, Integer>> apply(final Integer x) {          return new Function<Integer, Function<Integer, Integer>>() {            @Override            public Function<Integer, Integer> apply(final Integer y) {              return new Function<Integer, Integer>() {                @Override                public Integer apply(Integer t) {                  return x + y * t;                 }               };             }           };         }       }.apply(b).apply(a));     }

以上代码完全可以实现所需功能,但是要想说服开发者,让他们用这种方式编写代码,恐怕非常困难!还好,Java 8的lambda句法提供了以下实现方式:

private Stream<Integer> calculate(Stream<Integer> stream, Integer a) {      return stream.map(((Function<Integer, Function<Integer, Function<Integer, Integer>>>)                            x -> y -> t -> x + y * t).apply(b).apply(a));     }

怎么样?或者,是不是可以写得更简单一点:

private Stream<Integer> calculate(Stream<Integer> stream, Integer a) {      return stream.map((x -> y -> t -> x + y * t).apply(b).apply(a));     }

完全可以,但是Java 8不能自行判断参数类型,因此我们必须使用manifest类型来帮助确认(manifest在Java规范中的意思是explicit)。为了让代码看起来更整洁,我们可以使用一些小技巧:

interface F3 extends Function<Integer, Function<Integer, Function<Integer, Integer>>> {}    private Stream<Integer> calculate(Stream<Integer> stream, Integer a) {      return stream.map(((F3) x -> y -> z -> x + y * z).apply(b).apply(a));     }

现在,我们来为函数命名,并在必要时重用它:

private Stream<Integer> calculate(Stream<Integer> stream, Integer a) {       F3 calculation = x -> y -> z -> x + y * z;      return stream.map(calculation.apply(b).apply(a));     }

我们还可以声明计算函数为一个辅助类的静态成员,使用静态导入来进一步简化代码:

public class Functions {      static Function<Integer, Function<Integer, Function<Integer, Integer>>> calculation =            x -> y -> z -> x + y * z;         }         ...        import static Functions.calculation;        private Stream<Integer> calculate(Stream<Integer> stream, Integer a) {          return stream.map(calculation.apply(b).apply(a));         }

可惜,Java 8 鼓励的是使用闭包。不然,我会介绍更多能让局部套用的使用更为简便的功能性语法糖。比如,在Scala中,以上例子就可以这样改写:

stream.map(calculation(b)(a))

虽然在Java中我们没法这样写。可是,通过下面的静态方法,我们可以达到相似的效果:

static Function<Integer, Function<Integer, Function<Integer, Integer>>> calculation         = x -> y -> z -> x + y * z;    static Function<Integer, Integer> calculation(Integer x, Integer y) {      return calculation.apply(x).apply(y);     }

现在,我们可以写:

 private Stream<Integer> calculate(Stream<Integer> stream, Integer a) {      return stream.map(calculation(b, a));     }

请注意, calculation(b, a) 不是带有两个参数的函数。它只是一个方法,在将两个参数逐一地局部调用至一个带有三个参数的函数之后,它会返回一个带有一个参数的函数,该函数便可传递给映射函数。

现在, calculation 方法便可以单独测试了。

自动局部调用

在之前的例子中,我们已经亲手实践过局部调用了。然而,我们大可以编写程序来自动化调用过程。我们可以编写这样一个方法:它会接收带有两个参数的函数,并返回该函数的局部调用版本。写起来非常简单:

public <A, B, C> Function<A, Function<B, C>> curry(final BiFunction<A, B, C> f) {      return (A a) -> (B b) -> f.apply(a, b);     }

有必要的话,我们还可以写一个方法来颠倒这一过程。这个过程可以接受 AFunction 函数作为参数,返回一个可返回 CBFunction 函数,最终返回一个返回 CA , BBiFunction 函数。

public <A, B, C> BiFunction<A, B, C> uncurry(Function<A, Function<B, C>> f) {      return (A a, B b) -> f.apply(a).apply(b);     }

局部调用的其他应用

局部调用的应用方式还有很多。最重要的应用是模拟多参数函数。在Java  8提供了单参数函数( java.util.functions.Function )以及双参数函数( java.util.functions.BiFunction )。但并未提供存在于其他语言中的三参数、四参数、五参数甚至更多参数的函数。其实,有没有这些函数并不重要。它们只是在特定情况下,需要同时对所有参数取值时应用的语法糖。实际上,这也是 BiFunctin 在Java 8中存在的原因:函数的常见使用方法就是模拟二元运算符,(请注意:在Java 8中有 BinaryOperator 接口,但它只用于两个参数以及返回值都属于同一类型的特殊情况。我们将在下一篇文章中讨论这一点。)

局部调用在函数的各个参数需要在不同地方取值时是非常好用的。通过局部调用,我们可以在某一组件中对一个参数取值,然后将计算结果传递到另一组件对其他参数取值,如此反复,直到所有参数值都被取到。

小结

Java 8并不是一种函数式语言(可能永远也不会是)。但是,我们仍可以在Java(甚至是Java 8之前的版本)中使用函数式范式。这样做的确会略有代价。但这种代价在Java 8中已经大幅减少了。尽管如此,想要写函数型代码的开发者还是得动动脑筋才能掌握这种范式。使用局部调用就是智力成果之一。

请记住:

(A, B, C) -> D

总是可以由如下方式替代:

A -> B -> C -> D

即便Java 8无法判断该表达方式的类型,你只要自行指定其类型就可以了。这就是局部调用,它总是比闭包更为稳妥。

OneAPM 能为您提供端到端的Java 应用性能解决方案,我们支持所有常见的 Java 框架及应用服务器,助您快速发现系统瓶颈,定位异常根本原因。分钟级部署,即刻体验,Java 监控从来没有如此简单。想阅读更多技术文章,请访问OneAPM 官方技术博客。

编译自: https://dzone.com/articles/whats-wrong-java-8-currying-vs

原文  http://blog.oneapm.com/apm-tech/667.html
正文到此结束
Loading...