Java 中的闭包 Closure

我们常常将数据、代码保存起来,以后再使用。但代码指令执行时候,会处于一定的环境,单纯将代码保存下来,还是不够的,需要将代码所处的环境也保存下来。

闭包其实是,将代码跟代码所处于的环境做为一个整体来看待,把相关参数和变量都保存在一起,从一个函数传递到另一个函数,以后再调用

这个概念和 对象(Objects)、代码块(block)、匿名函数(lambda)是相通的。

我们先从普通的函数来看:

1. 组合子(Combinator)
普通我们常说的一个“函数”:
f(x,y)=x+y
函数有两个“自变量”(术语:约束变量),x和y。函数的返回值,也就是应变量,是自变量一系列操作的结果。比如例子里是返回x和y的和。这样的一个它内部操作依赖的变量全部由参数提供了的”自给自足“的函数,叫“组合子(Combinator)”。

blob.png

Java代码表示就是:

public int add(int x, int y){
    return x+y;}

换到编程的概念,强调的就是函数的**“作用域”**。大多数编程语言都是用一对花括号**"{}"**标识出作用域。上面代码里的add()函数被调用之后,
int sum=add(2,3);
编译器编译之后,可以理解成是这个样子,函数的参数x和y,是包含在函数add()的作用域里的。

add(){
    int x=2;
    int y=3;
    return x+y;
}

或者,函数像下面这样写也可以。这时候x作为函数参数出现,而y作为函数局部变量出现。效果和上面的例子是一样的。

public int add(int x){
    int y=3;
    return x+y;
}

2. 自由变量
但有的时候,函数也可以有它自身作用域以外的参数参与。这些在函数作用域以外,由函数的外部环境提供的参数就叫“自由变量(Free Variable)”。

简单但不严格的说,一个函数的“自由变量”就是既不是参数也不是局部变量的变量。

比如下面这个x 的函数,返回xy 的和。这里的y就是自由变量。

f(x)=x+y
写成代码就是这样,

int y=3;
add(){
    int x=2;
    return x+y;
}

blob.png

一个纯粹(无副作用)的函数如果不含有自由变量,那么每次用相同的参数调用后的得到的结果肯定是一样的。

但如果一个函数含有自由变量,那么调用返回的结果不但依赖于参数的值,还依赖于自由变量的值。

因此一个含有自由变量的函数要正确执行,必须保证其所依赖的外围环境的存在。

3. 闭包(Closure)
大白话不怎么严谨的说法就是三点:

  1. 一个依赖于自由变量的函数
  2. 处在含有这些自由变量的一个外围环境
  3. 这个函数能够访问外围环境里的自由变量

看下面这个Javascript闭包的例子:

function Add(y) {  
    return function(x) {  
        return x + y  
    }  
} 

对内部函数function(x)来讲,y就是自由变量,而且function(x)的返回值,依赖于这个外部自由变量y。而往上推一层,外围Add(y)函数正好就是那个包含自由变量y的环境。而且Javascript的语法允许内部函数function(x)访问外部函数Add(y)的局部变量。满足这三个条件,所以这个时候,外部函数Add(y)对内部函数function(x)构成了闭包。

闭包的结构,如果用λ演算表达式来写,就是多参数的Currying技术。
> λx.λy.x+y

但在Java中我们看不到这样的结构。因为Java主流语法不允许这样的直接的函数套嵌和跨域访问变量。

4. 类和对象
但Java中真的不存在闭包吗?正好相反,Java到处都是闭包,所以反而我们感觉不出来在使用闭包。因为Java的“对象”其实就是一个闭包。其实无论是闭包也好,对象也好,都是一种数据封装的手段。看下面这个类,

class Add{
    private int x=2;
    public int add(){
	int y=3;
    	return x+y;
    }
}

看上去x在函数add()的作用域外面,但是通过Add类实例化的过程,变量”x“和数值”2“之间已经绑定了,而且和函数add()也已经打包在一起。add()函数其实是透过this关键字来访问对象的成员字段的。

5. 内部类是闭包:包含指向外部类的指针
Java中的内部类就是一个典型的闭包结构。代码如下

public class Outer {
    private class Inner{
        private x=100;
        public int innerAdd(){
            return x+y;
        }
    }
    private int y=100;
}

下图画的就是上面代码的结构。内部类(Inner Class)通过包含一个指向外部类的引用,做到自由访问外部环境类的所有字段,变相把环境中的自由变量封装到函数里,形成一个闭包。

blob.png

6、别扭的匿名内部类

但Java匿名内部类就做得比较尴尬。下面这个例子中,getAnnoInner负责返回一个匿名内部类的引用。

interface AnnoInner(){addXYZ();}
public
class Outer {    public AnnoInner getAnnoInner(final int x){        final int y=100;        return new AnnoInner(){            int z=100;            public int addXYZ(){return x+y+z;}
           //这个函数无法修改外部环境中的自由变量y。
           //public void changeY(){y+=1;}
       };    }    private int num=100;}

匿名内部类因为是匿名,所以不能显式地声明构造函数,也不能往构造函数里传参数。不但返回的只是个叫AnnoInner的接口,而且还没有和它外围环境getAnnoInner()方法的局部变量x和y构成任何类的结构。但它的addXYZ()函数却直接使用了x和y这两个自由变量来计算结果。这就说明,外部方法getAnnoInner()事实上已经对内部类AnnoInner构成了一个闭包。

但这里别扭的地方是这两个x和y都必须用final修饰,不可以修改。如果用一个changeY()函数试图修改外部getAnnoInner()函数的成员变量y,编译器通不过,

error: cannot assign a value to final variable y

这是为什么呢?因为这里Java编译器支持了闭包,但支持地不完整。说支持了闭包,是因为编译器编译的时候其实悄悄对函数做了手脚,偷偷把外部环境方法的x和y局部变量,拷贝了一份到匿名内部类里。如下面的代码所示。

interface AnnoInner(){addXYZ();}
public class Outer {    public AnnoInner getAnnoInner(final int x){        final int y=100;        return new AnnoInner(){
          //编译器相当于拷贝了外部自由变量x的一个副本到匿名内部类里。
          int copyX=x;
          //编译器相当于拷贝了外部自由变量y的一个副本到匿名内部类里。
   int copyY=y;            int z=100;

          //这个函数无法修改外部环境中的自由变量y。
          //public void changeY(){y+=1;}

           public int addXYZ(){return x+y+z;}                    };    }    private int num=100;}

所以用R大回答里的原话说就是:

Java编译器实现的只是capture-by-value,并没有实现capture-by-reference。

而只有后者才能保持匿名内部类和外部环境局部变量保持同步。

但Java又不肯明说,只能粗暴地一刀切,就说既然内外不能同步,那就不许大家改外围的局部变量。

7. 其他和匿名内部类相似的结构
《Think in Java》书里,只点出了匿名内部类来自外部闭包环境的自由变量必须是final的。但实际上,其他几种不太常用的内部类形式,也都有这个特性。

比如在外部类成员方法内部的内部类。

public class Outer {
    public foo(final int x){
        final int y=100;
        public class MethodInner{
	    int z=100;
            public int addXYZ(){return x+y+z;}
        }
    }}

比如在一个代码块block里的内部类。

public class Outer {
    {
        final int x=100;
        final int y=100;
        class BlockInner{
            int z=100;
            public int addXYZ(){return x+y+z;}
        }
        BlockInner bi=new BlockInner();
        num=bi.addXYZ();
    }
	private int num;}

发表评论

电子邮件地址不会被公开。 必填项已用*标注