首页 > 编程语言 >Java 理论和实践: 了解泛型

Java 理论和实践: 了解泛型

时间:2023-07-28 19:33:39浏览次数:42  
标签:Java de 实践 类型 编译器 泛型 构造函数



级别: 初级


2005 年 1 月 25 日

Java 理论和实践”中,Brian Goetz 分析了束缚第一次使用泛型的用户的常见陷阱。您可以通过 讨论论坛与作者和其他读者分享您对本文的看法。(也可以单击本文顶端或底端的 讨论来访问这个论坛。)

表面上看起来,无论语法还是应用的环境(比如容器类),泛型类型(或者泛型)都类似于 C++ 中的模板。但是这种相似性仅限于表面,Java 语言中的泛型基本上完全在编译器中实现,由编译器执行类型检查和类型推断,然后生成普通的非泛型的字节码。这种实现技术称为擦除(erasure)(编译器使用泛型类型信息保证类型安全,然后在生成字节码之前将其清除),这项技术有一些奇怪,并且有时会带来一些令人迷惑的后果。虽然范型是 Java 类走向类型安全的一大步,但是在学习使用泛型的过程中几乎肯定会遇到头痛(有时候让人无法忍受)的问题。

注意:本文假设您对 JDK 5.0 中的范型有基本的了解。

泛型不是协变的

虽然将集合看作是数组的抽象会有所帮助,但是数组还有一些集合不具备的特殊性质。Java 语言中的数组是协变的(covariant),也就是说,如果 de<Integerde< 扩展了 de<Numberde<(事实也是如此),那么不仅de<Integerde< 是 de<Numberde<,而且 de<Integer[]de< 也是 de<Number[]de<,在要求 de<Number[]de< 的地方完全可以传递或者赋予 de<Integer[]de<。(更正式地说,如果 de<Numberde< 是 de<Integerde< 的超类型,那么 de<Number[]de< 也是 de<Integer[]de< 的超类型)。您也许认为这一原理同样适用于泛型类型 —— de<List<Number>de< 是 de<List<Integer>de< 的超类型,那么可以在需要 de<List<Number>de< 的地方传递 de<List<Integer>de<。不幸的是,情况并非如此。

不允许这样做有一个很充分的理由:这样做将破坏要提供的类型安全泛型。如果能够将 de<List<Integer>de< 赋给 de<List<Number>de<。那么下面的代码就允许将非 de<Integerde< 的内容放入 de<List<Integer>de<:


因为 de<lnde< 是 de<List<Number>de<,所以向其添加 de<Floatde< 似乎是完全合法的。但是如果 de<lnde< 是 de<lide< 的别名,那么这就破坏了蕴含在 de<lide< 定义中的类型安全承诺 —— 它是一个整数列表,这就是泛型类型不能协变的原因。

其他的协变问题

数组能够协变而泛型不能协变的另一个后果是,不能实例化泛型类型的数组(de<new List<String>[3]de< 是不合法的),除非类型参数是一个未绑定的通配符(de<new List<?>[3]de< 是合法的)。让我们看看如果允许声明泛型类型数组会造成什么后果:


最后一行将抛出 de<ClassCastExceptionde<,因为这样将把 de<List<Integer>de< 填入本应是 de<List<String>de< 的位置。因为数组协变会破坏泛型的类型安全,所以不允许实例化泛型类型的数组(除非类型参数是未绑定的通配符,比如 de<List<?>de<)。




构造延迟

因为可以擦除功能,所以 de<List<Integer>de< 和 de<List<String>de< 是同一个类,编译器在编译 de<List<V>de< 时只生成一个类(和 C++ 不同)。因此,在编译 de<List<V>de< 类时,编译器不知道 de<Vde< 所表示的类型,所以它就不能像知道类所表示的具体类型那样处理 de<List<V>de< 类定义中的类型参数(de<List<V>de< 中的 de<Vde<)。

因为运行时不能区分 de<List<String>de< 和 de<List<Integer>de<(运行时都是 de<Listde<),用泛型类型参数标识类型的变量的构造就成了问题。运行时缺乏类型信息,这给泛型容器类和希望创建保护性副本的泛型类提出了难题。

比如泛型类 de<Foode<:


假设 de<doSomething()de< 方法希望复制输入的 de<paramde< 参数,会怎么样呢?没有多少选择。您可能希望按以下方式实现 de<doSomething()de<:


但是您不能使用类型参数访问构造函数,因为在编译的时候还不知道要构造什么类,因此也就不知道使用什么构造函数。使用泛型不能表达“de<Tde< 必须拥有一个拷贝构造函数(copy constructor)”(甚至一个无参数的构造函数)这类约束,因此不能使用泛型类型参数所表示的类的构造函数。

de<clone()de< 怎么样呢?假设在 de<Foode< 的定义中,de<Tde< 扩展了 de<Cloneablede<:


不幸的是,仍然不能调用 de<param.clone()de<。为什么呢?因为 de<clone()de< 在 de<Objectde< 中是保护访问的,调用 de<clone()de< 必须通过将 de<clone()de< 改写公共访问的类引用来完成。但是重新声明 de<clone()de< 为 public 并不知道de<Tde<,因此克隆也无济于事。

构造通配符引用

因此,不能复制在编译时根本不知道是什么类的类型引用。那么使用通配符类型怎么样?假设要创建类型为 de<Set<?>de< 的参数的保护性副本。您知道 de<Setde< 有一个拷贝构造函数。而且别人可能曾经告诉过您,如果不知道要设置的内容的类型,最好使用 de<Set<?>de< 代替原始类型的 de<Setde<,因为这种方法引起的未检查类型转换警告更少。于是,可以试着这样写:


不幸的是,您不能用通配符类型的参数调用泛型构造函数,即使知道存在这样的构造函数也不行。不过您可以这样做:


这种构造不那么直观,但它是类型安全的,而且可以像 de<new HashSet<?>(set)de< 那样工作。

构造数组

如何实现 de<ArrayList<V>de<?假设类 de<ArrayListde< 管理一个 de<Vde< 数组,您可能希望用 de<ArrayList<V>de< 的构造函数创建一个 de<Vde< 数组:


但是这段代码不能工作 —— 不能实例化用类型参数表示的类型数组。编译器不知道 de<Vde< 到底表示什么类型,因此不能实例化 de<Vde< 数组。

Collections 类通过一种别扭的方法绕过了这个问题,在 Collections 类编译时会产生类型未检查转换的警告。de<ArrayListde< 具体实现的构造函数如下:


为何这些代码在访问 de<backingArrayde< 时没有产生 de<ArrayStoreExceptionde< 呢?无论如何,都不能将 de<Objectde< 数组赋给 de<Stringde< 数组。因为泛型是通过擦除实现的,de<backingArrayde< 的类型实际上就是 de<Object[]de<,因为de<Objectde< 代替了 de<Vde<。这意味着:实际上这个类期望 de<backingArrayde< 是一个 de<Objectde< 数组,但是编译器要进行额外的类型检查,以确保它包含 de<Vde< 类型的对象。所以这种方法很奏效,但是非常别扭,因此不值得效仿(甚至连泛型 Collections 框架的作者都这么说,请参阅参考资料)。

还有一种方法就是声明 de<backingArrayde< 为 de<Objectde< 数组,并在使用它的各个地方强制将它转化为 de<V[]de<。仍然会看到类型未检查转换警告(与上一种方法一样),但是它使一些未明确的假设更清楚了(比如de<backingArrayde< 不应逃避 de<ArrayListde< 的实现)。

其他方法

最好的办法是向构造函数传递类文字(de<Foo.classde<),这样,该实现就能在运行时知道 de<Tde< 的值。不采用这种方法的原因在于向后兼容性 —— 新的泛型集合类不能与 Collections 框架以前的版本兼容。

下面的代码中 de<ArrayListde< 采用了以下方法:


但是等一等!仍然有不妥的地方,调用 de<Array.newInstance()de< 时会引起未经检查的类型转换。为什么呢?同样是由于向后兼容性。de<Array.newInstance()de< 的签名是:


而不是类型安全的:


为何 de<Arrayde< 用这种方式进行泛化呢?同样是为了保持向后兼容。要创建基本类型的数组,如 de<int[]de<,可以使用适当的包装器类中的 de<TYPEde< 字段调用 de<Array.newInstance()de<(对于 de<intde<,可以传递 de<Integer.TYPEde< 作为类文字)。用 de<Class<T>de< 参数而不是 de<Class<?>de< 泛化 de<Array.newInstance()de<,对于引用类型有更好的类型安全,但是就不能使用 de<Array.newInstance()de< 创建基本类型数组的实例了。也许将来会为引用类型提供新的 de<newInstance()de< 版本,这样就两者兼顾了。

在这里可以看到一种模式 —— 与泛型有关的很多问题或者折衷并非来自泛型本身,而是保持和已有代码兼容的要求带来的副作用。




泛化已有的类

在转化现有的库类来使用泛型方面没有多少技巧,但与平常的情况相同,向后兼容性不会凭空而来。我已经讨论了两个例子,其中向后兼容性限制了类库的泛化。

另一种不同的泛化方法可能不存在向后兼容问题,这就是 de<Collections.toArray(Object[])de<。传入 de<toArray()de< 的数组有两个目的 —— 如果集合足够小,那么可以将其内容直接放在提供的数组中。否则,利用反射(reflection)创建相同类型的新数组来接受结果。如果从头开始重写 Collections 框架,那么很可能传递给 de<Collections.toArray()de< 的参数不是一个数组,而是一个类文字:


因为 Collections 框架作为良好类设计的例子被广泛效仿,但是它的设计受到向后兼容性约束,所以这些地方值得您注意,不要盲目效仿。

首先,常常被混淆的泛型 Collections API 的一个重要方面是 de<containsAll()de<、de<removeAll()de< 和 de<retainAll()de< 的签名。您可能认为 de<remove()de< 和 de<removeAll()de< 的签名应该是:


但实际上却是:


为什么呢?答案同样是因为向后兼容性。de<x.remove(o)de< 的接口表明“如果 de<ode< 包含在 de<xde< 中,则删除它,否则什么也不做。”如果 de<xde< 是一个泛型集合,那么 de<ode< 不一定与 de<xde< 的类型参数兼容。如果 de<removeAll()de< 被泛化为只有类型兼容时才能调用(de<Collection<? extends E>de<),那么在泛化之前,合法的代码序列就会变得不合法,比如:


如果上述片段用直观的方法泛化(将 de<cde< 设为 de<Collection<Integer>de<,de<rde< 设为 de<Collection<Object>de<),如果 de<removeAll()de< 的签名要求其参数为 de<Collection<? extends E>de< 而不是 no-op,那么就无法编译上面的代码。泛型类库的一个主要目标就是不打破或者改变已有代码的语义,因此,必须用比从头重新设计泛型所使用类型约束更弱的类型约束来定义 de<remove()de<、de<removeAll()de<、de<retainAll()de< 和 de<containsAll()de<。

在泛型之前设计的类可能阻碍了“显然的”泛型化方法。这种情况下就要像上例这样进行折衷,但是如果从头设计新的泛型类,理解 Java 类库中的哪些东西是向后兼容的结果很有意义,这样可以避免不适当的模仿。




擦除的实现

因为泛型基本上都是在 Java 编译器中而不是运行库中实现的,所以在生成字节码的时候,差不多所有关于泛型类型的类型信息都被“擦掉”了。换句话说,编译器生成的代码与您手工编写的不用泛型、检查程序的类型安全后进行强制类型转换所得到的代码基本相同。与 C++ 不同,de<List<Integer>de< 和 de<List<String>de< 是同一个类(虽然是不同的类型但都是 de<List<?>de< 的子类型,与以前的版本相比,在 JDK 5.0 中这是一个更重要的区别)。

擦除意味着一个类不能同时实现 de<Comparable<String>de< 和 de<Comparable<Number>de<,因为事实上两者都在同一个接口中,指定同一个 de<compareTo()de< 方法。声明 de<DecimalStringde< 类以便与 de<Stringde< 与 de<Numberde< 比较似乎是明智的,但对于 Java 编译器来说,这相当于对同一个方法进行了两次声明:


擦除的另一个后果是,对泛型类型参数是用强制类型转换或者 de<instanceofde< 毫无意义。下面的代码完全不会改善代码的类型安全性:


编译器仅仅发出一个类型未检查转换警告,因为它不知道这种转换是否安全。de<naiveCast()de< 方法实际上根本不作任何转换,de<Tde< 直接被替换为 de<Objectde<,与期望的相反,传入的对象被强制转换为 de<Objectde<。

擦除也是造成上述构造问题的原因,即不能创建泛型类型的对象,因为编译器不知道要调用什么构造函数。如果泛型类需要构造用泛型类型参数来指定类型的对象,那么构造函数应该接受类文字(de<Foo.classde<)并将它们保存起来,以便通过反射创建实例。




结束语

泛型是 Java 语言走向类型安全的一大步,但是泛型设施的设计和类库的泛化并非未经过妥协。扩展虚拟机指令集来支持泛型被认为是无法接受的,因为这会为 Java 厂商升级其 JVM 造成难以逾越的障碍。因此采用了可以完全在编译器中实现的擦除方法。类似地,在泛型 Java 类库时,保持向后兼容也为类库的泛化方式设置了很多限制,产生了一些混乱的、令人沮丧的结构(如 de<Array.newInstance()de<)。这并非泛型本身的问题,而是与语言的演化与兼容有关。但这些也使得泛型学习和应用起来更让人迷惑,更加困难。



参考资料




标签:Java,de,实践,类型,编译器,泛型,构造函数
From: https://blog.51cto.com/u_16065168/6886451

相关文章

  • Windows本地IDEA运行mapreduce报错java.io.FileNotFoundException: HADOOP_HOME and h
    问题原因在windows运行hadoopJob程序的时候需要模拟下hadoop的运行环境。否则出现会出现标题的问题。解决方案下载Hadoop的bin目录https://github.com/s911415/apache-hadoop-3.1.3-winutils将步骤1中下载的文件配置成环境变量HADOOP_HOME(指向解压之后的的bin的上级目录)。......
  • 利用JAVA操作EXCEL文件
    级别:初级2003年1月11日使用Windows操作系统的朋友对Excel(电子表格)一定不会陌生,但是要使用Java语言来操纵Excel文件并不是一件容易的事。在Web应用日益盛行的今天,通过Web来操作Excel文件的需求越来越强烈,目前较为流行的操作是在JSP或Servlet中创建一个CSV(commasepa......
  • Java开发 - SpringCache初体验
    前言早些时候,博主介绍过Redis的使用:Java开发-Redis初体验,Redie是基于缓存的一项技术,对于Redis,博主此处不再赘述,不了解的可以去看这篇文章,但Redis缓存并不是顶峰,本文要讲的内容就是Redis的辅助工具:SpringCache——的使用。有了SpringCache,Redis便可如虎添翼,使用效果更上一层楼,下面......
  • 信创啊,信创。Solon 的 war 包,现在同时支持 jakarta.servlet(及 javax.servlet)容器了!
    Solon是个神奇的项目,不是基于Servlet的。但是又很支持Servlet,尤其是war包。打起来还挺方便的。如果你是做信创的(听说,很多信创项目是用war部署到tomcat容器下的)。自从javaee改包名后,那个苦啊。但是,Solon可以用一样的开发,双同时支持:javax.servletjakarta.servlet......
  • java中常见的中文编码格式
    几种常见的编码格式为什么要编码首先要了解为什么要编码?我们能不能不编码?要回答这个问题必须要回到计算机是如何表示我们人类能够理解的符号的,这些符号也就是我们人类使用的语言。由于人类的语言有太多,因而表示这些语言的符号太多,无法用计算机中一个基本的存储单元——byte来......
  • Inspur KOS 龙蜥衍生版面向智慧新媒体转型的探索与实践 | 龙蜥案例
    编者按:日前,龙蜥社区理事单位浪潮信息正式对外发布基于龙蜥操作系统(Anolis OS)的服务器操作系统 Inspur KOS,并基于InspurKOS推出可视化迁移方案C2K,该方案能够将用户应用安全可靠地切换到InspurKOS,满足用户CentOS迁移替代需求。本案例为InspurKOS在传媒产业中的应用实践......
  • 通过 Javacore 诊断线程挂起等性能问题
    Javacore与WebSphereCommerce性能问题近年来,依据WebSphereCommerce(以下简称为WC)搭建的电子商务网站系统日益增多。由于系统本身的复杂性,一旦系统出现问题,尤其是性能问题,问题诊断和定位就会非常困难。下图所示为由WC系统为核心搭建的电子商务网站的一般逻辑架构,如图......
  • Java整理
    1.String类的特点Java程序中所有双引号字符串,都是String这个类的对象字符串一但被创建,就不可修改,字符串内容不可改变如果想要更改,创建新的对象替换Strings1="abc";s1="bcd"-String字符串虽然不可改变,但是可以共享字符串常量池:当我们使用双引号创建对象,会在常量池中......
  • android与PC,C#与Java 利用protob…
    protobuf是什么? Protocolbuffers是一种编码方法构造的一种有效而可扩展的格式的数据。谷歌使用其内部几乎RPC协议和文件格式的所有协议缓冲区。参考文档http://code.google.com/intl/zh-CN/apis/protocolbuffers/docs/overview.html  API的 参考文档 ......
  • 解决 Postman 报错的最佳实践指南
    Postman 是一个流行的API测试工具,它可以帮助开发者和测试人员快速地创建和发送各种HTTP请求,并查看响应结果。但是,在使用Postman的过程中,有时候会遇到一些报错或异常情况,影响了正常的测试流程。本文将介绍一些Postman常见的报错与处理方法,希望能够对大家有所帮助。想要学习......