潍坊淘宝网站建设,google seo怎么优化,二级注册建造师信息查询,网站开发技术服务费合同Java技术能够一直保持着非常良好的向后兼容性#xff0c;Class文件结构的稳定功不可没。
Class文件是一组以8个字节为基础单位的二进制流#xff0c;各个数据项目严格按照顺序紧凑地排列在文件之中。
Class文件格式采用一种类似于C语言结构体的伪结构来存储数据#xff0c… Java技术能够一直保持着非常良好的向后兼容性Class文件结构的稳定功不可没。
Class文件是一组以8个字节为基础单位的二进制流各个数据项目严格按照顺序紧凑地排列在文件之中。
Class文件格式采用一种类似于C语言结构体的伪结构来存储数据这种伪结构中只有两种数据类型“无符号数”和“表”。
无符号数属于基本的数据类型以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节和8个字节的无符号数。
表是由多个无符号数或者其他表作为数据项构成的复合数据类型为了便于区分所有表的命名都习惯性地以“_info”结尾。表用于描述有层次关系的复合结构的数据整个Class文件本质上也可以视作是一张表。
无论是无符号数还是表当需要描述同一类型但数量不定的多个数据时经常会使用一个前置的容量计数器加若干个连续的数据项的形式这时候称这一系列连续的某一类型的数据为某一类型的“集合”。
魔数与Class文件的版本
每个Class文件的头4个字节被称为魔数Magic Number它的唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件。
Class文件的魔数取得很有“浪漫气息”值为0xCAFEBABE咖啡宝贝。
紧接着魔数的4个字节存储的是Class文件的版本号第5和第6个字节是次版本号MinorVersion第7和第8个字节是主版本号Major Version。 Java的版本号是从45开始的JDK 1.1之后的每个JDK大版本发布主版本号向上加1JDK 1.01.1使用了45.045.3的版本号。 常量池 紧接着主、次版本号之后的是常量池入口常量池可以比喻为Class文件里的资源仓库它是Class文件结构中与其他项目关联最多的数据通常也是占用Class文件空间最大的数据项目之一。
由于常量池中常量的数量是不固定的所以在常量池的入口需要放置一项u2类型的数据代表常量池容量计数值constant_pool_count。
这个容量计数是从1而不是0开始的设计者将第0项常量空出来是有特殊考虑的这样做的目的在于如果后面某些指向常量池的索引值的数据在特定情况下需要表达“不引用任何一个常量池项目”的含义可以把索引值设置为0来表示。
Class文件结构中只有常量池的容量计数是从1开始对于其他集合类型包括接口索引集合、字段表集合、方法表集合等的容量计数都与一般习惯相同是从0开始。
常量池中主要存放两大类常量字面量Literal和符号引用Symbolic References。
字面量比较接近于Java语言层面的常量概念如文本字符串、被声明为final的常量值等。
符号引用则属于编译原理方面的概念主要包括下面几类常量
被模块导出或者开放的包Package类和接口的全限定名Fully Qualified Name字段的名称和描述符Descriptor方法的名称和描述符方法句柄和方法类型Method Handle、Method Type、Invoke Dynamic动态调用点和动态常量Dynamically-Computed Call Site、Dynamically-Computed Constant
在Class文件中不会保存各个方法、字段最终在内存中的布局信息这些字段、方法的符号引用不经过虚拟机在运行期转换的话是无法得到真正的内存入口地址也就无法直接被虚拟机使用的。当虚拟机做类加载时将会从常量池获得对应的符号引用再在类创建时或运行时解析、翻译到具体的内存地址之中。
常量表中分别有17种不同类型的常量。 使用javap命令输出常量表
访问标志
在常量池结束之后紧接着的2个字节代表访问标志access_flags这个标志用于识别一些类或者接口层次的访问信息包括这个Class是类还是接口、是否定义为public类型、是否定义为abstract类型、如果是类的话是否被声明为final等等。 类索引、父类索引与接口索引集合
类索引this_class和父类索引super_class都是一个u2类型的数据而接口索引集合interfaces是一组u2类型的数据的集合Class文件中由这三项数据来确定该类型的继承关系。
类索引用于确定这个类的全限定名父类索引用于确定这个类的父类的全限定名。
对于接口索引集合入口的第一项u2类型的数据为接口计数器interfaces_count表示索引表的容量。如果该类没有实现任何接口则该计数器值为0后面接口的索引表不再占用任何字节。
字段表集合
字段表field_info用于描述接口或者类中声明的变量包括类级变量以及实例级变量但不包括在方法内部声明的局部变量。
字段访问标记
描述符的作用是用来描述字段的数据类型、方法的参数列表包括数量、类型以及顺序和返回值。根据描述符规则基本数据类型byte、char、double、float、int、long、short、boolean以及代表无返回值的void类型都用一个大写字符来表示而对象类型则用字符L加对象的全限定名来表示。 对于数组类型每一维度将使用一个前置的“[”字符来描述如一个定义为“java.lang.String[][]”类型的二维数组将被记录成“[[Ljava/lang/String”一个整型数组“int[]”将被记录成“[I”。
用描述符来描述方法时按照先参数列表、后返回值的顺序描述参数列表按照参数的严格顺序放在一组小括号“()”之内。如方法void inc()的描述符为“()V”方法java.lang.String toString()的描述符为“()Ljava/lang/String”方法int indexOf(char[]sourceint sourceOffsetint sourceCountchar[]targetint targetOffsetint targetCountint fromIndex)的描述符为“([CII[CIII)I”。 其值为0x0001说明这个类只有一个字段表数据。接下来紧跟着容量计数器的是access_flags标志值为0x0002代表private修饰符的ACC_PRIVATE标志位为真ACC_PRIVATE标志的值为0x0002其他修饰符为假。代表字段名称的name_index的值为0x0005从代码清单6-2列出的常量表中可查得第五项常量是一个CONSTANT_Utf8_info类型的字符串其值为“m”代表字段描述符的descriptor_index的值为0x0006指向常量池的字符串“I”。根据这些信息我们可以推断出原代码定义的字段为“private int m”。
过在descriptor_index之后跟随着一个属性表集合用于存储一些额外的信息字段表可以在属性表中附加描述零至多项的额外信息。对于本例中的字段m它的属性表计数器为0也就是没有需要额外描述的信息但是如果将字段m的声明改为“final static int m123”那就可能会存在一项名称为ConstantValue的属性其值指向常量123。
方法表集合
Class文件存储格式中对方法的描述与对字段的描述采用了几乎完全一致的方式方法表的结构如同字段表一样依次包括访问标志access_flags、名称索引name_index、描述符索引descriptor_index、属性表集合attributes几项。 方法访问标志 方法里的Java代码经过Javac编译器编译成字节码指令之后存放在方法属性表集合中一个名为“Code”的属性里面属性表作为Class文件格式中最具扩展性的一种数据项目。
属性表集合 属性表attribute_info在前面的讲解之中已经出现过数次Class文件、字段表、方法表都可以携带自己的属性表集合以描述某些场景专有的信息。