转载

字符串String的最大长度

开篇三个问题

作为Java的程序员,不知道在Java代码中定义了多少个字符串,可是看看下面3个问题。你是否认真思考过?是否动手实践过?

1.Java中的字符串String的最大长度是多少?

2.Eclipse使用哪种Java编译器?

3.为何Eclipse要出自己的编译器?

对于字符串可以承受的最大长度,要分为2个阶段,一个是编译时期(也就是你代码定义了一个String字符串,String s= "xiaohu"),一个是运行时期(指在程序运行过程中)

编译期String字符串的限制

我们都知道JVM里面是包含常量池的,(是一种对字符串的性能优化,不用反复创建新的字符串了)当我们使用字符串字面量直接定义String的时候,是会把字符串在常量池中存储一份的。常量池中的每一项常量都是一个表,都有自己对应的类型。Java中的UTF-8编码的Unicode字符串在常量池中以CONSTANT_Utf8_info类型表,结构如下:

CONSTANT_Utf8_info型常量的结构

类型 名称 数量
u1 tag 1
u2 length 1
u1 bytes length

u2类型的length的值就表明了这个UTF-8编码字符串长度是多少字节。所以CONSTANT_Utf8_info型常量对应的最大长度也就是java中UTF-8编码的字符串的长度,顺便提一下Class文件中的方法和字段也是引用CONSTANT_Utf8_info型常量来描述名称的。u2是无符号的16位整数,因此理论上允许的的最大长度是2^16-1=65535

编译器javac下String的长度

创建一个测试类

public class TestStr {
    public static void main(String[] args) {
             String LongStr ="aaaa..."//一共65535个a
             System.out.println(LongStr.length());
     }
}

使用javac命令编译它。编译报错。相应目录没有生成对应的TestStr.class文件

去除一个字符串,使用65534个字符串。

public class TestStr {
    public static void main(String[] args) {
             String LongStr ="aaaa..."//一共65534个a
             System.out.println(LongStr.length());
     }
}

javac命令编译它。编译正常。相应目录生成对应的TestStr.class文件

我们在看看Oracle JDK的编译工具Javac内部,javac也是java写的。

/** Check a constant value and report if it is a string that is
 *  too large.
 */
private void checkStringConstant(DiagnosticPosition pos, Object constValue) {
    if (nerrs != 0 || // only complain about a long string once
        constValue == null ||
        !(constValue instanceof String) ||
        ((String)constValue).length() < Pool.MAX_STRING_LENGTH)
        return;
    log.error(pos, "limit.string");
    nerrs++;
}
...

在看看Pool.MAX_STRING_LENGTH

public class Pool {

    ...
    
    public static final int MAX_STRING_LENGTH = 0xFFFF;
    
    ...
}

通过上边代码可以看到 MAX_STRING_LENGTH = 0xFFFF 而 0xFFFF 是十进制的 65535。但是上面我们得出的结果是Javac编译下最大长度是65534,是因为 Javac 源码中做的限制是((String)constValue).length() < Pool.MAX_STRING_LENGTH) 注意是 < 而不是 <= , 小于65535那自然最多只能是65534了。

但是U2类型能表达的最大值是65535。上面65535个长度的字符串在javac下报错了是受到了javac编译器的限制了。如果你在上面65534长度生成的TestStr.class中手动在添加一个字符串(注意是在javac编译后的class文件中添加)是可以得到65535长度的结果。

总结一下:在Javac编译器下,字符串String的最大长度限制也即是U2类型所能表达的最大长度65534。避开javac最大长度是65535?

Eclise的JDT编译器下String的长度

Eclipse有自己的Java编译器,称为[JDT Core] [1](org.eclipse.jdt.core)。并不是用的javac编译器。

创建一个测试类

public class TestStr {
    public static void main(String[] args) {
             String LongStr ="aaaa..."//一共65540个a
             System.out.println(LongStr.length());
     }
}

发现Eclipse执行可正常执行。这肯定是Eclise的JDT编译器做了手脚。果然通过在Eclipse工作空间下找到了其编译生成的TestStr.class。使用javap命令查看

6:   invokespecial   #20; //Method java/lang/StringBuilder."<init>":(Ljava/la
ng/String;)V
   9:   ldc     #23; //String QyNDAbAgIGqQIBAQ1
   11:  invokevirtual   #25; //Method java/lang/StringBuilder.append:(Ljava/lang
/String;)Ljava/lang/StringBuilder;
   14:  invokevirtual   #29; //Method java/lang/StringBuilder.toString:()Ljava/l
ang/String;
   17:  invokevirtual   #33; //Method java/lang/String.intern:()Ljava/lang/Strin
g;
   20:  astore_1
   21:  getstatic       #38; //Field java/lang/System.out:Ljava/io/PrintStream;
   24:  aload_1
   25:  invokevirtual   #44; //Method java/lang/String.length:()I
   28:  invokevirtual   #48; //Method java/io/PrintStream.println:(I)V
   31:  return

}

上面我们就明白了之所以JDT能编译过,只是因为JDT优化为了StringBuilder的append。

Eclipse编译器本身包含在org.eclipse.jdt.core插件中。Eclipse不会使用任何用户安装的JDK。相反,由于以下主要原因,它使用自己的JDT核心来编译Java程序:

主要原因是JDT核心具有渐进式编译的能力,这意味着它会逐步编译代码中的更改(这也是Eclipse不需要编译按钮的原因,因为它会在检测到更改时自动编译)。但Oracle的JDK不支持增量编译。

运行期String的字符串限制

String内部是以char数组的形式存储,数组的长度是int类型,那么String允许的最大长度就是Integer.MAX_VALUE了。又由于java中的字符是以16位存储的,因此大概需要4GB的内存才能存储最大长度的字符串。

总结一下

1.Java中的字符串String最大长度,编译期如果是javac编译就是65534。如果绕过javac编译的限制,其最大长度可以达到u2类型变达的最大值65535。

2.Java中的字符串String最大长度运行期大约4G。

3.Eclise编译超过65534长度的字符串不报错,是Eclipse有自己的Java编译器。JDT优化为了StringBuilder的append。

4.Eclise使用自己的编译器。主要原因是JDT核心具有渐进式编译的能力,这意味着它会逐步编译代码中的更改(这也是Eclipse不需要编译按钮的原因,因为它会在检测到更改时自动编译)。但Oracle的JDK不支持增量编译。

这篇文章特别感谢since1986、Holis

参考: https://since1986.github.io/d...

参考: https://juejin.im/post/5d5365...

微信公众号:51码农网

字符串String的最大长度

原文  https://segmentfault.com/a/1190000020381075
正文到此结束
Loading...