转载

一文读懂 Java 字符串相关知识点和常见面试题

点击上方 黄小斜 ”, 选择“置顶或者星标”

你关注的就是我关心的!

一文读懂 Java 字符串相关知识点和常见面试题

作者: 黄小斜

来源:微信公众号【黄小斜】

    目录

    • string基础

      • Java String 类

      • 创建字符串

      • StringDemo.java 文件代码:

    • String基本用法

      • 创建String对象的常用方法

      • String中常用的方法,用法如图所示,具体问度娘

      • 三个方法的使用: lenth() substring() charAt()

      • 字符串与byte数组间的相互转换

      • ==运算符和equals之间的区别:

      • 字符串的不可变性

      • String的连接

      • String、String builder和String buffer的区别

    • String类的源码分析

      • String类型的intern

      • String类型的equals

      • StringBuffer和Stringbuilder

      • append方法

      • 扩容 *

      • 删除

      • system.arraycopy方法

    • String和JVM的关系

    • String为什么不可变?

      • 不可变有什么好处?

    • String常用工具类

    • 参考文章

    • 微信公众号

      • Java技术江湖

      • 个人公众号: 黄小斜 

本系列文章将整理到我在GitHub上的《Java面试指南》仓库,更多精彩内容请到我的仓库里查看, 喜欢的话麻烦Star一下哈

https://github.com/h2pl/Java-Tutorial

文章首发于我的个人博客:

www.how2playlife.com

string基础

Java String 类

字符串广泛应用 在 Java 编程中,在 Java 中字符串属于对象,Java 提供了 String 类来创建和操作字符串。

创建字符串

创建字符串最简单的方式如下:

String greeting = "菜鸟教程";

在代码中遇到字符串常量时,这里的值是 " 菜鸟教程 "",编译器会使用该值创建一个 String 对象。

和其它对象一样,可以使用关键字和构造方法来创建 String 对象。

String 类有 11 种构造方法,这些方法提供不同的参数来初始化字符串,比如提供一个字符数组参数:

StringDemo.java 文件代码:

以上实例编译运行结果如下:

注意:String 类是不可改变的,所以你一旦创建了 String 对象,那它的值就无法改变了(详看笔记部分解析)。

如果需要对字符串做很多修改,那么应该选择使用 StringBuffer & StringBuilder 类。

String基本用法

创建String对象的常用方法

(1) String s1 = "mpptest"

(2) String s2 = new String();

(3) String s3 = new String("mpptest")

String中常用的方法,用法如图所示,具体问度娘

一文读懂 Java 字符串相关知识点和常见面试题

三个方法的使用:lenth() substring() charAt()

package com.mpp.string; public class StringDemo1 { public static void main(String[] args) { //定义一个字符串"晚来天欲雪 能饮一杯无"
        String str = "晚来天欲雪 能饮一杯无";
        System.out.println("字符串的长度是:"+str.length()); //字符串的雪字打印输出  charAt(int index)
        System.out.println(str.charAt(4)); //取出子串  天欲
        System.out.println(str.substring(2));   //取出从index2开始直到最后的子串,包含2
        System.out.println(str.substring(2,4));  //取出index从2到4的子串,包含2不包含4  顾头不顾尾
 }
}

两个方法的使用,求字符或子串第一次/最后一次在字符串中出现的位置:indexOf() lastIndexOf()

package com.mpp.string; public class StringDemo2 { public static void main(String[] args) {
        String str = new String("赵客缦胡缨 吴钩胡缨霜雪明"); //查找胡在字符串中第一次出现的位置
        System.out.println("/"胡/"在字符串中第一次出现的位置:"+str.indexOf("胡")); //查找子串"胡缨"在字符串中第一次出现的位置
        System.out.println("/"胡缨/"在字符串中第一次出现的位置"+str.indexOf("胡缨")); //查找胡在字符串中最后一次次出现的位置
        System.out.println(str.lastIndexOf("胡")); //查找子串"胡缨"在字符串中最后一次出现的位置
        System.out.println(str.lastIndexOf("胡缨")); //从indexof为5的位置,找第一次出现的"吴"
        System.out.println(str.indexOf("吴",5));
    }
}

字符串与byte数组间的相互转换

package com.mpp.string; import java.io.UnsupportedEncodingException; public class StringDemo3 { public static void main(String[] args) throws UnsupportedEncodingException { //字符串和byte数组之间的相互转换
 String str = new String("hhhabc银鞍照白马 飒沓如流星"); //将字符串转换为byte数组,并打印输出
        byte[] arrs = str.getBytes("GBK"); for(int i=0;i){
            System.out.print(arrs[i]);
        } //将byte数组转换成字符串
 System.out.println();
        String str1 = new String(arrs,"GBK");  //保持字符集的一致,否则会出现乱码
 System.out.println(str1);
    }
}

==运算符和equals之间的区别:

引用指向的内容和引用指向的地址

一文读懂 Java 字符串相关知识点和常见面试题

package com.mpp.string; public class StringDemo5 { public static void main(String[] args) {
        String str1 = "mpp";
        String str2 = "mpp";
        String str3 = new String("mpp");

}

}

字符串的不可变性

String的对象一旦被创建,则不能修改,是不可变的

所谓的修改其实是创建了新的对象,所指向的内存空间不变

一文读懂 Java 字符串相关知识点和常见面试题

上图中,s1不再指向imooc所在的内存空间,而是指向了hello,imooc

String的连接

String、String builder和String buffer的区别

String是Java中基础且重要的类,并且String也是Immutable类的典型实现,被声明为final class,除了hash这个属性其它属性都声明为final,因为它的不可变性,所以例如拼接字符串时候会产生很多无用的中间对象,如果频繁的进行这样的操作对性能有所影响。

StringBuffer就是为了解决大量拼接字符串时产生很多中间对象问题而提供的一个类,提供append和add方法,可以将字符串添加到已有序列的末尾或指定位置,它的本质是一个线程安全的可修改的字符序列,把所有修改数据的方法都加上了synchronized。但是保证了线程安全是需要性能的代价的。

在很多情况下我们的字符串拼接操作不需要线程安全,这时候StringBuilder登场了,StringBuilder是JDK1.5发布的,它和StringBuffer本质上没什么区别,就是去掉了保证线程安全的那部分,减少了开销。

StringBuffer 和 StringBuilder 二者都继承了 AbstractStringBuilder ,底层都是利用可修改的char数组(JDK 9 以后是 byte数组)。

所以如果我们有大量的字符串拼接,如果能预知大小的话最好在new StringBuffer 或者StringBuilder 的时候设置好capacity,避免多次扩容的开销。扩容要抛弃原有数组,还要进行数组拷贝创建新的数组。

我们平日开发通常情况下少量的字符串拼接其实没太必要担心,例如

String str = "aa"+"bb"+"cc";

像这种没有变量的字符串,编译阶段就直接合成"aabbcc"了,然后看字符串常量池(下面会说到常量池)里有没有,有也直接引用,没有就在常量池中生成,返回引用。

如果是带变量的,其实影响也不大,JVM会帮我们优化了。

1、在字符串不经常发生变化的业务场景优先使用String(代码更清晰简洁)。如常量的声明,少量的字符串操作(拼接,删除等)。
2、在单线程情况下,如有大量的字符串操作情况,应该使用StringBuilder来操作字符串。不能使用String"+"来拼接而是使用,避免产生大量无用的中间对象,耗费空间且执行效率低下(新建对象、回收对象花费大量时间)。如JSON的封装等。
3、在多线程情况下,如有大量的字符串操作情况,应该使用StringBuffer。如HTTP参数解析和封装等。

String类的源码分析

String类型的intern

String类型的equals

StringBuffer和Stringbuilder

底层是继承父类的可变字符数组value

append方法

Stringbuffer在大部分涉及字符串修改的操作上加了synchronized关键字来保证线程安全,效率较低。

String类型在使用 + 运算符例如

String a = "a"

a = a + a;时,实际上先把a封装成stringbuilder,调用append方法后再用tostring返回,所以当大量使用字符串加法时,会大量地生成stringbuilder实例,这是十分浪费的,这种时候应该用stringbuilder来代替string。

扩容

注意在append方法中调用到了一个函数

ensureCapacityInternal(count + len); 该方法是计算append之后的空间是否足够,不足的话需要进行扩容

如果新字符串长度大于value数组长度则进行扩容

扩容后的长度一般为原来的两倍 + 2;

假如扩容后的长度超过了jvm支持的最大数组长度MAX ARRAY SIZE。

考虑两种情况

如果新的字符串长度超过int最大值,则抛出异常,否则直接使用数组最大长度作为新数组的长度。

删除

这两个类型的删除操作:

都是调用父类的delete方法进行删除

事实上是将剩余的字符重新拷贝到字符数组value。

这里用到了system.arraycopy来拷贝数组,速度是比较快的

system.arraycopy方法

转自知乎:

在主流高性能的JVM上(HotSpot VM系、IBM J9 VM系、JRockit系等等),可以认为System.arraycopy()在拷贝数组时是可靠高效的——如果发现不够高效的情况,请报告performance bug,肯定很快就会得到改进。

java.lang.System.arraycopy()方法在Java代码里声明为一个native方法。所以最naïve的实现方式就是通过JNI调用JVM里的native代码来实现。

String的不可变性 关于String的不可变性,这里转一个不错的回答

什么是不可变?String不可变很简单,如下图,给一个已有字符串"abcd"第二次赋值成"abcedl",不是在原内存地址上修改数据,而是重新指向一个新对象,新地址。

String和JVM的关系

下面我们了解下Java栈、Java堆、方法区和常量池:

Java栈(线程私有数据区):

Java堆(线程共享数据区):

方法区(线程共享数据区):

常量池(线程共享数据区):

下面重点了解的是字符串常量池:

String为什么不可变?

翻开JDK源码,java.lang.String类起手前三行,是这样写的:

首先String类是用final关键字修饰,这说明String不可继承。再看下面,String类的主力成员字段value是个char[]数组,而且是用final修饰的。

final修饰的字段创建以后就不可改变。有的人以为故事就这样完了,其实没有。因为虽然value是不可变,也只是value这个引用地址不可变。挡不住Array数组是可变的事实。

Array的数据结构看下图。

也就是说Array变量只是stack上的一个引用,数组的本体结构在heap堆。

String类里的value用final修饰,只是说stack里的这个叫value的引用地址不可变。没有说堆里array本身数据不可变。看下面这个例子,

不可变有什么好处?

这个最简单地原因,就是为了安全。看下面这个场景(有评论反应例子不够清楚,现在完整地写出来),一个函数appendStr( )在不可变的String参数后面加上一段“bbb”后返回。appendSb( )负责在可变的StringBuilder后面加“bbb”。

总结以下String的不可变性。

1 首先final修饰的类只保证不能被继承,并且该类的对象在堆内存中的地址不会被改变。
2 但是持有String对象的引用本身是可以改变的,比如他可以指向其他的对象。
3 final修饰的char数组保证了char数组的引用不可变。但是可以通过char[0] = 'a’来修改值。不过String内部并不提供方法来完成这一操作,所以String的不可变也是基于代码封装和访问控制的。

举个例子

这里的对f.a的修改可以理解为char[0] = 'a'这样的操作。只改变数据值,不改变内存值。

String常用工具类

问题描述 很多时候我们需要对字符串进行很多固定的操作,而这些操作在JDK/JRE中又没有预置,于是我们想到了apache-commons组件,但是它也不能完全覆盖我们的业务需求,所以很多时候还是要自己写点代码的,下面就是基于apache-commons组件写的部分常用方法:

代码成果

参考文章

https://blog.csdn.net/qq 34490018/article/details/82110578 https://www.runoob.com/java/java-string.html https://www.cnblogs.com/zhangyinhua/p/7689974.html https://blog.csdn.net/sinat 21925975/article/details/86493248 https://www.cnblogs.com/niew/p/9597379.html

微信公众号

Java技术江湖

如果大家想要实时关注我更新的文章以及分享的干货的话,可以关注我的公众号【Java技术江湖】一位阿里 Java 工程师的技术小站,作者黄小斜,专注 Java 相关技术:SSM、SpringBoot、MySQL、分布式、中间件、集群、Linux、网络、多线程,偶尔讲点Docker、ELK,同时也分享技术干货和学习经验,致力于Java全栈开发!

Java工程师必备学习资源:一些Java工程师常用学习资源,关注公众号后,后台回复关键字 “Java” 即可免费无套路获取。

一文读懂 Java 字符串相关知识点和常见面试题

个人公众号:黄小斜

作者是 985 硕士,蚂蚁金服 JAVA 工程师,专注于 JAVA 后端技术栈:SpringBoot、MySQL、分布式、中间件、微服务,同时也懂点投资理财,偶尔讲点算法和计算机理论基础,坚持学习和写作,相信终身学习的力量!

程序员3T技术学习资源:一些程序员学习技术的资源大礼包,关注公众号后,后台回复关键字 “资料” 即可免费无套路获取。

一文读懂 Java 字符串相关知识点和常见面试题

原文  http://mp.weixin.qq.com/s?__biz=MzUyOTk5NDQwOA==&mid=2247486382&idx=2&sn=953d5844f0b9aa81fc72f9e56b9d0809
正文到此结束
Loading...