Java中的字符串之字符串常量池
⭐️前面的话⭐️
本篇文章带大家认识Java基础知识——字符串类,在前面我们已经知道如何在Java中定义字符串,本文将介绍Java字符串中的字符串常量池,探究字符串相等问题。
📒博客主页:未见花闻的博客主页
🎉欢迎关注🔎点赞👍收藏⭐️留言📝
📌本文由未见花闻原创!
📆华为云首发时间:🌴2022年5月31日🌴
✉️坚持和努力一定能换来诗与远方!
💭参考书籍:📚《Java核心技术卷1》,📚《数据结构》,📚《Java编程思想》
💬参考在线编程网站:🌐牛客网🌐力扣
博主的码云gitee,平常博主写的程序代码都在里面。
博主的github,平常博主写的程序代码都在里面。
🍭作者水平很有限,如果发现错误,一定要及时告知作者哦!感谢感谢!
1.字符串的创建
在Java当中,使用String类来表示,"abc"是一个字符串常量,是String类对象,String类是一种引用类型,其引用变量可以指向String类的对象,如果需要创建一个字符串对象,有以下3种方法:
public class CreatTest {
public static void main(String[] args) {
//字符串创建
String str1 = "CSDN";//方法1
String str2 = new String("weijianhuawen");//方法2
char[] ch = {'j','a','v','a'};
String str3 = new String(ch);//方法3
System.out.println(str1);
System.out.println(str2);
System.out.println(str3);
}
}
方法1:直接定义String类引用变量指向一个字符串常量对象。
方法2:使用new创建一个新的字符串对象,传入构造函数的参数类型为String。
方法3:使用new创建一个新的字符串对象,传入构造函数的参数类型为字符数组。
字符串类是引用变量,在一个方法中修改引用的值是无效的,因为方法里面的引用变量是局部变量,作用域是在方法内。区别与数组,利用[]
形式访问的数组对象的内容,并不是引用变量的值,所以数组利用[]
修改是有效的。
public class Test2 {
public static void func(String str, char[] ch) {
str = "bili";
ch[0] = 'w';
}
public static void main(String[] args) {
String s = "csdn";
char[] c = {'a', 'b', 'c'};
System.out.println(s);
System.out.println(c);
System.out.println("=================");
func(s, c);
System.out.println(s);
System.out.println(c);
}
}
jdk1.8版本中String类的本质是char[]
,这一点可以通过访问String源码能够观察到。
我们发现这个字符数组是被private final
修饰的,因此字符串是不可变对象,因为你无法获取和修改这个对象。
2.字符串相等问题
2.1字符串常量池
在Java中为了提高效率,引入了常量池,那什么是常量池呢?常见的常量池有class文件常量池,运行时常量池,字符串常量池等。
这个“池”怎么理解呢?打个比方,你的女朋友想要吃瓜子,然后你剥瓜子,你事先把瓜子剥到一个盘中,然后你的女朋友要吃瓜子的时候可以从这个盘子中取,不需要等待你把剥瓜子剥完,这个盘就是这里所谓的“池”,使用“池”能够提高程序运行的效率。
class文件常量池储存在磁盘上,编译后形成的字节码文件,原本定义的很多基本类型常量,比如int a = 2
,这个2就被放在了这个常量池当中。
运行时常量池,当程序把编译好的字节码文件加载到JVM后,会形成一个运行时常量池,也称为方法区,实际上是class文件常量池。
字符串常量池,主要存放字符串常量,本质上是一个哈希表,直接使用双引号""
声明定义的字符串常量都会被存入字符串常量池当中去,jdk1.8后使用new新建的String对象也会存入常量池中。
刚刚说到了哈希表,那哈希表是什么呢?哈希表是一种数据结构,是描述和组织数据的一种方式,本质上哈希表就是一个数组,在存储数据的时候会根据一个映射关系将数据存储在数组当中,这个映射关系就叫做哈希函数,当然也有可能存在多个数据通过哈希函数映射后,得到在数组中的位置是一样的,这时就引发了哈希冲突,解决哈希冲突常用的方法就是使用链表,也就是说哈希表里面数组类型为链表,数组中存放的是链表的首元素的地址。这里简单认识一下,后面介绍数据结构时专门讲解哈希表。
2.2字符串引用相等的判断
了解了字符串常量池就能来分析String引用是否相等了。
public class Test3 {
public static void main(String[] args) {
String str1 = "csdn";
String str2 = "csdn";
System.out.println(str1 == str2);//(1)
System.out.println("============");
String str3 = new String("csdn");
System.out.println(str1 == str3);//(2)
System.out.println("=============");
String str4 = "cs" + "dn";
System.out.println(str1 == str4);//(3)
System.out.println("============");
String str5 = "cs";
String str6 = str5 + "dn";
System.out.println(str1 == str6);//(4)
}
(1):定义str1
时,检查字符串csdn
是否入池,发现没有入池,先将字符串入池,然后将该字符串对象地址赋值给str1
,定义str2
时,检查字符串csdn
是否入池,发现已经入池,直接将已经入池的字符串对象地址赋值给str2
,所以str1
与str2
引用的值是相等的,所以输出true
。
(2):定义str3
时,会先新建一个String对象,然后检查字符串csdn
是否入池,如果没入池则入池,再将入池后的对象的内容拷贝给新建的String对象,当然在这个栗子csdn
是已经入池了的,则直接将该对象的内容拷贝给新建的String对象。很明显,str1
与str3
的引用值是不同的,所以输出false
。
(3):定义str4
时,编译时就会把cs
与dn
拼接为csdn
,所以编译后str4
得到的就是csdn
对象的地址,这就与栗子(1)一样了,会先去常量池里找,常量池中有该字符串,所以str4
的引用值与str1
相等,结果输出true
。
(4):定义str5
时,会将字符串cs
入池,因为str5
是一个变量,编译时期不会将两字符串拼起来,所以定义str6
时会将dn
入池,运行时会使用StringBuilder
类将两个字符串进行拼接(该类在后面详细介绍),会得到一个新对象,该对象中存有拼接后的字符串csdn
,注意使用拼接得到的字符串不会自动入池。所以str1
与str6
的值不相等,输出false
。
当然除了自动入池,还可以手动入池,可以使用
方法手动入池。
2.3字符串内容相等的判断
判断两个字符串内容是否相等,使用string
类中的equals
方法,下图为该方法的源码。(Object类是所有类的父类,所以Object变量可以接受所以类的引用变量)
对于源码实现的思路不细说,重点是知道如何使用它。
public class Test4 {
public static void main(String[] args) {
String str1 = "weijianhuawen";
String str2 = "WJHW";
String str3 = "weijianhuawen";
System.out.println(str1.equals(str2));
System.out.println(str1.equals(str3));//将确定不为null的对象放前面,可防止空指针异常,但是这样做有时候会忽略方法内对象为null的情况
System.out.println(str1.equals(null));
}
}
2.4理解字符串内容不可变
我们根据源码知道字符串本质上就是一个字符数组。但是这个数组被private final
修饰,我们不能访问和修改,所以字符串内容是不可变的,如果硬要改变,只能采取反射(现在了解即可,后续博文详细介绍)。
反射是面向对象编程的一种重要特性, 有些编程语言也称为 “自省”.
指的是程序运行过程中, 获取/修改某个对象的详细信息(类型信息, 属性信息等), 相当于让一个对象更好的 “认清自己”
为什么 String 要不可变?
- 方便实现字符串对象池. 如果 String 可变, 那么对象池就需要考虑何时深拷贝字符串的问题了。
- 不可变对象是线程安全的。
- 不可变对象更方便缓存 hash code, 作为 key 时可以更高效的保存到 HashMap 中。
- 点赞
- 收藏
- 关注作者
评论(0)