String字符串类
在Java中,String
类是表示字符串的不可变对象。这意味着一旦创建了一个 String
对象,就不能修改它的内容。String是一个引用类型,它本身也是一个class类。
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
}
Java字符串的一个重要特点就是字符串不可变。这种不可变性是通过内部的private final char[]字段,以及没有任何修改char[]的方法实现的。例如:
public class Main {
public static void main(String[] args) {
String s = "Hello";
System.out.println(s);
// s未指向新的字符串
s.toUpperCase();
System.out.println(s);
// s重新指向新的字符串
s = s.toUpperCase();
System.out.println(s);
}
}
字符串比较
当我们想要比较两个字符串是否相同时,要特别注意,我们实际上是想比较字符串的内容是否相同。必须使用equals()方法而不能用==关系运算符。
public class Main {
public static void main(String[] args) {
String s1 = "hello";
String s2 = "hello";
System.out.println(s1 == s2);
System.out.println(s1.equals(s2));
}
}
从表面上看,两个字符串用==和equals()比较都为true,但实际上那只是Java编译器在编译期,会自动把所有相同的字符串当作一个对象放入常量池,s1和s2的引用地址就是相同的,结果为true。所以,这种==比较返回true纯属巧合。换一种写法,==比较就会失败。
例如:
public class Main {
public static void main(String[] args) {
String s1 = "hello";
String s2 = "HELLO".toLowerCase();
System.out.println(s1 == s2);
System.out.println(s1.equals(s2));
}
}
结论:两个字符串比较,必须总是使用equals()方法。要忽略大小写比较,使用equalsIgnoreCase()方法。
字符串的搜索
使用indexOf()方法可以从字符串的首部进行搜索,当前字符串中指定子字符串的下标位置,返回值为int类型。如果存在,则返回该子字符串的下标位置。如果不存在,则返回-1;
lastIndexOf()方法是从字符串的尾部进行搜索,返回值与indexOf()方法一致;
startsWith()和endsWith()方法是用于判断字符串是否以指定字符串开头或结尾,返回值为boolean类型;
contains()方法用于查找当前字符串中是否存在指定子字符串,返回值为boolean类型。
"Hello".indexOf("l"); // 2
"Hello".lastIndexOf("l"); // 3
"Hello".startsWith("He"); // true
"Hello".endsWith("lo"); // true
"Hello".contains("lo"); // true
截取子字符串
使用substring()方法可以从当前字符串中,截取指定下标区间的子字符串。
"大漠孤烟直".substring(2); // 孤烟直
"大漠孤烟直".substring(0,2); // 大漠
去除首尾空白字符
使用trim()方法可以移除字符串首尾空白字符。空白字符包括空格,\t,\r,\n:
" \tHello\r\n ".trim(); // 返回 "Hello"
注意:trim()并没有改变字符串的内容,而是返回了一个新字符串。
String还提供了isEmpty()判断字符串是否为空字符串:
"".isEmpty(); // true,因为字符串长度为0
" ".isEmpty(); // false,因为字符串长度不为0
替换字符串
要在字符串中替换子串,有两种方法。
第一种:根据字符或字符串替换。
String s = "hello";
s.replace('l', 'w'); // "hewwo",所有字符'l'被替换为'w'
s.replace("ll", "~~"); // "he~~o",所有子串"ll"被替换为"~~"
第二种:是通过正则表达式替换。
下面的代码通过正则表达式,把匹配的子串统一替换为","。
String s = "A,,B;C ,D";
s.replaceAll("[\\,\\;\\s]+", ","); // "A,B,C,D"
分割字符串
要分割字符串,使用split()方法,并且传入的也是正则表达式:
String str1 = "北京#上海#大连#连云港#南京#杭州#深圳#齐齐哈尔#乌鲁木齐";
String[] ret1 = str1.split("#"); // 按照普通字符内容切割
System.out.println(Arrays.toString(ret1));
String str2 = "北京.上海.大连.连云港.南京.杭州.深圳.齐齐哈尔.乌鲁木齐";
String[] ret2 = str2.split("\\."); // "."是正则表达式中符号,所以需要转义
System.out.println(Arrays.toString(ret2));
String str3 = "北京0上海1大连2连云港3南京4杭州5深圳6齐齐哈尔7乌鲁木齐";
String[] ret3 = str3.split("[0-9]"); // 按照正则表达式切割字符串
System.out.println(Arrays.toString(ret3));
拼接字符串
拼接字符串使用静态方法join(),它用指定的字符串连接字符串数组:
String[] arr = {"A", "B", "C"};
String s = String.join("***", arr); // "A***B***C"
格式化字符串
字符串提供了format()静态方法,可以传入其他参数,替换占位符,然后生成新的字符串。
例如:
String s = "Hi %s, your score is %d!";
System.out.println(s.format("Alice", 80)); // 字符串对象调用
System.out.println(String.format("Hi %s, your score is %.2f!", "Bob", 59.5)); // 字符串类调用
有几个占位符,后面就传入几个参数。参数类型要和占位符一致。我们经常用这个方法来格式化信息。常用的占位符有:
●%s:显示字符串
●%d:显示整数
● %f:显示浮点数
占位符还可以带格式,例如%.2f表示显示两位小数。如果你不确定用啥占位符,那就始终用%s,因为%s可以显示任何数据类型。
类型转换
要把任意基本类型或引用类型转换为字符串,可以使用静态方法valueOf()。这是一个重载方法,编译器会根据参数自动选择合适的方法:
String.valueOf(123); // "123"
String.valueOf(45.67); // "45.67"
String.valueOf(true); // "true"
String.valueOf(new Object()); // 类似java.lang.Object@636be97c
要把字符串转换为其他类型,就需要根据情况。
例如:把字符串转换为int类型。
int n1 = Integer.parseInt("123"); // 123
int n2 = Integer.parseInt("ff", 16); // 按十六进制转换,255
例如:把字符串转换为boolean类型:
boolean b1 = Boolean.parseBoolean("true"); // true
boolean b2 = Boolean.parseBoolean("FALSE"); // false
转换为char[ ]字符数组
String和char[]类型可以互相转换。
例如:
char[] cs = "Hello".toCharArray(); // String -> char[]
String s = new String(cs); // char[] -> String
如果修改了char[]数组,String并不会改变,这是因为通过new String(char[])创建新的String实例时,它并不会直接引用传入的char[]数组,而是会复制一份,所以,修改外部的char[]数组不会影响String实例内部的char[]数组,因为这是两个不同的数组。
char[] cs = "Hello".toCharArray();
String s = new String(cs);
System.out.println(s);
cs[0] = 'X';
System.out.println(s);
小结
●Java字符串String是不可变对象
●字符串操作不改变原字符串内容,而是返回新字符串
●常用的字符串操作:提取子串、查找、替换、大小写转换等
●Java使用Unicode编码表示String和char