面试中经常被问到的 list如何去重,用来考察你对list数据结构,以及相关方法的掌握,体现你的java基础学的是否牢固。
我们大家都知道,
set集合的特点就是没有重复的元素。如果集合中的数据类型是基本数据类型,可以直接将list集合转换成set,就会自动去除重复的元素,这个就相对比较简单。如下示例:
1 public class Test {
2 public static void main(String[] args) {
3 List list = new ArrayList();
4 list.add(11);
5 list.add(12);
6 list.add(13);
7 list.add(14);
8 list.add(15);
9 list.add(11);
10 System.out.println(list);
11 Set set = new HashSet();
12 List newList = new ArrayList();
13 set.addAll(list);
14 newList.addAll(set);
15 System.out.println(newList);
16 }
17 }
输出结果为:
我们可以看到去重成功了。
在面试中被问到
list去重问题,大部分回答都会是list和set互转,利用set自动去除重复属性的方法去重,但是这样的回答并不会得分。当list集合中存储的类型是对象类型的时候,我们就不能简单的只把list集合转换成set集合。我们定义一个对象类:
1 public class People {
2
3 private String name;
4 private String phoneNumber;
5
6 public String getName() {
7 return name;
8 }
9
10 public void setName(String name) {
11 this.name = name;
12 }
13
14 public String getPhoneNumber() {
15 return phoneNumber;
16 }
17
18 public void setPhoneNumber(String phoneNumber) {
19 this.phoneNumber = phoneNumber;
20 }
21
22 public People(String name, String phoneNumber) {
23 super();
24 this.name = name;
25 this.phoneNumber = phoneNumber;
26 }
27
28 @Override
29 public String toString() {
30 return "People{" +
31 "name='" + name + '/'' +
32 ", phoneNumber='" + phoneNumber + '/'' +
33 '}';
34 }
35
36 }
我们使用上面的 set去重的方法去重:
1 public static void main(String[] args) {
2 List<People> listPeople = new ArrayList<People>();
3 listPeople.add(new People("张三", "11111"));
4 listPeople.add(new People("张三", "22222"));
5 listPeople.add(new People("李四", "33333"));
6 listPeople.add(new People("张三", "22222"));
7
8 Set<People> setData = new HashSet<People>();
9 setData.addAll(listPeople);
10 System.out.println("list:" + listPeople.toString());
11 System.out.println("set:" + setData.toString());
12
13 }
运行后输出的结果为:
我们可以看到第二个张三和最后一个张三,信息都一样,却没有被去重。
当
list集合中存储的是对象时,我们需要在对象的实体类中去重写equals()方法和hashCode()方法,如下:
1 public class People {
2
3 private String name;
4 private String phoneNumber;
5
6 public String getName() {
7 return name;
8 }
9
10 public void setName(String name) {
11 this.name = name;
12 }
13
14 public String getPhoneNumber() {
15 return phoneNumber;
16 }
17
18 public void setPhoneNumber(String phoneNumber) {
19 this.phoneNumber = phoneNumber;
20 }
21
22 public People(String name, String phoneNumber) {
23 super();
24 this.name = name;
25 this.phoneNumber = phoneNumber;
26 }
27
28 @Override
29 public String toString() {
30 return "People{" +
31 "name='" + name + '/'' +
32 ", phoneNumber='" + phoneNumber + '/'' +
33 '}';
34 }
35
36 @Override
37 public boolean equals(Object arg0) {
38 // TODO Auto-generated method stub
39 People p = (People) arg0;
40 return name.equals(p.name) && phoneNumber.equals(p.phoneNumber);
41 }
42
43 @Override
44 public int hashCode() {
45 // TODO Auto-generated method stub
46 String str = name + phoneNumber;
47 return str.hashCode();
48 }
49
50 }
时运行上面的 test方法,去重就成功了。最后,我们拿出String中的equals()方法和hashCode()方法源码来加深认识:
1 public boolean equals(Object anObject) {
2 if (this == anObject) {
3 return true;
4 }
5 if (anObject instanceof String) {
6 String anotherString = (String)anObject;
7 int n = count;
8 if (n == anotherString.count) {
9 char v1[] = value;
10 char v2[] = anotherString.value;
11 int i = offset;
12 int j = anotherString.offset;
13 while (n-- != 0) {
14 if (v1[i++] != v2[j++])
15 return false;
16 }
17 return true;
18 }
19 }
20 return false;
21 }
比较两个对象时,首先先去判断两个对象是否具有相同的地址,如果是同一个对象的引用,则直接放回 true;如果地址不一样,则证明不是引用同一个对象,接下来就是挨个去比较两个字符串对象的内容是否一致,完全相等返回true,否则false。
1 public int hashCode() {
2 int h = hash;
3 if (h == 0 && count > 0) {
4 int off = offset;
5 char val[] = value;
6 int len = count;
7 for (int i = 0; i < len; i++) {
8 h = 31*h + val[off++];
9 }
10 hash = h;
11 }
12 return h;
13 }
hashCode()官方定义:
hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点,例如,java.util.Hashtable 提供的哈希表。
hashCode 的常规协定是:
在 Java 应用程序执行期间,在同一对象上多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。如果根据 equals(Object) 方法,两个对象是相等的,那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。以下情况不是必需的:如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是,程序员应该知道,为不相等的对象生成不同整数结果可以提高哈希表的性能。实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 JavaTM 编程语言不需要这种实现技巧。)当equals方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。
当然, List去重的方法很多,可以用for循环或者使用java8新特性stream等等,下面分别介绍一下五种方法:
1 //新建一个list数组:
2 List list = new ArrayList();
3 list.add(26);
4 list.add(39);
5 list.add(5);
6 list.add(40);
7 list.add(39);
8 list.add(25);
9 System.out.println(list);
10 //方法一:使用java8新特性stream进行List去重
11 List newList = list.stream().distinct().collect(Collectors.toList());
12 System.out.println(“java8新特性stream去重:”+newList);
13 list.add(39);
14 //方法二:双重for循环去重
15 for (int i = 0; i < list.size(); i++) {
16 for (int j = 0; j < list.size(); j++) {
17 if(i!=j&&list.get(i)==list.get(j)) {
18 list.remove(list.get(j));
19 }
20 }
21 }
22 System.out.println(“双重for循环去重:”+list);
23 list.add(39);
24 //方法三:set集合判断去重,不打乱顺序
25 Set set1 = new HashSet();
26 List newList1 = new ArrayList();
27 for (Integer integer : list) {
28 if(set1.add(integer)) {
29 newList1.add(integer);
30 }
31 }
32 System.out.println(“set集合判断去重:”+list);
33 list.add(39);
34 //方法四:遍历后判断赋给另一个list集合
35 List newList2 = new ArrayList();
36 for (Integer integer : list) {
37 if(!newList2.contains(integer)){
38 newList2.add(integer);
39 }
40 }
41 System.out.println(“赋值新list去重:”+newList2);
42 list.add(39);
43 //方法五:set和list转换去重
44 Set set2 = new HashSet();
45 List newList3 = new ArrayList();
46 set2.addAll(list);
47 newList3.addAll(set2);
48 System.out.println(“set和list转换去重:”+newList3);