集合-02

举报
kwan的解忧杂货铺 发表于 2024/05/27 22:14:44 2024/05/27
【摘要】 二.ArrayList 1.ArrayList 的特点?先来看一下类的声明,有一个继承(抽象类)和四个接口关系public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable{ // 源码具体内容...}R...

二.ArrayList

1.ArrayList 的特点?

先来看一下类的声明,有一个继承(抽象类)和四个接口关系

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    // 源码具体内容...
}
  • RandomAccess 是一个标志接口(Marker)只要 List 集合实现这个接口,就能支持快速随机访问(通过元素序号快速获取元素对象 —— get(int index)

  • Cloneable :实现它就可以进行克隆(clone()

  • java.io.Serializable :实现它意味着支持序列化,满足了序列化传输的条件

image-20230823103123737

  1. ArrayList 底层是动态数组,实现了 list,RandomAccess, Cloneable, java.io.Serializable 接口, 并允许包含 null 元素,实现了 RandomAccess 表示支持快速访问,底层是数组实现,访问时间复杂度是 O(1),实现了 cloneable 接口,表示可以被复制,且是浅复制。实现了 java.io.Serializable 接口,支持序列化传输。
  2. 底层是数组实现,默认容量是 10,当超出默认容量后,会扩容 1.5 倍,即自动扩容机制。数组的扩容是新建一个大数组,将原数组元素拷贝到新数组,此操作代价很高,我们应该减少这种操作。
  3. 该集合是可变长度的数组,扩容时,扩容为 1.5 倍,将原数组的元素拷贝到新数组, 扩容使用的是 Arrays.copyOf 浅复制的方式进行拷贝,添加元素 add 时使用的是 System.arraycopy。
  4. 采用了 fail-fast 的机制,面对并发修改时,迭代器很快就会完全失败,报异常 concurrentModificationException 并发修改错误。
  5. remove 方法会将下标到末尾的元素向前移动一位,并把最后一位置空,为了 gc。
  6. 数组扩容代价很高,我们在使用时尽量指定好容量。以避免数组扩容发生,或者根据实际需求,通过调用 ensureCapacity 方法手动增加 ArrayList 实例的容量。
  7. ArrayList 不是线程安全的,只能在单线程下使用,多线程下,尽量使用 Collections.synchronizedList(List l)返回一个安全的 ArrayList 类,或者使用并发包下面的 CopyOnWriteArrayList 类。
  8. 如果是删除指定元素,可能会挪动大量的数组元素,如果是末尾元素,那么代价是最小的。
  9. ArrayList 不会缩容,只会扩容.

2.类成员

下面接着看一些成员属性

// 序列化自动生成的一个码,用来在正反序列化中验证版本一致性。
private static final long serialVersionUID = 8683452581122892189L;

/**
 * 默认初始容量大小为10
 */
private static final int DEFAULT_CAPACITY = 10;

/**
 * 指定 ArrayList 容量为0(空实例)时,返回此空数组
 */
private static final Object[] EMPTY_ELEMENTDATA = {};

/**
 * 与 EMPTY_ELEMENTDATA 的区别是,它是默认返回的,而前者是用户指定容量为 0 才返回
 */
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

/**
 * 具体存放元素的数组
 * 保存添加到 ArrayList 中的元素数据(第一次添加元素时,会扩容到 DEFAULT_CAPACITY = 10 )
 */
transient Object[] elementData; // non-private to simplify nested class access

/**
 * ArrayList 实际所含元素个数(大小)
 */
private int size;

3.ArrayList 构造方法?

有三个构造方法

第一个:无参构造方法,初始容量为 10.

//默认容量为0
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

public ArrayList() {
	 //构造函数的默认容量为0
   this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

//在add方法时,会计算容量,当数组为空时,会取Math.max(最小容量,10)
private static int calculateCapacity(Object[] elementData, int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

第二个:构造一个包含指定元素的列表。

public ArrayList(Collection<? extends E> c) {
    Object[] a = c.toArray();
    if ((size = a.length) != 0) {
        if (c.getClass() == ArrayList.class) {
            elementData = a;
        } else {
            elementData = Arrays.copyOf(a, size, Object[].class);
        }
    } else {
        // replace with empty array.
        elementData = EMPTY_ELEMENTDATA;
    }
}

第三个:构造一个具有初始化容量的空列表。

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}

我们看到代码逻辑不复杂,从代码逻辑中,可以看到, 会有 new Object[] 的操作,从这里就能印证,ArrayList 就是以数组为底层的。

构造方法:

/**
 * 带参构造函数,参数为用户指定的初始容量
 */
public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        // 参数大于0,创建 initialCapacity 大小的数组
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        // 参数为0,创建空数组(成员中有定义)
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        // 其他情况,直接抛异常
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}

/**
 * 默认无参构造函数,初始值为 0
 * 也说明 DEFAULT_CAPACITY = 10 这个容量
 * 不是在构造函数初始化的时候设定的(而是在添加第一个元素的时候)
 */
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

/**
 * 构造一个包含指定 collection 的元素的列表
 * 这些元素是按照该 collection 的迭代器返回它们的顺序排列的。
 */
public ArrayList(Collection<? extends E> c) {
    // 将给定的集合转成数组
    elementData = c.toArray();
    // 如果数组长度不为 0
    if ((size = elementData.length) != 0) {
        // elementData 如果不是 Object 类型的数据,返回的就不是 Object 类型的数组
        if (elementData.getClass() != Object[].class)
            // 将不是 Object 类型的 elementData 数组,赋值给一个新的 Object 类型的数组
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // 数组长度为 0 ,用空数组代替
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

4.final object 数组

在 ArrayList 中,为什么有 2 个静态 final 修饰的 object 数组?

  • EMPTY_ELEMENTDATA
  • DEFAULTCAPACITY_EMPTY_ELEMENTDATA
private static final Object[] EMPTY_ELEMENTDATA = {};
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

从代码可以看到,这 2 个 object 的数组基本是一样的,那么为什么要用 2 个呢?从源码可以看到只有无参构造器使用的是 DEFAULTCAPACITY_EMPTY_ELEMENTDATA,其他 2 个构造器使用的是 EMPTY_ELEMENTDATA,先说结论,这里是为了初始化容量不同而设定的。

==和 equals 是啥区别?

  • ==是判断两个变量或实例是不是指向同一个内存空间,equals 是判断两个变量或实例所指向的内存空间的值是不是相同
  • ==是指对内存地址进行比较 , equals()是对字符串的内容进行比较
  • ==指引用是否相同, equals()指的是值是否相同

image-20231022232718723

回到正题,在使用 add 方法时,

public boolean add(E e) {
  // 确认容量
  ensureCapacityInternal(size + 1);  // Increments modCount!!
  // 直接将元素添加在数组中
  elementData[size++] = e;
  return true;
}

private void ensureCapacityInternal(int minCapacity) {
  // 进一步确认ArrayList的容量,看是否需要进行扩容
  ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {
  // 如果elementData为空,则返回默认容量和minCapacity中的最大值
  if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
    return Math.max(DEFAULT_CAPACITY, minCapacity);
  }
  // 否则直接返回minCapacity
  return minCapacity;
}

private void ensureExplicitCapacity(int minCapacity) {
  // 修改次数自增
  modCount++;

  // overflow-conscious code
  // 判断是否需要扩容
  if (minCapacity - elementData.length > 0)
    grow(minCapacity);
}

private void grow(int minCapacity) {
  // overflow-conscious code
  // 原容量
  int oldCapacity = elementData.length;
  // 扩容,相当于扩大为原来的1.5倍
  int newCapacity = oldCapacity + (oldCapacity >> 1);
  // 确认最终容量
  if (newCapacity - minCapacity < 0)
    newCapacity = minCapacity;
  if (newCapacity - MAX_ARRAY_SIZE > 0)
    newCapacity = hugeCapacity(minCapacity);
  // minCapacity is usually close to size, so this is a win:
  // 将旧数据拷贝到新数组中
  elementData = Arrays.copyOf(elementData, newCapacity);
}

从源码可以看到,如果是 DEFAULTCAPACITY_EMPTY_ELEMENTDATA,则容量为默认的 10,如果是 EMPTY_ELEMENTDATA,则容量为 1。调用 add 方法时才为 10,不调用为 0.

关于 ArrayList 的容量

  • 默认构造函数,不添加元素,容量为 0
  • 默认构造函数,添加元素,容量为 10
  • 初始化为 0,添加元素,容量为 1
//默认构造函数,不添加元素,容量为0
public class Basic_collection_01_ArrayList_03 {
  public static void main(String[] args) throws InterruptedException, ClassNotFoundException, NoSuchFieldException, IllegalAccessException {
    ArrayList arrayList = new ArrayList();
    Class<?> clazz = Class.forName("java.util.ArrayList");
    Field field = clazz.getDeclaredField("elementData");
    field.setAccessible(true);
    Object[] o = (Object[]) field.get(arrayList);
    System.out.println(o.length);
  }
}

// 默认构造函数,添加元素,容量为10
public class Basic_collection_01_ArrayList_04 {
  public static void main(String[] args) throws InterruptedException, ClassNotFoundException, NoSuchFieldException, IllegalAccessException {
    ArrayList arrayList = new ArrayList();
    arrayList.add(1);
    Class<?> clazz = Class.forName("java.util.ArrayList");
    Field field = clazz.getDeclaredField("elementData");
    field.setAccessible(true);
    Object[] o = (Object[]) field.get(arrayList);
    System.out.println(o.length);
  }
}

// 初始化为0,添加元素,容量为1
public class Basic_collection_01_ArrayList_05 {
  public static void main(String[] args) throws InterruptedException, ClassNotFoundException, NoSuchFieldException, IllegalAccessException {
    ArrayList arrayList = new ArrayList(0);
    arrayList.add(1);
    Class<?> clazz = Class.forName("java.util.ArrayList");
    Field field = clazz.getDeclaredField("elementData");
    field.setAccessible(true);
    Object[] o = (Object[]) field.get(arrayList);
    System.out.println(o.length);
  }
}

5.序列化后数据会丢失?

ArrayList 中的elementData用 transient 修饰,序列化后数据会丢失吗?

源码中的全局变量,transient Object[] elementData;

隐含面试题:

1.序列化是什么?

我们知道对象是不能直接进行网络传输的,必须将对象转为二进制字节流进行传输。序列化就是将对象转为二进制字节流的过程。同理,反序列化就是将字节流构建对象的过程

  • 对 java 对象来说,如果使用 jdk 的序列化实现,只需要实现 java.io.Serializable 接口。

  • 可以使用 ObjectOutputStream 和 ObjectInputStream 对对象进行序列化和反序列化。序列化的时候会调用 writeObject 方法,把对象转为字节流。反序列化会调用 readObject 方法,把字节流转为对象。

  • java 在反序列化的时候会校验 serialVersionUid 与对象的 serialVersionUid 是否一致,如果不一致,会抛出 InvalidClassException 异常

  • 官方强烈推荐序列化时指定一个 serialVersionUid,否则虚拟机会根据类的相关信息通过一个摘要算法生成,所以当我们修改类的参数的时候,虚拟机生成的 serialVersionUid 时变化的。

  • transient 关键字修饰的变量不会被序列化为字节流。

    2.transient 关键字的具体含义?

transient 关键字修饰的变量不会被序列化为字节流。

进入正题:

从源码可以看到 elementData 就是 ArrayList 的底层数组,如果不能被序列化,那 ArrayList 就是不可用的。

我们在进行对象序列化的时候,只需要实现 java.io.Serializable 接口,ArrayList 实现了该接口,说明 ArrayList 是可以被序列化的。所有用户数据,都保存在 elementData 中,如果序列化后数据丢失,那 ArrayList 肯定是有问题的。

arraylsit 用什么巧妙的方式,既防止了 elementData 的序列化,又保证存入的元素不丢失呢?

答案很简单,不对 elementData 序列化,对 elementData 里面的元素进行循环,取出的元素单独进行序列化

image-20231022232731976

image-20231022232743822

通过查看 ArrayList 源码中的 2 个方法,可以看到具体的实现 writeObject 和 readObject

6.为什么不直接序列化?

为什么不直接序列化 elementData?

elementData 是一个对象数组,不直接序列化这个对象,是因为绝大多数的情况下,存在没有存储任何元素的空间,这样序列化会存在空间浪费,全部序列化效率更低。

比如容量为 10,但只有一个元素,浪费了 9 个容量。

每次扩容都是原来的 1.5 倍,如果在大容量空间下比如 10 万,扩容到 15 万,将有 5 万的空间浪费。

7.transient 的理解?

  1. 一旦变量被 transient 修饰,变量将不再是对象持久化的一部分,该变量的内容在序列化后无法获得访问。
  2. transient 关键字只能修饰变量,不能修饰类和方法。
  3. 本地变量不能被 transient 关键字修饰。
  4. 自定义的类需要序列化,只需要实现 java.io.Serializable 接口。
  5. 被 transient 关键字修饰的变量不能再被序列化,静态变量不管是否被 transient 修饰,都不能被序列化。
  6. 使用场景,密码和银行卡不想被序列化,可以加上 transient 关键字。这个字段的生命周期仅存在于调用者的内存中,不会写到磁盘持久化。

8.add(E e)方法的原理?

add 方法主要执行以下逻辑:

  1. 确保数组已经使用的长度 size+1 之后足够存下下一个元素。
  2. 修改次数 modCount 自动加 1,如果当前数组的长度 size 加 1 后的长度大于当前数组的长度,则调用 grow 方法,增长数组,grow 方法会将当前数组的长度变为原数组的 1.5 倍。
  3. 确保新增的元素有地方存储后,新元素存储在 size 处。
  4. 返回添加成功的布尔值。

9.add(int index,E element)

ArrayList 中 add(int index,E element)有了解过吗?这个方法的优劣

public void add(int index, E element) {
  // 越界检查
  rangeCheckForAdd(index);

  // 确认容量
  ensureCapacityInternal(size + 1);  // Increments modCount!!
  // 将index及其之后的元素往后移动一位,将index位置空出来
  System.arraycopy(elementData, index, elementData, index + 1,
                   size - index);
  // 在index插入元素
  elementData[index] = element;
  // 元素个数自增
  size++;
}

该方法可以按照元素的位置,指定元素的插入位置,具体流程如下:

  1. 确保插入的位置小于等于当前数组的长度,并且不小于 0,否则抛出异常。
  2. 确保数组已经使用的长度 size 加 1 后足够存下一个数据。
  3. 修改标识自动加 1,如果当前数组已经使用的长度 size 加 1 后大于当前数组的长度,则调用 grow 方法,增长数组。
  4. grow 方法会将当前数组的长度变为原来容量的 1.5 倍。
  5. 确保有足够的容量之后,调用System.arraycopy方法,将需要插入位置 index 后面的元素统统后移一位。
  6. 将新的数据存放到新的数组的指定位置 index 处。

好处:因为存在 index,可以存在指定的位置。只要 index 符合要求。

坏处:调用System.arraycopy方法,插入的时候需要移动其他元素,频繁移动,速率会打折扣。

10.ArrayList 的扩容原理?

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE – 8 = 2^31-1-8 ;
Integer.MAX_VALUE = 0x7fffffff = 2^31-1;
private void grow(int minCapacity) {
  // overflow-conscious code
  int oldCapacity = elementData.length;
  int newCapacity = oldCapacity + (oldCapacity >> 1);//1.5倍
  if (newCapacity - minCapacity < 0)
    newCapacity = minCapacity;
  if (newCapacity - MAX_ARRAY_SIZE > 0)
    newCapacity = hugeCapacity(minCapacity);
  // minCapacity is usually close to size, so this is a win:
  elementData = Arrays.copyOf(elementData, newCapacity);
}
  1. 老的长度等于当前 elementData 的长度。
  2. 新数组的长度=原数组的长度+原数组长度>>1,右移 1 是除以 2.
  3. 若扩容 1.5 倍后仍不够用,则 newCapacity=minCapacity
  4. 如果 newCapacity 比 MAX_ARRAY_SIZE 还大,则调用 hugeCapacity 方法。
  5. 老数据拷贝到新数组中。
private static int hugeCapacity(int minCapacity) {
  if (minCapacity < 0) // overflow
    throw new OutOfMemoryError();
  return (minCapacity > MAX_ARRAY_SIZE) ?
    Integer.MAX_VALUE :
  MAX_ARRAY_SIZE;
}

如果 MAX_ARRAY_SIZE 达不到要求,则赋值 Integer.MAX_VALUE,理论上 ArrayList 的最大容量为 Integer.MAX_VALUE

11.数组在 jvm 中的构造

在 JVM 中,数组是作为对象来处理的,每个数组都有一个 Class 对象,用于描述数组的类型信息。当定义一个数组时,JVM 会在堆上为数组对象分配内存空间,并初始化数组元素的值,根据数组的类型不同,初始化的方式也不同。

对于基本数据类型的数组,例如 int[]、char[]等,JVM 会使用默认值来初始化数组元素。例如,int 类型的数组元素默认值为 0,char 类型的数组元素默认值为’\u0000’。JVM 在为数组对象分配内存空间时,会根据数组元素的个数和类型计算出所需的空间大小,并在内存中分配连续的空间存储数组元素。

对于对象数组,例如 String[]、Object[]等,JVM 会在堆上为数组对象分配内存空间,并使用 null 值来初始化数组元素。在数组元素的类型为引用类型时,JVM 只会为每个引用分配 4 个字节的空间,用于存储对象的地址,而不会为每个对象分配独立的空间。因此,在数组元素类型为引用类型时,数组对象只是存储了对象的地址,而不是对象本身。

需要注意的是,数组的大小在创建时就已经确定,并且无法改变。如果需要动态增加或减少数组大小,可以使用 Java 中提供的 List 接口及其实现类,例如 ArrayList、LinkedList 等。这些集合类可以根据需要动态调整集合大小,并且可以方便地添加、删除和访问集合元素。

12.最大容量是?

为什么 MAX_ARRAY_SIZE 是 Integer.MAX_VALUE 减去 8,而不是别的数字?

  • 数组在 java 中是一种特殊的数据类型,既不是基本类型也不是引用类型。
  • 在 jvm 中获取数组的长度使用 arrayLength 这个专门的字节码指令,在数组的对象头中有一个_length 字段,记录数组的长度,只需要去读_length 字段就可以了
  • 所以这个减去 8 字节就是存了数组_length 字段

13.说说 remove 方法?

ArrayList 的 remove 方法有了解过吗?如果长度为 1 的 ArrayList,移除后是如何进行垃圾回收的?

public E remove(int index) {
    // 越界检查
    rangeCheck(index);

    // 修改次数自增
    modCount++;
    // 获取对应index上的元素
    E oldValue = elementData(index);

    // 判断index是否在最后一个位置
    int numMoved = size - index - 1;
    // 如果不是,则需要将index之后的元素往前移动一位
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    // 将最后一个元素删除,帮助GC
    elementData[--size] = null; // clear to let GC do its work

    return oldValue;
}
  • 移除元素后,会改变 modCount,并且是++操作
  • 判断是否是移除最后一个元素,如果不是,则进行拷贝操作,如果是最后一个,则将最后一个元素设置为 null,为 gc 做准备。这个设计非常细节。

14.contains 方法?

ArrayList 中的 contains 方法的时间复杂度?知道值如何知道值在不在集合中?

在 ArrayList 中,contains 方法的时间复杂度为 O(n),其中 n 为 ArrayList 中元素的个数。contains 方法的实现是遍历 ArrayList 中的元素,逐个比较元素值,直到找到匹配的元素或遍历完所有元素。因此,当 ArrayList 中的元素个数增加时,contains 方法的时间复杂度也会相应增加。

需要注意的是,当 ArrayList 中的元素类型为基本数据类型时,contains 方法会先将基本数据类型的值装箱为对应的包装类对象,然后再进行比较,这可能会导致额外的性能开销。如果需要更高效的元素查找,可以考虑使用基于哈希表实现的集合类,例如 HashSet 或 HashMap。这些集合类的 contains 方法的时间复杂度为 O(1),可以快速地判断元素是否存在。

public boolean contains(Object o) {
  return indexOf(o) >= 0;
}

/**
     * Returns the index of the first occurrence of the specified element
     * in this list, or -1 if this list does not contain the element.
     * More formally, returns the lowest index <tt>i</tt> such that
     * <tt>(o==null&nbsp;?&nbsp;get(i)==null&nbsp;:&nbsp;o.equals(get(i)))</tt>,
     * or -1 if there is no such index.
     */
public int indexOf(Object o) {
  if (o == null) {
    for (int i = 0; i < size; i++)
      if (elementData[i]==null)
        return i;
  } else {
    for (int i = 0; i < size; i++)
      if (o.equals(elementData[i]))
        return i;
  }
  return -1;
}

15.和 LinkedList 区别?

ArrayList 和 LinkedList 都是 Java 中的集合类,都实现了 List 接口,可以存储一组有序的元素。它们之间的区别主要体现在底层数据结构、访问速度、插入删除操作的效率等方面。

  1. 底层数据结构:ArrayList 是通过数组实现的,它在内存中开辟了一块连续的空间存储元素,因此可以通过索引快速访问元素。LinkedList 是通过双向链表实现的,每个节点包含了元素值、前驱节点和后继节点的引用,因此访问元素时需要从头或尾开始遍历链表。
  2. 访问速度:ArrayList 的访问速度比 LinkedList 快,因为它可以通过索引直接访问元素,而不需要遍历链表。LinkedList 的访问速度相对较慢,因为它需要遍历链表来查找元素。
  3. 插入删除操作效率:LinkedList 的插入删除操作效率比 ArrayList 高,因为它只需要改变相邻节点的引用,而不需要移动其他元素。而 ArrayList 的插入删除操作效率较低,因为它需要移动其他元素来保证数组的连续性。
  4. 空间占用:LinkedList 的每个节点都包含了元素值、前驱节点和后继节点的引用,因此占用的内存空间相对较大。而 ArrayList 只需要占用连续的内存空间,因此占用的内存空间相对较小。

根据上述特点,可以通过对 ArrayList 和 LinkedList 的选择来提高代码的效率。如果需要快速地访问集合中的元素,可以使用 ArrayList;如果需要频繁地插入删除元素,可以使用 LinkedList。在实际开发中,也可以根据具体的需求和场景来选择最适合的集合类型。

16.fail-fast 原理?

ArrayList 的 fail-fast 机制是什么原理?

采用了 fail-fast 机制,面对并发修改时,会立即失败,报 concurrentModificationException 并发修改异常。

ArrayList 的父类 abstractlist 中有一个类属性,这个属性代表了 list 被结构性修改的次数。

protected transient int modCount = 0;

结构性修改是指:改变了 list 的 size 大小。

这个字段用于迭代器和列表迭代器的实现类中,由迭代器和列表迭代器的方法返回。如果这个值被意外修改,就会抛出 ConcurrentModificationException 异常。

在迭代过程中,它提供了 fail-fast 机制,而不是不确定的行为来处理并发修改。子类使用这个字段是可选的, 如果子类希望提供 fail-fast 迭代器,它仅仅需要在 add(int, E),remove(int)方法(或者它重写的其他任何 会结构性修改这个列表的方法)中添加这个字段。调用一次 add(int,E)或者 remove(int)方法时必须且仅仅给这个字段加 1,否则迭代器会抛出伪装的 ConcurrentModificationExceptions 错误。如果一个实现类 不希望提供 fail-fast 迭代器,则可以忽略这个字段。

  • expectedModCount 初始值是 modCount。
  • hasnext 的判断条件是 cursor!=size,当前迭代位置不是数组的最大容量值就返回 true。
  • next 和 remove 操作之前都会调用 checkForComodification 来检查 expectedModCount 和 modCount 是否相等。

如果没 checkForComodification 去检查 expectedModCount 与 modCount 相等,这个程序肯定会报越界异常

ArrayIndexOutOfBoundsException 因为有 modCount 的存在,在使用多线程对非线程安全的集合进行操作时,使用迭代器循环会产生 modCount != expectedModCount 的情况,会抛出异常。

private void fastRemove(int index) {
  modCount++;
  int numMoved = size - index - 1;
  if (numMoved > 0)
    System.arraycopy(elementData, index+1, elementData, index,
                     numMoved);
  elementData[--size] = null; // clear to let GC do its work
}   

// 删除元素后,遍历下一个元素会先校验,不通过,报错 
public E next() {
  checkForComodification();
  int i = cursor;
  if (i >= SubList.this.size)
    throw new NoSuchElementException();
  Object[] elementData = ArrayList.this.elementData;
  if (offset + i >= elementData.length)
    throw new ConcurrentModificationException();
  cursor = i + 1;
  return (E) elementData[offset + (lastRet = i)];
}

//校验修改值
final void checkForComodification() {
  if (expectedModCount != ArrayList.this.modCount)
    throw new ConcurrentModificationException();
}

总结

  • foreach 遍历,iterator 遍历都不能在遍历的过程中使用 list.remove 或 list.add 操作,会报并发修改异常,遍历删除后加个 break 即可解决
  • iterator 遍历过程中如果需要删除可以使用 iterator 提供的 remove()方法
  • 遍历根据元素索引删除是可行的
  • 原因是先判断 next,然后判断 check,发现修改值变了,对应不上

17.fail-fast 和 fail-safe 对比?

对比项 fail-fast fail-safe
Throw ConcurrentModification Exception 不会
Clone 不会
Memory Overhead 不会
Examples HashMap Vector ArrayList HashSet CopyOnWriteArrayList

fail-safe 也是得具体情况具体分析的。

  1. 如果是 CopyOnWriteArrayList 或者 CopyOnWriteArraySet ,就属于 复制原来的集合,然后在复制出来的集合上进行操作 的情况 ,所以是不会抛出这个 ConcurrentModificationException 的 。
  2. 如果是这个 ConcurrentHashMap 的,就比较硬核了~ 😄 它直接操作底层,调用 UNSAFE.getObjectVolatile ,直接 强制从主存中获取属性值,也是不会抛出这个 ConcurrentModificationException 的 。
  3. 并发下,无法保证遍历时拿到的是最新的值

18.避开 fail-fast 机制?

ArrayList 如果在循环中删除一个元素,有什么办法避开 fail-fast 机制?

// 普通循环删除
public class Basic_08_foreach_03 {
  public static void main(String[] args) throws InterruptedException {
    ArrayList<String> list = new ArrayList<>();
    list.add("111");
    list.add("222");
    list.add("333");
    System.out.println(list.toString());
    for (int i = 0; i <list.size(); i++) {
      list.remove("222");
    }
    System.out.println(list.toString());
  }
}
//迭代器删除
public class Basic_08_foreach_05 {
  public static void main(String[] args) throws InterruptedException {
    ArrayList<String> list = new ArrayList<>();
    list.add("111");
    list.add("222");
    list.add("333");
    System.out.println(list.toString());
    Iterator<String> it = list.iterator();
    while (it.hasNext()) {
      String next = it.next();
      //if外使用list的remove方法还是会报错的
      if (next.equals("222")) {
        it.remove();//这里使用的是迭代器里面的remove()方法,
      }
    }
    System.out.println(list.toString());
  }
}

使用迭代器和普通 for 循环都是可行的,使用增强 for 循环不行。

增强 for 循环底层还是用的迭代器,迭代器的内部实现如下,三个属性非常重要,理解三个字段在 next 和 remove 的变化过程很关键.

private class Itr implements Iterator<E> {
  int cursor;       // 指向下一个元素的索引,默认初始化为 0
  int lastRet = -1; // 指向已被迭代过的元素,默认初始化为-1.
  int expectedModCount = modCount;// 赋值为 modCount,删除元素后重新赋值

  Itr() {}

  public boolean hasNext() {
    return cursor != size;
  }

  @SuppressWarnings("unchecked")
  public E next() {
    checkForComodification();
    int i = cursor;
    if (i >= size)
      throw new NoSuchElementException();
    Object[] elementData = ArrayList.this.elementData;
    if (i >= elementData.length)
      throw new ConcurrentModificationException();
    //cursor更新
    cursor = i + 1;
    return (E) elementData[lastRet = i]; //lastRet更新
  }

  public void remove() {
    //说明没有被迭代过,没有迭代过不允许删除
    if (lastRet < 0)
      throw new IllegalStateException();
    checkForComodification();

    try {
      ArrayList.this.remove(lastRet);
			//因为cursor比lastRet大1,删除元素的时候cursor需要减去1
      cursor = lastRet;
      lastRet = -1;
      expectedModCount = modCount;
    } catch (IndexOutOfBoundsException ex) {
      throw new ConcurrentModificationException();
    }
  }

  // 检查并发修改异常
  final void checkForComodification() {
    if (modCount != expectedModCount)
      throw new ConcurrentModificationException();
  }

   @Override
  @SuppressWarnings("unchecked")
  public void forEachRemaining(Consumer<? super E> consumer) {
    Objects.requireNonNull(consumer);
    final int size = ArrayList.this.size;
    int i = cursor;
    if (i >= size) {
      return;
    }
    final Object[] elementData = ArrayList.this.elementData;
    if (i >= elementData.length) {
      throw new ConcurrentModificationException();
    }
    while (i != size && modCount == expectedModCount) {
      consumer.accept((E) elementData[i++]);
    }
    // update once at end of iteration to reduce heap write traffic
    cursor = i;
    lastRet = i - 1;
    checkForComodification();
  }
}

每调用一次 next 方法,cursor=i+1 ,指向下一个元素。lastRet 指向刚刚被迭代过的元素 ,lastRet=i。我们可以看到,多数情况下,lastRet 与 cursor 的角标是连续的,只差 1。

lastRet<0. 代表 lastRet 没有被 i 赋值,说明是初始值-1. 说明没有被迭代过,没有被迭代过就删除,这是不允许的。也就是说,iterator 是靠 lastRet 的值来判断是否可以进行 remove 操作的。

如果 lastRet > 0,说明已经被迭代过,可以删除,这时候 cursor 的角标需要减去 1,cursor - 1= lastRet,所以对 cursor 进行 lastRet 的赋值操作,lastRet 的位置被成功的 remove 了,自己的位置被 cursor 替代了。把自己置成 初始值-1,等待下次的赋值删除操作。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。