Java-线性结构-数组
数组(Array)是最简单的数据结构,是由有限个相同类型的变量或对象组成的有序集合。因为数组中各元素之间是按顺序线性排列的,所以数组是一种线性数据结构。
数组是一类物理空间和逻辑形式都连续的线性数据结构:
- 数组用唯一的名字标识,通过数组名可以对数组中的元素进行引用。例如
array[0]表示数组中的第一个元素。 - 数组中的元素类型必须相同。
 - 数组的内存单元是连续的,一个数组要占据一个地址连续的内存空间。
 - 数组中的数据元素都是顺序存放的,元素之间有先后关系,数组元素之间不能存在空隙。
 
数组的定义
int[] array;
或者:
int array[];
这两种定义方式是等价的,不过第一种更符合Java的编程规范。
上面只是声明了一个引用变量array,其本质还是一个指针,而数组本身并不存在,也就是说在内存中还没有开辟那段连续的存储空间。要使用数组,必须先对数组进行初始化。
Java中初始化数组有两种方法:静态初始化和动态初始化。
静态初始化:
定义数组时显式地指定数组的初始值,系统会根据初始值的个数和类型自动为数组在堆内存中开辟空间。
//定义数组和初始化数组同时完成
int[] array1 = {1, 2, 3};
int array2[] = {1, 2, 3};
//定义数组
int[] array3;
//初始化数组
array3 = new int[] {1,2,3};
 动态初始化:
在初始化数组时仅指定数组的长度,不指定数组元素的初始值。
动态初始化不会显式地为数组指定初始值,系统为会该数组指定默认的初始值。
//定义数组和初始化数组同时完成
int[] array1 = new int[3];
int array2[] = new int[3];
//定义数组
int[] array3;
//动态初始化数组,只指定数组的长度
array3 = new int[3];
System.out.println(array3[0]);//0
 定义自己的数组类
如果我们希望定义更加完备的数组结构,则可以定义一个数组类,对数组地属性和操作进行封装。
public class MyArray {
	int[] array;// 数组本身
	int elemNumber; // 记录数组中元素的个数
	public MyArray(int capacity) {
		array = new int[capacity]; // 动态初始化数组,长度为capacity
		elemNumber = 0;
	}
	public boolean insertElem(int elem, int index) {
		if (index < 1 || index > elemNumber + 1) {
			System.out.println("Insert index error ");
			return false;
		}
		if (elemNumber == array.length) {
			increaseCapacity();
		}
		// 循环地将第index个元素及后面的元素都向后移动一个位置
		for (int i = elemNumber - 1; i >= index - 1; i--) {
			array[i + 1] = array[i];
		}
		// 将新元素插入到腾出的array[index-1]
		array[index - 1] = elem;
		elemNumber++;
		return true;
	}
	public boolean deleteElem(int index) {
		// 删除数组中第index位置上的元素
		if (index < 1 || index > elemNumber) {
			System.out.println("Delete index error ");
			return false;
		}
		for (int i = index; i < elemNumber; i++) {
			array[i - 1] = array[i];
		}
		elemNumber--;
		return true;
	}
	public void increaseCapacity() {
		// 增加数组的容量
		// 初始化一个新数组,容量是array容量的1.5倍
		int[] arrayTmp = new int[array.length * 2];
		System.arraycopy(array, 0, arrayTmp, 0, array.length);
		array = arrayTmp;
	}
	public void printArray() {
		for (int i = 0; i < elemNumber; i++) {
			System.out.print(array[i] + " ");
		}
		System.out.println();
	}
	public static void main(String[] args) {
		MyArray array = new MyArray(5); // 初始化一个容量为5的数组
		array.insertElem(3, 1); // 在数组的第1个位置插入3
		array.insertElem(5, 2); // 在数组的第2个位置插入5
		array.insertElem(2, 3); // 在数组的第3个位置插入2
		array.insertElem(7, 4); // 在数组的第4个位置插入7
		array.insertElem(8, 5); // 在数组的第5个位置插入8
		array.printArray(); // 打印数组内容
		array.insertElem(0, 3); // 在数组的第3个位置上插入0,需要扩容
		array.printArray(); // 打印数组内容
		array.deleteElem(7); // 企图删除第7个元素,但是删除失败
		array.printArray(); // 打印数组内容
	}
}
 Myarray是我们定义的数组类,该类中包含两个成员变量:
array表示一个int[]类型的数组,通过array[index]的形式可以引用到数组中的元素。elemNumber表示数组中元素的数量。
需要注意数组的容量和数组中元素的数量之间的区别。
- 数组的容量指数组在堆内存中开辟的内存单元的数量,也就是上述构造函数的参数
capacity所指定的大小,它表示数组中最多可以存放多少个元素。 - 数组的中元素的数量是变量
elemNumber记录的数据,它表示该数组中当前存储的有效元素的数量。 
我们可以通过array.length属性获取数组的容量,所以在Myarray类中不需要定义一个变量专门记录数组的容量,但是变量elemNumber是必须的,因为数组的容量与数组中元素的数量可能不相等,这就需要通过一个变量来记录数组中有效元素的数量,否则可能从数组中取出无效值。
向数组中插入元素
public boolean insertElem(int elem, int index)
这个函数的作用是在整型数组中的第index个位置上插入一个整型元素elem。
首先要理解什么是数组的第index个位置以及什么是数组的第index个位置上插入元素。
 数组的第index个位置:
- 数组中元素的位置是从1开始的,因此数组元素的下标与数组元素的位置相差1。这是一种约定俗成的规则,很多数据结构的书籍都是这样规定的。
 
数组的第index个位置上插入元素:
- 就是插入的新元素要位于数组的第index个位置上,原index个位置上的元素以及后续元素都要顺序向后移动一个位置。
 
前面已经提到,数组的元素之间不能存在“空隙”,因此插入新元素的位置范围应为:[1,elemNumber+1],否则数组中出现空隙,从而无法判断哪些是无有效的元素、那些是无效的。
- 将数组中第index个及之后的元素都向后移动一个位置,将数组的第index个位置空出来。
 - 将新元素插入数组的第index个位置,即
array[index-1]=elem;因为数组的下标与数组的位置之间相差1,所以array[index-1]就是数组的第index个元素。 
需要指出的是,如果插入元素的位置是elemNumber+1,也就是在数组的最后插入一个元素,则不需要执行移动数组元素的操作,直接将元素插入数组的elemNumber+1位置即可。
public boolean insertElem(int elem, int index) {
    if (index < 1 || index > elemNumber + 1) {
        System.out.println("Insert index error ");
        return false;
    }
    // 循环地将第index个元素及后面的元素都向后移动一个位置
    for (int i = elemNumber - 1; i >= index - 1; i--) {
        array[i + 1] = array[i];
    }
    // 将新元素插入到腾出的array[index-1]
    array[index - 1] = elem;
    elemNumber++;
    return true;
}
 在这段代码中,如果函数insertElem()的参数index等于elemNumber+1,则代码中循环移动元素的操作实际上是不被执行的,因为循环变量i的初始值是elemNumber-1,不满足i≥index-1=elemNumber的循环条件。
最后不要忘记elemNumber++;
数组扩容
当数组元素数量达到数组的容量上限时,就不允许再向数组中插入新元素,而是直接返回false表示插入元素失败,但是这种方法限定了数组中元素的数量,不够灵活。
我们使用动态扩容方法解决数组容量问题。
当向数组中插入元素,而数组中的元素容量又达到上限时,可以调用一个数组扩容方法对数组进行扩容,这样数组的存储空间就会随着数组元素的增多而不断增大。
public void increaseCapacity() {
    // 增加数组的容量
    // 初始化一个新数组,容量是array容量的1.5倍
    int[] arrayTmp = new int[array.length * 2];
    System.arraycopy(array, 0, arrayTmp, 0, array.length);
    array = arrayTmp;
}
 这里用到了System.arraycopy()函数,具体用法请参照上面的代码。
删除元素
public boolean deleteElem(int index)
这个过程与插入元素的过程正好相反,我们只需要将第index个位置之后的元素(不含第index个位置上的元素)顺序向前移动一个位置,并将数组元素的数量减一,就可以完成删除操作。
被删除数组元素的位置只能在[1,elemNumber]的范围内,删除其他位置的元素都是非法的。
这里区间的右端点与插入时不同,插入是elemNumber+1。
public boolean deleteElem(int index) {
    // 删除数组中第index位置上的元素
    if (index < 1 || index > elemNumber) {
        System.out.println("Delete index error ");
        return false;
    }
    for (int i = index; i < elemNumber; i++) {
        array[i - 1] = array[i];
    }
    elemNumber--;
    return true;
}
 数组的性能分析
数组适合读操作频繁,而插入删除操作较少的场景。在定义数组时,要根据实际需求指定数组大小。
如果需要扩容,则应该选择合适的扩容因子,既要尽量提高空间利用率,又要最大限度避免频繁扩容对数组性能的影响。
优点:
- 数组是一种可随机访问的线性结构,只要给定数组名和数组的下标,就可以用
时间复杂度直接定位到对应的元素。 
缺点:
- 由于数组的元素都是顺序存储的,且数组元素之间不能存在空隙,因此在插入删除时会有大量元素移动,将严重影响效率。在数组中插入或删除一个元素的时间复杂度都是
级的。 - 没有扩容功能的数组大小是固定的,在使用数组时容易出现越界的问题。增加了扩容功能的数组虽然能避免内存越界问题,但会导致内存资源的浪费,因为总有一些空闲的数组空间。
 
来道算法题
数组元素逆置
一个基础的双指针问题。
编写一个函数reverseArray(),将数组中元素逆置。例如原数组中的元素顺序是{1,2,3,4,5},那么逆置后数组中的元素顺序是{5,4,3,2,1}。
数组元素的逆置操作一般要求不创建新数组,只在原数组内将数组元素的顺序颠倒过来,这样操作的效率比较高,实现起来也更加简单。
需要定义一个tmpElem作为数据缓冲区,同时要设置变量low和high,作为数组的下标分别指向数组的第1个元素和最后1个元素。然后执行以下步骤:
- 将
low指向的元素和high指向的的元素通过临时变量tmpElem交换位置。 - 执行
low++和high--。 - 重复上两个步骤直到
low≥high。 
对于只有一个元素的数组,以上步骤可以将该元素原地逆置,结果也是正确的。
该算法的时间复杂度为
,空间复杂度为
。
public void reverseArray() {
    int tmpElem;
    for (int low = 1, high = elemNumber; low < high; low++, high--) {
        // 数据交换
        tmpElem = array[low - 1];
        array[low - 1] = array[high - 1];
        array[high - 1] = tmpElem;
    }
}
 删除数组中的重复元素
方法很多的一道基础算法题
编写一个purge(),删除整数数组中重复的元素。例如,数组为{1,1,3,5,2,3,1,5,6,8},删除重复元素后数组变为{1,3,5,2,6,8}。
三重循环
解决这个问题,最直观的方法就是用三个循环:
- 首先用一个循环对每个数组元素进行定位。
 - 在用一个循环,将第一层循环定位的元素,拿来逐个对比该元素之后的每个元素。
 - 如果发现重复,则调用
deleteElem()将该元素删除。deleteElem()本身就是用一重循环来进行删除操作的。 
public void purge() {
    // 两层循环分别检索数组的每个元素
    for (int i = 1; i <= elemNumber; i++) {
        for (int j = i + 1; j <= elemNumber; j++) {
            if (array[i - 1] == array[j - 1]) {
                deleteElem(j - 1);
                // 由于deleteElem本身会将后面的元素提前,所以需要修正j的位置
                j--;
            }
        }
    }
}
 优化删除步骤:
上面的算法简单直观,但时间复杂度很高,为
。
我们可以在确定重复元素之后,不立刻删除该元素,而是等找到全部重复元素之后再进行整体删除。
这样就可以将
变为
从而优化整体的时间复杂度。
public void purge() {
    int flag = -111;
    int i, j, number = elemNumber;
    // 两层循环确定重复元素
    for (i = 1; i < elemNumber; i++) {
        for (j = i + 1; j < elemNumber; j++) {
            if (array[i - 1] == array[j - 1]) {
                // 将重复元素填充为标记值,此处为-111
                // 由于没有执行删除操作,也就没有元素前移,不需要修正j的位置
                array[j - 1] = flag;
            }
        }
    }
    // 找到第一个特殊标记flag
    for (i = 1; array[i - 1] != flag; i++)
        ;
    for (j = i + 1; j <= number;) {
        if (array[j - 1] != flag) {
            // 如果array[j-1]不等于flag,复制j所指的有效数据复制到i标记的位置
            // i和j中间的会增加一个无效数据,这个无效数据紧挨在i之后
            // 将i和j分别后移,i指向新的无效数据,j尝试检索下一个有效数据
            array[i - 1] = array[j - 1];
            i++;
            j++;
        } else {
            // 如果array[j-1]等于flag,则j后移,寻找下一个有效数据
            j++;
        }
        // i指向当前最后一个有效数据的下一个数据,将其-1,刷新为elemNumber
        elemNumber = i - 1;
    }
}
 在上面的代码中,有二重循环+一重循环+一重循环。将一重循环单独拿出来,是为了优化时间复杂度。
涉及到数组的第index个位置。需要注意元素位置和元素下标的转换。
哈希表优化查找:
使用Hashset需要导入java.util.*。
在向哈希表中添加新对象时,哈希表会判断重复对象。
- 如果添加的对象与哈希表中已有对象重复,则添加失败,同时返回false。
 - 如果没有重复,则添加成功并返回true。
 
向哈希表中添加元素并查重的操作的时间复杂度仅为
。
public void purge() {
int flag = -111;
int i, j, number = elemNumber;
//使用哈希表找出数组中的重复元素
HashSet<Integer>set=new HashSet<>();
for(i=1;i<=elemNumber;i++){
    if(!set.add(array[i-1])){
        array[i-1]=flag;
    }
}
// 找到第一个特殊标记flag
for (i = 1; array[i-1] != flag; i++)
    ;
for (j = i + 1; j <= number;) {
    if (array[j - 1] != flag) {
        // 如果array[j-1]不等于flag,复制j所指的有效数据复制到i标记的位置
        // i和j中间的会增加一个无效数据,这个无效数据紧挨在i之后
        // 将i和j分别后移,i指向新的无效数据,j尝试检索下一个有效数据
        array[i - 1] = array[j - 1];
        i++;
        j++;
    } else {
        // 如果array[j-1]等于flag,则j后移,寻找下一个有效数据
        j++;
    }
    // i指向当前最后一个有效数据的下一个数据,将其-1,刷新为elemNumber
    elemNumber = i-1;
}
}
 这一算法的代价就是需要用到哈希表,增加了空间复杂度。以空间换时间。
- 点赞
 - 收藏
 - 关注作者
 
            
           
评论(0)