03_C语言数据结构与算法之线性数据结构：数组与顺序表 —— 连续内存的高效操作艺术

C语言数据结构与算法之线性数据结构：数组与顺序表 —— 连续内存的高效操作艺术

有没有过这样的体验？整理书架时，把常用的书按顺序排好，想找某一本随手就能翻到，效率超高；但如果书堆得杂乱无章，找起来就得翻来覆去，耗时又费力。其实，C语言里的数组与顺序表，就像这排好序的书架——它们依托“连续内存”这块“专属区域”，把数据规整排列，让访问和操作变得又快又稳。今天，我们就抛开复杂的术语，从“怎么存才高效”的角度，聊聊数组与顺序表的核心逻辑，读懂连续内存背后的操作艺术。

在C语言的编程世界里，数据结构是构建高效程序的基石，而线性数据结构因其逻辑简单、操作直观，成为每个开发者的必修课。数组与顺序表作为依托连续内存块实现的典型代表，将“空间连续性”与“操作高效性”深度绑定，既凭借内存布局的优势实现了极致的随机访问效率，又通过封装与优化解决了原生数组的痛点。接下来，我们就从底层原理到实战应用，一步步拆解这份“高效秘籍”。

一、数组：连续内存的原生载体，随机访问的王者

数组是C语言内置的基础数据结构，其本质是内存中一块连续的、固定大小的存储区域。这种底层存储特性，决定了它的核心优势与天然局限。

1. 内存布局：连续存储的底层逻辑

当我们在C语言中定义int arr[5];时，编译器会在内存中开辟5个连续的int型内存单元（假设int占4字节）。这些单元的地址呈连续递增趋势，比如arr[0]的地址为0x100，那么arr[1]就是0x104，arr[2]是0x108，以此类推。

这种连续布局的关键在于：数组名本质是指向首元素的常量指针，存储的是数组首地址。我们访问数组元素时，编译器会自动将下标转换为“首地址+偏移量”的计算：


// 访问arr[i]的底层计算逻辑
*(arr + i) = 首地址 + i * 元素大小

这一计算过程与数组长度无关，是数组实现高效随机访问的核心。

2. 核心优势：O(1)时间复杂度的随机访问

随机访问是数组最亮眼的特性——无论数组长度是10还是10000，访问任意下标i的元素，都能通过一次地址计算直接定位，时间复杂度为O(1)。

举个例子，访问arr[9999]时，只需通过首地址 + 9999 * 4计算出目标地址，瞬间就能获取元素；而如果是链表，需要从表头遍历9999次才能到达对应节点，时间复杂度为O(n)。这种差异在频繁查询的场景中会被无限放大，也是数组在高性能场景中不可替代的原因。

3. 天然局限：固定长度的痛点

原生数组的最大问题是长度固定——一旦定义，内存空间就被固定分配，无法动态扩容。如果需要存储的元素数量超过数组长度，要么导致数据溢出，要么需要手动重新分配更大的数组并拷贝数据，操作繁琐且容易出错。此外，数组的插入、删除操作需要移动元素，原生实现也缺乏规范化的封装。

二、顺序表：数组的封装升级，解决动态扩容痛点

顺序表是基于数组的增强版封装结构，它保留了数组连续内存的核心优势，同时通过封装容量、长度属性和相关操作函数，解决了数组固定长度的痛点，让连续内存的操作更灵活、更安全。

1. 顺序表的结构定义

我们通常用结构体来定义顺序表，包含指向底层数组的指针、当前元素个数（长度）和数组最大容量：


#include <stdio.h>
#include <stdlib.h>
#include <string.h>

// 顺序表结构定义
typedef struct {
    int *data;    // 指向底层连续内存的数组指针
    int size;     // 当前存储的元素个数（有效长度）
    int capacity; // 底层数组的最大容量
} SeqList;

2. 数组与顺序表的核心对比

数组和顺序表共享连续内存的底层本质，因此具备相同的随机访问优势，但二者在功能、灵活性、使用方式上存在显著差异。为了更清晰地展现这种区别，我们通过表格和细节分析来对比：

特性维度	原生数组	顺序表
本质定位	C语言内置的基础数据类型/结构	基于数组封装的自定义线性数据结构
长度特性	静态固定，定义时确定长度且无法修改	动态可变，支持自动扩容/手动缩容
核心属性	仅存首地址（数组名）和固定长度	包含数据指针、有效长度、最大容量
内存管理	栈/全局区分配，自动回收（栈）或程序结束回收（全局）	堆区分配，需手动申请/释放内存
插入/删除操作	需手动编写移动元素逻辑，无统一规范	封装专用函数，逻辑规范化、可复用
扩容机制	无原生扩容能力，需手动重新分配数组并拷贝数据	内置扩容策略（如2倍扩容），自动处理
使用复杂度	简单，直接通过下标操作	稍复杂，需调用封装函数操作
适用场景	元素数量固定、频繁随机访问的场景	元素数量动态变化、需要规范化操作的场景

从本质上看，顺序表是对原生数组的“扬长避短”：它保留了数组连续内存带来的随机访问高效性，同时通过封装解决了数组长度固定、操作不规范的问题。可以说，数组是“基础原料”，而顺序表是“加工后的成品”——前者适合简单场景的快速使用，后者适合复杂场景的工程化开发。

3. 顺序表的核心操作实现

顺序表的核心操作包括初始化、插入、删除、查找与扩容，其中扩容策略是优化性能的关键。

（1）初始化：开辟初始内存

初始化的目标是为顺序表分配初始容量的内存，并初始化相关属性：


// 初始化顺序表，默认初始容量为4
int SeqList_Init(SeqList *list) {
    if (list == NULL) return -1; // 入参合法性检查
    int init_capacity = 4;
    list->data = (int *)malloc(init_capacity * sizeof(int));
    if (list->data == NULL) return -1; // 内存分配失败
    list->size = 0;
    list->capacity = init_capacity;
    return 0;
}

（2）扩容策略：2倍扩容避免频繁分配

当顺序表的有效长度等于容量时，需要扩容。如果每次只扩容1倍（即增加固定大小），会导致频繁的内存分配和数据拷贝，时间复杂度累积为O(n²)。2倍扩容是业界主流策略，能平衡扩容开销和空间利用率，使平均时间复杂度降至O(1)。


// 顺序表扩容：扩容为原来的2倍
int SeqList_Expand(SeqList *list) {
    if (list == NULL) return -1;
    int new_capacity = list->capacity * 2;
    int *new_data = (int *)realloc(list->data, new_capacity * sizeof(int));
    if (new_data == NULL) return -1; // 扩容失败
    list->data = new_data;
    list->capacity = new_capacity;
    printf("扩容成功，新容量：%d
", new_capacity);
    return 0;
}

（3）插入操作：后移元素预留位置

插入元素的核心逻辑是：检查位置合法性→判断是否需要扩容→将插入位置及后续元素后移→插入新元素→更新长度。时间复杂度取决于插入位置，表尾插入为O(1)，表头插入为O(n)，平均为O(n)。



// 在顺序表的pos位置插入元素val（pos范围：0 ~ size）
int SeqList_Insert(SeqList *list, int pos, int val) {
    // 1. 合法性检查
    if (list == NULL || pos < 0 || pos > list->size) return -1;
    // 2. 扩容检查
    if (list->size == list->capacity) {
        if (SeqList_Expand(list) == -1) return -1;
    }
    // 3. 插入位置及后续元素后移（从后往前移，避免覆盖）
    for (int i = list->size; i > pos; i--) {
        list->data[i] = list->data[i - 1];
    }
    // 4. 插入新元素
    list->data[pos] = val;
    list->size++;
    return 0;
}

（4）删除操作：前移元素覆盖无效数据

删除元素的逻辑与插入相反：检查位置合法性→将删除位置后续元素前移→更新长度。时间复杂度同样取决于删除位置，表尾删除为O(1)，表头删除为O(n)。



// 删除顺序表pos位置的元素（pos范围：0 ~ size-1）
int SeqList_Delete(SeqList *list, int pos) {
    if (list == NULL || pos < 0 || pos >= list->size) return -1;
    // 后续元素前移，覆盖被删除元素
    for (int i = pos; i < list->size - 1; i++) {
        list->data[i] = list->data[i + 1];
    }
    list->size--;
    return 0;
}

（5）查找操作：遍历或利用随机访问

顺序表的查找分为两种：按值查找需要遍历数组，时间复杂度O(n)；按下标查找则利用随机访问，时间复杂度O(1)。



// 按值查找：返回第一个匹配元素的下标，未找到返回-1
int SeqList_FindByVal(SeqList *list, int val) {
    if (list == NULL) return -1;
    for (int i = 0; i < list->size; i++) {
        if (list->data[i] == val) {
            return i;
        }
    }
    return -1;
}

// 按下标查找：返回对应元素的值，下标非法返回-1（需保证元素不为-1，或改用指针返回）
int SeqList_FindByIndex(SeqList *list, int index) {
    if (list == NULL || index < 0 || index >= list->size) return -1;
    return list->data[index]; // O(1)时间复杂度
}

（6）销毁顺序表：释放内存

使用完顺序表后，需要释放底层数组的内存，避免内存泄漏：



// 销毁顺序表
void SeqList_Destroy(SeqList *list) {
    if (list == NULL) return;
    free(list->data);
    list->data = NULL; // 野指针防护
    list->size = 0;
    list->capacity = 0;
}

三、实战场景：连续内存的高效应用

数组与顺序表的连续内存特性，使其在诸多实战场景中能发挥出高效优势，下面我们看两个典型案例。

1. 嵌入式场景：数组实现环形缓冲区（串口数据缓存）

在嵌入式开发中，串口数据的接收和处理往往不同步，需要一个缓冲区来暂存数据。环形缓冲区（循环队列） 是常用方案，基于数组实现的环形缓冲区能充分利用连续内存的优势，实现高效的数据存取。

实现思路

用数组作为底层存储，定义两个指针（下标）：head（读指针，指向待读取的元素）、tail（写指针，指向待写入的位置）。

空缓冲区：head == tail；满缓冲区：(tail + 1) % capacity == head（预留一个空位，避免空满判断冲突）。

写入数据：判断缓冲区是否满→写入数据→tail后移（取模）。

读取数据：判断缓冲区是否空→读取数据→head后移（取模）。

代码实现（简化版）



#include <stdio.h>
#include <stdint.h>

// 环形缓冲区配置
#define BUF_SIZE 64 // 缓冲区大小，2的幂数更高效（取模可替换为与运算）
typedef struct {
    uint8_t buf[BUF_SIZE];
    int head; // 读指针
    int tail; // 写指针
} RingBuffer;

// 初始化环形缓冲区
void RingBuffer_Init(RingBuffer *rb) {
    rb->head = 0;
    rb->tail = 0;
}

// 判断缓冲区是否为空
int RingBuffer_IsEmpty(RingBuffer *rb) {
    return rb->head == rb->tail;
}

// 判断缓冲区是否为满
int RingBuffer_IsFull(RingBuffer *rb) {
    return (rb->tail + 1) % BUF_SIZE == rb->head;
}

// 写入一个字节数据
int RingBuffer_Write(RingBuffer *rb, uint8_t data) {
    if (RingBuffer_IsFull(rb)) {
        return -1; // 缓冲区满
    }
    rb->buf[rb->tail] = data;
    rb->tail = (rb->tail + 1) % BUF_SIZE;
    return 0;
}

// 读取一个字节数据
int RingBuffer_Read(RingBuffer *rb, uint8_t *data) {
    if (RingBuffer_IsEmpty(rb) || data == NULL) {
        return -1; // 缓冲区空或入参非法
    }
    *data = rb->buf[rb->head];
    rb->head = (rb->head + 1) % BUF_SIZE;
    return 0;
}

应用场景

在串口中断服务函数中，接收到的数据通过RingBuffer_Write写入缓冲区；在主循环中，通过RingBuffer_Read读取数据并处理。这种方式避免了中断与主循环的同步问题，同时数组的连续内存布局保证了数据存取的高效性，适合嵌入式系统的资源受限场景。

2. 算法场景：LeetCode经典题解

数组是算法题中的高频载体，结合哈希表、双指针等技巧，能解决诸多经典问题。

（1）两数之和（LeetCode 1）：数组+哈希表优化

题目描述：给定一个整数数组nums和一个目标值target，找出数组中两个数的下标，使它们的和等于target。

常规思路：双重循环遍历数组，时间复杂度O(n²)，效率较低。

优化思路：利用哈希表（C语言用数组或结构体实现）存储已遍历元素的“值-下标”对，遍历数组时，计算target - nums[i]，并检查哈希表中是否存在该值。存在则返回下标，不存在则将当前元素存入哈希表。时间复杂度降至O(n)，空间复杂度O(n)。



#include <stdio.h>
#include <stdlib.h>

#define MAX_HASH_SIZE 100000 // 哈希表大小，根据数据范围调整

// 哈希表节点结构
typedef struct {
    int key;
    int value;
} HashNode;

// 哈希函数：取模
int HashFunc(int key) {
    return (key % MAX_HASH_SIZE + MAX_HASH_SIZE) % MAX_HASH_SIZE; // 处理负数
}

// 两数之和：返回结果数组（长度为2），失败返回NULL
int* twoSum(int* nums, int numsSize, int target, int* returnSize) {
    *returnSize = 0;
    HashNode *hashTable = (HashNode *)calloc(MAX_HASH_SIZE, sizeof(HashNode));
    if (hashTable == NULL) return NULL;

    for (int i = 0; i < numsSize; i++) {
        int complement = target - nums[i];
        int index = HashFunc(complement);
        // 哈希表中存在该值
        if (hashTable[index].key == complement) {
            int *result = (int *)malloc(2 * sizeof(int));
            result[0] = hashTable[index].value;
            result[1] = i;
            *returnSize = 2;
            free(hashTable);
            return result;
        }
        // 存入当前元素的键值对
        int curIndex = HashFunc(nums[i]);
        hashTable[curIndex].key = nums[i];
        hashTable[curIndex].value = i;
    }

    free(hashTable);
    return NULL;
}

// 测试
int main() {
    int nums[] = {2, 7, 11, 15};
    int target = 9;
    int returnSize;
    int *result = twoSum(nums, 4, target, &returnSize);
    if (result != NULL) {
        printf("[%d, %d]
", result[0], result[1]);
        free(result);
    }
    return 0;
}

（2）移除元素（LeetCode 27）：双指针技巧

题目描述：给你一个数组nums和一个值val，移除所有等于val的元素，并返回移除后数组的新长度。要求原地修改数组，空间复杂度O(1)。

常规思路：遍历数组，遇到val则删除（后移元素），时间复杂度O(n²)。

优化思路：使用双指针（快慢指针），快指针遍历数组，慢指针指向新数组的末尾。快指针遇到不等于val的元素时，将其赋值给慢指针位置，慢指针后移。时间复杂度O(n)，空间复杂度O(1)。



#include <stdio.h>

// 移除元素：双指针法
int removeElement(int* nums, int numsSize, int val) {
    int slow = 0; // 慢指针：新数组的下标
    for (int fast = 0; fast < numsSize; fast++) { // 快指针：遍历原数组
        if (nums[fast] != val) {
            nums[slow] = nums[fast];
            slow++;
        }
    }
    return slow; // 新数组长度
}

// 测试
int main() {
    int nums[] = {3, 2, 2, 3};
    int val = 3;
    int newLen = removeElement(nums, 4, val);
    printf("新长度：%d，新数组：", newLen);
    for (int i = 0; i < newLen; i++) {
        printf("%d ", nums[i]);
    }
    return 0;
}