文先生的博客 求职,坐标深圳。(wenfh2020@126.com)

[算法导论] 归并排序

2019-11-29

学习 《算法导论》2.3.1 分治法。测试源码在 (github)


1. 时间复杂度

归并排序采用了分治法的递归排序。分治法:分解子问题,解决子问题,合并子结果。

  • 分解:分解待排序的 $n$ 个元素的序列各成 $\frac{n}{2}$ 个元素的子列。
  • 解决:使用归并排序递归地排序两个子序列。
  • 合并:合并两个已排序的子序列以产生已排序的答案。

因为排序数组会被 $\frac{n}{2}$ 拆开,归并排序时间复杂度稳定的 $nlgn$。

相对于其它的 $nlgn$ 排序,它需要额外的临时空间辅助,有一定的资源损耗。小数量级(百万级别)的排序,要比快速排序慢。但是大数量级数据(千万级别),因为归并排序树深最小,排序比快速排序快。

快速排序,最优算法复杂度,数组会被 $\frac{n}{2}$ 拆开。实际操作中数据很难达到最优。而归并一直都是通过 $\frac{n}{2}$ 进行拆分。


2. 视图


3. 实现

实际实现,通过一个辅助数组进行实现(源码)。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
// g++ -g -O0 -std=c++11 test.cpp -o test && ./test
#include <iomanip>
#include <iostream>
#include <random>

void msort(int array[], int start, int mid, int end) {
    int k = 0;
    int low = start;
    int high = mid + 1;

    // 辅助的临时空间。
    int len = end - start + 1;
    int* temp_array = new int[len];

    // 合并两个有序数组到临时辅助空间上。
    while (low <= mid && high <= end) {
        if (array[low] < array[high]) {
            temp_array[k++] = array[low++];
        } else {
            temp_array[k++] = array[high++];
        }
    }

    // 区间没有拷贝完成的数据,继续拷贝到辅助的临时空间。
    while (high <= end) {
        temp_array[k++] = array[high++];
    }
    while (low <= mid) {
        temp_array[k++] = array[low++];
    }

    // 将临时空间的数据覆盖原空间对应数据。
    for (int i = 0; i < k; i++) {
        array[start + i] = temp_array[i];
    }

    delete [] temp_array;
}

void merge_sort(int array[], int start, int end) {
    if (start >= end) {
        return;
    }

    int mid = ((unsigned int)(start + end)) / 2;
    merge_sort(array, start, mid);
    merge_sort(array, mid + 1, end);
    msort(array, start, mid, end);
}

void print_datas(int array[], int size) {
    for (int i = 0; i < size; i++) {
        std::cout << std::setw(3) << array[i] << " ";
    }
    std::cout << std::endl;
}

bool is_sorted(int* array, int len) {
    if (array == nullptr || len < 2) {
        return true;
    }
    int max = array[0];
    for (int i = 1; i < len; i++) {
        if (max > array[i]) {
            return false;
        } else {
            max = array[i];
        }
    }
    return true;
}

void create_random_array(int** array, int* len, int max_value, int max_len) {
    std::random_device rd;
    *len = rd() % max_len;
    *array = new int[*len];

    for (int i = 0; i < *len; i++) {
        (*array)[i] = rd() % max_value;
    }
}

int main() {
    int len = 0;

    int max_len = 101;
    int max_value = 10000;
    int test_time = 100;

    for (int i = 0; i < test_time; i++) {
        len = 0;
        int* array = nullptr;
        create_random_array(&array, &len, max_value, max_len);

        if (array) {
            merge_sort(array, 0, len - 1);
            if (!is_sorted(array, len)) {
                std::cout << "failed!!!!!" << std::endl;
            }
            delete[] array;
        }
    }

    return 0;
}

4. 参考


作者公众号
微信公众号,干货持续更新~