二分查找
二分查找是基于有序序列的查找方法(以下假设严格单调自增),该算法一开始令 [left,right] 为整个序列的下标区间,然后每次测试当前 [left,right] 的中间位置 mid=(left+right)/2 ,判断 A[mid]与欲查询的元素 x 的大小:
-
- 如果 A[mid] == x ,说明查找成功,退出查询
- 如果 A[mid] > x ,说明元素 x 在 mid 位置的左边,因此往左子区间 [left,mid-1] 继续查找
- 如果 A[mid] < x ,说明元素 x 在 mid 位置的右边,因此往右子区间 [mid+1,right] 继续查找
因此其时间复杂度是 O(logn)。
1 #include2 #include 3 #include 4 #include 5 using namespace std; 6 7 // A[] 为严格递增序列, left 为二分下界, right 为二分上界, x 为欲查询数 8 int binarySearch(int A[], int left, int right, int x) { 9 int mid; // 中点10 while(left <= right) {11 mid = (left+right)/2;12 if(A[mid] == x) return mid;13 else if(A[mid] > x) {14 right = mid-1; // 往左区间查询 15 } else {16 left = mid+1; // 往右区间查询 17 } 18 } 19 20 return -1; // 未查询到 21 } 22 23 int main() {24 const int n = 10;25 int A[n] = { 1, 3, 4, 6, 7, 8, 10, 11, 12, 15};26 // 查询 3 和 5 27 printf("%d %d\n", binarySearch(A, 0, n-1, 6), binarySearch(A, 0, n-1, 5)); 28 29 return 0;30 }
那么,如果序列是递减的,只需把上面代码中的 A[mid] > x 改为 A[mid] < x 即可。
需要注意的是,如果二分上界超过 int 型数据范围的一半,那么语句 mid = (left+right)/2 有可能导致溢出,应改为 mid = left + (right-left)/2 。
接下来讨论更进一步的问题:如果递增序列 A 中的元素可能重复,那么如何对给定的欲查询元素 x ,求出序列中第一个大于等于 x 的元素的位置 L 以及第一个大于 x 的元素的位置 R ,这样元素 x 在序列中的存在区间就是 [L,R) 。
先来考虑第一个小问:求序列中的第一个大于等于 x 的元素的位置。
-
- 如果 A[mid] ≥ x ,说明第一个大于等于 x 的元素的位置一定在 mid 处或 mid 的左侧,应往左子区间 [left,mid] 继续查询,即令 right = mid 。
- 如果 A[mid] < x ,说明第一个大于等于 x 的元素的位置一定在 mid 的右侧,应往右子区间 [mid+1,right] 继续查询,即令 left = mid+1 。
1 // A[] 为递增序列,x 为欲查询的数,函数返回第一个大于等于 x 的元素的位置 2 // left,right 为左右边界 3 int lower_bound(int A[], int left, int right, int x) { 4 int mid; // 中点 5 while(left < right) { 6 mid = (left+right)/2; 7 if(mid >= x) { // 中间的数大于等于 x 8 right = mid; // 左区间 9 } else { // 中间的数小于 x 10 left = mid+1; // 右区间 11 }12 } 13 14 return left; 15 }
- 考虑到欲查询元素有可能比序列中的所有元素都要大,此时应当返回 n ,因此二分上界是 n ,故二分的初始区间为 [left,right] = [0,n] 。
接下来解决第二小问:求序列中第一个大于 x 的元素的位置。
-
- 如果 A[mid] > x ,说明第一个大于 x 的元素的位置一定在 mid 处或 mid 的左侧,应往左子区间 [left,mid] 继续查询,即令 right = mid 。
- 如果 A[mid] ≤ x ,说明第一个大于 x 的元素的位置一定在 mid 的右侧,应往右子区间 [mid+1,right] 继续查询,即令 left = mid+1 。
1 // A[] 为递增序列,x 为欲查询的数,函数返回第一个大于 x 的元素的位置 2 // left,right 为左右边界,传入的初值为 [0,n] 3 int upper_bound(int A[], int left, int right, int x) { 4 int mid; // 中点 5 while(left < right) { 6 mid = (left+right)/2; 7 if(mid > x) { // 中间的数大于 x 8 right = mid; // 左区间 9 } else { // 中间的数小于等于 x 10 left = mid+1; // 右区间 11 }12 } 13 14 return left; 15 }
读者会发现, lower_bound 函数 和 upper_bound 函数的代码高度相似,其实这两个函数都在解决这样一个问题:寻找有序序列中第一个满足某条件的元素的位置。此处总结了解决此类问题的固定模版:
1 // 解决“寻找有序序列第一个满足某条件的元素的位置”问题的固定模版 2 // 二分区间为左闭右闭的 [left,right],初值必须能覆盖解的所有可能取值 3 int upper_bound(int A[], int left, int right, int x) { 4 int mid; // 中点 5 while(left < right) { 6 mid = (left+right)/2; 7 if( 条件成立 ) { // 条件成立,第一个满足条件的元素位置 <= mid 8 right = mid; // 左区间 9 } else { // 条件不成立,第一个满足条件的元素位置 > mid 10 left = mid+1; // 右区间 11 }12 } 13 14 return left; // 返回夹出来的位置 15 }
另外,如果想要寻找最有一个满足 “条件 C”的元素的位置,则可以先求第一个满足 “条件 !C”的元素的位置,然后将该位置减 1 即可
而当二分区间是左开右闭区间 (left,right] 时,循环条件应当是 left+1 < right ,这样当退出循环时有 left+1 == right 成立,使得 (left,right] 才是唯一位置。且二分区间初始值应为 (-1,n] 。
二分法拓展
如何计算 √2 的近似值。
对 f(x) = x2 来说,令浮点型 left 和 right 的初值分别为 1 和 2,然后根据 left 和 right 的中点 mid 处 f(x) 的值与 2 的大小来选择子区间进行逼近:
-
- 如果 f(mid) > 2,说明 mid > √2,应当在 [left,mid]的范围内继续逼近,故令 right = mid 。
- 如果 f(mid) < 2,说明 mid < √2,应当在 [mid,right]的范围内继续逼近,故令 left= mid 。
上面两个步骤当 right - left < 10-5 时结束。
1 const double eps = 1e-5; // 精度为 10^-5 2 double f(double x) { // 计算 f(x) 3 return x * x - 2; 4 } 5 6 double calSqrt() { 7 double left=1, right=2, mid; // [left,right] = [1,2] 8 while(right - left > eps) { 9 mid = (left+right)/2;10 if(f(mid) > 0) { // mid > sqrt(2) 11 right = mid; // 左区间 12 } else { // mid < sqrt(2) 13 left = mid; // 右区间14 }15 }16 17 return mid; // 返回 mid 作为近似值 18 }
事实上,计算 √2 的近似值的问题其实是这样一个问题的特例:给定一个定义在 [L,R] 上的单调函数 f(x) ,求方程 f(x) = 0 的根。
此时只需修改上述代码 f 函数部分即可,显然计算 √2 的近似值等价于求 f(x) = x2 - 2 = 0 在 [1,2] 范围内的根。
装水问题:
在一个侧面看去是半圆的储水装置,该半圆的半径为 R ,要求往里面装入高度为 h 的水,使其从侧面看去的面积 S1 与半圆面积 S2 的比例恰好为 r 。现给定 R 和 r ,求高度 h 。
在这个问题中,需要寻找水面高度 h 与 面积比例 r 之间的关系。而很显然,随着水面升高,面积比例 r 一定是增大的。由此可以得到这样的思路:在 [0,R] 范围内对水面高度 h 进行二分,计算在高度下面积比例 r 的值。
1 #include2 #include 3 #include 4 #include 5 using namespace std; 6 7 const double PI = acos(-1.0); // PI 8 const double eps = 1e-5; // 精度为 10^-5 9 10 double f(double R, double h) { // 计算 r = f(h) 11 double alpha = 2 * acos((R-h)/R);12 double L = 2 * sqrt(R*R - (R-h)*(R-h));13 double S1 = alpha * R * R / 2 - L *(R-h) / 2;14 double S2 = PI * R * R /2;15 return S1 / S2; 16 } 17 18 double solve(double R, double r) {19 double left = 0, right = R, mid; 20 while(right-left > eps) {21 mid = (left+right)/2;22 if(f(R, mid) > r) { 23 right = mid; // 左区间 [left,mid] 24 } else {25 left = mid; // 右区间 [mid,right] 26 }27 }28 29 return mid; // 返回 mid 即为所求 h 30 }31 32 int main() {33 double R, r;34 scanf("%lf%lf", &R, &r);35 printf("%.4f\n", solve(R, r)); 36 37 return 0;38 }
木棒切割问题:
给定 N 根木棒,长度均已知,现在希望通过切割它们来得到至少 K 段长度相等的木棒(长度必须为整数),问这些长度相等的木棒最长能有多长。
首先可以注意到一个结论:如果长度相等的木棒的长度 L 越长,那么得到的木棒段数越少。从这个角度出发便可以先到本题的算法,即二分答案,根据对当前长度 L 来说能得到的木棒段数 k 与 K 的大小关系进行二分。
最后一个问题(没有思路):
给定 N 个线段的长度,试将它们头尾相接(顺序任意)地组合成一个凸多边形,使得凸多边形的外接圆的半径最大,求该最大半径。其中 N 不超过 105 ,线段长度均不超过 100 ,要求算法中不涉及坐标的计算。
快速幂
来看一个问题:给定三个正整数 a、b、m(a<109, b<1018, 1<m<109),求 ab % m 。
显然不能直接计算,这里要使用快速幂的做法,它基于二分的思想。快速幂基于以下事实:
-
- 如果 b 是奇数,那么有 ab = a * ab-1 。
- 如果 b 是偶数,那么有 ab = ab/2 * ab/2 。
快速幂的递归写法如下:
1 LL binaryPow(LL a, LL b, LL m) {2 if(b == 0) return 1;3 // b 为奇数4 if(b % 2) return a * binaryPow(a, b-1, m) % m;5 else { // b 为偶数 6 LL mu1 = binaryPow(a, b/2, m);7 return mu1 * mu1 % m;8 }9 }
接下来研究一下快速幂的迭代写法。
对 ab 来说,如果把 b 写成二进制,那么 b 就可以写成若干二次幂之和。例如 13 的二进制是 1101 ,那么 13=23+22+20,所以 a13 = a8 * a4 * a1 。
我们可以把 ab 表示成 a2k、... 、a8、 a4、a2、a1 中若干项的乘积,其中如果 b 的二进制的 i 号位为1,那么项 a2i 就被选中。
快速幂的迭代写法:
1 LL binaryPow(LL a, LL b, LL m) { 2 LL ans = 1; 3 while(b > 0) { 4 if(b & 1) { // 末位为 1 5 ans = ans * a % m; // 令 ans 累乘上 a 6 } 7 a = a * a % m; // 令 a 平方 8 b >>= 1; // b 右移1,相当于除2 9 }10 return ans; 11 }