最优化理论是数学的一个分支,它主要研究的是在满足某些条件限制下,如何达到最优目标的一系列方法。最优化理论的应用范围相当广泛,所涉及的知识面也很宽,并不是简单的一两章就可以涵盖的—因而本节的讲解重点在于和后续章节中强相关的一些最优化基础理论,从而为读者的进一步学习扫清障碍。
根据所选分类角度的不同,可以把最优化问题划分为多种类型。例如,从限制条件的角度,最优化问题通常被分为下面三种类型。
没有约束条件的优化问题(Unconstrained Optimization Problem)。
等式约束条件下的优化问题(Equality Constraint Optimization Problem)。
不等式约束条件下的优化问题(Inequality Constraint Optimization Problem)。
接下来针对上述三种类型分别进行讲解。
(1) 没有约束条件的优化问题。
这是最简单的一种最优化问题,即在没有任何限制条件下实现最大值或者最小值(最小值和最大值实际上是可以互相转换的)的求解。
例如,对于求解f(x)=x2函数最小值的问题,可以表示为
总的来说,这种情况下的最优解通常可以通过求导数的方式来获得。
对于带有限制条件的最优解问题,也可以再细分为两种情况—即equality和inequality contraint,简单而言就是等式和不等式约束的区别。
(2) 等式约束条件下的优化问题。
例如,前面所讲述的f(x)=x2函数,可以增加一个等式约束,这样一来问题就变成了:
针对不同的限定条件,最优解问题的解决策略也会有所差异。
概括来说,有如下几个核心点。
(1) 等式限定条件。
拉格朗日乘子法(Lagrange Multiplier)是将等式约束“隐含”到最大值/最小值求解过程中的关键理论基础。
(2) 不等式限定条件。
除了拉格朗日乘子法以外,对于不等式约束条件下的最优化问题,还需要借助于另一个理论—KKT(Karush-Kuhn-Tucher)。
在接下来的几节中,将首先基于若干范例来引出这些理论的应用场景,让读者有一个“感性”的认识。然后再尽量“抽丝剥茧”地详细分析隐藏在它们背后的基础原理以及各种公式的推导过程。
本文节选自《机器学习观止》,作者为我国著名通信技术公司、世界100强企业首席技术专家林学森,转载须注明出处。
《机器学习观止--核心原理与实践》(林学森)【简介_书评_在线阅读】 - 当当图书