对于平面上给定的点,要寻找y与x之间的近似函数关系
,插值法要求曲线
准确通过每个给定点
;而m较大时无论是高次插值还是分段低次插值都将很复杂,数据
一般是由实验观测得到的,总会带有观测误差,刻意要求
并不能反映真实的函数关系,反而会引起
的波动加剧,因此用
近似描述已知数据
,不必要求在每个点
处,误差
,都为0,只需在所有点处的某种总体误差最小即可,这就是所谓的曲线拟合问题,亦称为离散函数最佳平方逼近问题。
设给定基函数,我们在集合
中寻求形如
的函数,使其近似已知数据。
定义1对给定的数据,若
使得
则称
为曲线族
中的最小二乘拟合曲线,并称
为均方误差。
要确定拟合曲线(1)中的待定系数,由(2)式知,就是求多元函数
的最小值点(
),由多元函数取极值的必要条件,有
从而有
这是n+1个方程、n+1个未知数的线性方程组,借助矩阵运算,可写成如下矩阵形式:
其中,
而
方程组(3)称为法方程组,设线性无关(且满足Haar条件),则行列式
,线性方程组(3)存在唯一的一组解。
若取基函数,法方程的系数矩阵显然非奇异,此时一般称为多项式拟合,求解法方程组,得到拟合系数
从而得到
再由多元函数取极值的充分条件可证明,这样求出的确实是方程组(2)的解,即
为最小二乘拟合曲线。
以上讨论的都是线性最小二乘拟合问题,即拟合曲线,也就是
是基函数
的线性组合,有些问题虽然数学模型不是线性模型,但通过变换可化为线性模型,则上述最小二乘拟合方法仍然可用。
选取拟合函数为指数函数
为待定常数,
这是一个关于的非线性模型,现通过适当变换将其化为线性模型,为此对
两边取对数,有
令
于是
这是一个关于
的线性模型,原来的已知数据
经取对数后变成一组新数据
,这里
对这组新数据,求形如
的拟合曲线。
取基函数则由(3)式可得法方程组,求解出
后即得到拟合曲线
,从而得到
选取拟合函数为幂函数
为待定常数,
这也是关于的非线性模型.两边取对数,同样可将其化为线性模型,即
令
则拟合曲线为
这时基函数为
将原数据
中的
取对数,得新数据
其中
对此新数据,用
拟合即可。
双曲型也是关于
的非线性拟合模型,作变形
令
,则拟合曲线为
化成了关于
的线性拟合模型,这时新数据为
,其中
。基函数为
由法方程组(3)即可求出拟合曲线
进而求出拟合曲线
。[2]