关于最小二乘法

embedded/2024/10/20 15:50:40/

最小二乘法的核心思想简单而优雅:我们希望找到一条最佳的曲线,使其尽可能贴近所有的数据点。想象一下,当你在画布上描绘一条线,目标是让这条线与点的距离最小。数学上,这可以表示为:

在这个公式中,yi​ 是你观察到的值,f(xi) 则是你预测的值。通过调整模型的参数,我们努力去缩小这个误差的平方和,直到找到最完美的曲线。

多项式回归

如果说线性回归是最小二乘法的基础,那么多项式回归则为它增添了丰富的层次。通过将数据点拟合成一条曲线,我们可以捕捉到更复杂的趋势。比如,二次回归模型能够揭示数据中潜藏的非线性关系,让我们看到更真实的画面。

非线性最小二乘法

生活中的许多现象并不是线性的,这时非线性最小二乘法便应运而生。它能处理如指数、对数等更为复杂的关系,为我们打开新的视野。使用牛顿法、拟牛顿法等优化算法,我们能够精准地找到适合的参数,揭示数据的深层次关系。

加权最小二乘法

在某些情况下,数据的可靠性并不相同。加权最小二乘法允许我们为每个观测值赋予不同的权重。这就像是在选举中,有些选票比其他选票更有影响力。通过这种方式,我们能够更精准地反映数据的重要性。

应用的广阔天地

最小二乘法的应用场景几乎无处不在。它在社会科学中帮助我们分析教育与收入之间的关系;在经济学中,它帮助预测通货膨胀率和GDP增长;在工程领域,它优化了信号处理和控制系统的设计。甚至在医学研究中,它为评估治疗效果与患者特征的关系提供了有力支持。

Python 实现

接下来,我们来看看如何用Python实现简单的线性回归,利用最小二乘法来拟合数据。

代码示例

import numpy as np
import matplotlib.pyplot as plt# 创建一些示例数据
x = np.array([1, 2, 3, 4, 5])
y = np.array([2.2, 2.8, 3.6, 4.5, 5.1])# 计算最小二乘法的参数
A = np.vstack([x, np.ones(len(x))]).T
m, b = np.linalg.lstsq(A, y, rcond=None)[0]# 绘制结果
plt.scatter(x, y, color='blue', label='数据点')
plt.plot(x, m*x + b, color='red', label='拟合线')
plt.xlabel('x')
plt.ylabel('y')
plt.legend()
plt.title('最小二乘法线性回归')
plt.show()print(f"斜率: {m}, 截距: {b}")

代码解析

  1. 数据准备:首先,我们创建了一组示例数据点。x 是自变量,y 是因变量。
  2. 构建设计矩阵:我们将自变量和常数项组合成一个设计矩阵 AAA,以便进行线性回归。
  3. 计算最小二乘法参数:使用 NumPy 的 lstsq 函数,我们计算出最佳拟合线的斜率 mmm 和截距 bbb。
  4. 绘图:最后,我们用 Matplotlib 绘制数据点和拟合线,使结果一目了然。

现代数据科学中的重要性

在当今这个信息爆炸的时代,数据的海洋中充满了复杂性与不确定性。最小二乘法作为一种基础工具,依然具有不可替代的地位。它不仅使我们能够从纷繁复杂的数据中提炼出有价值的信息,更为许多机器学习算法提供了理论基础。它的易用性和高效性使得初学者能够快速上手,而其深厚的理论支持又让研究者得以深入探索。

  这个看似简单的工具,实则蕴含着深刻的数学智慧。希望这篇文章能让你在日后的数据探索中,感受到最小二乘法的力量与魅力,助你在复杂的世界中找到那条最优的路径。


http://www.ppmy.cn/embedded/119979.html

相关文章

【C++】set详解

📢博客主页:https://blog.csdn.net/2301_779549673 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文由 JohnKi 原创,首发于 CSDN🙉 📢未来很长&#…

从kafka和zookeeper中获取生产和消费偏移量

从kafka和zookeeper中获取生产和消费偏移量 特殊说明 该命令是使用python进行编译,需要使用centos7系统上进行使用。 命令详细 [rootmongodb_1 get_offsets_num]# ./get_offsets_num -h usage: get_offsets_num [-h] [-k KAFKA_HOST] [-z ZOOKEEPER_HOST][-m INT…

sql 时间交集

任务(取时间交集) 前端输入开始时间和结束时间,通过sql筛选出活动开始时间和活动结束时间再开时时间和结束时间有交集的活动 想法: 前后一段时间内遇到了类似取交集的,从网上找到了两种写法,再结合GPT等…

无人化焦炉四大车系统 武汉正向科技 工业机车无人远程控制系统

焦炉四大车无人化系统介绍 采用格雷母线光编码尺双冗余定位技术,炉门视觉定位自学习技术,wifi5G无线通讯技术,激光雷达安全识别技术,焦化智慧调度,手机APP监控功能。 焦炉四大车无人化系统功能 该系统能自动生成生产…

27 Vue3之unocss原子化

前置知识 什么是原子化 CSS 原子化 CSS 是一种 CSS 的架构方式,它倾向于小巧且用途单一的 class,并且会以视觉效果进行命名。 为什么使用 原子化 CSS 传统方案 制作原子化 CSS 的传统方案其实就是提供所有你可能需要用到的 CSS 工具。例如&#xff0c…

uni-app - - - - -vue3使用i18n配置国际化语言

uni-app - - - - -使用i18n配置国际化语言 1. 安装vue-i18n2. 配置文件2.1 创建如下文件2.2 文件配置2.3 main文件导入i18n 3. 页面内使用3.1 template内直接使用3.2 变量接收使用 1. 安装vue-i18n npm install vue-i18n --save2. 配置文件 2.1 创建如下文件 locales文件夹里…

Vscode超好看的渐变主题插件

样式效果: 插件使用方法: 然后重启,之后会显示vccode损坏,不用理会,因为这个插件是更改了应用内部代码,直接不再显示即可。

构建高效房屋租赁系统:Spring Boot应用

1 绪论 1.1 研究背景 中国的科技的不断进步,计算机发展也慢慢的越来越成熟,人们对计算机也是越来越更加的依赖,科研、教育慢慢用于计算机进行管理。从第一台计算机的产生,到现在计算机已经发展到我们无法想象。给我们的生活改变很…