python进行回归分析(Python多项式回归的实现方法)
python进行回归分析
Python多项式回归的实现方法多项式回归是一种线性回归形式,其中自变量x和因变量y之间的关系被建模为n次多项式。多项式回归拟合x的值与y的相应条件均值之间的非线性关系,表示为e(y | x)
为什么多项式回归:
- 研究人员假设的某些关系是曲线的。显然,这种类型的案例将包括多项式项。
- 检查残差。如果我们尝试将线性模型拟合到曲线数据,则预测变量(x轴)上的残差(y轴)的散点图将在中间具有许多正残差的斑块。因此,在这种情况下,这是不合适的。
- 通常的多元线性回归分析的假设是所有自变量都是独立的。在多项式回归模型中,不满足该假设。
多项式回归的使用:
这些基本上用于定义或描述非线性现象,例如:
- 组织生长速度。
- 疾病流行病的进展
- 湖泊沉积物中碳同位素的分布
回归分析的基本目标是根据自变量x的值来模拟因变量y的期望值。在简单回归中,我们使用以下等式 y = a + bx + e
这里y是因变量,a是y截距,b是斜率,e是误差率。
在许多情况下,这种线性模型将无法解决。例如,如果我们在这种情况下根据合成温度分析化学合成的产生,我们使用二次模型y = a + b1x + b2 ^ 2 + e
这里y是x的因变量,a是y截距,e是误差率。
通常,我们可以将其建模为第n个值。y = a + b1x + b2x ^ 2 + .... + bnx ^ n
由于回归函数在未知变量方面是线性的,因此这些模型从估计的角度来看是线性的。
因此,通过最小二乘技术,让我们计算y的响应值。
python中的多项式回归:
要获得用于分析多项式回归的数据集,请单击此处。
步骤1:导入库和数据集
导入重要的库和我们用于执行多项式回归的数据集。
|
# importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # importing the dataset datas = pd.read_csv( 'data.csv' ) datas |
第2步:将数据集分为2个组件
将数据集划分为两个组件,即x和yx将包含1到2之间的列.y将包含2列。
|
x = datas.iloc[:, 1 : 2 ].values y = datas.iloc[:, 2 ].values |
第3步:将线性回归拟合到数据集
拟合线性回归模型在两个组件上。
|
# fitting linear regression to the dataset from sklearn.linear_model import linearregression lin = linearregression() lin.fit(x, y) |
第4步:将多项式回归拟合到数据集
将多项式回归模型拟合到两个分量x和y上。
|
# fitting polynomial regression to the dataset from sklearn.preprocessing import polynomialfeatures poly = polynomialfeatures(degree = 4 ) x_poly = poly.fit_transform(x) poly.fit(x_poly, y) lin2 = linearregression() lin2.fit(x_poly, y) |
步骤5:在此步骤中,我们使用散点图可视化线性回归结果。
|
# visualising the linear regression results plt.scatter(x, y, color = 'blue' ) plt.plot(x, lin.predict(x), color = 'red' ) plt.title( 'linear regression' ) plt.xlabel( 'temperature' ) plt.ylabel( 'pressure' ) plt.show() |
步骤6:使用散点图可视化多项式回归结果。
|
# visualising the polynomial regression results plt.scatter(x, y, color = 'blue' ) plt.plot(x, lin2.predict(poly.fit_transform(x)), color = 'red' ) plt.title( 'polynomial regression' ) plt.xlabel( 'temperature' ) plt.ylabel( 'pressure' ) plt.show() |
步骤7:使用线性和多项式回归预测新结果。
|
# predicting a new result with linear regression lin.predict( 110.0 ) |
|
# predicting a new result with polynomial regression lin2.predict(poly.fit_transform( 110.0 )) |
使用多项式回归的优点:
- 广泛的功能可以适应它。
- 多项式基本上适合宽范围的曲率。
- 多项式提供了依赖变量和自变量之间关系的最佳近似。
使用多项式回归的缺点
- 这些对异常值过于敏感。
- 数据中存在一个或两个异常值会严重影响非线性分析的结果。
- 此外,遗憾的是,用于检测非线性回归中的异常值的模型验证工具少于线性回归。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持开心学习网。
原文链接:https://www.cnblogs.com/python01/p/10329383.html
- python技巧图解(Python魔法方法功能与用法简介)
- python比较两文件内容(Python判断两个文件是否相同与两个文本进行相同项筛选的方法)
- python3.7不兼容pywinauto(浅谈python编译pyc工程--导包问题解决)
- python基本数据结构(浅谈Python编程中3个常用的数据结构和算法)
- pythonimage库(Python/Django后端使用PIL Image生成头像缩略图)
- vscode如何配置python环境(VSCode Python开发环境配置的详细步骤)
- python开启两个线程(Python开启线程,在函数中开线程的实例)
- python random函数在哪个包(Python3.5内置模块之random模块用法实例分析)
- python把str转成list(python3 字符串/列表/元组str/list/tuple相互转换方法及join函数的使用)
- python程序锁教程(在python里协程使用同步锁Lock的实例)
- python和mysql实战(由Python编写的MySQL管理工具代码实例)
- python多线程超时设置(解决python线程卡死的问题)
- python闭包的讲解(详解python函数的闭包问题内部函数与外部函数详述)
- python语言中的递归(详解python中递归函数)
- java怎么调用支付宝的扫码支付(python实现银联支付和支付宝支付接入)
- python真的能高效处理excel报表吗(Python数据报表之Excel操作模块用法分析)
- 官宣 全椒籍明星许海峰 奚秀兰 方芳 王璐瑶携手回家 走太平(全椒籍明星许海峰)
- 以前全椒人是怎么过冬的 满满都是回忆(以前全椒人是怎么过冬的)
- NVIDIA显卡份额冲上88 A饭发愁 游戏优化恐没A卡份了(NVIDIA显卡份额冲上88A饭发愁)
- AMD YES A卡还是N卡 A卡和N卡的区别(AMDYESA卡还是N卡)
- 以后显卡多了一个新选择,N卡和A卡外又多了个I卡(以后显卡多了一个新选择)
- 读卖乐园的彩灯(读卖乐园的彩灯)
热门推荐
- vmwareesxi怎么安装(vmware esxi6.5安装使用详细步骤)
- opencv怎么设置图像形态(OpenCV图像颜色反转算法详解)
- ftp主动模式和被动模式设置(FTP主动模式和被动模式区别详解)
- php导出excel使用方法(PHP使用ajax的post方式下载excel文件简单示例)
- dedecms如何使用标签(dedecms 移动文章后,原来生成的HTML依然存在解决方法)
- centos7设置开机启动脚本(Centos7.3开机自动启动或执行指定命令操作)
- mysql连接navicat报错1045(Navicat 连接MySQL8.0.11出现2059错误)
- dedecms数据负载能力(详解织梦dedecms标签{dede:flink /}用法)
- docker部署redis集群查看版本(docker下的 redis 之持久化存储详解)
- thinkphp静态怎么设置(浅谈thinkphp的nginx配置,以及重写隐藏index.php入口文件方法)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9