《Python数据挖掘与机器学习实战》—3 回 归 分 析
第3章 回 归 分 析
回归分析是一种应用极为广泛的数量分析方法。它用于分析事物之间的统计关系,侧重考察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系,以帮助人们准确把握变量受其他一个或多个变量影响的程度,进而为预测提供科学依据。在大数据分析中,回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析、时间序列模型,以及发现变量之间的因果关系。
本章要点如下:
了解线性回归的基本概念;
掌握一元线性回归和多元线性回归;
实现基于线性回归的股票特征提取与预测;
了解逻辑回归的基本概念;
实现基于逻辑回归的环境数据检测。
3.1 回归分析概述
本节将介绍回归分析(regression analysis)的基本概念和步骤,以及可以解决的问题。它是一个统计预测模型,用以描述和评估因变量与一个或多个自变量之间的关系。
3.1.1 基本概念
回归分析是处理多变量间相关关系的一种数学方法。相关关系不同于函数关系,后者反映变量间的严格依存性,而前者则表现出一定程度的波动性或随机性,对自变量的每一个取值,因变量可以有多个数值与之相对应。在统计上,研究相关关系可以运用回归分析和相关分析(correlation analysis)。
当自变量为非随机变量而因变量为随机变量时,它们的关系分析称为回归分析;当两者都是随机变量时,它们的关系分析称为相关分析。回归分析和相关分析往往不加区分。广义上说,相关分析包括回归分析,但严格地说两者是有区别的。具有相关关系的两个变量ξ和η,它们之间虽存在着密切的关系,但不能由一个变量的数值精确地求出另一个变量的值。通常选定ξ=x时η的数学期望作为对应ξ=x时η的代表值,因为它反映ξ=x条件下η取值的平均水平。这样的对应关系称为回归关系。根据回归分析可以建立变量间的数学表达式,称为回归方程。回归方程反映自变量在固定条件下因变量的平均状态变化情况。相关分析是以某一指标来度量回归方程所描述的各个变量间关系的密切程度。相关分析常用回归分析来补充,两者相辅相成。若通过相关分析显示出变量间关系非常密切,则通过所建立的回归方程可获得相当准确的取值。
- 点赞
- 收藏
- 关注作者
评论(0)