标签: numpy
共 2 篇文章
大数据-205 线性回归的机器学习视角:矩阵表示、SSE损失与最小二乘
线性回归(Linear Regression)的核心链路:用矩阵形式统一表示预测函数 y=Xw,将参数向量 w 作为唯一未知量;以损失函数刻画拟合误差,重点解释 SSE(残差平方和/误差平方和)作为回归任务的典型优化目标;通过最小二乘法(Least Squares)把"让 SSE 最小"转化为对参数求导并令一阶导为 0,从一元线性回归的直观拟合过渡到多元线性回归的矩阵推导与求解框架(正规方程形式)。内容覆盖:线性回归的机器学习表示、损失函数与优化目标、最小二乘法、SSE 推导、多元线性回归矩阵求解。
大数据-206 用 NumPy 矩阵乘法手写多元线性回归:正规方程、SSE/MSE/RMSE 与 R²
pandas DataFrame 与 NumPy 矩阵乘法手写多元线性回归(线性回归实现)。核心思路是将特征矩阵 X(包含一列全 1 作为截距)与标签 y 组成正规方程,通过 w=(X^TX)^{-1}X^Ty 直接求解参数权重。实现中重点检查 X^TX 是否满秩:若行列式为 0 则矩阵奇异,无法求逆,需要改用伪逆或最小二乘。评估部分给出残差平方和 SSE、均方误差 MSE、均方根误差 RMSE,以及判定系数 R²(1-\frac{SSE}{SST})的计算方式,并用 matplotlib 将预测直线与原始数据点可视化展示。