第 10 周:回归与二分类的“开山斧”
第 10 周的学习计划非常清晰线性回归和逻辑回归确实是机器学习领域最经典的“开山斧”掌握它们不仅是入门的基础更是理解后续复杂算法的基石。针对你的实操落地任务我为你梳理了具体的实战思路与核心代码实现 实操一房价预测连续值预测核心算法线性回归 (Linear Regression)业务目标根据房屋特征如房间数、面积等预测一个具体的金额。这属于典型的回归问题模型的输出是连续的数值。关键步骤与代码示例数据准备加载加州房价或波士顿房价数据集划分训练集与测试集。模型训练使用sklearn的LinearRegression拟合数据寻找最佳趋势线。模型评估由于目标是预测具体数值我们需要衡量预测值与真实值的差距。常用的指标包括MSE均方误差、RMSE均方根误差、MAE平均绝对误差以及 R² 分数。python1from sklearn.model_selection import train_test_split 2from sklearn.linear_model import LinearRegression 3from sklearn.metrics import mean_squared_error, r2_score 4 5# X: 房屋特征矩阵, y: 目标房价 6X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) 7 8# 实例化并训练模型 9model LinearRegression() 10model.fit(X_train, y_train) 11 12# 进行预测 13y_pred model.predict(X_test) 14 15# 计算 MSE 和 R² 分数 16mse mean_squared_error(y_test, y_pred) 17r2 r2_score(y_test, y_pred) 18print(f均方误差(MSE): {mse:.2f}) 19print(fR²分数: {r2:.2f})✉️ 实操二学生成绩及格预测基础分类核心算法逻辑回归 (Logistic Regression)业务目标根据出勤率、作业分数预测期末是否及格0或1。虽然名字带“回归”但它本质上是解决二分类问题的统计学习方法。核心原理它利用线性模型计算出分值后通过Sigmoid 函数将输出压缩到 0~1 之间表示属于某一类别的概率。通常设定阈值为 0.5大于等于 0.5 判定为及格(1)否则为不及格(0)。关键步骤与代码示例模型训练使用LogisticRegression学习特征与及格标签之间的概率映射关系。模型评估对于分类问题我们不再看 MSE而是关注准确率 (Accuracy)即模型预测正确的样本占总样本的比例。python1from sklearn.linear_model import LogisticRegression 2from sklearn.metrics import accuracy_score 3 4# X: 学生特征(出勤、作业分等), y: 是否及格(0或1) 5X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) 6 7# 实例化并训练模型 8log_reg LogisticRegression() 9log_reg.fit(X_train, y_train) 10 11# 进行预测 12y_pred log_reg.predict(X_test) 13 14# 计算准确率 15accuracy accuracy_score(y_test, y_pred) 16print(f模型准确率(Accuracy): {accuracy:.2%}) 学习小贴士在跑通这两个项目时你可以尝试观察一下当你在房价预测中引入更多特征时MSE 是否在下降在学生成绩预测中如果某位同学作业分数极高但缺勤严重模型给出的及格概率是多少这种对数据的直观感受正是 AI 工程师的核心素养。祝你本周实操顺利