题目
在将特征输入模型之前,需要先做()对其进行预处理A. 归一化处理B. 连续化处理C. 离散化处理D. 跳跃式处理
在将特征输入模型之前,需要先做()对其进行预处理
A. 归一化处理
B. 连续化处理
C. 离散化处理
D. 跳跃式处理
题目解答
答案
A. 归一化处理
解析
考查要点:本题主要考查机器学习中数据预处理的基本概念,特别是特征工程中的归一化处理作用。
解题核心思路:
在机器学习模型训练前,归一化处理是常用且关键的预处理步骤。其核心目的是消除不同特征之间量纲差异的影响,使模型训练更高效、结果更稳定。例如,若特征范围差异大(如年龄0-100与收入0-1,000,000),模型可能过度关注范围大的特征,导致性能下降。
破题关键点:
- 归一化处理将特征值压缩到固定范围(如0-1),确保特征可比性。
- 其他选项(如离散化、连续化)属于特定场景下的处理方式,非通用预处理步骤。
归一化处理的作用:
- 消除量纲差异:统一特征尺度,避免范围大的特征主导模型。
- 加速收敛:梯度下降等优化算法在特征标准化后更快收敛。
- 提升模型性能:某些模型(如支持向量机、KNN)对特征尺度敏感,归一化后效果更佳。
选项辨析:
- B. 连续化处理:将离散特征转为连续,但并非所有模型都需要。
- C. 离散化处理:将连续特征分段,可能损失信息,适用于特定模型(如决策树)。
- D. 跳跃式处理:非标准术语,干扰项。