2026/4/18 5:26:40
网站建设
项目流程
网站建设的公司联系方式,站外推广免费网站,数字营销是什么,网站开发自学还是培训摘要#xff1a;数据缩放是机器学习中重要的预处理技术#xff0c;主要包括归一化和标准化两种方法。归一化将特征值缩放到0-1范围#xff0c;标准化则将特征调整为均值为0、标准差1的分布。Python中可通过sklearn的StandardScaler实现标准化处理#xff0c;示例展示了鸢尾…摘要数据缩放是机器学习中重要的预处理技术主要包括归一化和标准化两种方法。归一化将特征值缩放到0-1范围标准化则将特征调整为均值为0、标准差1的分布。Python中可通过sklearn的StandardScaler实现标准化处理示例展示了鸢尾花数据集缩放前后的对比使用fit_transform()方法完成数据拟合和转换。数据缩放能消除特征量纲差异提升模型性能。目录机器学习 —— 数据缩放示例输出结果缩放前的数据缩放后的数据机器学习 —— 数据缩放数据缩放Data Scaling是机器学习中的一种数据预处理技术用于对数据中特征的取值范围或分布进行归一化Normalization或标准化Standardization处理。数据缩放至关重要因为数据中的不同特征可能具有不同的量纲而部分算法在处理此类数据时性能会受影响。通过数据缩放可使每个特征的量纲和取值范围保持一致从而提升机器学习模型的性能。数据缩放主要包含两种常用技术归一化Normalization将特征值缩放至 0 到 1 之间。具体实现方式为用该特征的每个取值减去该特征的最小值再除以该特征的取值范围即最大值与最小值的差值。标准化Standardization将特征值缩放至均值为 0、标准差为 1 的分布状态。具体实现方式为用该特征的每个取值减去该特征的均值再除以该特征的标准差。示例在 Python 中可通过sklearn模块实现数据缩放。sklearn.preprocessing子模块提供了用于数据缩放的相关类。以下是使用StandardScaler类实现标准化的示例代码from sklearn.preprocessing import StandardScaler from sklearn.datasets import load_iris import pandas as pd # 加载鸢尾花数据集 data load_iris() X data.data # 特征数据 y data.target # 目标变量 # 将数据集转换为 DataFrame 格式 df pd.DataFrame(X, columnsdata.feature_names) print(缩放前的数据) print(df.head()) # 使用 StandardScaler 对数据进行标准化 scaler StandardScaler() X_scaled scaler.fit_transform(X) # 拟合数据并完成缩放转换 # 将缩放后的特征数据转换为新的 DataFrame df_scaled pd.DataFrame(X_scaled, columnsdata.feature_names) print(缩放后的数据) print(df_scaled.head())在本示例中首先加载鸢尾花Iris数据集并将其转换为 DataFrame 格式随后使用StandardScaler类对特征数据进行标准化处理生成缩放后的新 DataFrame。最后通过打印两个 DataFrame对比数据缩放前后的差异。需注意的是此处通过缩放器对象的fit_transform()方法同时完成了数据拟合与转换操作。输出结果运行上述代码后将得到如下输出缩放前的数据花萼长度厘米花萼宽度厘米花瓣长度厘米花瓣宽度厘米05.13.51.40.214.93.01.40.224.73.21.30.234.63.11.50.245.03.61.40.2缩放后的数据花萼长度厘米花萼宽度厘米花瓣长度厘米花瓣宽度厘米0-0.9006811.019004-1.340227-1.3154441-1.143017-0.131979-1.340227-1.3154442-1.3853530.328414-1.397064-1.3154443-1.5065210.098217-1.283389-1.3154444-1.0218491.249201-1.340227-1.315444