什么是网站程序微信小程序模板免费下载
2026/4/18 12:13:21 网站建设 项目流程
什么是网站程序,微信小程序模板免费下载,全国免费发布信息平台,成都建设网站报价机器学习一般通过python语言进行学习 ,而python中含有机器学习丰富的第三方库 例如python中的 scikit-learn 库 安装方式也很简单只需要执行: pip install scikit-learn 即可 机器学习的官网是: http://scikit-learn.org/stable/ 本篇文章是主要内容是描述一些机器学习中的基…机器学习一般通过python语言进行学习 ,而python中含有机器学习丰富的第三方库例如python中的scikit-learn库安装方式也很简单只需要执行: pip install scikit-learn 即可机器学习的官网是: http://scikit-learn.org/stable/本篇文章是主要内容是描述一些机器学习中的基本概念主要内容包括:- 人工智能发展相关概述- 机器学习发展三要素- 机器学习算法分类- 机器学习基本建模流程- 机器学习常用术语- 特征工程概念入门- 模型拟合问题概念入门1. 人工智能发展相关概述:人工智能三大概念: 人工智能(AI) ,机器学习(ML) ,深度学习(DL)1956年是人工智能的元年 ,人工智能这一词汇在这一年的会议上被提出人工智能( AI )之父: 约翰麦卡锡什么是人工智能(AI)呢?AI-用计算机模拟人脑 ,让计算机能够像人类一样 理性的思考 ,行动机器学习( ML )之父: 亚瑟塞缪尔什么是机器学习呢?ML-赋予计算机学习能力而不需要明确编程的研究领域人脑处理问题是根据经验 ,通过不断地输入归纳总结 ,从而达到回答一些问题以及对一些事物做出反应而机器学习与之类似 ,先通过各种数据训练我们的模型 ,让计算机自己找规律找公式 ,从而达到回答一些问题的目的什么是深度学习(DL)呢?DL-通过大脑仿生 ,设计一层一层的神将元模拟万事万物这三者之间的关系就是 AI 包含 ML 包含 DL规范编程与自动学习上面解释机器学习时提到的明确编程又名规范编程规范编程: 程序员根据经验利用手工的 if - else 的方式进行预测自动学习: 从数据中自动学出规律学出公式利用进行房价预测时 ,我们根据房子的住房面积 ,可以达到基本预测的效果 ,即面积越大 房价越高而规范编程就是程序员根据自己的理解根据不同的面积设计程序输出不同的房价自动学习就是我们将一些 面积与销售价钱 交给计算机 ,让计算机根据数据中的规律帮我们训练出一套公式机器学习常用术语上图中例如标签 ,样本等名词就是机器学习中的一些基本术语在训练模型时 ,我们需要传给电脑很多的数据 ,根据数据的一系列特征 预测出对应的结果- 样本:一条数据就是一个样本 ,多个样本组合构成数据集- 特征:就是模型预测的基准 ,有时也被称为属性- 标签:模型要预测的结果一个样本即一条数据一般包含 特征 和 标签 两部分- 数据集分为两部分 训练集 与 测试集 比例一般为 8:2 7:3训练集就是用于训练模型的数据测试集就是在模型训练完训练集以后对测试集进行预测 ,来测试模型的准确性机器学习发展的三要素就是 数据 算法 算力 也是AI发展的基石算力:- CPU 多进行I/O密集型操作- GPU 多进行并行计算- TPU 多进行大型计算机器学习算法分类有监督 无监督 半监督- 有监督的意思就是有特征同时有标签有监督根据标签的不同情况又分为两类如果标签是不连续的 ,就属于是分类问题 分类问题一般分为: 二分类 ,多分类如果标签是连续的 ,就属于是回归问题- 无监督的意思就是有特征但是没有标签这时就需要根据样本间的相似性 ,对样本进行聚类 ,以发现事物内部结构及相互关系- 半监督的意思就是一部分有标签 一部分没有标签半监督的工作原理就是先让专家对于少量数据标注上专业的标签 ,再利用有标签的数据训练出一个模型 ,在利用该模型去套用没有标签的数据 ,最后通过询问领域专家分类结果与模型分类结果作对比 这样做就可以大幅度降低专家标记的人工成本机器学习建模流程- 准备数据传入文本 ,图像 ,等数据给计算机- 数据预处理对于数据的筛查 ,一般用于处理数据中的缺失值以及异常值- 特征工程- 特征提取- 特征预处理- 特征降维 ,选择 ,组合- 模型训练- 线性回归- 逻辑回归- 决策树- GBDT- 模型预测通过上一步训练的模型 ,对测试集数据或者测试集以外的数据进行预测- 模型评估- 分类评估指标- 回归评估指标- 聚类评估指标- 模型部署- 测试无问题后 ,上线使用特征工程概念入门利用专业背景知识和技巧处理数据 ,让机器学习算法效果更好 ,这样的过程就是特征工程一句话概括数据与特征工程的重要性:数据和特征决定了机器学习的上限 ,而模型和算法只是逼近这个上线而已特征工程一般分为:- 特征提取- 从原始数据中只提取与任务相关的特征, 构成特征向量(由专家完成)- 特征预处理- 因量纲问题 ,有些特征权重对模型影响大 ,有些影响小- 解决 :- 归一化: (当前值-最小值)/)(最大值-最小值)- 标准化- 特征降维- 原始数据维度降低 ,一般会对原始数据产生影响- 特征选择- 原始数据特征很多 ,选择与任务相关的其中一个特征集合子集 ,不会改变原数据- 特征组合- 多个特征合并成一个特征 ,利用乘法或加法来完成模型拟合问题概述模型拟合问题一般出现在模型训练的过程中分为 欠拟合 正好拟合 过拟合 三种我们追求的就是正好拟合过拟合: 太复杂了, 学到了脏数据欠拟合: 太简单了, 条件缺失对于过拟合与欠拟合的分类标准就是 通过 训练集 与 测试集 来进行分类欠拟合: 在训练集和测试集上面的表现情况都不好过拟合: 在训练集上表现得很好 ,但是在测试集上表现得不好泛化: 是机器学习中来评估模型拟合情况的专有名词泛化能力越好 ,模型拟合能力越好当两个模型之间泛化能力相同时, 需要遵循奥卡姆提到原则:即较简单的模型比更加复杂的模型更可取

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询