导图社区 机器学习及数据分析第一章绪论
机器学习及数据分析第一章绪论的思维导图,整理了机器学习的类别、机器学习的应用场景、机器学习的实践工具、机器学习的应用领域、机器学习的基本术语的内容,有兴趣的可以看看哟。
年度个人工作计划,工欲善其事必先利其器,主要写了机器学习的相关函数、数据结构、python工具及实践工具。有需要的尽情查阅吧。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
机器学习及数据分析 第一章 绪论
人工智能与机器学习
机器学习的概念
概念
机器学习,最早是由一位人工智能领域的先驱,Arthur Samuel,在1959年提出来的。本意指的是一种让计算机在不经过明显编程的情况下,对数据进行学习,并且做出预测的方法,属于计算机科学领域的一个子集。公认的世界上第一个自我学习项目,就是Samuel跳棋游戏。
定义
机器学习领域的创始人Arthur Samuel(亚瑟·塞缪尔)早在1959年就给机器学习(Machine Learning,ML)下了定义: 机器学习是这样的一个研究领域,它能让计算机不依赖确定的编码指令来自主的学习工作。 机器学习就是对计算机一部分数据进行学习,然后对另外一些数据进行预测与判断。
核心
使用算法解析数据,从中学习,然后对新数据做出决定或预测
人工智能
AI(Artificial Intelligence)
可以简单的解释为:努力将通常由人类完成的智力任务自动化
AI的起源与发展
机器学习的类别
机器学习的分类
有监督学习:通过现有的训练数据集建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。 有监督学习的训练数据集一般包含样本特征变量和分类标签。
无监督学习:没有数据训练集的情况下,对没有标签的数据进行分析并建立合适的模型,以便给出问题的解决方案。
其他
机器学习的新热点
深度学习
层数较多、结构比较复杂的神经网络的机器学习技术叫做深度学习。
适用于图像、音频、视频等非结构化数据的处理
强化学习(Reinforcement Learning) 智能体(Agent)如何基于环境而做出行动反应,以取得最大化的累积奖励。
机器学习的应用场景
有监督学习解决的问题
分类的目标是对样本的类标签进行预测,判断样本属于哪一个分类,结果是离散的数值。
回归:回归的目标是要预测一个连续的数值或者是范围
无监督学习解决的方法
聚类:聚类(Clustering)问题是在没有标签的情况下,把数据按照其特征的性质分成不同的簇(分类)。
机器学习的实践工具
在线实践工具
https://jupyter.org/try-jupyter/lab/
https://www.kaggle.com/code
https://ml.azure.com/home
本机实践工具
https://www.anaconda.com/
https://conda.io/projects/conda/en/latest/
机器学习的应用领域
电子商务中的智能推荐
社交网络中的广告效果
互联网金融中的风控系统
新闻资讯中的内容审查
精准医学、智能医疗
无人驾驶
智能家居
机器学习的基本术语
模型的泛化
过拟合:如果基于训练集建立的模型过于复杂,以至于这个模型在拟合训练数据集时表现非常好,但是在测试数据集的表现差,说明模型出现了过拟合(overfitting)的问题。
欠拟合:相反,如果模型过于简单,连训练数据集的特点都不能完全考虑到的话,那么这样的模型在训练数据集和测试数据集的得分都会非常差,这个时候我们说模型出现了欠拟合(underfitting)的问题。