目录
- 一、机器学习
- 1、机器学习
- 2、各种机器学习问题
- 2.1 监督学习
- 2.1.1 回归
- 2.1.2 分类
- 2.1.3 标记问题
- 2.1.4 搜索
- 2.1.5 推荐系统
- 2.1.6 序列学习
- 2.2 无监督学习
- 2.3 强化学习
一、机器学习
机器学习: 帮助机器从现有的复杂数据中学习规律,以预测未来的行为结果和趋势。
深度学习: 机器学习研究中的一个新的领域,通过建立、模拟人脑进行学习的神经网络,它模仿人脑的机制来解释数据。
1、机器学习
机器学习的模型像是一个黑盒模型,通过输入输出来确定该模型。
机器学习中的关键组件:1、数据;2、模型;3、目标函数;4、算法。
2、各种机器学习问题
2.1 监督学习
监督学习:给定输入特征的情况下预测标签。
2.1.1 回归
回归:预测用户对一部电影的评分。
回归是训练一个回归模型来输出一个数值。
2.1.2 分类
分类:希望模型能够预测样本属于哪个类别。
分类是训练一个分类器来输出预测的类别。
最常见的类别不一定最终用于决策的类别。如判断一种蘑菇是否有毒,有80%的概率无毒,有20%的概率有毒,那我们也不会吃它,此时它不确定风险远远大于收益。
2.1.3 标记问题
当学习不相互排斥的类别问题称为多标签分类,如某篇博客同时具有“编程语言”,“深度学习”等标签。
2.1.4 搜索
在信息检索领域,我们希望对一组项目进行排序。(首先为集合中的每个元素分配响应的相关分数,然后检索评级最高的元素)
2.1.5 推荐系统
它的目标是向特定用户进行“个性化推荐”,在零售产品、音乐、短视频和新闻推荐中都有出现。
2.1.6 序列学习
如果输入样本之间有联系,是连续的,那模型可能就需要拥有“记忆”功能。
如自动语音识别,文本到语音和机器翻译。
2.2 无监督学习
没有十分具体的目标,“自发”地学习。可用于以下几个方面:
- 聚类问题:没有标签的情况下给数据分类
- 组成成分分析
- 因果关系和概率图模型
- 生成对抗性网络
2.3 强化学习
强化学习是一类明显与环境互动的问题。如:深度Q网络在雅达利游戏中仅使用视觉就击败了人类,以及AlphaGo程序在棋盘游戏围棋中击败了世界冠军。
强化学习在每个特定的时间点,智能体从环境接收一些观察,并且必须选择一个动作,然后通过某种机制将其传回环境,最后智能体从环境中获得奖励。