Introduction and Motivation

news/2024/10/22 12:32:54/

1.1 Finding Words for Intuitions

本书的第一部分介绍了谈论机器学习系统的三个主要组成部分所需的数学概念和基础:数据、模型和学习。

机器学习的主要概念:

  • 我们将数据表示为向量
  • 我们选择一个合适的模型,要么使用概率视图,要么使用优化视图。
  • 我们通过使用数值优化方法从可用数据中学习,目的是使模型在未用于训练的数据上表现良好

(至少)有三种不同的方式来看待向量(数据):向量是一个数字数组(计算机科学观点),向量是一支有方向和大小的箭头(物理学观点),以及向量是一种服从加法和定标的物体(数学观点)

模型通常用于描述生成数据的过程,类似于手头的数据集。一个好的模型可以用来预测现实世界中会发生什么,而无需进行真实世界的实验。

1.2 Two Ways to Read This Book

我们可以考虑两种策略来理解数学形式的机器学习:

  • 自下而上:建立从基础到更先进的概念。
  • 自上而下:从实际需求深入到更基本的需求。

我们决定以模块化的方式编写这本书,将基础(数学)概念与应用程序分离开来,以便这本书可以双向阅读。

本书分为两部分,第一部分奠定了数学基础,第二部分将第一部分的概念应用于一组基本的机器学习问题,这些问题构成了机器学习的四大支柱,如图1.1所示:回归、维度归纳、密度估计和分类。
在这里插入图片描述

Part I Is about Mathematics

我们将数值数据表示为向量,并将此类数据的表表示为矩阵。

  • 2.Linear Algebra
  • 3.Analytic Geometry
  • 4.Matrix Decompositions
  • 5.Vector Calculus
  • 6.Probability and Distribution
  • 7.Continuous Optimization

Part II Is about Machine Learning

  • 8.When Models Meet Data
  • 9.Linear Regression
  • 10.Dimensionality Reduction with Principal Component Analysis
  • 11.Density Estimation with Gaussian Mixture Models
  • 12.Classification with Support Vector Machines

http://www.ppmy.cn/news/39329.html

相关文章

超越百度、蚂蚁金服!用Docker构建完美测试环境,让你的测试效率达到Google级别!

很高兴为大家介绍如何在Docker中自动构建测试环境并运行测试框架。本次演示将使用Python语言进行代码实战操作。 环境准备 在开始之前,需要安装以下软件: DockerPython 3.x 创建Dockerfile文件 首先,我们需要创建一个Dockerfile文件。这个文…

案例研究|华鼎供应链通过JumpServer安全运维云端资产

成立于2019年的河南华鼎供应链管理有限公司(以下简称为华鼎供应链)是一家冷链食品流通服务商。目前,华鼎供应链在全国拥有25个分支机构,14个省级中心仓,仓储面积25万平方米,干支线网络1870条,冷…

【Docker】Docker安装

Docker安装 Docker官网和仓库 docker官网:http://www.docker.com Docker Hub(镜像仓库)官网:https://hub.docker.com/ 前提说明 Docker必须部署在Linux内核的系统上,如果其他系统想部署Docker就必须安装一个虚拟L…

vue下载文件

注意请求时加入:responseType: bloburl:写全了,因为前后端端口号不同downloadImage(imgUrl) {let formData new FormData();formData.append(fileName, this.getFilename(imgUrl)); // 用于后端下载文件的路径axios.post(http://localhost:8…

DehazeNet: An End-to-End System for Single ImageHaze Removal

Abstract 单图像雾霾去除是一个具有挑战性的不适定问题。现有的方法使用各种约束/先验来获得似是而非的去雾解。实现雾霾去除的关键是对输入的雾霾图像进行介质透射图的估计。在本文中,我们提出了一个可训练的端到端系统称为DehazeNet,用于介质传输估计…

美摄汽车数据匿名化方案:精准、高效、低耗

近年来随着智能网联汽车的升级迭代,车辆采集数据的量级与敏感度也日渐提升。以车载摄像头为例,当前智能汽车车身配备的摄像头数量逐渐增加,采集到的信息也更加复杂多样。根据来源主体不同,车联网敏感数据大致可以划分为以下几类&a…

rk3568 Android audio 调试

rk3568 Android tiny-alsa工具 Android 平台使用audio HAL应该是Linux alsa-utils 的变种;相对后者前者更简单,但是功能基本相同; 在使用命令遍历声卡和设备时,同样支持按照序号和名字索引,这点比较赞。录音或者播放测…

leetcode:验证回文串(详解)

前言:内容包括:题目,代码实现,大致思路 题目: 如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后,短语正着读和反着读都一样。则可以认为该短语是一个 回文串 。 字母和数字都属于字母…