【漫话机器学习系列】132.概率质量函数(Probability Mass Function, PMF)

devtools/2025/3/14 14:04:20/

概率质量函数(Probability Mass Function, PMF)详解

1. 概述

概率质量函数(PMF, Probability Mass Function)用于描述离散随机变量的概率分布。简单来说,它给出了随机变量取某个具体值的概率。PMF 适用于那些只能取有限个或可数无穷多个离散值的变量,例如抛硬币的结果(正面或反面)、掷骰子的点数(1-6)等。

2. 概率质量函数的数学定义

设 XXX 是一个离散随机变量,取值范围为 x_1, x_2, \dots, x_n,则概率质量函数定义如下:

P(X = x) = f(x)

其中:

  • P(X = x) 表示随机变量 X 取值为 x 的概率。
  • f(x) 代表该值的概率质量函数。

PMF 必须满足以下两个条件:

  1. 非负性:对于所有可能的 x,P(X = x) \geq 0
  2. 归一化性质(所有概率之和为 1):

    \sum_{x \in S} P(X = x) = 1

    其中 S 是随机变量 X 的所有可能取值集合。
3. 概率质量函数的直观解释

概率质量函数可以用柱状图条形图来表示。例如,在图片中,我们看到一个离散随机变量的概率分布,横轴是可能取值,纵轴是概率,用不同高度的柱子来表示每个取值的概率大小。

4. 例子
(1) 掷骰子的 PMF

假设掷一个公正的 6 面骰子,随机变量 X 表示掷出的点数。由于骰子是公正的,每个点数的概率相等,PMF 如下:

如果用柱状图表示,每个点数x(1 到 6)都会对应一个相等高度的柱子。

(2) 抛硬币的 PMF

设 X 为一次抛硬币时出现正面的次数,则:

这也是一个典型的离散概率分布。

5. PMF 与其他概率分布的关系
  • 概率密度函数(PDF, Probability Density Function):PMF 适用于离散随机变量,而 PDF 适用于连续随机变量。对于连续变量,例如人的身高或温度,我们不能用 PMF,而需要用概率密度函数。
  • 累积分布函数(CDF, Cumulative Distribution Function):PMF 只给出某个具体取值的概率,而 CDF 是从小到大累积概率,定义为:

    F(x) = P(X \leq x) = \sum_{t \leq x} P(X = t)

    CDF 适用于 PMF 和 PDF,但 PMF 直接给出每个取值的独立概率,而 CDF 累加这些概率。
6. PMF 的实际应用

概率质量函数在很多现实场景中都有重要作用:

  1. 机器学习和数据科学:离散数据建模,如分类问题、朴素贝叶斯分类器等。
  2. 金融建模:股票价格涨跌的离散状态概率。
  3. 质量控制:工厂产品的合格与不合格概率建模。
  4. 自然语言处理(NLP):分析单词在文本中的出现概率。
7. 结论

概率质量函数是描述离散随机变量概率分布的重要工具,广泛应用于统计学、数据科学、金融等领域。理解 PMF 有助于更深入地研究概率论,并在实际问题中构建有效的概率模型。


图示解析 在图片中:

  • 标题用中文和英文分别写出了“概率质量函数”(Probability Mass Function)。
  • 文字说明指出 PMF 是用于描述离散随机变量的概率分布。
  • 右侧的柱状图表示了某个离散随机变量的概率分布,其中每个可能取值对应一个概率高度。
  • 画面风格手绘,增强了可读性和直观理解。

希望这篇文章能帮助你全面理解概率质量函数(PMF)


http://www.ppmy.cn/devtools/166661.html

相关文章

【含文档+PPT+源码】基于微信小程序的乡村振兴民宿管理系统

项目介绍 本课程演示的是一款基于微信小程序的乡村振兴民宿管理系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含:项目源码、项目文档、数据库脚本、软件工具等所有资料 2.带你从零开始部署运行本套系统 3.该…

CentOS7离线部署安装docker和docker-compose

CentOS7离线部署安装docker和docker-compose 安装包准备 docker下载地址、docker-compose下载地址 docker和docker-compose版本对应关系 注:本次安装部署选择的版本是 docker:docker-28.0.1.tgzdocker-compose:docker-compose-linux-x86_6…

JAVA编程【JVM编程】

1. JVM 体系结构 JVM 主要包括以下几个核心部分: 类加载器(ClassLoader) 运行时数据区(Runtime Data Area) 执行引擎(Execution Engine) 本地方法接口(Native Interface&#xff0…

今日头条文章爬虫教程

今日头条文章爬虫教程 随着互联网的发展,新闻资讯类平台如今日头条积累了海量的数据。对于数据分析师、研究人员等群体来说,获取这些数据进行分析和研究具有重要的价值。本文将介绍如何使用Python编写爬虫,爬取今日头条的文章数据。 一、准…

下一代AIGC一站式商业解决方案Chat Nio

简介 什么是 AIGC ? AIGC(Artificial Intelligence Generated Content)是“人工智能生成内容”的简称,指的是利用人工智能技术,通过算法和模型自动生成各种形式的内容,包括但不限于文本、图像、音频、视频…

react脚手架(creat-react-app)

安装 react脚手架 React官方提供的脚手架工程Create React App:https://github.com/facebook/create-react-app npm install create-react-app -g 全局安装 create-react-app my-react (my-react为项目名称,可以自定义) cd my-react 启动项目&#xff1a…

Python Flask 开发用于访问数据库的 REST API

Python Flask 开发用于访问数据库的 REST API Python Flask 开发用于访问数据库的 REST API Python Flask 开发用于访问数据库的 REST API 为了说明如何使用 Flask 和 Flask-RESTful 扩展构建 REST API,我们将修改之前网页应用程序,并使用 REST 架构风格…

Git与GitHub:理解两者差异及其关系

目录 Git与GitHub:理解两者差异及其关系Git:分布式版本控制系统概述主要特点 GitHub:基于Web的托管服务概述主要特点 Git和GitHub如何互补关系现代开发工作流 结论 Git与GitHub:理解两者差异及其关系 Git:分布式版本控…