最大期望算法是什么

最大期望算法(EM)是一类通过迭代进行极大似然估计的优化算法,通常作为牛顿迭代法的替代用于对包含隐变量或缺失数据的概率模型进行参数估计。

最大期望算法(Expectation-Maximization algorithm, EM),或 Dempster-Laird-Rubin 算法,是一类通过迭代进行极大似然估计(Maximum Likelihood Estimation, MLE)的优化算法,通常作为牛顿迭代法(Newton-Raphson method)的替代用于对包含隐变量(latent variable)或缺失数据(incomplete-data)的概率模型进行参数估计。

最大期望算法是什么

EM 算法的标准计算框架由 E 步(Expectation-step)和 M 步(Maximization step)交替组成,算法的收敛性可以确保迭代至少逼近局部极大值。EM 算法是 MM 算法(Minorize-Maximization algorithm)的特例之一,有多个改进版本,包括使用了贝叶斯推断的 EM 算法、EM 梯度算法、广义 EM 算法等。

由于迭代规则容易实现并可以灵活考虑隐变量,EM 算法被广泛应用于处理数据的缺测值,以及很多机器学习(machine learning)算法,包括高斯混合模型(Gaussian Mixture Model, GMM)和隐马尔可夫模型(Hidden Markov Model, HMM)的参数估计。

历史

对 EM 算法的研究起源于统计学的误差分析(error analysis)问题。1886 年,美国数学家 Simon Newcomb 在使用高斯混合模型(Gaussian Mixture Model, GMM)解释观测误差的长尾效应时提出了类似 EM 算法的迭代求解技术。在极大似然估计(Maximum Likelihood Estimation, MLE)方法出现后,英国学者 Anderson McKendrick 在 1926 年发展了 Newcomb 的理论并在医学样本中进行了应用。1956 年,Michael Healy 和 Michael Westmacott 提出了统计学试验中估计缺失数据的迭代方法,该方法被认为是 EM 算法的一个特例。1970 年,B. J. N. Blight 使用 MLE 对指数族分布的 I 型删失数据(Type I censored data)进行了讨论。Rolf Sundberg 在 1971 至 1974 年进一步发展了指数族分布样本的 MLE 并给出了迭代计算的完整推导。

EM 算法的正式提出来自美国数学家 Arthur Dempster、Nan Laird 和 Donald Rubin,其在 1977 年发表的研究对先前出现的作为特例的 EM 算法进行了总结并给出了标准算法的计算步骤,EM 算法也由此被称为 Dempster-Laird-Rubin 算法。1983 年,美国数学家吴建福(C.F. Jeff Wu)给出了 EM 算法在指数族分布以外的收敛性证明。

此外,在二十世纪 60-70 年代对隐马尔可夫模型(Hidden Markov Model, HMM)的研究中,Leonard E. Baum 提出的基于 MLE 的 HMM 参数估计方法,即 Baum-Welch 算法(Baum-Welch algorithm)也是 EM 算法的特例之一。

理论

EM 算法是基于极大似然估计(Maximum Likelihood Estimation, MLE)理论的优化算法。给定相互独立的观测数据

算法标准算法

计算框架

EM 的计算框架:对数似然(蓝),E 步(绿),M 步(实心点)

1. E 步(Expectation-step, E-step)

由 EM 算法的求解目标可知,E 步有如下优化问题:

2. M 步(Maximization step, M-step)

在 E 步的基础上,M 步求解模型参数使

计算步骤

将统计模型带入 EM 算法的计算框架即可得到其计算步骤。这里以高斯混合模型(Gaussian Mixture Model, GMM)为例进行说明。由 GMM 的一般定义可知,其似然和参数有如下表示:

将上述内容带入 EM 算法的计算框架后,E 步有如下展开:

M 步通过 E 步输出的隐变量后验计算模型参数,在 GMM 中,M 步计算框架的优化问题有如下表示:

根据以上计算步骤,这里给出一个在 Python 3 环境使用 EM 算法求解 GMM 的编程实现:

改进算法

基于贝叶斯推断(Bayesian inference)的 EM 算法

参见:变分贝叶斯 EM

在 MLE 理论下,EM 算法仅能给出模型参数

MAP-EM 在 Dempster et al. (1977)就已被提出,但不同于标准 EM,MAP-EM 的隐分布

VBEM 使用平均场理论(Mean Field Theory, MFT)将隐分布近似为其在各个维度上分布的乘积:

EM 梯度算法(EM gradient algorithm)和广义 EM 算法(Generalized EM algorithm, GEM)

参见:广义期望最大算法

EM 算法的 M 步通过计算偏导数求解代理函数的极大值,EM 梯度算法(EM gradient algorithm)将该过程替换为牛顿迭代法(Newton-Raphson method)以加速迭代收敛。更进一步地,当代理函数

EM 算法的 E 步也可以按 ECM 的方法分解为条件极值问题,由先前推导可知,E 步的优化问题仅有一个全局极大值,即隐分布

α-EM 算法(α-EM algorithm)

α-EM 算法是对标准算法的隐变量概率分布引入权重系数

性质

收敛性与稳定性:EM 算法必然收敛于对数似然的局部极大值或鞍点(saddle point),其证明考虑如下不等关系:

计算复杂度:在 E 步具有解析形式时,EM 算法是一个计算复杂度和存储开销都很低的算法,可以在很小的计算资源下完成计算。在 E 步不具有解析形式或使用 MAP-EM 时,EM 算法需要结合其它数值方法,例如变分贝叶斯估计或 MCMC 对隐变量的后验分布进行估计,此时的计算开销取决于问题本身。

与其它算法的比较:相比于梯度算法,例如牛顿迭代法和随机梯度下降(Stochastic Gradient Descent, SGD),EM 算法的优势是其求解框架可以加入求解目标的额外约束,例如在高斯混合模型的例子中,EM 算法在求解协方差时可以确保每次迭代的结果都是正定矩阵。EM 算法的不足在于其会陷入局部最优,在高维数据的问题中,局部最优和全局最优可能有很大差异。

应用

EM 算法及其改进版本被用于机器学习算法的参数求解,常见的例子包括高斯混合模型(Gaussian Mixture Model, GMM)、概率主成份分析(probabilistic Principal Component Analysis)、隐马尔可夫模型(Hidden Markov Model, HMM)等非监督学习算法。EM 算法可以给出隐变量,即缺失数据的后验

(0)
时间不会说谎  的头像时间不会说谎  

相关推荐

  • vivo耳机没坏但听不到声音,怎样解决?

    如果你使用vivo耳机时,发现耳机并没有坏,但是却听不到声音,那么这个问题可能会让你很困扰。这种情况可能会出现在vivo手机或其他设备上,但是不要担心,我们将在本文中为你提供一些解决方案,让你的vivo耳机恢复正常使用。1.检查耳机插头

    2023年10月12日
  • Fiddler是什么

    Fiddler是一个强大的HTTP调试抓包工具。可以用其检测网页和服务器的交互情况,能够记录所有客户端和服务器间的http请求,支持监视、设置断点、甚至修改输入输出数据等功能。 F…

  • 正浩移动电源怎么样,使用体验分享

    本文目录一览外观设计电池容量和充电速度使用体验总结正浩移动电源是一款备受好评的移动电源,它的品牌知名度和用户口碑都非常不错。我最近购买了这款电源,使用了一段时间,现在来分享一下我的使用体验。外观设计正浩移动电源采用黑色塑料外壳,手

    2023年11月6日
  • 海信hz55e8a怎么样,值得购买吗?

    如果你正在寻找一款高性价比的电视,那么海信hz55e8a可能是一个不错的选择。这款电视在市场上的价格相对较低,但是它的功能和性能却非常出色。在这篇文章中,我们将深入探讨海信hz55e8a的各项特点,并帮助你决定是否值得购买。外观和设计海

    2023年12月6日
  • 中崎收银机开不了机,如何解决开机问题

    作为一款高品质的收银机品牌,中崎收银机在市场上备受欢迎。但是,有时候用户会遇到开不了机的问题,这对于商家来说是非常困扰的。那么,如何解决中崎收银机开不了机的问题呢?下面,我们将为您介绍一些解决方法。一、检查电源是否正常中崎收银机的开机需

    2023年10月11日
  • 电视哪里可以找到投屏,如何实现手机与电视的无缝连接

    随着科技的不断发展,我们的生活方式也在发生着翻天覆地的变化。在过去,我们只能通过电视机来观看电视节目,而现在,我们可以通过手机、平板电脑等移动设备来观看电视节目。但是,有时候我们会发现手机屏幕太小,不够舒适,这时候就需要将手机屏幕投射到电视

    2023年10月7日
  • win10玩游戏蓝屏重启,如何解决?

    如果你是一位游戏玩家,那么你一定会遇到这样的问题:当你玩游戏的时候,突然蓝屏重启,这是什么原因呢?如何解决这个问题呢?本文将为你详细介绍。一、什么是蓝屏重启?蓝屏重启是指在使用电脑的过程中,出现蓝屏错误后,电脑自动重启的情况。这种情况很

    2024年1月2日
  • PCI通讯控制器必须要装吗,影响及解决方法

    PCI通讯控制器是一种用于管理计算机硬件的设备,它可以帮助计算机与其他设备进行通讯,如音频设备、网卡、USB接口等。但是,很多人对于PCI通讯控制器是否必须要装存在疑惑。本文将详细介绍PCI通讯控制器的作用、不装的影响以及解决方法。一、P

    2023年11月11日
  • 响应时间是什么

    响应时间是一个计算机,显示器成像等多个领域的概念,在网络上,指从空载到负载发生一个步进值的变化时,传感器的响应时间。通常定义为测试量变化一个步进值后,传感器达到最终数值90%所需要…

  • 宏碁v5573g加内存条频率,如何选择合适的内存条并进行安装

    宏碁v5573g加内存条频率(如何选择合适的内存条并进行安装)作为一款性能优越的笔记本电脑,宏碁v5573g在市场上备受瞩目。但是,对于一些高性能应用程序和游戏,它的内存容量可能不足。幸运的是,它可以通过添加内存条来提高性能。本文将介绍如

    2023年10月14日
  • 达尔优和雷柏机械键盘哪个好,如何选择最适合你的键盘

    作为一名电脑爱好者,选择一款合适的键盘是至关重要的。在众多的品牌中,达尔优和雷柏机械键盘备受关注。那么,达尔优和雷柏机械键盘哪个好呢?本文将为你详细介绍两者的优缺点,帮助你选择最适合你的键盘。一、达尔优机械键盘达尔优机械键盘是一款高端机

    2023年10月9日
  • 索爱s35拆解图,如何轻松拆解你的手机

    如果你是一个DIY爱好者,那么你一定会对拆解手机这个话题感兴趣。今天,我将向大家介绍如何轻松拆解索爱s35手机,并提供详细的拆解图示。第一步:准备工作在开始拆解索爱s35手机之前,我们需要准备一些必要的工具。这些工具包括螺丝刀、塑料开壳

    2023年10月25日
  • 联通卡2g没信号怎么办,解决方法大揭秘

    随着移动互联网的普及,手机已经成为我们生活中不可或缺的一部分。而作为手机的重要组成部分之一,SIM卡的作用也越来越重要。不过,有些用户反映联通卡2g没有信号的问题,这给他们的生活带来了很多不便。那么,联通卡2g没信号怎么办呢?本文将为大家介

    2023年10月23日
  • 微信同步通讯录怎么关闭(微信同步通讯录怎么关闭通知)

    本篇文章给大家谈谈微信同步通讯录怎么关闭,以及微信同步通讯录怎么关闭通知对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。本文目录一览:1、怎么停用微信通讯录?2、我老公同步我的微信,怎样才能解除?我老公同步我的微信,怎样才能解除..

    2023年10月2日
  • 诺基亚7650,它是如何成为一代经典手机的?

    作为一款经典的手机,诺基亚7650在2002年发布时引起了不小的轰动。当时,移动通信技术刚刚开始普及,手机市场也处于起步阶段。在这个背景下,诺基亚7650以其强大的功能和时尚的外观,成为了当时最受欢迎的手机之一。本文将从历史背景、设计特点、

    2023年10月15日

发表回复

登录后才能评论