高斯过程(Gaussian Process, GP)是 概率论 数理统计 随机过程 (stochastic process)的一种,是一系列服从 正态分布 随机变量 (random variable)在一指数集(index set)内的组合
高斯过程中任意随机变量的 线性组合 都服从正态分布,每个有限维分布都是联合正态分布,且其本身在连续指数集上的 概率密度函数 即是所有随机变量的高斯测度,因此被视为联合正态分布的无限维广义延伸 。高斯过程由其 数学期望 协方差函数 完全决定,并继承了正态分布的诸多性质
高斯过程的例子包括 维纳过程 、奥恩斯坦-乌伦贝克过程等 。对高斯过程进行建模和预测是 机器学习 信号处理 等领域的重要内容,其中常见的模型包括 高斯过程回归 (Gaussian Process Regression, GPR)和高斯过程分类(Gaussian Process Classification, GPC) 。高斯过程的命名来自德国数学家 卡尔·弗里德里希·高斯 (Carl Friedrich Gauss)以纪念其提出 正态分布 概念。
对高斯过程的定义中没有包含指数集的先验假设,这意为着指数集可以有任意的 拓扑结构 ,高斯过程通常考虑其指数集拥有无穷个元素的情形,常见形式包括 时间序列 (timeseries)和空间位置。在指数集对应空间关系时,高斯过程也被称为高斯随机场(Gaussian random field) 。高斯过程在文献中常记为
相互独立
高斯过程由其数学期望和核函数完全定义,核函数赋予高斯过程平滑性(smoothness)、 各向同性 (isotropy)、 周期性 和平稳性。平稳高斯过程的数学期望是一常数,因此由核函数完全定义。
高斯过程具有边缘分布性质(marginalization property),若高斯过程有服从联合正态分布的随机向量
,则其该向量中的随机变量
,且随机变量间有条件分布:
高斯过程的边缘分布性质意味着由大的随机变量集得到的结果不会对小的随机变量造成影响。对有限个随机变量的高斯过程,只要协方差函数定义了 协方差矩阵 的所有元素,则该性质依然成立 被称为 赫斯特指数 (Hurst exponent),可以度量非整数布朗运动的记忆性 。当其大于0.5时,非整数布朗运动的差值有正相关;当其小于0.5时有负相关,当其等于0.5时,非整数布朗运动没有记忆性,等价于一个维纳过程
1. 构建高斯过程先验 :高斯过程由其数学期望和协方差函数完全决定,常见的选择是平稳高斯过程,即数学期望为一常数,协方差函数取平稳高斯过程可用的核函数,使用最多的核函数是RBF核
2. 求解超参数 :在给定学习样本
后GPR由
贝叶斯定理 (Bayes' theorem)求解超参数后验:
为超参数的似然,对正态似然的情形,GPR通常使用 极大似然估计 (Maximum Likelihood Estimation, MLE)按非线性优化方法求解超参数;对非正态似然的情形,可使用解析近似(analytical approximation)和 蒙特卡罗方法 (Monte Carlo method)
作为具有全贝叶斯特性(full Bayesian)的非参数模型,GPR可提供预测结果的后验,且在 似然 服从正态分布时,该后验具有解析形式,因此其是一个具有泛用性和可解析性的 概率模型 。此外,在核函数和指数集满足特定条件时,GPR是任意函数的通用近似(universal approximator)。
高斯过程分类(Gaussian Process Classification, GPC)
对判别模型,在 二元分类 (binary classification)中,给定权重矩阵和从实数域映射至
区间的响应函数(例如 Sigmoid函数 ),可定义如下的 线性分类器 (linear classifier):
除GPR和GPC外,高斯过程建模可以有其它更复杂的形式,例如半参数高斯过程(Semi-parametric Gaussian Processes, SGP) 、深度高斯过程(Deep Gaussian Process, DGP) 、可加高斯过程(Additive Gaussian Process, AGP)等
高斯过程主要应用于各领域的建模和预报,在 时间序列分析 中,高斯过程被用于时间序列的多步前向预报(multi-step-ahead prediction) 、在 信号处理 中,高斯过程建模是处理非线性信号的工具 、在 人工智能 领域,GPR和GPC是被广泛使用的 机器学习 算法 ,具有 卷积 结构的高斯过程(Convolutional Gaussian Processes, CGP)在图像处理问题中表现出了良好效果 。此外一些高斯过程可以模拟特殊的科学现象,例如OU过程被用于神经活动的建模 、布朗桥被用于模拟生物的迁徙行为 Rasmussen, C.E. and Williams, C.K.I. . Gaussian processes in machine learning :MIT Press ,2006 :Chapter 2-5, pp.7-128, Appendix B Gibbs, M.N., 1998. Bayesian Gaussian processes for regression and classification. Doctoral dissertation, University of Cambridge. Brown, R. G. and Hwang, P. Y. .Introduction to random signals and applied Kalman filtering (Vol. 3) .New York :Wiley ,1992 :Chapter 2 (72-111) Khoshnevisan, D. and Alberts, T., Topics in Probability: Gaussian Analysis (Chapter 6) .Department of Mathematics, University of Utah [引用日期2018-10-25]
  • Vanmarcke, E. .Random fields: analysis and synthesis :World Scientific ,2010 :13-17 Barber, D .Bayesian reasoning and machine learning :Cambridge University Press ,2012 :Chapter 19 (347-363) Bokma, F., Godinot, M., Maridet, O., Ladevèze, S., Costeur, L., Solé, F., et al. (2015). Testing for Depéret's rule (body size increase) in mammals using combined extinct and extant data. Systematic biology, 65(1), 98-108. Mandelbrot, B.B. and Van Ness, J.W., 1968. Fractional Brownian motions, fractional noises and applications. SIAM review, 10(4), pp.422-437. Hurst, H. E., 1951. Long-term storage capacity of reservoirs. Trans. Amer. Soc. Civil Eng., 116, pp.770-799. Uhlenbeck, G.E. and Ornstein, L.S., 1930. On the theory of the Brownian motion. Physical review, 36(5), p.823. Mansuy, R. and Yor, M. .Aspects of Brownian motion :Springer Science & Business Media. ,2008 :1-3 Wu, T. and Movellan, J., 2012. Semi-parametric Gaussian process for robot system identification. In Intelligent Robots and Systems (IROS), 2012 IEEE/RSJ International Conference on (pp. 725-731). IEEE. Duvenaud, D., 2014. Automatic model construction with Gaussian processes. Doctor of Philosophy Thesis. University of Cambridge. Girard, A., Rasmussen, C.E., Candela, J.Q. and Murray-Smith, R., 2003. Gaussian process priors with uncertain inputs application to multiple-step ahead time series forecasting. In Advances in neural information processing systems (pp. 545-552). Pérez-Cruz, F., Van Vaerenbergh, S., Murillo-Fuentes, J.J., Lázaro-Gredilla, M. and Santamaria, I., 2013. Gaussian processes for nonlinear signal processing: An overview of recent advances. IEEE Signal Processing Magazine, 30(4), pp.40-50. van der Wilk, M., Rasmussen, C.E., and Hensman, J., 2017. Convolutional Gaussian Processes. In Advances in Neural Information Processing Systems (pp. 2849-2858). Ricciardi, L. M., and Sacerdote, L., 1979. The Ornstein-Uhlenbeck process as a model for neuronal activity. Biological cybernetics, 35(1), pp.1-9. Horne, J.S., Garton, E.O., Krone, S.M. and Lewis, J.S., 2007. Analyzing animal movements using Brownian bridges. Ecology, 88(9), pp.2354-2363.
  •