人工智能导论(4)——不确定性推理(Uncertainty Reasoning)

1.3 基本问题

所有的不确定性推理方法都必须解决3个问题：

（1）表示问题

表示问题指的是采用什么方法描述不确定性。

在专家系统中，“知识不确定性”一般分为两类：一是规则的不确定性，二是证据的不确定性。

一般用(E→H, f(H,E))来表示规则的不确定性，f(H,E)即相应规则的不确定性程度，称为规则强度。
一般用(命题E, C(E))表示证据的不确定性，C(E)通常是一个数值，代表相应证据的不确定性程度，称为动态强度。

规则和证据不确定性的程度常用可信度来表示。

在专家系统MYCIN 中，可信度表示规则及证据的不确定性，取值范围为 [−1, 1] 。

当可信度取大于零时，其数值越大，表示相应的规则或证据越接近于“真”；
当可信度小于零时，其数值越小，表示相应的规则或证据越接近于“假”。

（2）语义问题

语义问题指上述表示和计算的含义是什么，即对它们进行解释。即需要对规则和证据的
不确定性给出度量。

对于证据的不确定性度量C(E)，需要定义在下述3种典型情况下的取值：
- E为真，C(E)=?
- E为假，C(E)=?
- 对E一无所知，C(E)=?
规则的不确定性度量f(H,E)，需要定义在下述3种典型情况下的取值：
- 若E为真，则H为真，这时f(H,E)=?
- 若E为真，则H为假，这时f(H,E)=?
- E对H没有影响，这时f(H,E)=?

（3）计算问题

计算问题主要指不确定性的传播和更新。即计算问题定义了一组函数，求解结论的
不确定性度量。

主要包括3方面：

不确定性的 传递算法
- 已知前提E的不确定性C(E)和规则强度f(H,E)求结论H的不确定性
- 即定义函数f1，使得C(H)=f1(C(E),f(H,E))
结论不确定性合成
- 由两个独立的证据E1和E2求得的假设H的不确定性C1(H)和C2(H)，求证据E1和E2的组合导致的假设H的不确定性
- 即定义函数C(H)=f2(C1(H),C2(H))
组合证据 的不确定性算法
- 已知证据E1和E2的不确定性C1(E)和C2(E)，求证据E1和E2的析取和合取的不确定性
- 即定义函数C(E1∧E1)=f3(C(E1),C(E2))；C(E1∨E2)=f4(C(E1),C(E2))

组合证据的不确定性的计算已经提出了多种算法，用得最多的是如下3种：

最大最小法
- C(E1∧E2) = min{C(E1),C(E2)}
- C(E1∨E2) = max{C(E1),C(E2)}
概率方法
- C(E1∧E2) = C(E1)×C(E2)
- C(E1∨E2) = C(E1)+C(E2)−C(E1)×C(E2)
有界方法
- C(E1∧E2) = max{0, C(E1)+C(E2)−1}
- C(E1∨E2) = min{1, C(E1)+C(E2)}

2. 概率方法

有完善的理论，被最早用于不确定性知识的表示和处理。但因条件概率不易给出、计算量
大等原因，应用受了限制。

2.1 基础知识

（1）条件概率定义

P(B|A)=P(AB)/P(A)称为事件A发生的条件下事件B的条件概率

（2）全概率公式

设事件A1,A2,…,An互不相容，其和为全集。则对于任何事件B：P(B)=Σ(P(Ai)×P(B|Ai))

一般的，如果一个集合含有我们所研究问题中涉及的所有元素，那么就称这个集合为
全集，通常记作U。

（3）贝叶斯公式

设事件A1,A2,…,An互不相容，其和为全集。则对于任何事件B：
P(Ai|B)=P(Ai)×P(B|Ai)/P(B)

贝叶斯公式可以用条件概率公式证明：

用全概率公式代入贝叶斯公式，可以得到贝叶斯公式的另一种形式：

（1）单条件

设有产生式规则：IF E THEN Hi (其中，E为前提条件，Hi为结论)
用条件概率：P(Hi|E) 表示证据E条件下，Hi成立的确定性程度

（2）复合条件

对于复合条件： E = E1 AND E2 AND … AND Em
用条件概率：P(Hi|E1,E2,…,Em) 表示E1,E2,…,Em出现时，结论Hi的确定性程度

2.3 逆概率方法

在实际中，求条件E出现情况下结论Hi的条件概率P(Hi|E)非常困难。
但是求逆概率P(E|Hi)要容易的多。

比如：E 代表咳嗽，以Hi代表支气管炎

P(Hi|E)，咳嗽的人中有多少是患支气管炎，统计工作量较大
P(E|Hi)，患支气管炎的人有多少咳嗽，统计就容易多了

如果前提条件E表示，用Hi表示结论，用贝叶斯公式就可得到：

P ( H i ​ ∣ E ) = Σ i ​ [ P ( H i (adsbygoogle = window.adsbygoogle || []).push({}); ​ ) P ( E ∣ H i ​ ) ] P ( H i ​ ) P ( E ∣ H i ​ ) ​ 当已知Hi的先验概率，结论Hi成立时E的条件概率P(E|Hi)就可以求Hi的条件概率。 多个证据E1,E2,…,Em和多个结论H1,H2,…,Hn,则可以进一步扩充为： P(H_i|E_1,E_2,...,E_m) = \frac{P(H_i)P(E_1|H_i)P(E_2|H_i)...P(E_m|H_i)}{Σ[P(H_i)P(E_1|H_i)P(E_2|H_i)...P(E_m|H_i)]}

可信度是指人们根据以往的经验对某个事物或现象为真的程度的一个判断，或者说是人们对某个事物或现象为真的相信程度。

3.1 可信度的基本概念

3.1.1 可信度的定义

可信度最初定义为信任与不信任的差。

CF(H,E) = MB(H,E)-MD(H,E)

CF(Certainty Factor，确定性因子)是由证据E得到假设H的可信度。

MB(Measure Belief)称为信任增长度，表示E的出现使结论H为真的信任值增长程度。

MB(H,E) = 1 当P(H)=1时
MB(H,E) =(max(P(H|E),P(H)}-P(H))/(1-P(H)) 其他情况

MD(Measure Disbelief)称为不信任增长度

MD(H,E)=1 当P(H)=0时
MD(H,E) =(min(P(H|E),P(H)}-P(H))/(-P(H)) 其他情况

根据以上定义，可以得到：

CF(H,E)=MB(H,E)-0 当P(H|E)>P(H)时
CF(H,E)=0 P(H|E)=P(H)时
CF(H,E)=0-MD(H,E) 当P(H|E)<P(H)时

** 3.1.2 可信度的性质**

（1）互斥性

当MB(H,E)>0时， MD(H,E)=0
当MD(H,E)>0时， MB(H,E)=0

（2）值域

0≤MB(H,E)≤1
0≤MD(H,E)≤1
-1≤CF(H,E)≤1

（3）典型值

CF(H,E)=1时，P(H|E)=1, MB(H,E)=1, MD(H,E)=0
CF(H,E)=-1时，P(H|E)=0, MB(H,E)=0, MD(H,E)=1
CF(H,E)=0时，P(H|E)=P(H)，MB(H,E)=0, MD(H,E)=0，表示E对H无影响

（4）H的信任增长度等于非H的不信任增长度

MB(H,E) = MD(¬H,E)
MD(H,E) = MB(¬H,E)

（5）H的可信度对非H的可信度之和等于0

CF(H,E)+CF(¬H,E) = 0

（6）可信度与概率的区别

概率：P(H)+P(¬H)=1 且 0≤P(H),P(¬H)≤1
可信度：-1≤CF(H,E)≤1

**（7）对于同一前提E，若支持多个不同的结论Hi，则

ΣCF(Hi,E) ≤1

实际应用中，P(H)和 P(H|E)的值很难获得，因此CF(H,E)的值由领域专家给出。

3.2 可信度模型

3.2.1 规则的不确定性的表示

可信度(CF)模型中，规则用产生式规则表示：

IF E THEN H (CF(H,E))
3.2.2 证据的不确定性表示 
可信度(CF)模型中，证据E的不确定性也用可信度因子CF表示，取值范围为[-1,1],典型值为： 
证据E肯定为真: CF(E)=1
证据E肯定为假: CF(E)=-1
证据E一无所知: CF(E)=0 
3.2.3 组合证据的不确定性的计算 
E=E1 AND E2 AND … AND En 
  CF(E) = min({CF(E1),CF(E2),…,CF(En)}’
 
E=E1 OR E2 OR … OR En 
  CF(E) = max({CF(E1),CF(E2),…,CF(En)}
  
3.2.4 否定证据的不确定性计算 
CF(¬E) = -CF(E) 
3.2.5 不确定性推理 
证据肯定存在，即CF(E)=1时，则CF(H)=CF(H,E)
CF(E)≠1时，则CF(H)=CF(H,E)×max{0,CF(E)} 
  CF(E)＜0时，CF(H)=0
 
多条相互独立的规则分别推出相同结论，结论合成综合可信度算法 
  分别对每个规则用第二步公式求出CF，即CF1(H),CF2(H)…
对E1、E2求综合可信度 
    CF(H) = CF1(H)+CF2(H)-CF1(H)×CF2(H) 当CF1,CF2≥0时
CF(H) = CF1(H)+CF2(H)+CF1(H)×CF2(H) 当CF1,CF2<0时
CF(H) = CF1(H)+CF2(H) 当CF1,CF2异号时
 
对于多条规则，依次合成，直到结束。
  
 可信度模型的特点： 
 简洁、直观、容易理解
可能和条件概率得出的值相反、计算的累积可能导致一个规则和多个规则计算结果不同、组合规则顺序不同可能结果不同 
4. 模糊推理
 
4.1 模糊数学的基本知识
 
4.1.1 模糊集合 
（1）定义 
集合元素对集合的隶属程度称为隶属度，用 µ 表示。 
µ=1，表示元素属于集合
µ=0，表示元素不属于集合 
模糊集合用“隶属度/元素”的形式来记：
  
（2）模糊集合相等 
A=B，当且仅当：∀x，μA(x)=μB(x) 
（3）模糊集合包含 
B包含A，当且仅当：∀x∈U，μA(x)≤μB(x) 
 A,B均是论域U上的模糊集合，即A,B中的元素∈U，下同 
（4）模糊集合并、交、补 
µ(A∪B)(x) = max(µA(x), µB(x)) ∀x∈U 
  也记为：µA(x) ∨ μB(x) ∨表示取极大
 
µ(A∩B)(x) = min(µA(x), µB(x)) ∀x∈U 
  也记为：µA(x) ∧ μB(x) ∧表示取极小
 
µ(¬A)(x) = 1-(µA(x) ∀x∈U 
（5）模糊集合的积 
A、B分别是论域U、V上的模糊集合。即A中的元素为x∈U，B中的元素为y∈V 
A×B = ∫(μA(x) ∧ μA(y))/(x,y) 
 相乘之后元素变为(x,y)值对 
4.1.2 模糊关系及运算 
（1）模糊关系定义 
论域U到V上的模糊关系R：指U×V上的一个模糊集合： 
集合元素为有序对<x,y>
集合隶属函数为μR(x,y) 
模糊关系 R 通常用矩阵表示： 
以U=V={1,2,3}为例： 
x\y 1 2 3
1 0 0.1 0.6
2 0 0 0.1
3 0 0 0 
模糊关系矩阵
R=[[0, 0.1, 0.6],
   [0,   0,  0.1],
   [0,   0,   0]]
（2）模糊关系的合成 
R 是 U×V 上的模糊关系
S 是 V×W 上的模糊关系
U×W（叉积）上的模糊关系T=R৹S 
模糊关系T的隶属函数为： 
T=∪(μR(x,y) ∧ μS(y,z)) 
 R=[0.3, 0.7, 0.2]    #1x3
 S=[0.2,
    0.6,
    0.9]              #3x1
 T=(0.3∧0.2) ∨ (0.7∧0.6) ∨ (0.2∧0.9) = 0.6 
4.2 模糊假言推理
 
4.2.1 模糊规则的表示 
模糊命题的一般形式：x is A 或者 x is A(CF) 
模糊规则产生式的一般形式： IF E THEN R(CF,λ) 
 E：用模糊命题表示的模糊条件
R：用模糊命题表示的模糊结论
CF：该产生式规则所表示的知识的可信度因子，由领域专家在给出规则时同时给出
λ：阈值，用于指出相应知识在什么情况下可被应用 
模糊规则示例： 
IF x is A THEN y is B(λ)
IF x is A THEN y is B(CF, λ)
IF x1 is A1 AND x2 is A2 THEN y is B(λ)
IF x1 is A1 AND x2 is A2 AND x3 is A3 THEN y is B(CF, λ)
4.2.2 证据的模糊匹配 
规则的前提条件中的 A 与证据中的 A′ 不一定完全相同，推理时需要先考虑他们的相似程度是否大于某个预先设定的阈值λ。 
贴近度是一种表示接近程度的计算方法。A,B的贴近度定义为： 
(A,B) = 0.5[ A·B + (1-A⊙B) ]
A·B = ∨( μA(xi) ∧ μA(xi))
A⊙B = ∧( μA(xi) ∨ μA(xi))
“∧”表示取极小，“∨”表示取极大
4.2.3 简单模糊推理 
IF x is A THEN y is B(λ)
证据：x is A’ 且（A,A’)≥λ
结论：y is B’ 
推理步骤： 
构造A、B之间的模糊关系R 
  R的典型构造方法扎德法
 
合成R与前提，B’=A’৹R
得出结论 
 个人总结，部分内容进行了简单的处理和归纳，如有谬误，希望大家指出，持续修订更新中。 
 修订历史版本见：https://github.com/hustlei/AI_Learning_MindMap 
				4.1.1 不确定推理的概念
所谓推理就是从已知事实出发，运用相关知识（或规则）逐步推出结论或证明某个假设成立或不成立的思维过程。其中已知事实和知识（规则）是构成推理的两个基本要素。已知事实是推理过程的出发点，把它称为证据。
4.1.2 不确定性推理方法的分类
可信度方法、主观Bayes方法、证据理论 都是在概率论的基础上发展起来的不确定性推理方法。
4.1.3 不确定性推理
知识库是人...
				文章目录不确定性推理的含义什么是不确定性推理为什么采用不确定性推理不确定性推理的基本问题不确定性的表示知识不确定性的表示证据的不确定性表示不确定性的匹配组合证据不确定性的计算不确定性的更新不确定性结论的合成不确定性推理的类型
不确定性推理的含义
什么是不确定性推理
不确定性推理是指建立在不确定性知识和证据基础上的推理。例如，不完备、不精确知识的推理，模糊知识的推理等。实质上是一种从不确定的初试证据...
				文章目录一. 基本概念二. 必背公式1. 证据不确定性的组合算法2. 结论不确定性的传递算法3. 结论不确定性的合成算法三. 典型例题例题1例题2四. 通用解法
一. 基本概念
要掌握C-F模型首先需要了解可信度的概念，可信度是根据经验对一个事物或现象为真的相信程度，说白了就是有多大把握相信一个事情。由于可信度不可避免地带有较大主观性和经验性，难以把握准确性。C-F模型便是基于可信度表示的不确定性推理的基本方法。
不确定性推理主要有两种不确定性，即关于知识的不确定性和关于证据的不确定性。
C-F模型中关于知
% 定义变量
P_wind = optimvar('P_wind', 'LowerBound', 0, 'UpperBound', P_wind_max);
P_solar = optimvar('P_solar', 'LowerBound', 0, 'UpperBound', P_solar_max);
P_grid_import = optimvar('P_grid_import', 'LowerBound', 0);
P_grid_export = optimvar('P_grid_export', 'LowerBound', 0);
% 定义约束
constr1 = P_wind + P_solar + P_grid_import - P_grid_export == P_load;
constr2 = P_wind <= P_wind_max;
constr3 = P_solar <= P_solar_max;
% 定义目标函数
obj = f(P_wind, P_solar, P_grid_import, P_grid_export);
% 定义风光不确定性
wind_uncertainty = optimexpr;
for t = 1:T
    wind_uncertainty = wind_uncertainty + (P_wind(t) - P_wind_avg)^2;
solar_uncertainty = optimexpr;
for t = 1:T
    solar_uncertainty = solar_uncertainty + (P_solar(t) - P_solar_avg)^2;
% 定义随机规划
stoch_constr = [wind_uncertainty <= wind_uncertainty_threshold, solar_uncertainty <= solar_uncertainty_threshold];
stoch_obj = expect(obj, [wind_uncertainty <= wind_uncertainty_threshold, solar_uncertainty <= solar_uncertainty_threshold]);
% 将随机规划加入模型
model.Constraints.stoch_constr = stoch_constr;
model.Objective = stoch_obj;
% 求解模型
[sol, fval, exitflag] = solve(model);
在上述代码中，`P_wind`和`P_solar`分别表示风力发电和太阳能发电的功率，`P_grid_import`和`P_grid_export`分别表示电网的进口和出口功率，`P_load`表示微电网负载功率，`P_wind_max`和`P_solar_max`分别表示风力和太阳能发电的最大功率，`P_wind_avg`和`P_solar_avg`分别表示风力和太阳能发电的平均值，`wind_uncertainty_threshold`和`solar_uncertainty_threshold`分别表示风力和太阳能发电的不确定性阈值，`T`表示时间步数，`f`表示目标函数，`expect`表示期望值，`model`表示优化模型，`sol`表示优化解，`fval`表示优化目标函数值，`exitflag`表示优化求解状态。

一、概述

二、重点内容

三、思维导图

四、重点知识笔记

1. 不确定性推理概述

1.1 概念

1.2 分类

1.3 基本问题

2. 概率方法

2.1 基础知识

2.3 逆概率方法

3.1 可信度的基本概念

3.2 可信度模型

4. 模糊推理

4.1 模糊数学的基本知识

4.2 模糊假言推理

3. 可信度方法

2.2 经典概率方法