|
|
没读研的牛排 · Miranda So | Davis Polk· 3 月前 · |
|
|
坚强的西装 · 2023年台州学院硕士研究生招生简章-台州学 ...· 1 年前 · |
|
|
豁达的帽子 · 想学日本剑术,想知道剑术与剑道的区别,还有报 ...· 2 年前 · |
人工智能经典三大基本技术为:知识表示、推理、搜索策略。推理是人类求解
问题的主要思维方法。
无论是人类智能还是人工智能,都离不开不确定性的处理。
可以说,智能主要反映在求解不确定性问题的能力上。
因此,不确定性推理模型是人工智能和专家系统的一个核心研究课题。
为方便记忆和回顾,根据个人学习,总结人工智能基础知识和思维导图形成系列。
不确定性推理是指从
不确定性的初始证据
出发,通过运用
不确定性的知识
,
推出具有
一定程度的不确定性但却合理或近乎合理
的结论的思维过程。
不精确性是科学认识中的重要规律,也是进行机器智能推理的主要工具之一。
不确定性推理方法主要分为控制方法和模型方法两类。
控制方法没有处理不确定性的统一模型,其效果极大地依赖于控制策略。
不确定性推理的控制方法主要取决于控制策略,包括相关性指导、机缘控制、启发式
搜索、随机过程控制等。
模型方法具体可分为数值模型方法和非数值模型方法两类。按其依据的理论不同,
数值模型方法主要有基于概率的方法和基于模糊理论的推理方法。
纯概率方法虽然有严格的理论依据,但通常要求给出事件的先验概率和条件概率,
而这些数据又不易获得,因此使其应用受到限制。在概率论的基础上提出了一些
理论和方法,主要有可信度方法、证据理论、基于概率的贝叶斯推理方法等。
目前,在人工智能中,处理不确定性问题的主要数学工具有概率论和模糊数学。
目前常用的不确定性推理的数学方法主要有基于概率的似然推理(Plausible Reasoning)、基于模糊数学的模糊推理(FuzzyReasoning)、可信度方法,
以及使用人工神经网络算法、遗传算法的计算推理等。
所有的不确定性推理方法都必须解决3个问题:
(1)表示问题
表示问题指的是采用什么方法描述不确定性。
在专家系统中,“知识不确定性”一般分为两类:一是规则的不确定性,二是证据的不确定性。
规则和证据不确定性的程度常用可信度来表示。
在专家系统MYCIN 中,可信度表示规则及证据的不确定性,取值范围为
[−1, 1]
。
(2)语义问题
语义问题指上述表示和计算的含义是什么,即对它们进行解释。即需要对规则和证据的
不确定性给出度量。
(3)计算问题
计算问题主要指不确定性的传播和更新。即计算问题定义了一组函数,求解结论的
不确定性度量。
主要包括3方面:
组合证据的不确定性的计算已经提出了多种算法,用得最多的是如下3种:
有完善的理论,被最早用于不确定性知识的表示和处理。但因条件概率不易给出、计算量
大等原因,应用受了限制。
(1)条件概率定义
P(B|A)=P(AB)/P(A)称为事件A发生的条件下事件B的条件概率
(2)全概率公式
设事件A1,A2,…,An互不相容,其和为全集。则对于任何事件B:P(B)=Σ(P(Ai)×P(B|Ai))
一般的,如果一个集合含有我们所研究问题中涉及的所有元素,那么就称这个集合为
全集,通常记作U。
(3) 贝叶斯公式
设事件A1,A2,…,An互不相容,其和为全集。则对于任何事件B:
P(Ai|B)=P(Ai)×P(B|Ai)/P(B)
贝叶斯公式可以用条件概率公式证明:
P ( Ai | B ) = P ( AiB ) / P ( B ) #条件概率公式 = P ( Ai ) ×P ( B | Ai ) / P ( B ) #分子代入条件概率公式 P ( Ai | B ) = P ( Ai ) ×P ( B | Ai ) / P ( B ) = P ( AiB ) / P ( B ) #分子代入条件概率公式 = P ( Ai | B ) #条件概率公式用全概率公式代入贝叶斯公式,可以得到贝叶斯公式的另一种形式:
P ( A i ∣ B ) = Σ i [ P ( A i ) P ( B ∣ A i ) ] P ( A i ) P ( B ∣ A i )
(1)单条件
(2)复合条件
在实际中,求条件E出现情况下结论Hi的条件概率P(Hi|E)非常困难。
但是求逆概率P(E|Hi)要容易的多。
比如:E 代表咳嗽,以Hi代表支气管炎
如果前提条件E表示,用Hi表示结论,用贝叶斯公式就可得到:
P ( H i ∣ E ) = Σ i [ P ( H i ) P ( E ∣ H i ) ] P ( H i ) P ( E ∣ H i )
当已知Hi的先验概率,结论Hi成立时E的条件概率P(E|Hi)就可以求Hi的条件概率。
多个证据E1,E2,…,Em和多个结论H1,H2,…,Hn,则可以进一步扩充为:
P(H_i|E_1,E_2,...,E_m) = \frac{P(H_i)P(E_1|H_i)P(E_2|H_i)...P(E_m|H_i)}{Σ[P(H_i)P(E_1|H_i)P(E_2|H_i)...P(E_m|H_i)]} P ( H i ∣ E 1 , E 2 , . . . , E m ) = Σ [ P ( H i ) P ( E 1 ∣ H i ) P ( E 2 ∣ H i ) . . . P ( E m ∣ H i ) ] P ( H i ) P ( E 1 ∣ H i ) P ( E 2 ∣ H i ) . . . P ( E m ∣ H i )
可信度是指人们根据以往的经验对某个事物或现象为真的程度的一个判断,或者说是人们对某个事物或现象为真的相信程度。
3.1.1 可信度的定义
可信度最初定义为信任与不信任的差。
CF(H,E) = MB(H,E)-MD(H,E)
CF(Certainty Factor,确定性因子)是由证据E得到假设H的可信度。
MB(Measure Belief)称为信任增长度,表示E的出现使结论H为真的信任值增长程度。
MD(Measure Disbelief)称为不信任增长度
根据以上定义,可以得到:
** 3.1.2 可信度的性质**
(1)互斥性
(2)值域
(3)典型值
(4)H的信任增长度等于非H的不信任增长度
(5)H的可信度对非H的可信度之和等于0
(6)可信度与概率的区别
**(7)对于同一前提E,若支持多个不同的结论Hi,则
实际应用中,P(H)和 P(H|E)的值很难获得,因此CF(H,E)的值由领域专家给出。
3.2.1 规则的不确定性的表示
可信度(CF)模型中,规则用产生式规则表示:
IF E THEN H (CF(H,E))3.2.2 证据的不确定性表示
可信度(CF)模型中,证据E的不确定性也用可信度因子CF表示,取值范围为
[-1,1],典型值为:
- 证据E肯定为真: CF(E)=1
- 证据E肯定为假: CF(E)=-1
- 证据E一无所知: CF(E)=0
3.2.3 组合证据的不确定性的计算
- E=E1 AND E2 AND … AND En
- CF(E) = min({CF(E1),CF(E2),…,CF(En)}’
- E=E1 OR E2 OR … OR En
- CF(E) = max({CF(E1),CF(E2),…,CF(En)}
3.2.4 否定证据的不确定性计算
- CF(¬E) = -CF(E)
3.2.5 不确定性推理
- 证据肯定存在,即CF(E)=1时,则CF(H)=CF(H,E)
- CF(E)≠1时,则CF(H)=CF(H,E)×max{0,CF(E)}
- CF(E)<0时,CF(H)=0
- 多条相互独立的规则分别推出相同结论,结论合成综合可信度算法
- 分别对每个规则用第二步公式求出CF,即CF1(H),CF2(H)…
- 对E1、E2求综合可信度
- CF(H) = CF1(H)+CF2(H)-CF1(H)×CF2(H) 当CF1,CF2≥0时
- CF(H) = CF1(H)+CF2(H)+CF1(H)×CF2(H) 当CF1,CF2<0时
- CF(H) = CF1(H)+CF2(H) 当CF1,CF2异号时
- 对于多条规则,依次合成,直到结束。
可信度模型的特点:
- 简洁、直观、容易理解
- 可能和条件概率得出的值相反、计算的累积可能导致一个规则和多个规则计算结果不同、组合规则顺序不同可能结果不同
4. 模糊推理
4.1 模糊数学的基本知识
4.1.1 模糊集合
(1)定义
集合元素对集合的隶属程度称为隶属度,用 µ 表示。
- µ=1,表示元素属于集合
- µ=0,表示元素不属于集合
模糊集合用“隶属度/元素”的形式来记:
A=µ1/x1+µ2/x2+...+µn/xn=∫μA(x)/x(2)模糊集合相等
A=B,当且仅当:∀x,μA(x)=μB(x)
(3)模糊集合包含
B包含A,当且仅当:∀x∈U,μA(x)≤μB(x)
A,B均是论域U上的模糊集合,即A,B中的元素∈U,下同
(4)模糊集合并、交、补
- µ(A∪B)(x) = max(µA(x), µB(x)) ∀x∈U
- 也记为:µA(x) ∨ μB(x) ∨表示取极大
- µ(A∩B)(x) = min(µA(x), µB(x)) ∀x∈U
- 也记为:µA(x) ∧ μB(x) ∧表示取极小
- µ(¬A)(x) = 1-(µA(x) ∀x∈U
(5)模糊集合的积
A、B分别是论域U、V上的模糊集合。即A中的元素为x∈U,B中的元素为y∈V
- A×B = ∫(μA(x) ∧ μA(y))/(x,y)
相乘之后元素变为(x,y)值对
4.1.2 模糊关系及运算
(1)模糊关系定义
论域U到V上的模糊关系R:指U×V上的一个模糊集合:
- 集合元素为有序对<x,y>
- 集合隶属函数为μR(x,y)
模糊关系 R 通常用矩阵表示:
以U=V={1,2,3}为例:
x\y 1 2 3 1 0 0.1 0.6 2 0 0 0.1 3 0 0 0
模糊关系矩阵 R=[[0, 0.1, 0.6], [0, 0, 0.1], [0, 0, 0]](2)模糊关系的合成
- R 是 U×V 上的模糊关系
- S 是 V×W 上的模糊关系
- U×W(叉积)上的模糊关系T=R৹S
模糊关系T的隶属函数为:
T=∪(μR(x,y) ∧ μS(y,z))
R=[0.3, 0.7, 0.2] #1x3 S=[0.2, 0.6, 0.9] #3x1 T=(0.3∧0.2) ∨ (0.7∧0.6) ∨ (0.2∧0.9) = 0.64.2 模糊假言推理
4.2.1 模糊规则的表示
模糊命题的一般形式:
x is A或者x is A(CF)模糊规则产生式的一般形式: IF E THEN R(CF,λ)
- E:用模糊命题表示的模糊条件
- R:用模糊命题表示的模糊结论
- CF:该产生式规则所表示的知识的可信度因子,由领域专家在给出规则时同时给出
- λ:阈值,用于指出相应知识在什么情况下可被应用
模糊规则示例:
IF x is A THEN y is B(λ) IF x is A THEN y is B(CF, λ) IF x1 is A1 AND x2 is A2 THEN y is B(λ) IF x1 is A1 AND x2 is A2 AND x3 is A3 THEN y is B(CF, λ)4.2.2 证据的模糊匹配
规则的前提条件中的 A 与证据中的 A′ 不一定完全相同,推理时需要先考虑他们的相似程度是否大于某个预先设定的阈值λ。
贴近度是一种表示接近程度的计算方法。A,B的贴近度定义为:
(A,B) = 0.5[ A·B + (1-A⊙B) ] A·B = ∨( μA(xi) ∧ μA(xi)) A⊙B = ∧( μA(xi) ∨ μA(xi)) “∧”表示取极小,“∨”表示取极大4.2.3 简单模糊推理
- IF x is A THEN y is B(λ)
- 证据:x is A’ 且(A,A’)≥λ
- 结论:y is B’
推理步骤:
- 构造A、B之间的模糊关系R
- R的典型构造方法扎德法
- 合成R与前提,B’=A’৹R
- 得出结论
个人总结,部分内容进行了简单的处理和归纳,如有谬误,希望大家指出,持续修订更新中。
修订历史版本见:https://github.com/hustlei/AI_Learning_MindMap
4.1.1 不确定推理的概念 所谓推理就是从已知事实出发,运用相关知识(或规则)逐步推出结论或证明某个假设成立或不成立的思维过程。其中已知事实和知识(规则)是构成推理的两个基本要素。已知事实是推理过程的出发点,把它称为证据。 4.1.2 不确定性推理方法的分类 可信度方法、主观Bayes方法、证据理论 都是在概率论的基础上发展起来的不确定性推理方法。 4.1.3 不确定性推理 知识库是人...文章目录不确定性推理的含义什么是不确定性推理为什么采用不确定性推理不确定性推理的基本问题不确定性的表示知识不确定性的表示证据的不确定性表示不确定性的匹配组合证据不确定性的计算不确定性的更新不确定性结论的合成不确定性推理的类型 不确定性推理的含义 什么是不确定性推理 不确定性推理是指建立在不确定性知识和证据基础上的推理。例如,不完备、不精确知识的推理,模糊知识的推理等。实质上是一种从不确定的初试证据...文章目录一. 基本概念二. 必背公式1. 证据不确定性的组合算法2. 结论不确定性的传递算法3. 结论不确定性的合成算法三. 典型例题例题1例题2四. 通用解法 一. 基本概念 要掌握C-F模型首先需要了解可信度的概念,可信度是根据经验对一个事物或现象为真的相信程度,说白了就是有多大把握相信一个事情。由于可信度不可避免地带有较大主观性和经验性,难以把握准确性。C-F模型便是基于可信度表示的不确定性推理的基本方法。 不确定性推理主要有两种不确定性,即关于知识的不确定性和关于证据的不确定性。 C-F模型中关于知% 定义变量 P_wind = optimvar('P_wind', 'LowerBound', 0, 'UpperBound', P_wind_max); P_solar = optimvar('P_solar', 'LowerBound', 0, 'UpperBound', P_solar_max); P_grid_import = optimvar('P_grid_import', 'LowerBound', 0); P_grid_export = optimvar('P_grid_export', 'LowerBound', 0); % 定义约束 constr1 = P_wind + P_solar + P_grid_import - P_grid_export == P_load; constr2 = P_wind <= P_wind_max; constr3 = P_solar <= P_solar_max; % 定义目标函数 obj = f(P_wind, P_solar, P_grid_import, P_grid_export); % 定义风光不确定性 wind_uncertainty = optimexpr; for t = 1:T wind_uncertainty = wind_uncertainty + (P_wind(t) - P_wind_avg)^2; solar_uncertainty = optimexpr; for t = 1:T solar_uncertainty = solar_uncertainty + (P_solar(t) - P_solar_avg)^2; % 定义随机规划 stoch_constr = [wind_uncertainty <= wind_uncertainty_threshold, solar_uncertainty <= solar_uncertainty_threshold]; stoch_obj = expect(obj, [wind_uncertainty <= wind_uncertainty_threshold, solar_uncertainty <= solar_uncertainty_threshold]); % 将随机规划加入模型 model.Constraints.stoch_constr = stoch_constr; model.Objective = stoch_obj; % 求解模型 [sol, fval, exitflag] = solve(model); 在上述代码中,`P_wind`和`P_solar`分别表示风力发电和太阳能发电的功率,`P_grid_import`和`P_grid_export`分别表示电网的进口和出口功率,`P_load`表示微电网负载功率,`P_wind_max`和`P_solar_max`分别表示风力和太阳能发电的最大功率,`P_wind_avg`和`P_solar_avg`分别表示风力和太阳能发电的平均值,`wind_uncertainty_threshold`和`solar_uncertainty_threshold`分别表示风力和太阳能发电的不确定性阈值,`T`表示时间步数,`f`表示目标函数,`expect`表示期望值,`model`表示优化模型,`sol`表示优化解,`fval`表示优化目标函数值,`exitflag`表示优化求解状态。
|
|
没读研的牛排 · Miranda So | Davis Polk 3 月前 |