本文基于不完备多粒度信息系统,主要讨论了概率粗糙集的上下近似和精度的变化,以及基于优劣关系的规则提取。首先,对不完备信息系统中多粒度粗糙集关于乐观(悲观)的上下近似进行了简单的介绍。其次,基于相似关系优势关系和劣势关系,对不完备信息系统中的多粒度概率粗糙集从乐观(悲观)的角度对其上下近似进行了讨论,得出了近似精度随α, β的变化而变化的规律。最后,讨论了基于优劣关系随参数γ变化的概率粗糙集的规则提取。 Based on incomplete multi-granularity information system, this paper mainly discusses the upper-lower approximation and approximate accuracy of probabilistic rough sets, and the rules extraction based on dominance-disadvantage relationship. Firstly, the optimistic (pessimistic) multi-granularity rough approximation in incomplete multi-granularity information systems is introduced. Secondly, it discusses the optimistic (pessimistic) multi-granularity lower-upper approximation of probabilistic rough sets based on the similar relation, dominance relation and disadvantage relation respectively, the rule of approximate accuracy variation with α, β is given. Finally, it discusses rule extraction of probabilistic rough sets based on the variation of dominance and disadvantage relationship with parameter γ.
石孝安*,傅丽
青海民族大学数学与统计学院,青海 西宁
收稿日期:2020年7月27日;录用日期:2020年8月13日;发布日期:2020年8月20日
本文基于不完备多粒度信息系统,主要讨论了概率粗糙集的上下近似和精度的变化,以及基于优劣关系的规则提取。首先,对不完备信息系统中多粒度粗糙集关于乐观(悲观)的上下近似进行了简单的介绍。其次,基于相似关系优势关系和劣势关系,对不完备信息系统中的多粒度概率粗糙集从乐观(悲观)的角度对其上下近似进行了讨论,得出了近似精度随 α , β 的变化而变化的规律。最后,讨论了基于优劣关系随参数 γ 变化的概率粗糙集的规则提取。
关键词 :概率粗糙集模型,规则提取,优劣关系,不完备多粒度信息系统
Copyright © 2020 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
粗糙集是1982年英国数学家Pawlak提出的理论 [
经典粗糙集模型是一种可以被要求利用信息是完全性的一种模型,却忽略了随机,文献 [
本文是基于不完备信息系统进行的讨论,主要讨论了概率粗糙集的优劣关系及规则提取。在本文当中,第二部分介绍了相关概念;第三部分我们基于相似关系,对多粒度概率粗糙集进行了讨论;第四部分基于劣势关系和优势关系分别从乐观和悲观的角度对不完备的多粒度概率粗糙集进行了讨论,并给出了随 α , β 的变化规律与精度变化的规律。第五部分,讨论了基于优劣关系随参数 γ 变化的概率粗糙集的规则提取。
定义1 [
定义2 [
(1) 乐观多粒度上(下)近似定义:
∑ i m A i o ( X ) _ = { x : T Λ 1 ( x ) ⊆ X ∨ T Λ 2 ( x ) ⊆ X ∨ ⋯ ∨ T Λ m ( x ) ⊆ X , x ∈ U }
∑ i = 1 m A i o ( X ) ¯ = ~ ( ∑ i = 1 m A i o ( ~ X ) )
(2) 悲观多粒度下(上)近似分别定义:
∑ i = 0 m A i p ( X ) _ = { x : T A 1 ( x ) ⊆ X ∧ T A 2 ( x ) ⊆ X ∧ ⋯ ∧ T A m ( x ) ⊆ X , x ∈ U }
∑ i = 1 m A i p ( X ) ¯ = ~ ( ∑ i = 1 m A i p ( ~ X ) _ )
定义3 [
R B = { ( x , y ) ∈ U ⊗ U | ∀ a ∈ B , a ( x ) = a ( y ) 或 a ( x ) = * 或 a ( y ) = * }
相似关系 R B 是自反而且满足对称性,但通常不满足传递性。记作 S B ( x ) = { y ∈ U | ( x , y ) ∈ R B } ,则 S B ( x ) 被称为x关于 R B 的相似类;记 U / R B 是构成U的一个划分。
定义4 [
(1) 称 R A ≥ 为优势关系,当满足
R A ≥ = { ( y , x ) ∈ U ⊗ U | V a ∈ A , f a ( y ) ≥ f a ( x ) 或 f a ( x ) = * 或 f a ( y ) = * }
时,可以利用优势类关系归类: U / R A ≥ = { [ x ] A ≥ | x ∈ U } ,其中: [ x ] ≥ = { y ∈ U | ( y , x ) ∈ R A ≥ } , [ x ] ≤ = { y ∈ U | ( x , y ) ∈ R A ≤ } ; [ x ] A ≥ 表示在属性A上优于x的优势类, [ x ] A ≤ 表示在属性A上劣于x的劣势类。
(2) 称 R A ≤ 为劣势关系,当满足
R A ≤ = { ( y , x ) ∈ U ⊗ U | V a ∈ A , f a ( y ) ≤ f a ( x ) 或 f a ( x ) = * 或 f a ( y ) = * }
时,可以利用劣势类关系归类: U / R A ≤ = { [ x ] A ≤ | x ∈ U } ,其中: [ x ] ≥ = { y ∈ U | ( y , x ) ∈ R A ≤ } , [ x ] ≤ = { y ∈ U | ( x , y ) ∈ R A ≤ } ; [ x ] A ≥ 表示在属性A上优于x的优势类, [ x ] A ≤ 表示在属性A上劣于x的劣势类。
注:(1) 下文中的所有讨论基于不完备信息系统进行讨论,小标题中不在体现。
(2) 根据定义2中悲观多粒度的上下近似,在下面的文章中,可类似于乐观多粒度概率粗糙集的上下近似的讨论方式得出其相关定理和性质,本文不再给出。
定义5:设 M I S = 〈 U , A T , V , f 〉 为一个不完备多粒度信息系统, ∀ x ∈ U , X ⊆ U , 0 ≤ β ≤ 0.5 < α ≤ 1 ,
则X在相似关系 R B 上依参数 α , β 的乐观(悲观)多粒度概率粗糙集下近似 ∑ i = 1 m A i o _ α ( X ) 和上近似 ∑ i = 1 m A i o β ¯ ( X )
分别定义:
∑ i = 1 m A i o _ α ( X ) = { x ∈ U : p ( X | [ x ] A 1 S B ) ≥ α ∨ P ( X | [ x ] A 2 S B ) ≥ α ∨ ⋯ ∨ P ( X | [ x ] A m S B ) ≥ α }
∑ i = 1 m A i o β ¯ ( X ) = ~ ∑ i = 1 m A i o _ 1 − β ( ~ X )
通过定义5,可以得到在不完备系统中,乐观多粒度概率粗糙集的边界域集合:
B n d ∑ i = 1 m A i ( α , β ) o = ∑ i = 1 m A i o β ¯ ( X ) − ∑ i = 1 m A i o _ α ( X )
二元组 〈 ∑ i = 1 m A i o _ α ( X ) , ∑ i = 1 m A i o β ¯ ( X ) 〉 称作是X基于相似关系 R B 关于粒度 A i ( i = 1 , 2 , ⋯ , m ) 的乐观多粒度概率粗糙集。
定理3.1:设 M I S = 〈 U , A T , V , f 〉 为一个不完备的多粒度信息系统, ∀ x ∈ U , X ⊆ U , 0 ≤ β ≤ 0.5 < α ≤ 1 , A T = { A 1 , A 2 , ⋯ , A m } 则
∑ i = 1 m A i o β ¯ ( X ) = { x ∈ U : p ( X | [ x ] A 1 S B ) > β ∧ P ( X | [ x ] A 2 S B ) > β ∧ ⋯ ∧ P ( X | [ x ] A m S B ) > β }
证明: ∑ i = 1 m A i o β ¯ ( X ) = ~ ∑ i = 1 m A i o _ 1 − β ( ~ X ) = { x ∈ U : p ( ~ X | [ x ] A 1 S B ) ≥ 1 − β ∨ P ( ~ X | [ x ] A 2 S B ) ≥ 1 − β ∨ ⋯ ∨ P ( ~ X | [ x ] A m S B ) ≥ 1 − β } = { x ∈ U : 1 − p ( X | [ x ] A 1 S B ) ≥ 1 − β ∨ 1 − P ( X | [ x ] A 2 S B ) ≥ 1 − β ∨ ⋯ ∨ 1 − P ( X | [ x ] A m S B ) ≥ 1 − β } = { x ∈ U : | ~ X ∩ [ x ] A 1 S B | | [ x ] A 1 S B | ≥ 1 − β ∨ | ~ X ∩ [ x ] A 2 S B | | [ x ] A 2 S B | ≥ 1 − β ∨ ⋯ ∨ | ~ X ∩ [ x ] A m S B | | [ x ] A m S B | ≥ 1 − β } = { x ∈ U : 1 − | X ∩ [ x ] A 1 S B | | [ x ] A 1 S B | ≥ 1 − β ∨ 1 − | X ∩ [ x ] A 2 S B | | [ x ] A 2 S B | ≥ 1 − β ∨ ⋯ ∨ 1 − | X ∩ [ x ] A m S B | | [ x ] A m S B | ≥ 1 − β } = { x ∈ U : p ( X | [ x ] A 1 S B ) > β ∧ P ( X | [ x ] A 2 S B ) > β ∧ ⋯ ∧ P ( X | [ x ] A m S B ) > β }
定义6:设 M I S = 〈 U , A T , V , f 〉 为一个不完备的多粒度信息统, ∀ x ∈ U , X ⊆ U , A T = { A 1 , A 2 , ⋯ , A m } , 0 ≤ β ≤ 0.5 < α ≤ 1 ,X在相似关系 R B 上依参数 α , β 的乐观(悲观)多粒度概率粗糙集近似精度 λ o ( α , β ) 分别定义为:
λ o ( α , β ) = | ∑ i m A i _ α o ( X ) | | ∑ i m A i ¯ β o ( X ) | ; λ p ( α , β ) = | ∑ i m A i _ α p ( X ) | | ∑ i m A i ¯ β p ( X ) | 。
例1:S是一个不完备的多粒度信息系统,(如表1所示), A 1 = { a 1 } , A 2 = { a 2 } , A 3 = { a 3 , a 4 } , U = { x 1 , x 2 , ⋯ , x 8 } , x 1 , x 2 , ⋯ , x 8 是8个对象, a 1 , a 2 , a 3 , a 4 是四个条件属性,D是决策性, A = { A 1 , A 2 , A 3 } 是粒度空间。
U | a 1 | a 2 | a 3 | a 4 | d |
---|---|---|---|---|---|
x 1 | 1 | 1 | 3 | 2 | 1 |
x 2 | 2 | * | 2 | 1 | 1 |
x 3 | 1 | 1 | 3 | 2 | 1 |
x 4 | 1 | * | * | 1 | 2 |
x 5 | * | 2 | 2 | * | 2 |
x 6 | 1 | 2 | * | 2 | 2 |
x 7 | 2 | 2 | 2 | 1 | 2 |
x 8 | 1 | 2 | 1 | 1 | 1 |
表1. 不完备信息系统S
U / d = { { x 1 , x 2 , x 3 , x 8 } , { x 4 , x 5 , x 6 , x 7 } }
根据定义4基于相似关系,当 α 变小, β 变大时,求得在不完备多粒度信息系统中概率粗糙集在不同决策类型的乐观(悲观)多粒度上(下)近似集(如表2所示):
∑ i = 1 3 A i o _ α ( D 1 ) | ∑ i = 1 3 A i β ¯ o ( D 1 ) | ∑ i = 1 3 A i _ α o ( D 2 ) | ∑ i = 1 3 A i β ¯ o ( D 2 ) | ∑ i = 1 3 A i p _ α ( D 1 ) | ∑ i = 1 3 A i β ¯ p ( D 1 ) | ∑ i = 1 3 A i _ α p ( D 2 ) | ∑ i = 1 3 A i β ¯ p ( D 2 ) | |
---|---|---|---|---|---|---|---|---|
α = 0.8 β = 0.1 | ϕ | ϕ | ϕ | ϕ | ϕ | U | ϕ | U |
α = 0.7 β = 0.1 | { x 1 , x 2 , x 3 , x 4 } | ϕ | { x 2 , x 4 , x 5 , x 7 } | ϕ | { x 1 , x 2 , x 3 , x 4 } | U | { x 2 , x 4 , x 5 , x 7 } | U |
α = 0.6 β = 0.4 | { x 1 , x 2 , x 3 , x 4 , x 6 } | ϕ | { x 1 , x 2 , x 4 , x 5 , x 6 , x 7 , x 8 } | ϕ | { x 1 , x 3 } | U | { x 2 , x 5 , x 7 } | U |
表2. 基于相似关系的不完备多粒度概率粗糙集的乐观(悲观)上下近似集
得到近似精度为:
λ o ( 0.8 , 0.1 ) ( D 1 ) = 0 ; λ o ( 0.8 , 0.1 ) ( D 2 ) = 0 ; λ p ( 0.8 , 0.1 ) ( D 1 ) = 0 ; λ p ( 0.8 , 0.1 ) ( D 2 ) = 0 ;
λ o ( 0.7 , 0.1 ) ( D 1 ) = 0 ; λ o ( 0.7 , 0.1 ) ( D 2 ) = 0 ; λ p ( 0.7 , 0.1 ) ( D 1 ) = 1 2 ; λ p ( 0.7 , 0.1 ) ( D 2 ) = 1 2 ;
λ o ( 0.6 , 0.4 ) ( D 1 ) = 0 ; λ o ( 0.6 , 0.4 ) ( D 2 ) = 0 ; λ p ( 0.6 , 0.4 ) ( D 1 ) = 2 8 ; λ p ( 0.6 , 0.4 ) ( D 2 ) = 3 8
通过例1,可以发现在不完备信息系统中,基于相似关系对缺省的值进行分类;会出现在乐观的情况下所有的上(下)近似和精度都为空的情况,并且在完备的信息系统中近似精度所满足的性质此时也都不在满足。由此,我们在接下来的文章中基于优劣关系进行讨论。
定义7:设 M I S = 〈 U , A T , V , f 〉 为一个不完备的多粒度信息系统, ∀ x ∈ U , X ⊆ U , 0 ≤ β ≤ 0.5 < α ≤ 1 ,则
(1) 在优势关系 R A i ≥ 上,依参数 α , β 的乐观(悲观)多粒度概率粗糙集下近似 ∑ i = 1 m A i o _ α ( X ) 和上近似 ∑ i = 1 m A i o β ¯ ( X ) 分别定义:
∑ i = 1 m A i o _ α ( X ) = { x ∈ U : p ( X | [ x ] A 1 ≥ ) ≥ α ∨ P ( X | [ x ] A 2 ≥ ) ≥ α ∨ ⋯ ∨ P ( X | [ x ] A m ≥ ) ≥ α }
∑ i = 1 m A i o β ¯ ( X ) = ~ ∑ i = 1 m A i o _ 1 − β ( ~ X )
通过定义,可以得到在不完备系统中,乐观(悲观)多粒度概率粗糙集的边界域集合如下:
B n d ∑ i = 1 m A i ( α , β ) o = ∑ i = 1 m A i o β ¯ ( X ) − ∑ i = 1 m A i o _ α ( X )
二元组 〈 ∑ i = 1 m A i o _ α ( X ) , ∑ i = 1 m A i o β ¯ ( X ) 〉 是一个被称作是X基于优势关系 R A i ≥ 关于粒度 A i ( i = 1 , 2 , ⋯ , m ) 的乐
观多粒度概率粗糙集。
(2) 在劣势关系 R A i ≤ 上,依参数 α , β 的乐观(悲观)多粒度概率粗糙集下近似 ∑ i = 1 m A i o _ α ( X ) 和上近似 ∑ i = 1 m A i o β ¯ ( X ) 分别定义:
∑ i = 1 m A i o _ α ( X ) = { x ∈ U : p ( X | [ x ] A 1 ≤ ) ≥ α ∨ P ( X | [ x ] A 2 ≤ ) ≥ α ∨ ⋯ ∨ P ( X | [ x ] A m ≤ ) ≥ α }
∑ i = 1 m A i o β ¯ ( X ) = ~ ∑ i = 1 m A i o _ 1 − β ( ~ X )
通过定义,可以得到,在不完备系统中,乐观多粒度概率粗糙集的边界域集合:
B n d ∑ i = 1 m A i ( α , β ) o = ∑ i = 1 m A i o β ¯ ( X ) − ∑ i = 1 m A i o _ α ( X )
二元组 〈 ∑ i = 1 m A i o _ α ( X ) , ∑ i = 1 m A i o β ¯ ( X ) 〉 称作是X基于劣势关系关于粒度 A i ( i = 1 , 2 , ⋯ , m ) 的乐观多粒度概率粗糙集。
定理4.1:设 M I S = 〈 U , A T , V , f 〉 为一个不完备的多粒度信息系统, X ⊆ U , ∀ x ∈ U , 0 ≤ β ≤ 0.5 < α ≤ 1 ,则上近似可以表示为
∑ i = 1 m A i 0 ¯ = { x ∈ U : p ( X | [ x ] A 1 ≥ ) > β ∧ P ( X | [ x ] A 2 ≥ ) > β ∧ ⋯ ∧ P ( X | [ x ] A m ≥ ) > β }
证明: ∑ i = 1 m A i o β ¯ ( X ) = ~ ∑ i = 1 m A i o _ 1 − β ( ~ X ) (其余等式证明可类似定理3.1可证)。
注:(1) 同理可得,悲观的上近似有如下性质
∑ i = 1 m A i p β ¯ = { x ∈ U : p ( X | [ x ] A 1 ≥ ) > β ∨ P ( X | [ x ] A 2 ≥ ) > β ∨ ⋯ ∨ P ( X | [ x ] A m ≥ ) > β } 。
(2) 同理基于劣势关系也可得出如上定理。
定义8:设 M I S = 〈 U , A T , V , f 〉 为不完备多粒度信息系统 ∀ x ∈ U , X ⊆ U , 0 ≤ β ≤ 0.5 < α ≤ 1 ,因此X在优势关系 R A i ≥ (劣势关系 R A i ≤ )上依参数 α , β 的乐观(悲观)多粒度概率粗糙集近似精度 λ o ( α , β ) 分别定义为:
λ o ( α , β ) = | ∑ i m A i _ α o ( X ) | | ∑ i m A i ¯ β o ( X ) | ; λ p ( α , β ) = | ∑ i m A i _ α p ( X ) | | ∑ i m A i ¯ β p ( X ) | 。
例2 不完备多粒度信息系统为例1中给出的(如表1)我们基于优势关系进行讨论,得到在优势关系下
的归类: U / R A i ≥ = { [ x 1 ] A i ≥ , [ x 2 ] A i ≥ , ⋯ , [ x 8 ] A i ≥ }
根据定义7,当 α 变小, β 变大时,基于优势关系求得在不完备多粒度信息系统中概率粗糙集在不同决策类的乐观(悲观)多粒度上(下)近似集(如表3所示):
∑ i = 1 3 A i o _ α ( D 1 ) | ∑ i = 1 3 A i β ¯ o ( D 1 ) | ∑ i = 1 3 A i _ α o ( D 2 ) | ∑ i = 1 3 A i β ¯ o ( D 2 ) | ∑ i = 1 3 A i p _ α ( D 1 ) | ∑ i = 1 3 A i β ¯ p ( D 1 ) | ∑ i = 1 3 A i _ α p ( D 2 ) | ∑ i = 1 3 A i β ¯ p ( D 2 ) | |
---|---|---|---|---|---|---|---|---|
α = 0.8 β = 0.1 | ϕ | ϕ | ϕ | ϕ | ϕ | U | ϕ | U |
α = 0.7 β = 0.1 |
|
|
|
|
|
U |
|
U |
|
|
|
|
|
|
U |
|
U |
表3. 优势关系下的不完备多粒度概率粗糙集的乐观(悲观)上下近似
得到近似精度为:
根据定义7,当
|
|
|
|
|
|
|
|
|
---|---|---|---|---|---|---|---|---|
|
|
|
|
|
|
U |
|
U |
|
|
|
|
|
|
U |
|
U |
|
|
|
|
|
|
U |
|
U |
表4. 劣势关系下的不完备多粒度概率粗糙集的乐观(悲观)上下近似
基于劣势关系得到近似精度为:
定理4.2:设
注:在相似关系中上述性质一般不成立。
通过例1和例2的比较,可以发现在不完备系统中,基于优劣关系对缺省的值进行分类;这样可以避免依据相似关系分类时造成的信息偏差,和在乐观情况下所有的上(下)近似和精度都为空的情况。根据乐观和悲观,可以在不完备的多粒度概率粗糙集中通过调整
(1) 在相同的
(2) 当
(3) 当
(4) 当
定义9 [
定义10:设
则可能的决策规则有:
(1) 确定的
(2) 可能的
(3) 确定的
(4) 可能的
例3:s是一个不完备的多粒度决策信息系统(如下表5所示),
U |
|
|
|
|
d |
---|---|---|---|---|---|
|
1 | 1 | 3 | 2 | 2 |
|
2 | * | 2 | 1 | 2 |
|
1 | 1 | 3 | 2 | 2 |
|
1 | * | * | 1 | 1 |
|
* | 2 | 2 | * | 2 |
|
1 | 2 | * | 2 | 2 |
---|---|---|---|---|---|
|
2 | 2 | 2 | 1 | 2 |
|
1 | 2 | 1 | 1 | 1 |
表5. 不完备信息系统
从表中得到决策类
由于只有两个决策类,得到向下联合
取
因此,可以将不完备信息中的多粒度层整体考虑来得到规则:
当
当
由此,可以发现当
本文是基于不完备信息系统进行的研究。在本文开始,介绍了不完备系统中的多粒度粗糙集理论和乐观粗糙集近似和悲观多粒度粗糙集近似的定义;第三部分给出了不完备信息系统中基于相似关系的多粒度概率粗糙集的相关定义及性质,讨论了其上下近似和近似精度。第四部分基于优势关系劣势关系分别讨论了多粒度概率粗糙集的上下近似和近似精度,并做了对比,通过调整参数
每个相关的定义都给出了具体实例验证,进一步探讨概率粗糙集模型基于优劣关系的规则提取的有效性,接下来的工作将针对这些规则的给出,尝试给出更为高效的约简及其规则提取的算法。
青海省自然科学基金(2018-ZJ-911);青海民族大学科研创新团队专项经费支助。
石孝安,傅 丽. 不完备信息系统中多粒度概率粗糙集的规则提取Rule Extraction of Multi-Granularity Probabilistic Rough Sets in Incomplete Information Systems[J]. 应用数学进展, 2020, 09(08): 1298-1308. https://doi.org/10.12677/AAM.2020.98152
https://doi.org/10.1007/BF01001956