信息系统中的局部邻域粗糙集及属性约简

期刊菜单

信息系统中的局部邻域粗糙集及属性约简
Local Neighborhood Rough Sets and Attrib-ute Reduction in Information Systems

DOI:10.12677/PM.2022.122031,PDF,HTML,XML,下载: 457浏览: 830科研立项经费支持
作者:切洛太,傅丽^*：青海民族大学数学与统计学院，青海西宁
关键词:不协调信息系统；邻域半径；局部粗糙集；属性约简；The Information System of Uncoordinated Decision；Neighborhood Radius；Local Rough Set；At-tribute Reduction

摘要:信息粒度和近似方法是粗糙集理论中两个重要描述数据的方法，为了解决经典邻域粗糙集的计算效率低下和数据识别有用性不足的问题，有人提出了局部邻域粗糙集模型。在局部邻域粗糙集中，邻域半径的大小直接影响数据的有效性，因此邻域半径的取值为至关重要，但在局部邻域粗糙集中邻域半径的取值范围有点过大。为了进一步缩小邻域半径取值范围，本文借助邻域半径的取值，讨论了系统的协调性。首先给出了不协调信息系统中的局部邻域粗糙集，然后将属性约简不协调集的思想引入邻域，缩小了邻域半径的取值范围，为计算局部邻域粗糙集的邻域半径提供了有效工具，同时研究了相关的性质。

Abstract:The information granular and approximation method is two important methods to describe data in rough set theory. In order to work out the computational inefficiency and lack of cognitive data in the classical neighborhood rough set, then someone proposed the local neighborhood rough set model. For the local neighborhood rough set model, the value of neighborhood radius is very of great importance since its value has a close relation with the efficiency. However, the value range of neighborhood radius in the local neighborhood rough set is too large. Further, in order to reduce the value range of neighborhood radius, this paper studies the coordination of the system. Firstly, the local neighborhood decision rough sets of the uncoordinated information system are given, then the idea of the property reduction coordination set is added to the neighborhood, which can reduce the range of radius of the neighborhood, provide an effective tool for calculating neighborhood radius of rough set. The related properties are also studied.

文章引用：切洛太, 傅丽. 信息系统中的局部邻域粗糙集及属性约简[J]. 理论数学, 2022, 12(2): 264-275. https://doi.org/10.12677/PM.2022.122031

1. 引言

粗糙集理论是1982年波兰数学家Palawk [1] 第一次提出来的，是处理不确定性和不完整性数据的数学工具，在很多领域如人工智能、数据挖掘、医疗分析、模式识别等中应用广泛。此后，很多学者提出并研究了各种粗糙集模型，如Yao [2] 等将贝叶斯决策理论引入概率粗糙集模型，提出了决策粗糙集模型和三支决策 [3]，给出了概率阈值 $(α, β)$ 的最佳值求解方法。经典粗糙集只能处理名义型数据，其思想是根据不可分辨关系划分等价类，确定上下近似。但实际应用中，大部分数据是数值型数据，应用这种数据时首先要对原始数据进行离散化处理，在处理过程中必定造成信息丢失，从而文 [4] 提出了一种基于邻域关系的邻域粗糙集模型，文 [5] 提出了一种基于邻域的决策理论粗糙集模型。鉴于由二元关系导出的粗糙集模型，它的上、下近似是由预先计算的信息粒所构成，其中信息粒用来近似一个目标概念，计算时这些信息粒必须遍历给定论域中的所有对象。因此这种计算方法时间复杂度高，不能满足大数据高效计算的要求，从而文 [6] 提出了局部粗糙集的理论框架，文 [7] 提出局部邻域粗糙集。本文在文 [7] 的基础上讨论了系统的协调性，将不协调集思想引入邻域半径，证明它缩小了邻域半径的取值范围，这为计算局部邻域决策粗糙集的邻域半径提供了有效的工具。文章结构如下，第一部分回顾局部粗糙集、邻域半径、局部邻域决策的一些基本概念。第二部分给出基于局部邻域的协调决策系统。第三部分，讨论基于局部邻域的不协调决策系统。第四部分是总结和后期工作。

2. 基础知识

定义1 [4] [8] [9] 假设信息系统 $S = (U, A, f, V)$ 的属性集为A所有属性的值域 $V = \underset{a \in A}{\cup} V_{a}$ ， $f : U \times A \to V$ ， $\forall a \in A$ ， $\forall x \in U$ ， $f (x, a) \in V_{a}$ ， $B \subseteq A$ ，x在属性集B上的 $δ$ -邻域定义为

$δ_{B} (x) = {y \in U | d i s (x, y) \leq δ, δ > 0} .$

其中， $d i s (•)$ 表示任意对象之间的欧氏距离。

定义2 [4] [10] 设信息系统 $S = (U, A, f, V)$ ， $\forall x \in U$ ， $B \subseteq A$ ，x在属性集B上对X的粗糙隶属度 $μ_{B} (x)$ 定义为

$μ_{B} (x) = P (X | δ_{B} (x)) = \frac{| X \cap δ_{B} (x) |}{| δ_{B} (x) |} .$

其中 $P (X | δ_{B} (x))$ 表示分类的条件概率， $| \cdot |$ 表示集合中元素的个数。

定义3 [11] 假设 $S = (U, A, f, V)$ 为一个信息系统， $X \subseteq U$ ， $B \subseteq A$ ，则属性集B下X关于 $δ$ -邻域的局部粗糙集上下近似集分别定义为

$\bar{δ_{B}} (x) = {x \in X | δ_{B} (x) \cap X \neq \emptyset},$

$\underline{δ_{B}} (x) = {x \in X | δ_{B} (x) \subseteq X} .$

属性集B下X关于 $δ$ -邻域的局部粗糙集的正域、负域和边界域分别定义为

$P O S_{B} (X) = \underline{δ_{B}} (x) = {x \in X | P (X | δ_{B} (x)) = 1},$

$N E G_{B} (X) = U - \bar{δ_{B}} (x) = {x \in X | P (X | δ_{B} (x)) = 0},$

$B N D_{X} (X) = \bar{δ_{B}} (x) - \underline{δ_{B}} (x) = {x \in X | 0 < P (X | δ_{B} (x)) < 1} .$

定义4 [11] 设信息系统 $S = (U, A T = C \cup D, f, V)$ 的条件属性C，决策属性为D， $X \subseteq U$ ， $B \subseteq C$ 则属性集B下X关于 $δ$ -邻域的局部决策粗糙集上下近似集分别定义为

$\bar{δ_{B}^{D T}} (x) = {x \in X | P (X | δ_{B} (x)) > β},$

$\underline{δ_{B}^{D T}} (x) = {x \in X | P (X | δ_{B} (x)) \geq α} .$

正域、负域和边界域分别定义为

$P O S_{B}^{D T} (X) = \underline{δ_{B}^{D T}} (x) = {x \in X | P (X | δ_{B} (x)) \geq α},$

$B N D_{B}^{D T} (X) = \bar{δ_{B}^{D T}} (x) - \underline{δ_{B}^{D T}} (x) = {x \in X | β < P (X | δ_{B} (x)) < α},$

$N E G_{B}^{D T} (X) = U - \bar{δ_{B}^{D T}} (x) = {x \in X | P (X | δ_{B} (x)) \leq β} .$

决策粗糙集有两种状态，所有属于X的对象集X和所有不属于X的对象集 $X^{c}$ ，用 $Ω = (X, X^{c})$ 表示。

定义5 [12] [13] 设信息系统 $S = (U, A T = C \cup D, f, V)$ 的条件属性C，决策属性为D，若 $δ_{A} (X) \subseteq U / R_{d}$ ， $R_{d} = {(x_{i}, x_{j}) | d (x_{i}) = d (x_{y})}$ ，则称 $S = (U, A T = C \cup D, f, V)$ 为协调决策信息系统。

定义6 [14] 设信息系统 $S = (U, A T = C \cup D, f, V)$ 的条件属性C，决策属性为D，若 $δ_{A} (X) ⊈ U / R_{d}$ ， $R_{d} = {(x_{i}, x_{j}) | d (x_{i}) = d (x_{y})}$ ，则称 $S = (U, A T = C \cup D, f, V)$ 为不协调决策信息系统。

设 $U / R_{d} = {X_{1}, X_{2}, \dots, X_{n}}$ ， $B \subseteq C$ ，则 $U / R_{d}$ 上的概率分布函数记为

$μ_{B}^{D T} (x_{i}) = (P (X_{1} | δ_{B} (x_{i})), P (X_{2} | δ_{B} (x_{i})), \dots, P (X_{n} | δ_{B} (x_{i}))),$

进一步记

$m_{B} (x_{i}) = \max_{t \leq n} P (X_{t} | δ_{B} (x_{i})) = P (X_{t_{0}} | δ_{B} (x_{i})) (x_{i} \in U),$

称 $m_{B} (x_{i})$ 是不确定性命题规则“若 $y \in δ_{B} (x_{i})$ ，则 $y \in X_{t_{0}}$ “的可信度，记为

$η_{B} (x_{i}) = {X_{t_{0}} | P (X_{t_{0}} | δ_{B} (x_{i})) = \max_{t \leq n} P (X_{t} | δ_{B}) (x_{i}) (x_{i} \in U)} .$

定义7 [14] 设 $S = (U, A T = C \cup D, f, V)$ 为一个不协调决策信息系统， $B \subseteq C$ 。

1) 若 $\forall x_{i} \in U$ ，有 $μ_{B}^{D T} (x_{i}) = μ_{C}^{D T} (x_{i})$ ，则称B是分布协调集。若B是分布协调集且B的任何真子集都不是分布协调集，则称B为分布约简集。

2) 若 $\forall x_{i} \in U$ ，有 $η_{B} (x_{i}) = η_{C} (x_{i})$ ，则称B是最大分布协调集。若B是最大分布协调集且B的任何真子集都不是最大分布协调集，称B为最大分布约简集。

定义8 [14] 设 $S = (U, A T = C \cup D, f, V)$ 为一个不协调决策信息系统， $B \subseteq C$ 。

1) 若 $\underline{δ_{C}^{D T}} (x) = \underline{δ_{B}^{D T}} (x)$ ，则B称下近似协调集。如果下近似协调集B任何子集都不是它的下近似协调集，那么B称下近似约简集。

2) 若 $\bar{δ_{C}^{D T}} (x) = \bar{δ_{B}^{D T}} (x)$ ，则B称上近似协调集。如果上近似协调集B的任何子集都不是它的上近似协调集，那么B称上近似约简集。

3. 局部邻域粗糙集的协调性

这部分，首先用一个例子来说明系统的协调性，以及如何把一个不协调决策信息系统转化为协调的。

例1 设表1为一个不协调决策信息系统，U为有限论域， $U = {x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, x_{6}, x_{7}, x_{8}, x_{9}}$ ，条件属性集 $C = {a_{1}, a_{2}, a_{3}, a_{4}, a_{5}, a_{6}, a_{7}}$ ，决策属性为D。

Table 1. Information system

表1. 信息系统

$U / R_{d} = {{x_{1}, x_{2}, x_{6}, x_{7}}, {x_{3}, x_{4}, x_{5}, x_{8}, x_{9}}} = {X_{1}, X_{2}},$

由定义5知若决策系统协调，则 $δ_{A} (X) \subseteq U / R_{d}$ ， $R_{d} = {(x_{i}, x_{j}) | d (x_{i}) = d (x_{y})}$ ，即 $δ_{A} (x_{i}) \in U / R_{d}, (i = 1, 2, \dots, 9)$ 。

当 $δ_{1} = 0.34$ 时， $δ_{A} (x_{1}) = {x_{1}, x_{2}, x_{6}, x_{7}} \subseteq X_{1}$ 。当 $δ_{1} > 0.34$ 时， $δ_{A} (x_{1}) \notin U / R_{d}$ 。因此当 $δ_{1} \leq 0.34$ 时， $δ_{A} (x_{1}) \in U / R_{d}$ 。按照上述方法有

$δ_{2} \leq 0.5$ 时， $δ_{A} (x_{2}) \in U / R_{d}$ 。

$δ_{3} \leq 0.34$ 时， $δ_{A} (x_{3}) \in U / R_{d}$ 。

$δ_{4} \leq 0.51$ 时， $δ_{A} (x_{4}) \in U / R_{d}$ 。

$δ_{5} \leq 0.4$ 时， $δ_{A} (x_{5}) \in U / R_{d}$ 。

$δ_{6} \leq 0.49$ 时， $δ_{A} (x_{6}) \in U / R_{d}$ 。

$δ_{7} \leq 0.5$ 时， $δ_{A} (x_{7}) \in U / R_{d}$ 。

$δ_{8} \leq 0.34$ 时， $δ_{A} (x_{8}) \in U / R_{d}$ 。

$δ_{9} \leq 0.46$ 时， $δ_{A} (x_{9}) \in U / R_{d}$ 。

令 $δ = \min {δ_{1}, δ_{2}, δ_{3}, δ_{4}, δ_{5}, δ_{6}, δ_{7}, δ_{8}, δ_{9}} = \min {0.34, 0.5, 0.34, 0.51, 0.4, 0.49, 0.5, 0.34, 0.46} = 0.34$ 。则有

$\begin{array}{l} δ_{A} (X) = {{x_{1}, x_{2}, x_{6}, x_{7}}, {x_{1}, x_{7}}, {x_{3}}, {x_{4}, x_{5}}, {x_{3}, x_{4}, x_{5}, x_{9}}, {x_{3}, x_{5}, x_{8}}, {x_{3}, x_{5}, x_{9}}} \\ \subseteq R_{d} = {{x_{1}, x_{2}, x_{6}, x_{7}}, {x_{3}, x_{4}, x_{5}, x_{8}, x_{9}}} \end{array}$ 。也就是说，当 $δ \leq 0.34$

时，此系统转化为协调的。

命题1 设 $S = (U, A T = C \cup D, f, V)$ 为一个信息系统，当邻域半径的取值范围为 $[0, δ^{'}]$ 时，这里

$δ^{'} = \min {δ_{i} | δ_{i} = \sup {δ_{j} | δ_{j A} (x_{i}) = {y | d i s_{A} (x_{i}, y) \leq δ_{j}, δ_{j} > 0} \subseteq U / R_{d}}, δ_{i} > 0}, (i = 0, 1, \dots, 7)$ ，则此系统是协调的。

证明：反证法。设 $S = (U, A T = C \cup D, f, V)$ 为协调系统，取 $δ > \min {δ_{i} | δ_{i} = \sup {δ_{j} | δ_{j} A (x_{i}) = {y | d i s_{A} (x_{i}, y) \leq δ_{j}, δ_{j} > 0} \subseteq U / R_{d}}, δ_{i} > 0}$ ，则总能找到一个 $i_{0}, (i_{0} = 1, 2, \dots, 7)$ ，使得 $δ > δ_{i_{0}} = \sup {δ_{j} | δ_{j A} (x_{i_{0}}) = {y | d i s_{A} (x_{i_{0}}, y) \leq δ_{j} > 0} \subseteq U / R_{d}}, δ_{j} > 0$ 满足 $δ_{A} (x_{i_{0}}) \notin U / R_{d}$ ，则 $δ_{A} (X) ⊈ U / R_{d}$ 。由定义6知与假设矛盾，命题1得证。

设X为不可定义集，属性 $B \subseteq C$ 下X关于 $δ$ -邻域的局部邻域决策粗糙集上下近似不相等，取 $δ \in [0, δ^{'}]$ ，这里 $δ^{'} = \min {δ_{i} | δ_{i} = \sup {δ_{j} | δ_{j A} (x_{i}) = {y | d i s_{A} (x_{i}, y) \leq δ_{j}, δ_{j} > 0} \subseteq U / R_{d}}, δ_{i} > 0}, (i = 0, 1, \dots, 7)$ ，则系统变成协调的，有当 $X \subseteq U, X = X_{1}$ 时，由局部性得到

$δ_{C} (x_{1}) = {x_{1}, x_{2}, x_{6}, x_{7}} \subseteq X_{1},$

$δ_{C} (x_{2}) = {x_{1}, x_{2}, x_{6}, x_{7}} \subseteq X_{1},$

$δ_{C} (x_{6}) = {x_{1}, x_{2}, x_{6}, x_{7}} \subseteq X_{1},$

$δ_{C} (x_{7}) = {x_{1}, x_{7}} \subseteq X_{1} .$

当 $X \subseteq U, X = X_{2}$ 时，由局部性得到

$δ_{C} (x_{3}) = {x_{3}} \subseteq X_{2},$

$δ_{C} (x_{4}) = {x_{4}, x_{5}} \subseteq X_{2},$

$δ_{C} (x_{5}) = {x_{3}, x_{4}, x_{5}, x_{9}} \subseteq X_{2},$

$δ_{C} (x_{8}) = {x_{3}, x_{5}, x_{8}} \subseteq X_{2},$

$δ_{C} (x_{9}) = {x_{3}, x_{5}, x_{9}} \subseteq X_{2} .$

从而属性集C下 $X_{t}$ 关于 $δ$ -邻域的局部决策粗糙集上下近似集分别为

$\bar{δ_{B}^{D T}} (X_{1}) = {x \in X_{1} | P (X_{1} | δ_{B} (x)) = 1 > β} = X_{1} = \underline{δ_{B}^{D T}} (X_{1}) (0 \leq β \leq α \leq 1),$

$\underline{δ_{B}^{D T}} (X_{2}) = {x \in X_{2} | P (X_{2} | δ_{B} (x)) = 1 \geq α} = X_{2} = \bar{δ_{B}^{D T}} (X_{2}) (0 \leq β \leq α \leq 1) .$

命题2 设 $S = (U, A T = C \cup D, f, V)$ 为一个协调决策信息系统， $X_{t} \in U / d, (t = 1, 2, \dots, n), n = | U / R_{d} |$ ，邻域半径的取值范围为 $[0, δ^{'}]$ 。则 $\bar{δ_{B}^{D T}} (X_{t}) = \underline{δ_{B}^{D T}} (X_{t})$ ， $X_{t}$ 是可定义集。

证明：设 $S = (U, A T = C \cup D, f, V)$ 为一个协调决策信息系统，若 $\bar{δ_{B}^{D T}} (X_{t_{0}}) \neq \underline{δ_{B}^{D T}} (X_{t_{0}}), (t_{0} = 1, 2, \dots, n)$ ，则存在 $x_{i_{0}} (i_{0} = 1, 2, \dots, 7)$ ， $δ_{j} A (x_{i_{0}}) ⊈ X_{t_{0}}$ 且 $δ_{j} A (x_{i_{0}}) \cap X_{t_{0}} \neq \emptyset$ ，从而有 $δ_{j} A (x_{i_{0}}) \notin U / R_{d}$ ， ${δ^{'}}_{A} (X) ⊈ U / R_{d}$ ，这与假设矛盾，命题2得证。

性质1 设 $S = (U, A T = C \cup D, f, V)$ 为一个协调决策信息系统， $X_{1}, X_{2} \subseteq U / R_{d}$ ， $B_{1}, B_{2} \subseteq A T$ ， $δ \subseteq [0, δ^{'}]$ ， $0 \leq β < α \leq 1$ 。下列等式成立

1) $\underline{δ_{B}^{D T}} (X) = X; \bar{δ_{B}^{D T}} (X) = X$

2) $\underline{δ_{B}^{D T}} (\emptyset) = \bar{δ_{B}^{D T}} (\emptyset) = \emptyset, \underline{δ_{B}^{D T}} (U) = \bar{δ_{B}^{D T}} (U) = U$

3) $\underline{δ_{B}^{D T}} (X_{1} \cap X_{2}) = \underline{δ_{B}^{D T}} (X_{1}) \cap \underline{δ_{B}^{D T}} (X_{2}); \bar{δ_{B}^{D T}} (X_{1} \cap X_{2}) = \bar{δ_{B}^{D T}} (X_{1}) \cap \bar{δ_{B}^{D T}} ( X 2 )$

4) $\underline{δ_{B}^{D T}} (X_{1} \cup X_{2}) = \underline{δ_{B}^{D T}} (X_{1}) \cup \underline{δ_{B}^{D T}} (X_{2}); \bar{δ_{B}^{D T}} (X_{1} \cup X_{2}) = \bar{δ_{B}^{D T}} (X_{1}) \cup \bar{δ_{B}^{D T}} ( X 2 )$

证明：由命题2知， $\underline{δ_{B}^{D T}} (X) = \bar{δ_{B}^{D T}} (X)$ ，从而上述4条性质容易得正。

4. 局部邻域粗糙集的属性约简

在基于局部邻域的协调系统中，集合 $X_{i}$ 是可定义的，在基于局部邻域的不协调信息系统中， $X_{i}$ 是不可定义的和粗糙的，因此我们只考虑系统为不协调的情况。

性质2 设 $S = (U, A, f, V)$ 为一个不协调信息系统， $X_{1}, X_{2} \subseteq U$ ， $B_{1}, B_{2} \subseteq A$ 。下列等式成立

1) $\underline{δ_{B}} (X) \subseteq X; X \subseteq \bar{δ_{B}} ( X )$

2) $\underline{δ_{B}} (\emptyset) = \bar{δ_{B}} (\emptyset) = \emptyset, \underline{δ_{B}} (U) = \bar{δ_{B}} (U) = U$

3) $\underline{δ_{B}} (X_{1} \cap X_{2}) \subseteq \underline{δ_{B}} (X_{1}) \cap \underline{δ_{B}} (X_{2}); \bar{δ_{B}} (X_{1} \cap X_{2}) \subseteq \bar{δ_{B}} (X_{1}) \cap \bar{δ_{B}} ( X 2 )$

4) $\underline{δ_{B}} (X_{1} \cup X_{2}) \supseteq \underline{δ_{B}} (X_{1}) \cup \underline{δ_{B}} (X_{2}); \bar{δ_{B}} (X_{1} \cup X_{2}) \supseteq \bar{δ_{B}} (X_{1}) \cup \bar{δ_{B}} ( X 2 )$

5) 当 $δ^{1} \leq δ^{2}$ 时， $\underline{δ_{B}^{1}} (X) \supseteq \underline{δ_{B}^{2}} (X); \bar{δ_{B}^{1}} (X) \subseteq \bar{δ_{B}^{2}} ( X )$

证明：1) 设 $\forall x \in \underline{δ_{B}} (X)$ ，由定义2有 $x \in \underline{δ_{B}} (x) = {x \in X | δ_{B} (x) \subseteq X} \Rightarrow x \in X$ ， $\underline{δ_{B}} (X) \subseteq X$ 。

2) 设 $\forall x \in \underline{δ_{B}} (\emptyset)$ 由定义2有 $δ_{B} (x) \subseteq \emptyset \Rightarrow δ_{B} (x) = \emptyset$ ，则 $\underline{δ_{B}} (\emptyset) = \emptyset$ 同样 $x \in δ_{B} (x) \cap \emptyset = \emptyset \Rightarrow \bar{δ_{B}} (\emptyset) = \emptyset$ 。

3) 设 $X_{1}, X_{2} \subseteq U$ ， $\forall x \in \underline{δ_{B}} (X_{1} \cap X_{2}) \Rightarrow x \in δ_{B} (x) \subseteq X_{1} \cap X_{2}$ ， $x \in δ_{B} (x) \subseteq X_{1} \land x \in δ_{B} (x) \subseteq X_{2} \Rightarrow x \in \underline{δ_{B}} (X_{1}) \cap \underline{δ_{B}} (X_{2})$ ，则 $\underline{δ_{B}} (X_{1} \cap X_{2}) \subseteq \underline{δ_{B}} (X_{1}) \cap \underline{δ_{B}} (X_{2})$ 。

4) 设 $X_{1}, X_{2} \subseteq U$ ， $\forall x \in \underline{δ_{B}} (X_{1} \cup X_{2}) \Rightarrow x \in δ_{B} (x) \subseteq X_{1} \cup X_{2}$ ， $x \in δ_{B} (x) \subseteq X_{1} \lor x \in δ_{B} (x) \subseteq X_{2} \Rightarrow x \in \underline{δ_{B}} (X_{1}) \cup \underline{δ_{B}} (X_{2})$ ，则 $\underline{δ_{B}} (X_{1} \cup X_{2}) \subseteq \underline{δ_{B}} (X_{1}) \cup \underline{δ_{B}} (X_{2})$ 。另外， $\forall x \in \bar{δ_{B}} (X_{1} \cup X_{2}) \Leftrightarrow x \in (X_{1} \cup X_{2}) \cap δ_{B} (x) \Leftrightarrow x \in (X_{1}) \cap δ_{B} (x) \lor x \in (X_{2}) \cap δ_{B} (x)$ $\Leftrightarrow \bar{δ_{B}} (X_{1} \cup X_{2}) = \bar{δ_{B}} (X_{1}) \cup \bar{δ_{B}} (X_{2})$

5) 设 $δ^{1} \leq δ^{2}$ ， $\forall x \in \underline{δ_{B}^{2}} (X) \Rightarrow δ_{B}^{1} (x) \subseteq δ_{B}^{2} (x)$ ， $x \in X$ ，由定义3有 $x \in \underline{δ_{B}^{2}} (X) \subseteq \underline{δ_{B}^{1}} (X)$ ， $x \in \underline{δ_{B}^{1}} (X)$ ，则 $\underline{δ_{B}^{1}} (X) \supseteq \underline{δ_{B}^{2}} (X)$ 。另外， $\forall x \in \bar{δ_{B}^{1}} (X) \Rightarrow δ_{B}^{1} (x) \subseteq δ_{B}^{2} (x)$ ，由定义3有 $x \in δ_{B}^{1} (x) \cap X \subseteq δ_{B}^{2} (x) \cap X$ ， $x \in \bar{δ_{B}^{2}} (X)$ ，则 $\bar{δ_{B}^{1}} (X) \subseteq \bar{δ_{B}^{2}} ( X )$

性质3 设 $S = (U, A T = C \cup D, f, V)$ 为一个不协调决策信息系统， $X_{1}, X_{2} \subseteq U / R_{d}$ ， $B_{1}, B_{2} \subseteq A T$ ， $0 \leq β < α \leq 1$ ，下列等式成立

1) $\underline{δ_{B}^{D T}} (X) \subseteq X; X \subseteq \bar{δ_{B}^{D T}} ( X )$

2) $\underline{δ_{B}^{D T}} (\emptyset) = \bar{δ_{B}^{D T}} (\emptyset) = \emptyset, \underline{δ_{B}^{D T}} (U) = \bar{δ_{B}^{D T}} (U) = U$

3) $\underline{δ_{B}^{D T}} (X_{1} \cap X_{2}) \subseteq \underline{δ_{B}^{D T}} (X_{1}) \cap \underline{δ_{B}^{D T}} (X_{2}); \bar{δ_{B}^{D T}} (X_{1} \cap X_{2}) \subseteq \bar{δ_{B}^{D T}} (X_{1}) \cap \bar{δ_{B}^{D T}} ( X 2 )$

4) $\underline{δ_{B}^{D T}} (X_{1} \cup X_{2}) \supseteq \underline{δ_{B}^{D T}} (X_{1}) \cup \underline{δ_{B}^{D T}} (X_{2}); \bar{δ_{B}^{D T}} (X_{1} \cup X_{2}) \supseteq \bar{δ_{B}^{D T}} (X_{1}) \cup \bar{δ_{B}^{D T}} ( X 2 )$

证明：由定义4的局部性，1)和2)很容易得证。

3) 设 $X_{1}, X_{2} \subseteq U / R_{d}$ ， $\forall x \in \bar{δ_{B}^{D T}} (X_{1} \cap X_{2}) \Rightarrow x \in X_{1} \cap X_{2}$ ， $P (X_{1} \cap X_{2} | δ_{B} (x)) > β \Rightarrow x \in X_{1}$ ， $P (X_{1} | δ_{B} (x)) \geq P (X_{1} \cap X_{2} | δ_{B} (x)) > β$ ，且 $x \in X_{2}$ ， $P (X_{2} | δ_{B} (x)) \geq P (X_{1} \cap X_{2} | δ_{B} (x)) > β \Rightarrow x \in \bar{δ_{B}^{D T}} (X_{1}) \cap \bar{δ_{B}^{D T}} ( X 2 )$

4) 设 $X_{1}, X_{2} \subseteq U / R_{d}$ ， $\forall x \in \bar{δ_{B}^{D T}} (X_{1}) \cup \bar{δ_{B}^{D T}} (X_{2}) \Rightarrow x \in X_{1}$ ， $P (X_{1} | δ_{B} (x)) > β \lor x \in X_{2}$ ， $P (X_{2} | δ_{B} (x)) > β \Rightarrow x \in X_{1} \cup X_{2}$ ， $P (X_{1} \cup X_{2} | δ_{B} (x)) \geq P (X_{1} | δ_{B} (x)) \lor P (X_{2} | δ_{B} (x)) > β \Rightarrow x \in \bar{δ_{B}^{D T}} (X_{1} \cup X_{2})$ 。

在性质3中性质2的第5条不成立，因此，我们给出下面的推论。

推论1 设 $δ^{1} \leq δ^{2}$ ，当 $\underline{δ_{B}^{1 D T}} (X) \subseteq \underline{δ_{B}^{2 D T}} (X)$ 时， $\forall x \in X$ 存在着一个正整数n，使得 $δ^{n}$ 为x的最佳邻域半径。

证明：设 $δ^{1} \leq δ^{2}$ ，当 $\underline{δ_{B}^{1 D T}} (X) \subseteq \underline{δ_{B}^{2 D T}} (X)$ 。则有 $δ^{1} \leq δ^{2} \leq \dots \leq δ^{n}$ ，使得 $\underline{δ_{B}^{1 D T}} (X) \subseteq \underline{δ_{B}^{2 D T}} (X) \subseteq \dots \subseteq \underline{δ_{B}^{n D T}} (X) ⊈ \underline{δ_{B}^{(n + 1) D T}} (X)$ ，这说明当 $δ > δ^{n}$ 时， $δ_{B} (x)$ 与X具有的共同元素不会随着 $δ$ 的增大而增多，反而 $p (X | δ_{B}^{n} (x)) \geq p (X | δ_{B}^{n + 1} (x)) \geq \dots$ 。从而正域中的元素越来越少，这不利于处理数据的效果，因此， $δ^{n}$ 为x的最佳邻域半径。

任何信息系统按照邻域半径取值范围的不同而可分为协调的部分和不协调的部分。原邻域半径的取值为 $δ \in [\min {d i s_{B} (x, y) | d i s_{B} (x, y), x, y \in U}, \max {d i s_{B} (x, y) | d i s_{B} (x, y), x, y \in U}]$ 从上面的命题发现，当 $δ \in [\min {d i s_{B} (x, y) | d i s_{B} (x, y), x, y \in U}, δ^{'}]$ 时，可定义的，也就是说边界域为空集，从而我们需要重点研究不可定义的部分，也就是边界域为非空的尽可能把它变小。

例2 某单位选高管时，为把德才兼备的人才提拔到领导岗位上，制定了5个标准。 $a_{1}$ ——政策水平， $a_{2}$ ——工作作风， $a_{3}$ ——业务能力， $a_{4}$ ——口才， $a_{5}$ ——近十年的请假次数，d——是否适合当选高管。现有7个目标，即 $U = {x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, x_{6}, x_{7}}$ 。先给7位候选人按照5项指标进行打分，打分情况如表2~5。表2为信息系统， $U / R_{d} = {Y_{1}, Y_{2}} = {{x_{1}, x_{2}, x_{6}}, {x_{3}, x_{4}, x_{5}, x_{7}}}$ ， $δ^{'} = \min {δ_{1}, δ_{2}, δ_{3}, δ_{4}, δ_{5}, δ_{6}, δ_{7}} = \min {0.32, 0.31, 0.44, 0.31, 0.49, 0.44, 0.32} = 0.31$ 。

Table 2. Judge 1

表2. 评委1

Table 3. Judge 2

表3. 评委2

Table 4. Judge 3

表4. 评委3

Table 5. Judge 4

表5. 评委4

$a_{1}, a_{2}, a_{3}, a_{4}$ 均为效益型，则用公式 $r_{i j} = \frac{a_{i j}}{\frac{\max (a_{i j})}{i}}$ ， $a_{5}$ 为成本型，则用公式 $r_{i j} = \frac{\frac{\min (a_{i j})}{i}}{a_{i j}}$ [15] 从而得到规范矩阵 $R_{i}$ ，如表6~9。

Table 6. R 1

表6. $R_{1}$

Table 7. R 2

表7. $R_{2}$

Table 8. R 3

表8. $R_{3}$

Table 9. R 4

表9. $R_{4}$

最后我们用平均法， $r_{j, t} = \frac{\sum r_{j, t}^{i}}{n}, i = 1, \dots, n; j = 1, \dots, 7; t = 1, \dots, 5$ 其中i代表评委，j代表目标，t为条件属性。比如 $r_{1, 3} = \frac{\sum r_{1, 3}^{i}}{4} = \frac{0.63 + 1 + 0.86 + 1}{4} = 0.87$ 也就是说目标概念 $x_{1}$ 在条件属性 $a_{3}$ 下的值取所有表 $R_{i}$ 中对应值的平均值。由此得到下列的表R如表10。

Table 10. R

表10. R

当 $δ \leq 0.31$ 时，此系统为协调的。 $Y_{1}, Y_{2}$ 是可定义的。

当 $δ > 0.31$ 时，此系统为不协调的， $Y_{1}, Y_{2}$ 是不可定义的。因此，设 $B = {a_{2}, a_{3}, a_{4}, a_{5}} \subseteq C$ ， $δ = 0.4$ ( $δ$ 在 $(0.31,0.54]$ 中取值)，

$μ_{C}^{D T} (x_{1}) = (0.6, 0.4) = μ_{B}^{D T} (x_{1}),$

$μ_{C}^{D T} (x_{2}) = (0.5, 0.5) = μ_{B}^{D T} (x_{2}),$

$μ_{C}^{D T} (x_{3}) = (0, 1) = μ_{B}^{D T} (x_{3}),$

$μ_{C}^{D T} (x_{4}) = (0.33, 0.67) = μ_{B}^{D T} (x_{4}),$

$μ_{C}^{D T} (x_{5}) = (0, 1) = μ_{B}^{D T} (x_{5}),$

$μ_{C}^{D T} (x_{6}) = (1, 0) = μ_{B}^{D T} (x_{6}),$

$μ_{C}^{D T} (x_{7}) = (0.33, 0.67) = μ_{B}^{D T} (x_{7}),$

则 $μ_{C}^{D T} (x_{i}) = μ_{B}^{D T} (x_{i})$ ，由定义9(1)知B是分布协调集，它的任何子集都不是它的分布协调集。因此B是分布约简集。同理B还是最大分布约简集。由于局部性，取 $α = 0.6, β = 0.45, (0 \leq β \leq α \leq 1)$ 则有

$\underline{δ_{C}^{D T}} (X) = (δ_{C}^{D T} (X_{1}), δ_{C}^{D T} (X_{2})) = ({x_{1}, x_{6}}, {x_{3}, x_{4}, x_{5}, x_{7}}) = \underline{δ_{B}^{D T}} (X),$

$\bar{δ_{C}^{D T}} (X) = (δ_{C}^{D T} (X_{1}), δ_{C}^{D T} (X_{2})) = ({x_{1}, x_{2}, x_{6}}, {x_{3}, x_{4}, x_{5}, x_{7}}) = \bar{δ_{B}^{D T}} (X),$

B的任何子集都不是它的上(下)近似协调集。因此B是上(下)近似约简集。

命题3 对于信息系统 $S = (U, A T = C \cup D, f, V)$ ，若邻域半径在 $(δ^{'}, \max_{i, j \leq n} (d i s_{C} (x_{i}, x_{j}))]$ 内取值时，则它不协调，这里 $δ^{'} = \min {δ_{i} | δ_{i} = \sup {δ_{j} | δ_{j} A (x_{i}) = {y | d i s_{A} (x_{i}, y) \leq δ_{j}, δ_{j} > 0} \subseteq U / R_{d}}, δ_{i} > 0}, (i = 0, 1, \dots, 7)$ 。

证明：设 $S = (U, A T = C \cup D, f, V)$ 为不协调信息系统且邻域半径 $δ \leq δ^{'}$ ，则由命题1得，存在一个 $δ_{A} (x_{i_{0}}) \in U / R_{d}$ ，从而S为协调的，与假设矛盾。因此 $δ \in (δ^{'}, \max_{i, j \leq n}, (d i s_{C} (x_{i}, x_{j}))]$ 。

5. 总结

在局部邻域粗糙集中邻域半径的取值范围过大而找到最佳邻域半径有所困难，因此本文研究了协调系统下的局部邻域粗糙集和不协调系统的局部邻域粗糙集及属性约简，借助邻域信息系统的协调性，发现任何一个邻域信息系统都可分为协调的部分和不协调的部分，用这种方法缩小了邻域半径的取值范围，为计算最佳邻域半径提供了方法。后期继续研究乐观和悲观下的邻域半径及属性约简。

基金项目

青海民族大学研究生创新项目(项目编号：07M2021005)。

NOTES

^*通讯作者。

参考文献

[1]	Pawlak, Z. (1982) Rough Sets. International Journal of Computer and Information Sciences, 11, 341-356. https://doi.org/10.1007/BF01001956
[2]	Yao, Y.Y. and Wong, S.K.M. (1992) A Decision Theoretic Framework for Approximating Concepts. International Journal of Man-Machine Studies, 37, 793-809. https://doi.org/10.1016/0020-7373(92)90069-W
[3]	Yao, Y.Y. (2010) Three-Way Decisions with Probabilistic Rough Sets. Information Sciences, 180, 341-353. https://doi.org/10.1016/j.ins.2009.09.021
[4]	Hu Q.H., Yu, D.R., Liu, J.F. and Wu, C. (2008) Neighborhood Rough Set Based Heterogeneous Feature Subset Selection. Information Sciences, 178, 3577-3594. https://doi.org/10.1016/j.ins.2008.05.024
[5]	Li, W.W., Huang, Z.Q., Jia, X.Y. and Cai, X.Y. (2016) Neigh-borhood Based Decision-Theoretic Rough Set Models. International Journal of Approximate Reasoning, 69, 1-17. https://doi.org/10.1016/j.ijar.2015.11.005
[6]	Qian, Y.H., Liang, X.Y., Wang, Q., Liang, J., Liu, B., Skowron, A., et al. (2018) Local Rough Set: A Solution to Rough Data Analysis in Big Data. International Journal of Approximate Reasoning, 97, 38-63. https://doi.org/10.1016/j.ijar.2018.01.008
[7]	Wang, Q., Qain, Y.H., Liang, X.Y., Guo, Q. and Liang, J. (2018) Local Neighborhood Rough Set. Knowledge-Based Systems, 153, 53-64. https://doi.org/10.1016/j.knosys.2018.04.023
[8]	Lin, T.Y. (1998) Granular Computing on Binary Relations I: Data Mining and Neighborhood Systems. Proceedings of the International Workshop on Rough Sets and Knowledge Discovery: Rough Sets, Fuzzy Sets and Knowledge Discovery, 107-121.
[9]	Li, G.-H., Hao W.-J. and Li, Z.-W. (2018) Generalized Consistent Space Based on Distance and Its Attribute Reduction. Fuzzy Systems and Mathematics, 32, 150-154.
[10]	Ziarko, W. (1993) Variable Precision Rough Set Model. Journal of Computer and System Sciences, 46, 39-59. https://doi.org/10.1016/0022-0000(93)90048-2
[11]	孙颖, 蔡天使, 张毅, 鞠恒荣, 丁卫平. 基于合理粒度的局部邻域决策粗糙计算方法[J]. 南京大学学报(自然科学), 2021, 57(2): 262-271.
[12]	Greco, S., Matarazzo, B. and Slowinski, R. (2001) Rough Sets Theory for Multicriteria Decision Analysis. European Journal of Operational Research, 129, 1-47. https://doi.org/10.1016/S0377-2217(00)00167-3
[13]	张文修, 仇国芳. 基于粗糙集的不确定决策[M]. 北京: 清华大学出版社, 2005.
[14]	Slowinski, R., Stefanowski, J., Greco, S. and Matarazzo, B. (2000) Rough Set Based Processing of Inconsistent Information in Decision analysis. Control and Cybernetics, 29, 379-404.
[15]	Hwang, C.L. and Yoon, K. (1981) Multiple Attribute Decision Making: Methods and Applications. Springer-Verlag, New York. https://doi.org/10.1007/978-3-642-48318-9

为你推荐

友情链接