Processing math: 0%
  • 中文核心期刊要目总览
  • 中国科技核心期刊
  • 中国科学引文数据库(CSCD)
  • 中国科技论文与引文数据库(CSTPCD)
  • 中国学术期刊文摘数据库(CSAD)
  • 中国学术期刊(网络版)(CNKI)
  • 中文科技期刊数据库
  • 万方数据知识服务平台
  • 中国超星期刊域出版平台
  • 国家科技学术期刊开放平台
  • 荷兰文摘与引文数据库(SCOPUS)
  • 日本科学技术振兴机构数据库(JST)
微信公众号

微信公众号

电磁环境与人口热力及建筑密度的关联规则挖掘

宋欣蔚, 陈依婕, 韩孟琦, 岳云涛

宋欣蔚,陈依婕,韩孟琦,等. 电磁环境与人口热力及建筑密度的关联规则挖掘[J]. 电波科学学报,2023,38(5):800-806. DOI: 10.12265/j.cjors.2022160
引用格式: 宋欣蔚,陈依婕,韩孟琦,等. 电磁环境与人口热力及建筑密度的关联规则挖掘[J]. 电波科学学报,2023,38(5):800-806. DOI: 10.12265/j.cjors.2022160
SONG X W, CHEN Y J, HAN M Q, et al. Mining of association rules among electromagnetic environment, population heat and building density[J]. Chinese journal of radio science,2023,38(5):800-806. (in Chinese). DOI: 10.12265/j.cjors.2022160
Reference format: SONG X W, CHEN Y J, HAN M Q, et al. Mining of association rules among electromagnetic environment, population heat and building density[J]. Chinese journal of radio science,2023,38(5):800-806. (in Chinese). DOI: 10.12265/j.cjors.2022160

电磁环境与人口热力及建筑密度的关联规则挖掘

基金项目: 北京市教育委员会科学研究计划(KM202210016005)
详细信息
    作者简介:

    宋欣蔚: (1990—),女,河北人,北京建筑大学电气与信息工程学院讲师,博士,硕士生导师,研究方向为电磁环境、电磁兼容. E-mail: songxinwei@bucea.edu.cn

    陈依婕: (1999—),女,海南人,北京建筑大学电气与信息工程学院硕士研究生,研究方向为电磁环境测试与建模. E-mail: sicasy418@163.com

    韩孟琦: (1999—),男,北京人,北京建筑大学电气与信息工程学院硕士研究生,研究方向为电磁环境测试与分析. E-mail: hmq13699223171@163.com

    岳云涛: (1972—),男,黑龙江人,北京建筑大学电气与信息工程学院副教授,博士,硕士生导师,研究方向为电机驱动、变换器脉宽调制及微处理器应用. E-mail: yueyuntao@bucea.edu.cn

    通信作者:

    宋欣蔚 E-mail: songxinwei@bucea.edu.cn

  • 中图分类号: TN98

Mining of association rules among electromagnetic environment, population heat and building density

  • 摘要:

    城市电磁环境强度的逐渐升高对人体健康和电子系统正常工作构成潜在威胁,为实现对电磁环境状况的快速判别,提出一种电磁环境与人口热力及建筑密度的关联规则挖掘方法. 首先通过两步聚类分别将电磁环境、人口热力、建筑密度数据离散为三种等级,再基于动态阈值FP增长(Frequent Pattern Growth)算法进行规则挖掘,最后筛选出有效的关联规则. 将所提出方法应用于北京城区道路采样的28 424组数据,实验结果表明:人口热力为中、低等级的区域或建筑密度低的区域,电磁环境强度通常低于1.52 V/m;建筑密度高的区域,电磁环境强度通常在1.52~3.50 V/m;而电磁环境强度高于3.50 V/m的情况主要出现在人口热力高的区域. 本文的研究工作为城市电磁环境的快速估计与监测预警提供了新思路和参考.

    Abstract:

    The gradual increase in the strength of the urban electromagnetic environment poses a potential threat to human health and the normal operation of electronic systems. In order to realize the rapid identification of the electromagnetic environment, this paper proposes a mining method for association rules among the electromagnetic environment, population heat and building density. Firstly, the electromagnetic environment, population heat, and building density data were discretely divided into three levels through two-step clustering. Then, the dynamic threshold frequent pattern growth (FP-growth) algorithm was used to conduct rule mining. Finally, the effective association rules were screened out. The proposed method is applied to 28424 sets of data sampled from roads in Beijing urban areas. The experimental results show that in areas with medium and low population thermal power or areas with low building density, the electromagnetic environment strength is usually lower than 1.52 V/m; in areas with high building density , the electromagnetic environment strength is usually in the range of 1.52−3.50 V/m; while the situation when the electromagnetic environment strength is higher than 3.50 V/m, mainly occurs in areas with high population heat. new ideas and references. The research work in this paper provides new ideas and references for rapid estimation, monitoring and early warning of urban electromagnetic environment.

  • 生产生活中的诸多用电设备(如广播电视塔、基站、无线路由器、工业和医疗用频设备等)向环境中辐射电磁场,从而形成相应的电磁环境. 超出控制限值的电磁环境对人体和电子系统都会产生不容忽视的影响:一方面,环境中长期过量的电磁辐射通过热效应和非热效应会对人体的生殖系统、神经系统、免疫系统等造成伤害,可诱发皮肤病、心血管疾病、糖尿病、癌突变等[1];另一方面,环境中的电磁场可能会成为电子系统的电磁干扰源,通过感应出非预期的电压和电流而引发系统故障[2]. 上述情况将随无线应用的增多和系统复杂程度的增加而更加严重. 因此,获知电磁环境状况进而实现风险预估是至关重要的.

    目前,获知电磁环境状况的方法主要有测试和发射源建模两种. 测试方面的研究工作近些年在持续开展,如国内北京市[3]、乌鲁木齐市[4]、广州市[5]、厦门市[6]等,以及国外荷兰多地[7]、波士顿[8]、华沙[9]、莫索罗[10]等的电磁环境测试研究. 测试虽能够直接得到电磁环境数据,但需借助专业仪器,不能覆盖区域任意位置,且测试数据时效性较差。而发射源建模的方法在一定程度上解决了区域覆盖的问题,如文献[11]提出对某发射源进行空间和频域同时插值的方法,以获取区域内其他位置的电磁场强度;文献[12]通过一种收敛的无限级数来建模基站辐射到周边的电磁功率密度;文献[13]提出一种由电波传播路径损耗模型辅助的神经网络模型,以推算未测试点位的电磁场强度. 但发射源建模的方法需预知环境内的所有发射源参数,实际可行性较差,且同样存在时效性较差的问题.

    为此,本文提出将电磁环境与其他较易获取的信息(如实时人口热力、建筑密度)建立关联的新思路,即通过其他信息快速估计电磁环境状况. 利用数据挖掘[14]思想,本文提出一套电磁环境与人口热力及建筑密度的关联规则挖掘方法. 近期文献[15]利用数据挖掘探究了电磁频谱数据的异常检测、底噪挖掘、占用度分析等环节;文献[16]对环境中多种信道的频谱进行了信息挖掘与关联分析;文献[17]从武器装备角度实现了频谱使用规律挖掘与预测,以及网络化通信关联规律挖掘,但上述文献主要针对电磁频谱数据,与本文类似的研究尚未见报道. 此外,本文于北京城区主要道路上获取了28 424组相关数据,从而利用所提出的方法得到电磁环境与人口热力及建筑密度的关联规则. 所提出的方法与所得到的关联规则,对于任意区域不同时段的电磁环境状况估计具有指导意义,并为电磁环境与其他领域信息的内在关联分析与融合提供了参考.

    电磁环境数据通过电磁辐射检测仪(意大利微纳德PRO2型号)测试获取. 该仪器通过其顶部三个相互垂直的探针,测量三个正交方向的电磁场,从而合成空间的综合场强. 测量的频率范围为100 kHz~6.5 GHz. 电磁辐射检测仪被架设在小轿车顶部,以便在城区道路上进行测试,仪器的探针检测部分距地面高度为1.7 m,每个采样点测量5次、每次测量时间不少于15 s,并记录稳定状态的最大值. 在实施测试前,对电磁辐射检测仪进行了校准. 所采用的仪器及测试设置符合我国现行的环境保护行业标准《辐射环境保护管理导则 电磁辐射监测仪器和方法》(HJ/T 10.2—1996)[18]. 此外,根据国家标准《电磁环境控制限值》(GB 8702—2014)[19],对于100 kHz以上频率,在远场区可以只限制电场强度或磁场强度或等效平面波功率密度的大小,而本研究的测试属于远场区测试,因此可以将电场强度(大小)作为衡量电磁环境的数据.

    电磁环境测试的地理范围为北京城区的以下路段:二环路、三环路、四环路、五环路、奥林西路北端至槐房西路南五环端、北辰路北辰桥口至南苑路南端、北苑路北苑桥口至德贤路南端、玲珑路西端至姚家园路与黄杉木店路交叉口、石景山路西端至建国路远通桥口、京港澳高速宛平桥口至广渠路东端. 在上述路段近似均匀地采样测试,共28 424个采样点,同时通过GPS模块记录各点的经纬度坐标. 将电磁环境测试数据绘制为以经纬度坐标为横纵坐标、综合电场强度值为灰度的二维图,如图1所示. 所有采样点电场强度的最大值为13.26 V/m,最小值为0.10 V/m,平均值为1.69 V/m,中位值为1.50 V/m,标准差为1.25 V/m.

    图  1  电磁环境测试数据灰度图
    Fig.  1  Grayscale image of electromagnetic environment measurement data

    人口热力数据能够在某些地图软件(如本文采用的百度地图)中获取. 由于人口热力为实时数据,因此需在电磁环境测试的同时记录采样点的实时人口热力状况,图2为某时段五环路以内人口热力的一个示例. 实时人口热力将人群密度分为7个等级,从高到低利用颜色依次表示为:红色、橙色、黄色、绿色、蓝色、靛色、紫色.

    图  2  北京五环路以内实时人口热力示例
    Fig.  2  Example of real-time population heat within Beijing’s Fifth Ring Road

    建筑密度数据利用地理信息系统软件(如本文采用的ArcGIS)截取. 根据文献[20]的研究结果,人为电磁噪声水平与300 m范围内的房屋数量相关性最强,故本文将采样点为圆心、300 m为半径的范围内的建筑面积作为衡量采样点周围建筑密度的数据,图3所示为其中一个采样点的示意图. 对于采样点数目较多的情况,可通过编写Python脚本程序控制软件进行批量处理,从而批量获取每个采样点对应的建筑密度数据.

    图  3  建筑密度数据截取示意图
    Fig.  3  Schematic of building density data interception

    关联规则挖掘用于发现隐藏在大型数据集中的有意义的联系. 常用的两种经典关联规则挖掘算法为Apriori[21]、FP增长(Frequent Pattern Growth)[22],但由于算法处理的为二元型数据,不能直接用于分析本文数据. 因此,本文提出首先采用两步聚类法[23]将电场强度、人口热力、建筑密度的原始数据进行离散分级;再将离散分级后的数据进行二元化,从而生成事务矩阵;进而根据事务矩阵特点设置支持度、置信度和提升度阈值,并进行规则生成;最后通过规则筛选得到电磁环境与人口热力、建筑密度之间有意义的关联规则. 上述方法的流程图如图4所示,下面对其中的关键环节(数据离散、规则生成)进行详细阐述.

    图  4  本文关联规则挖掘方法流程图
    Fig.  4  Flowchart of association rule mining method in this paper

    由于电场强度、人口热力、建筑密度的原始数据分别为连续型、分级型、连续型数据,而非关联规则挖掘算法所处理的二元型数据,因此,需将原始数据进行离散分级. 本文采用聚类分析的方法进行数据分级,以使同一级内的数据相似性更强. 常用的聚类算法有K均值[24]、两步聚类等,本文采用两步聚类法的原因在于其既能处理连续型数据又能处理分级型数据,且善于处理海量数据.

    对电场强度、人口热力、建筑密度的原始数据首先进行预聚类形成若干簇,即逐一扫描数据并决定当前数据归属于已有簇或形成一个新簇,决定的判别通过计算当前数据与已有簇的距离是否小于阈值来实现. 对于电场强度、建筑密度这类连续型数据,所计算的距离为欧几里得距离;对于人口热力这类分级型数据,所计算的距离为对数似然距离. 完成预聚类后,接着通过计算簇与簇之间的距离将间距最小的簇合并,直至簇的数量降为3个,即电场强度、人口热力、建筑密度的原始数据 {{\boldsymbol{E}}_{n \times 1}} {{\boldsymbol{P}}_{n \times 1}} {{\boldsymbol{B}}_{n \times 1}} n=28 424)被离散分级为三级制(高、中、低)数据 {{\boldsymbol{E}}'_{n \times 1}} {{\boldsymbol{P}}'_{n \times 1}} {{\boldsymbol{B}}'_{n \times 1}} ,其中各级的取值区间如表1所示.

    表  1  三级制数据的取值区间
    Tab.  1  The value range of the three-level data
    级别电场强度/(V∙m−1)人口热力建筑密度/m2
    (3.50, 13.26]红、橙(43 222, 99 900]
    (1.52, 3.50]黄、绿(16 818, 43 222]
    (0, 1.52]蓝、靛、紫(0, 16 818]
    下载: 导出CSV 
    | 显示表格

    将三级制数据 {{\boldsymbol{E}}'_{n \times 1}} {{\boldsymbol{P}}'_{n \times 1}} {{\boldsymbol{B}}'_{n \times 1}} 二元化,能够得到用于关联规则挖掘算法的事务矩阵 {T_{n \times 9}} . 该矩阵的每一行代表一个采样点的数据,记为“事务”;矩阵的9列分别代表: {E}^{\prime }=高 {E}^{\prime }=中 {E}^{\prime }=低 {P}^{\prime }=高 {P}^{\prime }=中 {P}^{\prime }=低 {B}^{\prime }=高 {B}^{\prime }=中 {B}^{\prime }=低 ,记为“项”. 矩阵的元素由0和1组成:0代表“否”,即该项在对应的采样点中未出现;1代表“是”,即该项在对应的采样点中出现. 上述原始数据的离散分级并形成事务矩阵的过程以其中3个采样点为例示于图5中.

    图  5  原始数据离散分级并形成事务矩阵示意图
    Fig.  5  Schematic of discrete grading of raw data and formation of transaction matrix

    电场强度、人口热力、建筑密度的原始数据转换为二元型事务矩阵后,便能够采用经典关联规则挖掘算法Apriori、FP增长等进行规则生成. 本文采用FP增长算法的原因在于其使用事务数据集的压缩表示来有效地产生频繁项集,对于某些数据集,它的效率高于Apriori算法. 经典FP增长算法的核心思想是构造一种频繁模式树(Frequent Pattern Tree,以下简称“FP树”)的数据结构来产生频繁项集,以设定的阈值自底向上方式探索FP树来提取规则. 本文对其中的阈值设定环节进行改进以适用于不均衡数据集.

    首先,设置规则的支持度、置信度和提升度阈值. 规则的表达式记为 X \to Y ,其中XY为2.1节所述9个项中的一项或几项. 为避免规则的偶然性、保证规则的可靠性,通常采用以下三个参量对规则进行评估和筛选:支持度(s)、置信度(c)、提升度(l)。表达式如下:

    s\left( {X \to Y} \right) = {{\sigma \left( {X \to Y} \right)} \mathord{\left/ {\vphantom {{\sigma \left( {X \to Y} \right)} n}} \right. } n} (1)
    c\left( {X \to Y} \right) = {{\sigma \left( {X \to Y} \right)} \mathord{\left/ {\vphantom {{\sigma \left( {X \to Y} \right)} {\sigma \left( X \right)}}} \right. } {\sigma \left( X \right)}} (2)
    l\left( {X \to Y} \right) = {{c\left( {X \to Y} \right)} \mathord{\left/ {\vphantom {{c\left( {X \to Y} \right)} {s\left( Y \right)}}} \right. } {s\left( Y \right)}} (3)

    式中, \sigma (\cdot ) 表示计数,即同时包含括号内项集的事务(采样点)个数. 支持度评估规则前项和后项同时出现在事务矩阵中的频繁程度,置信度评估规则后项在包含规则前项的事务中出现的频繁程度,提升度评估规则前项和后项的相关性. 由式(1)~(3)可以得出,三个参量的取值范围分别为[0, \min \left\{ {s\left( X \right),s\left( Y \right)} \right\} ]、[0, 1]、[0, {1 \mathord{\left/ {\vphantom {1 {s\left( Y \right)}}} \right. } {s\left( Y \right)}} ],除置信度外,支持度和提升度的取值范围与具体规则有关. 现有研究通常将上述三个参量设置为固定的阈值进行规则挖掘,这对于分布不均衡的数据集(如本文电场强度级别高的数据远远少于电场强度级别低的数据)来说,容易遗漏规则或生成无意义规则,因此本文提出基于动态阈值的规则挖掘方法. 根据每条规则的前项和后项形成相应的支持度、置信度和提升度阈值,该阈值设置为三个参量取值范围中最大值的一半,即支持度阈值 {s_{\min }} = 0.5 \min \left\{ {s\left( X \right),s\left( Y \right)} \right\} ,置信度阈值 {c_{\min }} = 0.5 ,提升度阈值 {l_{\min }} = {{0.5} \mathord{\left/ {\vphantom {{0.5} {s\left( Y \right)}}} \right. } {s\left( Y \right)}} .

    然后,构建电场强度、人口热力、建筑密度的FP树. 扫描事务矩阵 {{\boldsymbol{T}}_{n \times 9}} ,以收集频繁项并计算其支持度(频繁项的支持度不小于smin),按支持度降序重新排列 {{\boldsymbol{T}}_{n \times 9}} ,记为D. FP树的根节点标记为null,对D中的每一个事务,记该事务为 \left[ {{d_{i1}}|{d_i}} \right] ,其中di1为第一个元素,di为剩余元素的列表,调用下列过程,记为 insert\_tree\left( {\left[ {{d_{i1}}|{d_i}} \right],\;t} \right) :如果t有子节点Ndi1为同一项,则N的计数加1;否则创建新节点N并令其计数为1,连接到其父节点t,且通过节点链结构将其连接到具有相同项名称的节点;如果di为非空,则递归调用 insert\_tree\left( {{d_i},\;N} \right) . 至此完成了FP树(记为tree)的构建.

    最后,利用电场强度、人口热力、建筑密度的FP树挖掘关联规则,挖掘过程如表2所示. 该过程产生的所有模式即为规则的完全集,再根据研究所关注的因素(如本研究关注包含电场强度的规则,而不关注仅包含人口热力和建筑密度的规则)及支持度、置信度和提升度阈值对每条规则进行筛选,从而最终得到电磁环境与人口热力、建筑密度之间的关联规则.

    表  2  基于FP增长的规则挖掘过程
    Tab.  2  Rule mining process based on FP-growth
    过程FP_growth(tree, α)
    if tree包含单个路径P then
    for 路径P中节点的每个组合(记为β
    生成模式\; \beta \cup \alpha (α初始为null),其支持度等于β中节点的最小支持度;
    else for tree首层中的每个ai
    {生成模式\; \beta = {a_i} \cup \alpha ,其支持度等于ai的支持度;
    构建β的条件模式基,再构建β的条件FP树treeβ
    if tre{e_\beta } \ne \emptyset then
    调用FP_growth(treeβ, β);}
    下载: 导出CSV 
    | 显示表格

    采用上述关联规则挖掘方法流程分析28 424个采样点的电场强度数据、人口热力数据、建筑密度数据,最终筛选出的关联规则如表3所示. 规则的支持度、置信度、提升度越高,代表规则项出现的越频繁、规则后项在前项存在的条件下出现得越频繁、规则前项和后项的相关性越强. 本文2.2节所提出的基于动态阈值的规则挖掘方法,能够避免遗漏规则或生成无意义规则,下面以支持度阈值为例进行说明. 由于包含 {E}^{\prime }=高 {E}^{\prime }=中 {E}^{\prime }=低 的采样点占比分别为6.4%、43%、50.6%,数据集不均衡度高,因此若将支持度阈值设置为固定值(如8%),则一方面遗漏了有意义的规则(如表3的规则1: {E}^{\prime }=高\to {P}^{\prime }=高 ,因其支持度5.4%小于固定阈值8%),另一方面生成了无意义的规则(如规则u: {E}^{\prime }=低、{B}^{\prime }= 中\to {P}^{\prime }=高 ,因其支持度9.8%大于固定阈值8%). 而采用本文提出的动态阈值方法,则不会出现上述问题,因为规则1对应的支持度阈值为3.2%,故将被保留;规则u对应的支持度阈值为14.7%,故将被放弃.

    表3中的规则首先按照包含 {E}^{\prime }=高 (规则1)、 {E}^{\prime }=中 (规则2、3)、 {E}^{\prime }=低 (规则4~10)的顺序排列,其次按照置信度进行降序排列. 从规则1可以看出,电场强度高的情况倾向于出现在人口热力高的区域. 从规则2、3可以看出,电场强度中等的情况也倾向于出现在人口热力高的区域;而建筑密度高的区域,其电场强度往往为中等. 从规则4~10可以看出,规则8涵盖了规则4,说明电场强度低的情况倾向于出现在建筑密度低的区域;规则5、6、7、10可归为一类,说明人口热力低或建筑密度低的区域,其电场强度往往为低等级;规则9说明人口热力中等的区域,其电场强度往往也为低等级.

    表  3  电磁环境与人口热力、建筑密度之间的关联规则
    Tab.  3  Association rules between electromagnetic environment and population heat and building density
    序号规则支持度/%置信度/%提升度
    1 {E}^{\prime }=高\to {P}^{\prime }=高 5.484.21.36
    2 {E}^{\prime }=中\to {P}^{\prime }=高 30.771.41.15
    3 {B}^{\prime }=高\to {E}^{\prime }=中 8.751.11.19
    4 {E}^{\prime }=低、{P}^{\prime }=低\to {B}^{\prime }=低 13.591.61.71
    5 {P}^{\prime }=低、{B}^{\prime }=低\to {E}^{\prime }=低 13.571.31.41
    6 {P}^{\prime }=低\to {E}^{\prime }=低 14.769.71.38
    7 {P}^{\prime }=低\to {E}^{\prime }=低、{B}^{\prime }=低 13.563.92.05
    8 {E}^{\prime }=低\to {B}^{\prime }=低 31.161.51.15
    9 {P}^{\prime }=中\to {E}^{\prime }=低 10.259.51.18
    10 {B}^{\prime }=低\to {E}^{\prime }=低 31.158.01.15
    下载: 导出CSV 
    | 显示表格

    综合上述规则的含义,能够将电磁环境与人口热力及建筑密度的关联关系概述为图6,即通过人口热力为黄、绿、蓝、靛、紫色的情况,或者建筑密度不超过16 818 m2的情况,可推断该区域的电场强度倾向处于0~1.52 V/m;通过建筑密度为43 222~99 900 m2的情况,可推断该区域的电场强度倾向处于1.52~3.50 V/m. 反过来,通过电场强度为0~1.52 V/m的情况,可推断该区域的建筑密度倾向于不超过16 818 m2;通过电场强度高于1.52 V/m的情况,可推断该区域的人口热力倾向于为红、橙色. 虽然上述关联关系未给出何种情况能够推断电场强度高于3.50 V/m,但对于电磁环境监测与风险预警具有重要启示,即电磁环境高风险的情况倾向于出现在人口热力极高的区域,宜将监测资源重点分布在这些区域。

    图  6  电磁环境与人口热力及建筑密度的关联关系概要图
    Fig.  6  Overview of the association between the electromagnetic environment and population heat and building density

    本研究的关联规则结果通过其他采样点的数据进行了验证。这些采样点位于北京城区西二环与西五环之间的阜成路-阜石路段,共568个,其电场强度、人口热力及建筑密度的测量结果如图7所示。经计算,人口热力为黄、绿、蓝、靛、紫色的采样点中,68.3%的采样点的电场强度处于0~1.52 V/m;建筑密度不超过16 818 m2的采样点中,60.9%的采样点的电场强度处于0~1.52 V/m;建筑密度为43 222~99 900 m2的采样点中,63.2%的采样点的电场强度处于1.52~3.50 V/m;电场强度为0~1.52 V/m的采样点中,64.0%的采样点的建筑密度不超过16818 m2;电场强度高于1.52 V/m的采样点中,75.8%的采样点的人口热力为红、橙色。上述结果与表3图6所表述的含义是一致的,从而验证了本研究得到的电磁环境与人口热力及建筑密度的关联规则。

    图  7  用于验证的采样点的数据结果
    Fig.  7  Data results for sampling points used for validation

    本文针对电磁环境与人口热力、建筑密度的关联规则挖掘研究,得出以下结论:1)电场强度为中等(1.52~3.50 V/m)、高(高于3.50 V/m)等级的情况,主要出现在人口热力高(红色、橙色)的区域;2)建筑密度高(高于43222 m2)的区域,其电场强度通常为中等等级;3)人口热力为中(黄色、绿色)、低(蓝色、靛色、紫色)等级的区域,或建筑密度低(低于16818 m2)的区域,其电场强度通常为低(低于1.52 V/m)等级;4)电场强度为低等级的情况,主要出现在建筑密度低的区域.

    上述研究结果一方面通过将电磁环境与人口热力、建筑密度建立关联,为电磁环境的快速估计提供了依据;另一方面为电磁环境监测点位的选取提供了参考,建议重点设置在人口热力极高的区域. 城市电磁环境监测是我国官方和诸多学者在持续进行的工作,监测点位的有效选取能够提高监测资源的利用率并最大程度避免对潜在风险的遗漏.

    本文的研究工作为数据挖掘理论应用于电磁环境方面的有益探索,此研究中的人口热力、建筑密度数据也可被替换或补充其他数据,如实时交通状况等,其方法流程也可运用到其他领域的关联分析. 此外,基于电磁环境与其他数据的关联规则挖掘,可进一步建立电磁环境预测的深度学习模型,从而能够实现对电磁环境更加精准的预测.

  • 图  1   电磁环境测试数据灰度图

    Fig.  1   Grayscale image of electromagnetic environment measurement data

    图  2   北京五环路以内实时人口热力示例

    Fig.  2   Example of real-time population heat within Beijing’s Fifth Ring Road

    图  3   建筑密度数据截取示意图

    Fig.  3   Schematic of building density data interception

    图  4   本文关联规则挖掘方法流程图

    Fig.  4   Flowchart of association rule mining method in this paper

    图  5   原始数据离散分级并形成事务矩阵示意图

    Fig.  5   Schematic of discrete grading of raw data and formation of transaction matrix

    图  6   电磁环境与人口热力及建筑密度的关联关系概要图

    Fig.  6   Overview of the association between the electromagnetic environment and population heat and building density

    图  7   用于验证的采样点的数据结果

    Fig.  7   Data results for sampling points used for validation

    表  1   三级制数据的取值区间

    Tab.  1   The value range of the three-level data

    级别电场强度/(V∙m−1)人口热力建筑密度/m2
    (3.50, 13.26]红、橙(43 222, 99 900]
    (1.52, 3.50]黄、绿(16 818, 43 222]
    (0, 1.52]蓝、靛、紫(0, 16 818]
    下载: 导出CSV

    表  2   基于FP增长的规则挖掘过程

    Tab.  2   Rule mining process based on FP-growth

    过程FP_growth(tree, α)
    if tree包含单个路径P then
    for 路径P中节点的每个组合(记为β
    生成模式\; \beta \cup \alpha (α初始为null),其支持度等于β中节点的最小支持度;
    else for tree首层中的每个ai
    {生成模式\; \beta = {a_i} \cup \alpha ,其支持度等于ai的支持度;
    构建β的条件模式基,再构建β的条件FP树treeβ
    if tre{e_\beta } \ne \emptyset then
    调用FP_growth(treeβ, β);}
    下载: 导出CSV

    表  3   电磁环境与人口热力、建筑密度之间的关联规则

    Tab.  3   Association rules between electromagnetic environment and population heat and building density

    序号规则支持度/%置信度/%提升度
    1 {E}^{\prime }=高\to {P}^{\prime }=高 5.484.21.36
    2 {E}^{\prime }=中\to {P}^{\prime }=高 30.771.41.15
    3 {B}^{\prime }=高\to {E}^{\prime }=中 8.751.11.19
    4 {E}^{\prime }=低、{P}^{\prime }=低\to {B}^{\prime }=低 13.591.61.71
    5 {P}^{\prime }=低、{B}^{\prime }=低\to {E}^{\prime }=低 13.571.31.41
    6 {P}^{\prime }=低\to {E}^{\prime }=低 14.769.71.38
    7 {P}^{\prime }=低\to {E}^{\prime }=低、{B}^{\prime }=低 13.563.92.05
    8 {E}^{\prime }=低\to {B}^{\prime }=低 31.161.51.15
    9 {P}^{\prime }=中\to {E}^{\prime }=低 10.259.51.18
    10 {B}^{\prime }=低\to {E}^{\prime }=低 31.158.01.15
    下载: 导出CSV
  • [1]

    WHO. Establishing a dialogue on risks from electromagnetic fields[EB/OL]. (2012-06-16)[2022-08-30]. https://www.who.int/publications/i/item/9241545712

    [2]

    ZHANG Y, ZHANG X, CHEN L, et al. Research on vehicle radiation immunity test method based on actual electromagnetic environment[C]// Joint International Symposium on Electromagnetic Compatibility and Asia-Pacific International Symposium on Electromagnetic Compatibility, Sapporo, 2019: 468-471.

    [3] 宋欣蔚, 岳云涛, 朱心月, 等. 北京市中心商区射频电磁环境测试与分析[J]. 中国环境监测,2021,37(4):135-142. doi: 10.19316/j.issn.1002-6002.2021.04.18

    SONG X W, YUE Y T, ZHU X Y, et al. Measurement and analysis of the radio-frequency electromagnetic environment in Beijing’s central business districts[J]. Environmental monitoring in China,2021,37(4):135-142. (in Chinese) doi: 10.19316/j.issn.1002-6002.2021.04.18

    [4] 赵其文, 艾克热木·艾力肯. 2013-2021年新疆乌鲁木齐市电磁环境水平调查与分析[J]. 干旱环境监测,2022,36(1):44-48. doi: 10.3969/j.issn.1007-1504.2022.01.009

    ZHAO Q W, AILIKEN A. Investigation and analysis of 2013 to 2021 electromagnetic environment level in Urumqi[J]. Arid environmental monitoring,2022,36(1):44-48. (in Chinese) doi: 10.3969/j.issn.1007-1504.2022.01.009

    [5] 李华琴, 宁健, 周雪, 等. 2008—2017年广州市一般环境射频综合场强监测结果分析探讨[J]. 环境保护与循环经济,2019,39(9):73-75. doi: 10.3969/j.issn.1674-1021.2019.09.018

    LI H Q, NING J, ZHOU X, et al. Analysis and discussion on the monitoring results of the overall environment radio-frequency comprehensive field strength in Guangzhou from 2008 to 2017[J]. Environmental protection and circular economy,2019,39(9):73-75. (in Chinese) doi: 10.3969/j.issn.1674-1021.2019.09.018

    [6] 段临林, 杨传俊, 唐超, 等. 厦门市电磁环境解析[J]. 中国环境监测,2018,34(2):122-129. doi: 10.19316/j.issn.1002-6002.2018.02.18

    DUAN L L, YANG C J, TANG C, et al. Preliminary studies on the electromagnetic environment of Xiamen city[J]. Environmental monitoring in China,2018,34(2):122-129. (in Chinese) doi: 10.19316/j.issn.1002-6002.2018.02.18

    [7]

    FOCKENS T, ZWAMBORN A, LEFERINK F. Measurement methodology and results of measurements of the man-made noise floor on HF in the Netherlands[J]. IEEE transactions on electromagnetic compatibility,2019,61(2):337-343. doi: 10.1109/TEMC.2018.2830512

    [8]

    BRETON D, HAEDRICH C, KAMRATH M, et al. Street-scale mapping of urban radiofrequency noise at VHF and UHF[J]. Radio science,2019,54(1):1-20. doi: 10.1002/rds.20695

    [9]

    KARPOWICZ J, MIGUEL-BILBAO S, RAMOS V, et al. The evaluation of stationary and mobile components of radiofrequency electromagnetic exposure in the public accessible environment[C]// International Symposium on Electromagnetic Compatibility-EMC EUROPE. Angers, 2017: 1-4.

    [10]

    SANTANA T A A, ANDRADE H D, JUNIOR I S Q, et al. Measurement campaign on the electromagnetic environment in the central region of the city of Mossoro[C]// SBMO/IEEE MTT-S International Microwave and Optoelectronics Conference. Aguas de Lindoia, 2017: 1-4.

    [11]

    SATO K, SUTO K, INAGE K, et al. Space-frequency-interpolated radio map[J]. IEEE transactions on vehicular technology,2021,70(1):714-725. doi: 10.1109/TVT.2021.3049894

    [12]

    LINHARES A, AZEVEDO A P, FERNANDES L C. Radio-frequency electromagnetic fields: simultaneous exposure to infinite sources from typical base stations[J]. IEEE antennas and propagation magazine,2022,64(3):52-58. doi: 10.1109/MAP.2021.3106829

    [13]

    THRANE J, ZIBAR D, CHRISTIANSEN H L. Model-aided deep learning method for path loss prediction in mobile communication systems at 2.6 GHz[J]. IEEE access,2020,8:7925-7936. doi: 10.1109/ACCESS.2020.2964103

    [14] 范明, 范宏建. 数据挖掘导论(完整版)[M]. 北京: 人民邮电出版社, 2018: 201-250.
    [15] 王圆春, 肖东, 林云, 等. 电磁频谱数据挖掘中的关联规则挖掘[J]. 电波科学学报,2022,37(5):802-809. doi: 10.12265/j.cjors.2021225

    WANG C Y, XIAO D, LIN Y, et al. Mining association rules for electromagnetic spectrum data[J]. Chinese journal of radio science,2022,37(5):802-809. (in Chinese) doi: 10.12265/j.cjors.2021225

    [16] 李爽, 刘海鹏, 郭兰图. 基于电磁环境数据的信息挖掘与关联分析[J]. 太赫兹科学与电子信息学报,2022,20(1):8-15. doi: 10.11805/TKYDA2021168

    LI S, LIU H P, GUO L T. Information mining and association analysis based on electromagnetic environment data[J]. Journal of terahertz science and electronic information technology,2022,20(1):8-15. (in Chinese) doi: 10.11805/TKYDA2021168

    [17] 李永志, 金芳. 基于海量频谱数据的电磁环境信息挖掘技术研究[J]. 无线通信技术,2021(1):58-61. doi: 10.3969/j.issn.1003-8329.2021.01.012

    LI Y Z, JIN F. Research on electromagnetic environment information mining technology based on mass spectrum data[J]. Wireless communication technology,2021(1):58-61. (in Chinese) doi: 10.3969/j.issn.1003-8329.2021.01.012

    [18] 国家环境保护局. 辐射环境保护管理导则 电磁辐射监测仪器和方法: HJ/T 10.2—1996[S]. 北京: 中国环境科学出版社, 1996: 441-453.
    [19] 环境保护部, 国家质量监督检验检疫总局. 电磁环境控制限值: GB 8702—2014[S]. 北京: 中国环境科学出版社, 2014: 2-4.
    [20]

    FOCKENS K, LEFERINK F. Correlation between measured man-made noise levels and the density of habitation[J]. IEEE transactions on electromagnetic compatibility,2020,62(6):2696-2703. doi: 10.1109/TEMC.2020.3001979

    [21]

    XIE D, WANG M, ZHAO X. A spatiotemporal apriori approach to capture dynamic associations of regional traffic congestion[J]. IEEE access,2020,8:3695-3709. doi: 10.1109/ACCESS.2019.2962619

    [22]

    ESSAM A, ABDEL-FATTAH M A, ABDELHAMID L. Towards enhancing the performance of parallel FP-growth on spark[J]. IEEE access,2022,10:286-296. doi: 10.1109/ACCESS.2021.3137789

    [23]

    SATISH S M, BHARADHWAJ S. Information search behaviour among new car buyers: a two-step cluster analysis[J]. IIMB management review,2010,22(1/2):5-15.

    [24]

    SINAGA K P, YANG M. Unsupervised K-means clustering algorithm[J]. IEEE access,2020,8:80716-80727. doi: 10.1109/ACCESS.2020.2988796

图(7)  /  表(3)
计量
  • 文章访问数:  145
  • HTML全文浏览量:  17
  • PDF下载量:  61
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-07-25
  • 网络出版日期:  2022-10-20
  • 刊出日期:  2023-10-30

目录

/

返回文章
返回