2025年, 第53卷, 第3期 刊出日期:2025-03-25
  

  • 全选
    |
    面向无人系统的智能视觉算法
  • 谷美颖, 李航, 张家伟, 百晓, 郑锦
    电子学报. 2025, 53(3): 651-685. https://doi.org/10.12263/DZXB.20240699
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着无人机(Unmanned Aerial Vehicle,UAV)成本的降低,无人机引起了越来越多的研究兴趣.其应用领域广泛,包括农业、消防、测绘、航拍以及娱乐应用.这些应用需要无人机在精准的自我定位下进行自主飞行,通常高度依赖于全球导航卫星系统(Global Navigation Satellite System,GNSS).然而,GNSS在长距离无线电通信方面存在多种缺陷(如非视距接收、多路径效应、欺骗信号),这推动了补充或取代卫星导航新方法的发展.基于视觉的无人机定位与导航方法利用无人机搭载的视觉传感器,实现自主定位与导航,成为解决这一问题的重要途径.本文的贡献在于系统性地梳理了基于视觉的无人机定位与导航技术,全面总结了该领域的研究现状和发展趋势.首先,介绍了无人机视觉定位的方法,主要分为图像检索和图像匹配两类,并对其技术特点、适用场景以及相关数据集和评价指标进行了分析.其次,详细阐述了无人机视觉导航的方法,根据导航功能的不同分为障碍物检测与规避方法以及路径规划方法,揭示了现有技术的优势和局限.最后,进一步讨论了基于视觉的无人机定位与导航方法在公共可用数据集、硬件加速、环境复杂性、实时性要求、能源限制以及模拟器到真实世界的泛化等方面可能面临的挑战.

  • 汪进中, 戴顺, 张秀伟, 田雪涛, 邢颖慧, 汪芳, 尹翰林, 张艳宁
    电子学报. 2025, 53(3): 686-704. https://doi.org/10.12263/DZXB.20240602
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于无人机(Unmanned Aerial Vehicle,UAV)平台的可见光(Red Green Blue,RGB)和热红外(Thermal infrared,T)多源目标检测,可实现全天时、全天候的目标侦察,在军用和民用领域有着重要的应用价值.受限于数据拍摄获取和处理的复杂性,当前少有公开的UAV视角RGB-T多源目标检测数据集,一定程度上限制了UAV视角RGB-T多源目标检测算法的研究和应用.与此同时,UAV应用场景复杂多变,其飞行高度、速度、焦距和背景等快速变化,所拍摄目标在图像上呈现出尺度多样、稠密/稀疏分布不均衡、类别不平衡等特点,具有一定的挑战性.此外,在诸如目标侦察、交通监控等高时效性应用场景中,算法需在保证高精度的同时实现实时目标检测,因此,算法的设计必须充分考虑精度与速度之间的平衡.针对上述问题,本文构建了一个跨季节、跨昼夜、多类别、多尺度的大规模UAV视角RGB-T多源图像数据集UAV-RGBT,包含20个类别、5 117对RGB-T图像和超11万个标注,有助于推进UAV视角多源目标检测算法的研究.同时,基于YOLOv8n模型,本文提出了一种UAV视角多源目标检测(UAV-based Dual-branch Multispectral object Detection,UAV-DMDet)模型,其通过多源交叉注意力融合和多源特征分解组合方法有效促进了多源特征的深度融合,较好地实现了模型参数量、检测速度和检测精度的均衡.实验结果表明:在UAV-RGBT数据集上,UAV-DMDet模型较单源YOLOv8n模型,在RGB和T模态方面,mAP@0.5分别提高了3.61%、11.03%,mAP@0.5:0.95分别提高了0.84%、6.76%;在DroneVehicle数据集上,mAP@0.5和mAP@0.5:0.95较主流算法I2MDet提高了2.66%和12.36%;在检测速度方面,以640 × 640分辨率图像为例,UAV-DMDet模型在单张GeForce RTX 3090显卡上FP32精度推理速度可达31帧/s,在华为昇腾710处理器上FP16精度推理速度可达58帧/s,可有效应用于UAV视角RGB-T多源实时目标检测任务.

  • 陈进朝, 王洋, 张营, 尤涛, 卢岩涛, 杜承烈
    电子学报. 2025, 53(3): 705-715. https://doi.org/10.12263/DZXB.20240258
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    覆盖路径规划是无人机集群实现搜索、搜救等全面探测性任务的关键技术之一.当前研究往往只关注单一区域内飞行路径的设计与优化,而较少能在多区域环境中依据无人机的性能实现区域的合理分配和区域间路径的高效寻优.同时,现有方法大多采用同构无人机集群来执行覆盖路径规划任务,忽略了无人机个体的能力差异,致使集群资源利用率不足且难以适应任务与环境的不确定性变化.本文聚焦于异构无人机集群在多区域上的覆盖路径规划问题.首先,构建了具有异构特性的无人机模型,分析了覆盖路径规划问题的路径要求和能耗约束,并以最小化任务完成时间为目标,给出了基于混合整数线性规划的精确求解公式,以获得无人机集群的最佳飞行路径方案.随后,进一步提出了一种基于时空密度聚类的启发式算法来提高覆盖路径规划问题的求解效率,依据区域在时间和空间上的密度进行汇聚,形成各个无人机待覆盖的区域簇,并优化簇内区域间的覆盖顺序和区域内的扫描路径,以保证覆盖任务的高效完成.实验结果表明,所提出方法可在较短时间内产生有效的飞行路径,且路径长度可缩短10.55%、任务完成时间可降低5.47%.

  • 杨维静, 徐瑞, 顾浩文, 陈涛, 舒祥波, 姚亚洲
    电子学报. 2025, 53(3): 716-727. https://doi.org/10.12263/DZXB.20240357
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,导致最终分割精度较低.为此,本文提出一种伪标签去噪和SAM优化(Pseudo-label Denoising and SAM Optimization,PDSO)方法以解决大规模无监督语义分割问题.本文设计了一种基于去噪的特征微调模块,在基于小损失准则从大规模数据集中筛选出具有干净图像级伪标签的潜在样本后,利用这些干净样本对预训练的主干网络进行微调,使网络获得更稳健的类别表示.为了进一步减少伪标签中的类别噪声,设计了一种基于聚类的样本去噪模块,根据类别占比和样本与聚类中心之间的距离来去除干扰聚类任务的噪声样本,从而提升聚类性能.本文还设计了一种SAM提示优化模块,根据聚类距离识别出图像中的活跃类别,以过滤噪声目标,并将点和框作为SAM的目标提示信息,生成预期的目标掩膜以细化伪标签中目标的边缘.实验结果表明,在大规模语义分割数据集ImageNet-S50、ImageNet-S300和ImageNet-S919的测试集上,本文方法在平均交并比指标上分别达到了45.0%、26.6%和14.5%,显著提高了分割目标的类别准确率和边缘精度.

  • 伍瀚, 孙浩, 计科峰, 匡纲要
    电子学报. 2025, 53(3): 728-743. https://doi.org/10.12263/DZXB.20240727
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    多无人机多目标跟踪旨在从多架无人机同时捕获的视频中预测所有目标的轨迹和身份标识,以解决单个无人机视频受遮挡和杂乱背景等干扰时跟踪性能衰退的问题.然而,不同无人机捕获的图像视角和尺度差异通常较大,导致对齐和融合不同无人机图像特征困难.针对该问题,本文提出一种通过时序信息引导跨视角特征融合的跟踪算法——TCFNet.该算法首先设计一种目标感知的对齐网络(Object-aware Alignment Network,OAN),利用跟踪过程中的目标轨迹先验估计先前时刻不同视角无人机视频帧间的转换关系.其次,构建一种时序感知的对齐网络(Temporal-aware Alignment Network,TAN),探索前后时刻同一架无人机捕获图像的信息对不同视角图像的转换关系进行精调.最后,基于OAN和TAN估计的不同无人机图像间的转换关系,设计一个跨机特征融合网络(Cross-drone Feature Fusion Network,CFFN)对不同无人机捕获的视觉信息进行融合,解决复杂场景下模型跟踪性能衰退的问题.在MDMT数据集上的实验结果表明,所提出的TCFNet相比其他主流的跟踪方法更具竞争力,在跟踪准确率、识别F1值和多机目标关联分数上超出当前的先进算法2.23、1.67和2.15个百分点.

  • 柴蓉, 王丙燕, 孙瑞锦, 景小荣
    电子学报. 2025, 53(3): 744-753. https://doi.org/10.12263/DZXB.20240656
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    本文针对多天线无人机(Unmanned Aerial Vehicle,UAV)辅助的通信感知一体化场景,综合考虑目标感知及用户通信性能,定义系统成本函数为系统能耗与用户速率的加权和,将通信感知调度、感知预编码设计以及UAV飞行轨迹优化问题建模为一个满足约束条件的系统成本函数优化问题.由于所建模优化问题为一个变量高度耦合且非凸的混合整型优化问题,难以直接求解,本文将原优化问题拆分为三个子问题,即UAV飞行轨迹优化子问题、通信感知调度子问题和雷达感知预编码子问题,并提出一种迭代嵌套方法来求解这些子问题.针对UAV飞行轨迹优化子问题,将其建模为马尔可夫决策过程(Markov Decision Process,MDP),并提出一种基于双重深度Q网络的UAV轨迹优化算法.对于给定的MDP系统状态,采用拉格朗日对偶变换方法和二次变换方法求解通信感知调度子问题,并通过引入辅助变量及约束条件等价转换方法求解雷达感知预编码子问题.基于所得到的通信感知调度策略和雷达感知预编码,更新MDP奖励函数,确定UAV飞行轨迹,以迭代实现通信感知调度策略、感知预编码设计及UAV飞行轨迹的联合优化.最后,通过仿真验证了本文所提算法的有效性.

  • 学术论文
  • 陈佳, 刘上, 郜帅, 黄旭, 张宏科
    电子学报. 2025, 53(3): 754-764. https://doi.org/10.12263/DZXB.20240512
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着全息技术的发展,全息通信在教育、娱乐和医疗等多个领域展现出广泛的应用前景.然而,现有的网络资源调度方法难以满足全息通信大带宽、低时延和数据同步的传输需求.智算融合网络具有原生的网内计算(in-network computing)能力,可以在数据包传输中对数据进行计算和优化,从而减少传输时延和网络带宽压力.本文根据前期的智融标识网络技术,研究面向全息通信的智算融合网络,提出基于业务标识、资源链标识、网络功能标识和网络组件标识的标识映射方法,实现全息业务到计算、存储和转发等多样化资源的自适应调度.基于标识映射方法,本文进一步设计了全息通信智算融合网络系统.实验结果表明,与传统边缘计算方法相比,面向全息通信的智算融合网络能够降低全息通信业务60%的网络带宽压力和45%的传输时延,同时提供更灵活的网络资源调度能力.

  • 习宁, 周晓琳, 孙聪, 李乔杨, 马建峰, 郭鑫玉
    电子学报. 2025, 53(3): 765-781. https://doi.org/10.12263/DZXB.20240890
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    作为信息物理系统(Cyber-Physical Systems,CPS)的典型设备之一,无人机使用方便、对作业环境要求低、灵活性强,已广泛应用于农业、工业、军事等领域.其中,飞行控制系统是无人机核心基础服务,保障无人机遥测感知、通信覆盖、测绘救灾等应用的有效执行.但多变的物理环境、复杂的功能结构使无人机飞行控制系统在开发过程中容易引入各类软件安全问题,导致无人机发生劫持、坠毁、失控等严重问题.如何检测无人机飞控软件系统的安全问题变得非常重要.现有的大多数无人机异常检测技术依靠数字世界构造输入,难以及时发现无人机逻辑安全的问题,本文提出一种支持物理交互的无人机飞控软件安全检测方法,将静态与动态分析方法相结合,用模糊测试方法对无人机飞行控制软件的安全性进行测试,结果表明该方法能够以97%的高覆盖率对无人机飞控任务进行安全检测,并根据测试结果进行无人机特征数据提取,基于该特征数据采用机器学习的方法训练出双重异常检测模型,在多组数据集上与现有检测方法进行对比,本文方法达到发现无人机异常状况97.5%的准确率,有效检测出无人机飞控软件系统中的已知安全问题.

  • 尹佳媛, 吴简, 邓敬亚, 周世钢, 曹新月
    电子学报. 2025, 53(3): 782-789. https://doi.org/10.12263/DZXB.20240447
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    本文提出了一种可提高增益并在宽边进行连续波束扫描的慢波基片集成波导周期性漏波天线.带有贴片的周期性盲孔组成的慢波结构可降低电磁波在基片集成波导中传播的相速度,导波波长可因此减少50%.与一般的基片集成波导周期漏波天线相比,这样的慢波基片集成波导周期漏波天线中相邻辐射单元之间的距离可减少一半,使得相同长度的慢波基片集成波导周期漏波天线中辐射单元的数量增加一倍.因此,慢波基片集成波导周期漏波天线的辐射效率和增益可以显著提高.此外,由于辐射单元下方慢波结构的贴片被延长,辐射单元的阻抗匹配被改善,反射波被抑制,在边射方向不存在开阻带.因此,辐射波束可以从后向到前向连续扫描.对所提出的天线进行了制作和测试,在13.4~15.4 GHz工作频率范围内,扫描角度达到72.7°,最大增益为8.47 dBi.测试结果与仿真结果十分吻合.

  • 赵文浒, 王嘉祥, 胡致远, 苏开明, 李铁, 杨卓青
    电子学报. 2025, 53(3): 790-799. https://doi.org/10.12263/DZXB.20240975
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    呼吸作为维持生命的关键生理过程,与呼吸暂停、哮喘等多种呼吸系统疾病密切相关.为了满足日益增长的健康监测需求,本文创新性地提出了一种集成柔性撑鼻器的双通路可穿戴MEMS(Micro-Electro-Mechanical Systems)呼吸监测微系统.该微系统集成了柔性撑鼻器、呼吸传感器和信号处理模块,能够持续实时监测鼻腔内气流.传感器的敏感单元采用折叠式金属电阻结构,通过平面MEMS技术沉积在玻璃基底上,基于热阻效应,实现信号测量.传感器嵌入柔性撑鼻器后,可同时监测鼻腔内左右两侧的呼吸信号,尤其适合长时间连续监测.通过信号模拟及性能测试,结果表明该传感器在灵敏度、响应速度和抗干扰能力上表现出色,并且在模拟呼吸暂停和哮喘等疾病的测试中,传感器能够准确区分正常与异常的呼吸信号,可用于进一步分析各种呼吸疾病.基于此,本文开发了一种集成柔性撑鼻器的双通路可穿戴MEMS呼吸监测装置,旨在实现连续、实时且长时间的呼吸监测,特别适用于睡眠期间的异常呼吸筛查与健康监控.此外,该系统还能捕捉人体鼻周期的变化信息,为深入分析呼吸模式和生理节律提供了新的数据维度,展现了在长期健康管理中的潜在应用价值.

  • 俞冯, 李卫, 任青颖, 李金泽, 许巍, 许杰
    电子学报. 2025, 53(3): 800-810. https://doi.org/10.12263/DZXB.20240987
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    通过第一性原理计算,利用优化几何结构和计算相应的电子性质,文章系统分析了NO2、NO、CO、CO2、CH4和SO2等分子在Ge掺杂磷烯材料表面的吸附性能,吸附分子在材料表面的吸附位置,确定最稳定的吸附构型.研究发现,Ge掺杂磷烯材料对NO2、NO、CO、CO2、CH4和SO2等分子表现出较高的吸附能力,表明其在气体分子吸附领域具有潜在的应用前景.此外,研究分析Ge掺杂对材料电子结构的影响,结果表明,Ge掺杂引入了新的能级,影响了材料的导电性质,从而影响了吸附分子与材料之间的相互作用,这为进一步理解Ge掺杂磷烯材料吸附气体分子的机制提供了理论基础.综合而言,本研究揭示了Ge掺杂磷烯材料在吸附NO2、NO、CO、CO2、CH4和SO2等气体分子方面的优越性能,并为其在气体吸附及其他相关应用中的潜在应用提供了理论支持,对于开发新型高效吸附材料以解决环境和能源领域的问题具有重要意义.

  • 吴海洋, 余宁梅
    电子学报. 2025, 53(3): 811-820. https://doi.org/10.12263/DZXB.20240624
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    乙醇蒸汽因易挥发和易燃性可能会带来安全隐患,对其进行实时监测至关重要.然而,目前改善SnO2乙醇传感器性能的方法往往不利于器件的小型化.为此,论文设计了一种具有场效应管结构的本征SnO2乙醇传感器,采用磁控溅射法制备了敏感膜,系统研究了栅压对传感器气敏性能的调控作用.实验结果表明,溅射法制备的SnO2传感器为 n沟道耗尽型器件.气敏测试显示,在不同工作栅压下,传感器的响应存在显著差异:当栅压为10 V时,传感器在100 ppm乙醇中电流变化为2.40倍;而在-30 V栅压下,沟道电流变化显著增强至3.42倍,比10 V时提高了42%.进一步研究发现,SnO2的气敏特性来源于乙醇分子的表面吸附对沟道中载流子浓度的调制作用.这一效应在负栅压下显著增强,而在正栅压下被抑制.然而,10 V正栅压通过在沟道中诱导产生更多电子,有效加速了乙醇的吸附与解吸过程,使传感器对100 ppm乙醇的响应和恢复时间分别缩短至8 s和17 s,展现出更快的动态特性.论文研究结果表明,乙醇蒸汽在SnO2表面发生反应的程度和速率都受到传感器栅压的显著调控.该研究为优化SnO2传感器的气敏性能提供了新思路,有助于进一步推动其在微型化、快响应、高精度气敏检测领域的应用.

  • 蒋伟进, 杜熙晨, 蒋意容, 杨璇, 聂彩燕, 刘茜
    电子学报. 2025, 53(3): 821-835. https://doi.org/10.12263/DZXB.20240946
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着工业化和城市化的快速发展,环境监测的重要性日益凸显,然而传统监测方法受限于高昂成本、布局困难和维护挑战,难以实现全面和实时的监测.群智感知作为一种新兴的环境监测方法,利用广泛使用的高度智能设备和集成传感器进行环境数据的大规模收集和实时传输.但现有研究很少同时考虑到数据隐私保护、工作平衡以及系统成本,导致在实际应用中难以达到预期效果.为解决这一问题,本文提出一种能适用于环境监测群智感知的低成本、高效率方法(Adaptive Federated Learning based Crowd Sensing algorithm for Environmental Monitoring,AFL-CSEM).具体而言,考虑系统中的资源限制、设备异构性和数据非独立同分布等挑战,本文结合群智感知与联邦学习技术进行了系统建模,在用户设备上进行本地模型训练,仅共享模型参数,有效保护数据隐私;进行系统的收敛性分析,得到基于联邦学习的群智感知算法在非独立同分布数据分布下的收敛界限;为了减少设备异构性影响,依据收敛性分析的结果,设计一种自适应控制方法,动态调整局部更新频率和批大小,以适应异构与动态的监测环境.通过在真实数据集上的比较,所有实验结果一致证明了本文所提出算法的有效性,AFL-CSEM算法在减少计算和通信开销、降低经济成本的同时,提升了模型训练的效率与精度,为环境监测领域的群智感知提供了一种新颖且具有参考价值的解决方案.

  • 徐欣, 甘志刚, 叶天语
    电子学报. 2025, 53(3): 836-848. https://doi.org/10.12263/DZXB.20240193
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    本文提出一种基于类GHZ态与Bell态纠缠交换的半量子隐私比较(SemiQuantum Private Comparison,SQPC)协议,在不泄露两个半量子通信者隐秘信息的前提下借助半忠诚第三方(Third Party,TP)正确地比较出隐秘信息的相等性.半忠诚TP被假定可以发起任何攻击,但不能与她人合谋.本文详细证明了该协议针对外部窃听者的攻击具备完全鲁棒性,并且分析了该协议针对内部不诚实参与者具备安全性.本文还通过IBM的Qiskit对该协议的流程和输出正确性进行实验仿真.

  • 谢丽霞, 魏晨阳, 杨宏宇, 胡泽, 成翔
    电子学报. 2025, 53(3): 849-863. https://doi.org/10.12263/DZXB.20240746
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现有恶意软件检测方法缺乏对样本特征的有效提取、过度依赖领域专家知识和运行行为监控,导致严重影响检测分类性能的问题,提出一种基于多维度动态加权alpha图像融合与特征增强的恶意软件检测方法.通过无效样本清洗与异常值处理获得标准化样本集,利用三通道图像生成与多维度动态加权alpha图像融合方法生成高质量融合图像样本.采用傀儡优化算法进行数据重构,减少因数据类不平衡对检测结果造成的影响,并对重构数据样本进行图像增强.通过基于双分支特征提取与融合通道信息表示的空间注意力增强网络,分别提取图像特征和文本特征并进行特征增强,提高特征表达能力.通过加权融合的方法将增强的图像特征与文本特征进行融合,实现恶意软件家族的检测分类.实验结果表明,本文所提方法在BIG2015数据集上的恶意软件检测分类准确率为99.72%,与现有检测方法相比提升幅度为0.22~2.50个百分点.

  • 田甜, 王苗苗, 李成龙, 巩敦卫
    电子学报. 2025, 53(3): 864-877. https://doi.org/10.12263/DZXB.20240741
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    变异测试通过注入变异算子生成变异体模拟软件中的潜在缺陷,是提高软件质量的关键技术.大量变异体及其执行成本制约着变异测试的研究进展和在工业领域的应用.选择有效的变异算子是减少变异体数量的主要途径.针对分布存储并行程序,本文提出变异算子有效性评价准则.从顽固变异体、崩溃变异体和等价变异体3个方面对变异体进行分类;基于不同变异体对测试数据质量的影响,定义变异算子有效性评价准则,分析不同变异算子的有效性.实验结果表明,使用本文提出的评价准则能够选择合理的变异算子,基于这些变异算子能够生成更多的有效变异体和尽可能少的无效变异体,在保持变异测试有效性的前提下,平均减少了22.61%的变异体,提高了变异测试效率.

  • 张朋飞, 翟睿辰, 程祥, 张治坤, 刘西蒙, 王杰
    电子学报. 2025, 53(3): 878-894. https://doi.org/10.12263/DZXB.20240938
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为空间众包中的工人分配任务是后续收集位置相关数据的重要前提.为了应对可能的位置隐私泄露问题,研究者往往结合地理不可区分性进行保护.现有满足地理不可区分性的任务分配方法通常针对一对一场景,其研究目标一般集中在最小化平均旅行距离,而不是最大化任务分配数量;同时,它们假设工人能分配去执行任意的任务.此外,这些研究往往结合平面拉普拉斯机制实现地理不可区分性.上述机制的随机性和无界性会导致工人上传的位置数据包含过量噪音,进而降低任务分配的效用,导致工人平均旅行距离较大或者任务无法完全分配.为解决以上问题,本文提出满足地理不可区分性的偏好感知多对多任务分配算法MONITOR(Many-to-many task allOcation under geo-iNdIsTinguishability for spatial crOwdsouRcing).该算法主要思想是对工人的偏好任务进行分组加噪并上传工人真实位置到模糊偏好任务位置之间的距离以代替直接上传工人的模糊位置.在MONITOR中,为了收集任务分配必需的工人到任务的距离信息,设计了基于分组的模糊距离收集方法GroCol(Group-based obfuscated distance Collection);同时为了提高任务分配的效用,设计了参数无关的模糊距离比较方法ParCom(Parameter-free obfuscated distance Comparison).此外,本文进一步从理论上分析了MONITOR的隐私、效用和复杂度.在2个真实数据集和1个模拟数据集上的实验结果表明MONITOR取得与非隐私任务分配类似的任务分配数量,且较基准方法的旅行距离降低了20%以上.

  • 李波, 李泽超, 邢鹏, 唐金辉
    电子学报. 2025, 53(3): 895-909. https://doi.org/10.12263/DZXB.20240733
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    异常检测是一项重要的计算机视觉任务,它的目标是检测异常样本同时定位异常区域.近期,主流的无监督异常检测方案通常基于蒸馏方法和重构方法.然而,它们仍存在相似的局限.在基于蒸馏方法的异常检测中,学生网络通常能学习到教师网络相似的表征能力,无法针对某些异常区域产生与教师网络有明显差异的表征.在重构模型中,编码-解码结构容易学习到简单的复原捷径,导致复原图像与输入相似,无法有效地检测异常.为了解决上述挑战,本文提出基于双向约束蒸馏的无监督图像异常检测方法 𝒩 -Net,它通过双向蒸馏模块和多级过滤模块缓解了上述局限.具体地,在教师学生网络中,本文首先提出蒸馏适应域特征而非原始域特征,它通过双向蒸馏分支保证了正常适应域特征的高效对齐.然后,本文提出多级过滤模块,通过查询和压缩的方式过滤异常特征,进一步增强学习正常语义特征分布的能力,提升异常检测性能.最后,本文在两个基准异常检测数据集MVTec和VisA上进行了大量实验,结果表明所提方法在异常检测和定位任务上取得了先进的性能.

  • 方鑫, 陈柘, 刘占文, 李小鹏, 宿雨心
    电子学报. 2025, 53(3): 910-925. https://doi.org/10.12263/DZXB.20240713
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    可见光热红外(RGB and Thermal infrared,RGBT)跟踪是一种结合了可见光和热红外光两种不同传感器信息的多模态目标跟踪方法.这种方法旨在克服单一传感器在特定环境下的局限性,通过融合多种传感器的数据来提高目标跟踪的鲁棒性和准确性.然而,在现有的RGBT跟踪算法中,大多将可见光与热红外图像提取的特征直接进行融合,忽略了两种模态间的同质性与异质性.此外,RGBT跟踪还经常受到目标快速运动、尺度变化、光照变化、热交叉和遮挡等多种挑战因素的影响,现有工作往往是通过研究单一结构来同时解决所有问题,但这需要足够复杂的模型和足够多的训练数据.本文提出了一种新的面向不同挑战并结合多模态同异质信息分离与融合的网络,用于RGBT跟踪.在该网络的每层主干中都设计了一个挑战感知模块用于融合每种挑战下来自可见光与热红外两种不同模态的特征,并自适应地聚合所有挑战下的融合特征.此外,还加入了注意力增强模块及多尺度辅助模块对主干网络所提取的特征进行增强.最后根据可见光与热红外的同质性与异质性,分别提取它们的特有特征与共有特征并进行自适应融合.在GTOT、RGBT234和LasHeR数据集上的大量实验表明,与现有RGBT跟踪方法相比,本文提出的跟踪器显示出非常强的竞争力.

  • 李悦洲, 牛玉贞, 李富晟, 柯逍, 施逸青
    电子学报. 2025, 53(3): 926-940. https://doi.org/10.12263/DZXB.20240375
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    暗光场景下拍摄的图像容易受暗光、噪声、模糊等多种退化因素的影响,导致其内容可视度低且视觉观感较差.多退化的暗光图像对现有图像增强方法提出了挑战:一方面,暗光图像增强或去模糊等方法不能涵盖所有的退化类型,而组合使用已有方法的效果受到计算开销增加与误差累积的限制;另一方面,已有多退化暗光图像增强方法采用了先提升亮度再去除模糊的策略,这种顺序处理方式会增加特征线索丢失的风险,不利于细节复原.为应对上述挑战,本文提出渐进式边缘感知交互增强网络(Progressive Edge-aware Interactive Enhancement Network,PEIE-Net),以逐步增强的方式减少图像增强过程中特征细节的丢失.具体来说,该网络由图像增强分支与边缘预测分支组成.在图像增强分支的每个增强阶段中,设计自注意力调制预测模块提取全局信息,用于对通道调制模块和多尺度复原模块进行自适应调制.在边缘预测分支中,设计空频域特征变换模块提取边缘感知信息,既用于预测高质量图像的边缘,又与图像增强分支的特征进行融合,以此模拟人类视觉系统在不同感知之间的交互.此外,本文还提出了场景亮度估计损失对多个渐进式增强阶段进行协调.在合成与真实数据集上的实验验证了本文方法在增强暗光、噪声、模糊退化图像方面的有效性与先进性,并可用于暗光图像增强与超分辨率任务.

  • 康冉斓, 李玉榕, 史武翔, 李吉祥
    电子学报. 2025, 53(3): 941-950. https://doi.org/10.12263/DZXB.20240885
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为解决传统基于脑电信号(ElectroencEphaloGraphy,EEG)的单模态脑机接口(Brain-Computer Interface,BCI)技术存在的空间分辨率低、易受噪声干扰等问题,越来越多的研究开始关注基于EEG信号和功能近红外光谱(functional Near-InfRared Spectroscopy,fNIRS)信号融合的BCI研究.然而,这两种异构信号之间的融合具有挑战性,本文创新性地提出一种基于深度学习和证据理论的端对端信号融合方法,用于运动想象(Motor Imagery,MI)分类.对于EEG信号,本文通过双尺度时间卷积和深度可分离卷积提取其时空特征信息,并引入混合注意力模块以增强网络对重要特征的感知能力.对于fNIRS信号,本文通过全通道的空间卷积探索大脑不同区域之间的激活差异,并通过并联时间卷积和门控循环单元(Gated Recurrent Unit,GRU)模块捕获更丰富的时间特征信息.在决策融合阶段,首先将两种信号分别解码得到的决策输出利用Dirichlet分布参数估计,以量化不确定性;然后使用Dempster-Shafer理论(Dempster-Shafer Theory,DST)进行双层推理,从而融合来自两种基本信念分配(Basic Belief Assignment,BBA)方法和不同模态的证据,得到最终的分类结果.本文基于公开数据集TU-Berlin-A进行模型的测试评估,获得了83.26%的平均准确率,相较于最先进研究提升了3.78个百分点,该结果为基于EEG和fNIRS信号的融合研究提供了新的思路和方法.

  • 周涛, 牛玉霞, 叶鑫宇, 刘隆, 陆惠玲
    电子学报. 2025, 53(3): 951-961. https://doi.org/10.12263/DZXB.20240642
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于深度学习的三维多模态正电子发射型断层扫描/计算机断层扫描(Positron Emission Tomography/Computed Tomography,PET/CT)肺部肿瘤识别是一个重要的研究方向.肺部肿瘤病灶的空间形状不规则、与周围组织边界模糊,导致模型难以充分提取肿瘤特征,且模型在三维任务中需要较高的计算复杂度.针对上述问题,本文提出一种跨模态Light-3Dformer的三维肺部肿瘤识别模型.本文的主要创新工作有以下几个方面.首先,采用主、辅网络结构,其中主干网络提取PET/CT图像特征,辅助网络提取PET图像和CT图像特征,并采用轻量化跨模态协同注意力实现多模态特征增强和交互式学习.其次,设计Light-3Dformer模块,在该模块中,将Transformer的2次矩阵乘法操作更新为全局注意力机制Lightformer的线性元素乘法操作;设计级联Lightformer结构,其输出特征图和最初的输入特征图融合,通过并行和融合更多的深浅层特征,可以实现轻量化和提取丰富的梯度信息;设计无参数的注意力,该机制能从通道、空间和断层3个方面增强肺部肿瘤特征提取能力.再次,设计轻量化跨模态协同注意力模块(Light Cross-modal Collaborative Attention Module,LCCAM),该模块能充分学习三维多模态影像的跨模态优势信息,对深浅层特征进行交互式学习.最后,进行消融实验和对比实验,在自建的肺部肿瘤三维多模态数据集中,本文模型在计算量和运行时间最优的前提下,准确率和曲线下面积(Area Under the Curve,AUC)值分别达到90.19%和89.81%,与3D-SwinTransformer-S模型相比,参数量降低117倍,计算量降低400倍.实验结果表明:本文模型能更好地提取肺部肿瘤病灶的多模态信息,这为深度学习三维模型轻量化和多模态交互提供了新思路.

  • 刘颖, 薛家昊, 张伟东, 许志杰
    电子学报. 2025, 53(3): 962-973. https://doi.org/10.12263/DZXB.20240754
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为提高卷积神经网络图像分类精度的同时实现网络轻量化,本文提出一种基于坐标重要性池化和解耦类别对齐蒸馏的图像分类算法.首先,设计一种坐标重要性池化模块并将其嵌入ResNet34,充分利用图像像素的位置信息,以增强其判别重要性特征的能力;其次,采用BlurPool缓解在下采样过程中移位等变性丢失对网络性能的影响,以此构建教师网络;最后,构造一种解耦类别对齐蒸馏算法,分别考虑目标类和非目标类的知识并引入类别之间的关联信息,以高效地将分类知识从教师网络迁移到轻量级MobileNetV3学生网络.在不同数据集上的实验结果表明,本文提出的教师网络有效提高了分类性能,且蒸馏训练后的学生网络明显优于其他同量级网络,实现了更优越的综合性能,能够更好地应用于计算和内存资源受限的实际场景.

  • 陈平平, 林虎, 陈宏辉, 谢肇鹏
    电子学报. 2025, 53(3): 974-985. https://doi.org/10.12263/DZXB.20240919
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    在复杂自然场景的端到端文本识别中,由于文本和背景难以区分,文本检测的位置信息和识别的语义信息不匹配,无法有效利用检测和识别之间的相关性.针对该问题,本文提出双域感知下多方显式信息协同的自然场景端到端文本识别方法(Multi-party Synergetic explicit Information with Dual-domain Awareness text spotting,MSIDA),通过强化文本区域特征和边缘纹理,利用文本检测和识别特征之间的协同作用提高端到端文本识别性能.首先,设计融合文本空间和方向信息的双域感知模块(Dual-Domain Awareness,DDA),增强文本实例的视觉特征信息;其次,提出多方显式信息协同模块(Multi-party Explicit Information Synergy,MEIS)提取编码特征中的显式信息,通过匹配对齐用于检测和识别的位置、分类和字符多方信息生成候选文本实例;最后,协同特征通过解码器引导可学习的查询序列获得文本检测和识别的结果.相比最新的DeepSolo(Decoder with explicit points Solo)方法,在Total-Text、ICDAR 2015和CTW1500数据集上,MSIDA模型的准确率分别提升0.8%、0.8%和0.4%.代码和数据集在https://github.com/msida2024/MSIDA.git可以获取.

  • 高铭, 陈奕可, 陈佳彤, 肖甫, 韩劲松
    电子学报. 2025, 53(3): 986-999. https://doi.org/10.12263/DZXB.20240237
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    语音隐私安全对于国家和个人信息安全至关重要.为了确保用户的语音隐私免受窃听,超声波录音干扰技术被广泛采用.此技术利用电子录音设备中的超声波非线性特征,在不影响正常交流的前提下,实现了高效且低成本的窃听录音干扰.然而,现有的语音防窃听技术仍存在安全隐患.由于以往技术仅采用简单的噪声掩盖技术,窃听者能够通过先进的去噪技术恢复语音信息,威胁语音隐私安全.特别地,这些方法的设计主要针对英语语音,对汉语语音的适用性有限.因此,针对汉语语音的隐私保护需求更为迫切.为提高超声波录音干扰的安全性和适用性,本文针对汉语语音隐私保护,设计了一种安全稳健的防窃听方法.本文分析汉语语音独特特征,以此为基础设计一种耦合噪声生成算法,该算法所生成的超声干扰噪声与汉语用户的语音信号紧密耦合、高度相关,因此难以分离,能够有效抵御各种去噪手段.本文充分考虑了窃听者的能力,实现不可恢复的录音干扰,在不影响用户听力及正常交流的情况下,构建了安全的防窃听方案,全面保护用户的语音隐私安全.为验证该方法的有效性,本文设计了超声波录音干扰原型系统.实验结果表明,在6 m的范围内,本文方法能够确保90%以上的用户语音内容无法被窃听者识读,为汉语语音隐私保护提供了强有力的技术支持.

  • 韩亮, 刘媛, 蒲秀娟, 谈云帆, 任青
    电子学报. 2025, 53(3): 1000-1013. https://doi.org/10.12263/DZXB.20240770
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    阿尔茨海默病(Alzheimer’s Disease,AD)是一种慢性神经系统退行性疾病,其准确分类有助于实现AD的早期诊断,从而及时采取针对性的治疗和干预措施.本文提出了一种最近邻域聚合图神经网络(Graph neural network with nearest Neighborhood AgGrEgation,GraphNAGE)的AD分类新方法.首先进行图数据建模,将AD数据样本表示为图数据.采用基于互信息(Mutual Information,MI)的特征选择方法,从样本的114维大脑皮层与皮层下感兴趣区域(Cerebral Cortex and Subcortical Regions Of Interest,CCS-ROI)的体积特征中选取重要性高的体积特征,并将其用于节点建模.提出基于相似性度量的关系建模方法,利用重要性高的体积特征、遗传基因、人口统计信息和认知评分对样本之间的关系进行建模.进而构建GraphNAGE,针对每个节点,基于与该节点相关的边的权重进行最近邻域采样,然后使用均值聚合方法对采样得到的邻居节点和中心节点的数据进行聚合,最后通过一个全连接层和一个Softmax层实现AD分类.在TADPOLE(The Alzheimer’s Disease Prediction Of Longitudinal Evolution)数据集上进行实验,结果表明:本文提出的AD分类方法的准确率(ACCuracy,ACC)为98.20%, F 1分数为97.34%,曲线下面积(Area Under Curve,AUC)为97.80%.实验结果表明:本文提出的AD分类方法充分利用了AD数据样本之间的相关性,其性能优于传统的基于机器学习、深度学习和图神经网络(Graph Neural Network,GNN)的AD分类方法.

  • 特约稿件
  • 吴琦, 王梓潼, 张栋梁, 夏思雨, 范文琪, 陈逸隆
    电子学报. 2025, 53(3): 1014-1039. https://doi.org/10.12263/DZXB.20240933
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    先进飞行器测控通信需要实现遥测、遥控、通信、跟踪等多种功能,传统上一般由多个无线收发系统及分立天线单元构成,其体积、重量、成本和安装等方面与飞行器有限资源的矛盾日益突出.天线孔径综合使用单个多功能天线孔径实现多个专用天线孔径的功能,大幅减少了天线孔径数量,显著缓解了飞行器平台上天线孔径布局压力,为提升系统级电磁兼容性提供了全新手段.本文系统阐述了面向飞行器测控通信的天线孔径综合技术路线,着重介绍了面向多个分立天线单元进行综合的多频多极化天线技术、面向发射/接收天线综合的双工天线技术、面向多个天线综合于同一孔径的共孔径天线技术及面向同频天线阵列集成的耦合抑制技术.结合软件无线电系统工作特点,分析了软件无线电系统应用于飞行器测控通信系统的优势与可行性.最后,本文对飞行器测控通信的天线孔径综合技术发展进行了展望,提出天线孔径综合技术在飞行器测控通信系统发展中可能的发展方向.

  • 综述评论
  • 郑航, 史治国, 王勇, 周成伟
    电子学报. 2025, 53(3): 1040-1062. https://doi.org/10.12263/DZXB.20240504
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着新一代信息基础设施建设的持续推进,多维阵列信号处理在雷达、通信、遥感等领域发挥着越发关键的基础性作用.多维阵列信号涵盖了丰富的空域/时域/频域/极化等参数信息,蕴含着巨大的经济和社会价值.为了解决传统矢量/矩阵模型在表征多维阵列信号时存在的结构化信息损失问题,张量代数逐步成为多维信号特征提取和利用的有力数理工具.然而,随着信号维度的扩张,遵循奈奎斯特采样定理所获取的信号规模在张量空间以指数级别膨胀,而现有系统所能提供的算力资源却在逼近物理极限,造成计算过载、时延过长等问题的出现.针对这些问题,稀疏感知利用信号在物理空间的稀疏性实现欠奈奎斯特采样信号处理,其从一维到多维空间的拓展为大规模张量信号的高效处理提供了可能.同时,引入互质、嵌套等结构化稀疏感知模式,可从增广虚拟域信号处理的角度提升系统性能.因此,本文面向多维阵列信号特征的高经济性获取需求,以“理论基础—算法设计—鲁棒机理”为主线,介绍结构化稀疏阵列张量信号处理的新理论与新方法.本文介绍了稀疏张量信号处理的高阶统计处理理论,通过构建虚拟域张量模型并设计其对应的信源辨识能力优化策略,保障了多维虚拟域上的奈奎斯特匹配处理和欠定参数估计;在此理论基础上,围绕波达方向估计和波束成形这两个基本问题,介绍了基于虚拟域张量填充的稀疏阵列波达方向估计算法,充分利用全部的非连续多维虚拟域信息实现高精度、超分辨信源测向,并介绍了基于互质张量权重优化的稀疏阵列波束成形算法,实现波束方向图上的虚峰消除和主瓣尖锐化,提高了稀疏阵列的信号增强与抗干扰性能;在此基础上,从提高非理想条件下的稀疏张量信号处理鲁棒性角度出发,介绍了一种资源集约型张量化神经网络架构,克服了非理想张量统计模型失配带来的性能衰落问题,从数据驱动层面实现面向稀疏张量信号特征开展机器学习的高效性、鲁棒性.

  • 电子学报. 2025, 53(3): 1063.
    摘要 ( ) PDF全文 ( )   可视化   收藏