最新刊期

    2025年第53卷第12期

      中国电子学会科学技术奖特约专栏

    • 大规模卫星网络通算协同资源管理

      鲍晨曦, 盛敏, 周笛, 姬思敬, 史琰, 李建东
      2025, 53(12): 4199-4215. DOI: 10.12263/DZXB.20250885
      摘要:大规模卫星网络(Large-scale Satellite Networks,LSN)星载算力的显著提升,推动了星上自主资源管理的实现,是保障多样化业务端到端(End-to-End,E2E)服务时效性的关键手段.然而,LSN拓扑的高动态变化使得星间通算资源难以高效协同,对满足各类业务差异化的时效性需求并确保高质量E2E服务提出了严峻挑战.为此,本文通过建立虚拟节点及链路映射模型,形成静态覆盖业务请求的虚拟网络,有效避免卫星高速运动对业务E2E服务的影响;通过建立融合LSN拓扑结构的网络状态信息提取模型,实时捕捉星间结构化通算资源与业务需求特征的动态演化关系,并通过设计参数共享的切片资源分配决策机制,实现星地协作智能切片资源管理及融合业务需求特征的网络通算资源切片;此外,通过设计区域资源管理模式并引入服务导向信息,为星上自主E2E服务决策提供局部拓扑感知和目标定位能力,实现动态LSN通算资源的按需高效协同,借助星载处理能力改善时延约束下多样化业务的E2E服务性能.仿真结果表明,提出的算法与非拓扑感知算法相比,在不同通算资源及业务到达数量下分别可提升28%、25.2%和39.3%的服务完成性能.  
      关键词:大规模卫星网络;多样化业务;通算协同;资源管理;端到端服务   
      38
      |
      8
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144422930 false
      更新时间:2026-04-24
    • 昆虫监测雷达精细测量技术

      胡程, 王锐, 李卫东, 王江涛, 叶子涵, 蔡炯, 姜琦, 张济川, 谭荔嘉
      2025, 53(12): 4216-4230. DOI: 10.12263/DZXB.20250883
      摘要:昆虫迁飞是虫害跨区域暴发与病害大规模流行的重要因素,造成严重的粮食损失、环境污染、生物安全等问题,迁飞昆虫监测对粮食安全、物种入侵生物安全等国家战略具有重大意义.昆虫监测雷达是专用于探测迁飞昆虫的雷达系统,相较于空中网捕、高空灯诱等传统监测手段,雷达能够对迁飞昆虫进行全天时、全天候、广域范围的非侵入式监测,成为当前研究和监测昆虫迁飞最有效的技术手段之一,已发现聚集成层、共同定向等很多昆虫群体迁飞现象和规律.但昆虫迁飞研究至今仍是世界性难题,是《Science》公布125个科学难题之一.要破解昆虫迁飞未解之谜,国际昆虫学领域专家普遍认为首先要对昆虫迁飞个体进行轨迹分析与种类辨识.其中,轨迹分析的核心是测量昆虫个体头部朝向等行为学参数,种类辨识的核心是测量昆虫个体体长、体宽、振翅频率等生物学参数.然而,昆虫体型从毫米至厘米级分布,跨度大,散射特性覆盖瑞利区至谐振区,散射特性复杂;昆虫个体雷达散射截面积(Radar Cross Section,RCS)低至-70 dBsm,回波信号微弱,信噪比极低,振翅回波信号更微弱.因此,传统雷达难以实现行为学和生物学参数的精细测量.为此,课题组开展了雷达谐振区微弱目标测量技术研究,提出了谐振区全极化多视角昆虫三维朝向测量、谐振区多频点全极化特征映射的昆虫尺寸测量、极弱微动回波增强的昆虫振翅频率测量等系列方法,攻克了昆虫头部朝向、体长、体宽、振翅频率等个体参数精确测量难题,并在此基础上研发了新一代昆虫个体监测雷达系统,首次实现了昆虫个体三维头部朝向、体长、体宽等参数测量,大幅提升了昆虫振翅频率测量精度.目前,该系统已布设于我国山东东营国家级农高区——北方重要迁飞通道途径地,并开展业务观测,为迁飞昆虫行为机理研究和重大虫害预警防控提供重要技术和数据支撑.  
      关键词:昆虫个体监测雷达;谐振区测量;头部朝向;体型尺寸;振翅频率   
      122
      |
      55
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149817803 false
      更新时间:2026-04-24
    • 基于突发特征词元自学习的未知加密恶意流量检测方法

      沈蒙, 贾冀哲, 赵卜凡, 常力元, 杨明, 任琛琛, 宋悦, 祝烈煌
      2025, 53(12): 4231-4249. DOI: 10.12263/DZXB.20250731
      摘要:当今,互联网流量已普遍加密,以保障其机密性与隐私性.然而,攻击者常常滥用流量加密技术来隐藏其恶意网络行为.由于加密恶意流量与加密良性流量具有相似特征,其能够轻易规避传统基于特征签名与深度包检测(Deep Packet Inspection,DPI)的检测方法.现有加密恶意流量的检测研究主要集中于基于有监督学习的范式,尽管其在已知攻击类型上表现良好,但其有效性严重依赖于大量且持续更新的标记恶意流量样本.面对恶意软件快速迭代、变种频繁以及加密隧道技术的广泛应用,有监督学习模型难以应对训练数据中未曾出现的未知攻击类型,存在显著的泛化能力不足问题.此外,现有方法的特征表示多依赖于手工设计的统计特征,难以捕捉恶意行为在加密流量底层数据报文中的深层语义信息与复杂时序动态,导致特征区分度有限,无法有效适配新型攻击模式.为此,本文提出了一种可靠的基于突发特征词元自学习的未知加密恶意流量检测方法MalGuard.通过分析网络传输底层机理及观察良性流量与恶意流量的关键特征差异性分布,创新地提出了一种基于流量突发特征的新型流量词元化表示方法,实现了对数据报文语义信息与时序动态的关联表征,为后续预训练模型提供了高信息密度的输入基础.基于新型流量词元化表示方法,本文提出两项流量领域专用的自监督预训练任务——跨度掩码语言模型与跨度边界目标任务,通过掩码并重构流量数据报文的跨度内容,强化模型对跨度内数据报文上下文关联的整体感知,实现具备泛化能力的流量通用特征提取.基于该特征,进一步构建适配流量特征分布的轻量级无监督学习算法,通过定位高维表征空间中的离群点,无需恶意标签数据即可实现对加密恶意流量的可靠检测.为验证MalGuard的有效性,我们在三个公开数据集上进行了实验评估.实验结果表明,MalGuard在未知加密恶意流量上的检测表现超过了现有的最佳方法.具体而言,将良性流量与恶意流量的样本数量定义为不平衡比例β,在β=4∶1和β=16∶1时,MalGuard的检测平均F1值分别为91.76%和84.56%,相比现有最佳方法提高了6.01个百分点和28.23个百分点.  
      关键词:网络安全;加密流量分析;恶意流量检测;恶意软件;自监督预训练;无监督学习   
      141
      |
      33
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149484856 false
      更新时间:2026-04-24
    • 异构模型多层次蒸馏的红外-可见光图像融合

      张棋, 宋红, 李金夫, 马士瀚, 林毓聪, 杨健
      2025, 53(12): 4250-4266. DOI: 10.12263/DZXB.20250764
      摘要:知识蒸馏可将复杂教师网络的表征能力迁移至轻量学生网络,有效提升模型性能与部署效率.然而,现有基于知识蒸馏的多模态图像融合方法常忽视师生网络的特征表示、模态偏好异构性及多模态图像的固有差异,导致知识传递低效、语义对齐不足及融合性能退化.针对上述问题,本文提出基于异构模型多层次知识蒸馏的红外与可见光图像融合方法,创新性设计跨层级知识传递机制,在特征层通过注意力引导红外显著性目标与可见光纹理的精准迁移;在关系层通过相似性关系匹配与拓扑结构对齐优化跨模态语义适配;在输出层通过响应约束确保融合结果的视觉一致性与语义完整性,缓解了师生网络模态偏好不匹配导致的信息失衡.此外,构建适配任务特性的轻量化CNN-Transformer双分支学生网络,兼顾全局信息建模与局部细节感知,增强对异构知识的接收整合能力.在MSRS、RoadScene、TNO和M3FD数据集上的实验结果表明,所提方法在三种结构差异显著的教师模型的指导下,互相关系数(Correlation Coefficient,CC)、峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)、空间频率保持度(Sum of the Correlations of Differences,SCD)和结构相似性指数(Structural Similarity Index Measure,SSIM)四项指标均优于教师模型及现有方法,且模型参数量仅为0.077 2 M,服务器上推理时间仅为31.22 ms,在提升融合性能与蒸馏鲁棒性的同时,实现了融合网络的轻量化与实时性;同时模型在Jetson AGX Xavier边缘平台上推理时间仅为250.31 ms,具备良好的边缘部署能力与实际应用价值.  
      关键词:红外与可见光图像融合;知识蒸馏;异构模型;轻量化设计;特征对齐   
      28
      |
      18
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148553512 false
      更新时间:2026-04-24
    • 面向不确定性融合的多模态遥感数据分类

      何欣, 陈雨时, 谷延锋, 刘天竹
      2025, 53(12): 4267-4278. DOI: 10.12263/DZXB.20250882
      摘要:分类是多模态遥感数据解译的关键技术和热点问题.近年来,深度学习方法在多模态遥感数据像素级分类中取得了长足的进展.然而,多模态遥感数据包含的不同模态经过特征提取后,预测结果存在不一致的问题,即预测结果不确定性,影响多模态遥感数据分类方法的分类精度.为降低预测结果不确定性,本文提出了一种面向不确定性融合的多模态遥感数据分类框架.该框架联合提取不同模态(如合成孔径雷达数据、激光雷达数据、高光谱数据等)的空间特征与通道特征,并构建对应的神经网络,通过设计特定的证据融合函数,实现基于证据信息的有效融合.在融合过程中,当预测结果存在冲突时,设计基于冲突感知的动态权重调整机制,通过折扣因子自适应地降低冲突模态的权重,动态重分配证据质量,从而有效降低多模态遥感数据分类方法的不确定性.在此基础上,为进一步预测结果的差异,本文在模型参数优化过程中引入一致性损失函数,以约束各模态预测结果的一致性.实验在3种国际公开的多模态遥感数据集上进行,并与6种主流方法进行对比,结果表明本文所提方法在分类性能上均取得了显著提升.  
      关键词:多模态遥感数据;证据深度学习;不确定性;像素级遥感图像分类   
      89
      |
      10
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 145196001 false
      更新时间:2026-04-24
    • 透射式时域编码超表面无线通信系统

      韩嘉宇, 戴俊彦, 程强
      2025, 53(12): 4279-4287. DOI: 10.12263/DZXB.20250343
      摘要:随着现代通信需求的不断增长与射频技术的快速发展,基于超表面的无线通信系统因具有轻量化、高效性、低成本的显著优势,已成为实现下一代无线通信和雷达系统的关键技术之一,吸引了国内外研究者的广泛关注.本文提出一种基于1 bit透射式超表面的无线通信系统.研究设计了一款工作频段为4.75~5.65 GHz的低损耗透射式超表面,可以对透射电磁波实现180°的相位调控.同时,通过改变超表面控制信号的时间延迟和占空比,该超表面可以进一步实现2 bit的精准相位信息调制.基于上述理论方法,构建了一套工作在5 GHz频率处的高效正交相移键控(Quadrature Phase Shift Keying,QPSK)无线通信系统.测试结果表明,该系统成功实现了高质量的QPSK信息调制,并能够完成稳定且精确的定向通信.研究结果充分展现了透射式时域编码超表面在无线通信领域的优越性能和应用潜力,为下一代超表面通信系统的设计与优化提供了重要的理论依据和技术支持.  
      关键词:透射式超表面;低损耗;时域编码超表面;无线通信;QPSK调制   
      68
      |
      14
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 128150784 false
      更新时间:2026-04-24

      学术论文

    • 球坐标系下异形金属谐振腔电磁特性的解析分析

      李德贵, 孙琦, 马子寅, 梅中磊
      2025, 53(12): 4288-4295. DOI: 10.12263/DZXB.20250644
      摘要:分离变量法分析球形谐振腔的亥姆霍兹方程时,其通解只能取整数阶第一类联带勒让德函数,因此难以有效表征该结构派生得到的异形金属谐振腔的电磁特性.针对上述问题,本研究提出一种异形金属谐振腔电磁特性的普适性解析分析框架.通过引入广义超几何函数,构建了任意阶、次的第一类、第二类联带勒让德函数,获得亥姆霍兹方程的完备通解.在此基础上,基于伯格尼斯位函数法,推导得到异形金属谐振腔在横磁、横电模式下基模与高阶模电磁场的解析解,并通过有限元数值仿真进行验证.结果表明,解析解与数值解的谐振频率在基模、高阶模的相对误差分别为0.070%和0.069%;而且,两个解的归一化电磁场分布完全一致,其基模、高阶模的均方根误差仅为1.670×10-32.667×10-3,验证了研究方法的准确性与可靠性.本研究不仅成功将经典球形腔结论推广至异形结构,也拓展了电磁场解析建模的应用范围,有助于新型微波、光学器件等的精确设计.  
      关键词:异形金属谐振腔;分离变量法;球坐标;亥姆霍兹方程;任意阶、次连带勒让德函数;伯格尼斯位函数   
      14
      |
      5
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144030584 false
      更新时间:2026-04-24
    • 可转向天线辅助的多用户MISO物理层密钥生成

      朱政宇, 柳记通, 李鑫泽, 郑倍雄, 金梁, 黄开枝, 钟州
      2025, 53(12): 4296-4304. DOI: 10.12263/DZXB.20250959
      摘要:针对无线通信系统中存在的窃听攻击与信息泄露风险,提出一种可转向天线(Rotatable Antenna,RA)辅助的多用户多输入单输出(Multiple Input Single Output,MISO)系统的物理层密钥生成(Physical Layer Key Generation,PLKG)方案.通过利用RA的方向可控特性,构建了以系统密钥和速率最大化为目标函数,以总功率、各用户最低服务质量、RA最大天顶角及指向向量归一化为约束条件的优化问题.为求解该非凸问题,设计了一种基于交替优化(Alternating Optimization,AO)、半正定松弛(Semi-Definite Relaxation,SDR)、连续凸逼近(Successive Convex Approximation,SCA)的优化算法.仿真结果表明,所提方案相较于基准方案具有更高的密钥和速率,验证了RA在提高物理层密钥生成速率方面的有效性.  
      关键词:可转向天线;物理层密钥生成;交替优化;半正定松弛;连续凸逼近   
      50
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144030728 false
      更新时间:2026-04-24
    • 基于Pade近似的MEMS麦克风输出响应优化

      毛鑫隆, 熊宇阳, 余建航, 李少平, 董旸, 姜岩峰
      2025, 53(12): 4305-4316. DOI: 10.12263/DZXB.20250163
      摘要:为了改善电容式微机电系统(Micro-Electro-Mechanical Systems,MEMS)硅麦克风输出的非线性和温度漂移,本文在调研了相关传感器输出校准相关算法的基础上,提出了一种基于Pade近似的新型校准算法,具有较高实用性,已成功应用于国产高性能MEMS麦克风传感器中.该算法中,首先利用Pade近似对硅麦克风输出数据进行处理,以改善交叉灵敏度和跳跃点的影响;并利用一种精度拟合和线性回归的方法进行二次计算,以达到提高输出的校准精度的目的.在相对湿度50%的环境下,精度可以从6%FS提升到1.2%FS.与目前主流的相同精度的多项式拟合校准算法相比,本文使用的算法消耗的计算内存减少了约14%.该算法对于其他传感器或电路输出响应优化具有重大参考意义.  
      关键词:电容式MEMS硅麦克风;校准算法;温湿度校准;线性拟合;Pade近似   
      35
      |
      10
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144607713 false
      更新时间:2026-04-24
    • 基于Star-RTMPose的双目视觉定位与测量

      张梦权, 许四祥, 杨玉, 吴端正
      2025, 53(12): 4317-4329. DOI: 10.12263/DZXB.20250422
      摘要:针对传统双目视觉特征点检测算法效率低、匹配精度不足、对光照变化敏感以及参数调优复杂,导致双目视觉定位与测量精度受限的问题,本文提出一种基于Star-RTMPose(Star-enhanced Real-Time Multi-person Pose estimation)的双目视觉定位与测量方法.本文以钢铁冶金行业的连铸坯为研究对象,聚焦其火焰切割后毛刺切除所需的精准定位与尺寸测量需求,给出了对应的技术实现路径.首先,通过标定后的双目相机采集连铸坯图像,并采用LabelMe工具完成目标区域与关键点标注,将标注结果统一转换为MSCOCO(MicroSoft Common Objects in COntext)格式以适配模型训练.随后,采用“目标检测-关键点提取”的双阶段框架实现精准检测,即先基于RTMDet(Real-Time Models for object Detection)算法快速定位连铸坯的主体区域,进而采用基于RTMPose(Real-Time Multi-person Pose estimation)的改进模型Star-RTMPose提取关键点坐标.改进包括:在RTMPose主干引入StarTriBlock(Star Triple Block)模块,通过多支路动态融合机制增强网络对目标高层语义特征的表征能力,充分利用该阶段最大感受野与全局空间关联信息;使用基于深度可分离卷积的MaxDSC2(Maximum Depthwise Separable Convolution 2)模块替代网络头部的7×7大核卷积,并将该模块的中间通道数设定为输入通道数的0.45倍,在提升语义信息敏感度的同时降低参数量;用无参SimAM(Simple parameter-free Attention Module)注意力模块替代传统通道注意力模块,通过能量函数闭式解生成通道-空间三维联合权重,强化网络对空间特征的捕获性能,避免参数冗余.最终,结合双目相机标定参数与三角测量原理,完成关键点三维重建与连铸坯尺寸测量.实验结果表明:在关键点检测任务中,改进后的Star-RTMPose模型对单张图像的推理时间仅为9.86 ms,相较于基准模型RTMPose-T,其AP(Average Precision)提升1.09个百分点,PCK(Percentage of Correct Keypoints)提升0.40个百分点,NME(Normalized Mean Error)降低42.86%;改进后的模型在参数量更为精简的前提下,综合性能显著优于HRNet-W32、SwinTransformer-T等主流模型;在三维测量精度方面,本文方法对1型连铸坯长边尺寸的测量相对误差相较于传统ORB(Oriented FAST and Rotated BRIEF)算法以及改进后的FAST(Features from Accelerated Segment Test)算法分别降低了1.715个百分点和0.365个百分点.本文方法有效解决了传统算法鲁棒性欠佳的问题,实现了检测精度与测量精度的双重提升,切实满足工业场景对高精度检测的需求.  
      关键词:双目视觉;RTMPose;注意力模块;三维重建;尺寸测量;关键点检测   
      50
      |
      8
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144995457 false
      更新时间:2026-04-24
    • 微波波导滤波器的复合空间映射优化策略

      龚建强, 章晨磊, 廖梓豪, 刘宜润, 余韩超, 谢健
      2025, 53(12): 4330-4336. DOI: 10.12263/DZXB.20250768
      摘要:本文针对微波波导滤波器提出了一种融合单步渐进空间映射(One-Step Aggressive Space Mapping,OS-ASM)和隐式空间映射(Implicit Space Mapping,ISM)的高效复合优化策略.单步渐进空间映射能使远离最优解的初值迅速向最优解附近靠近,再辅以隐式空间映射优化,一般五步迭代以内即可使基于物理结构的微波波导滤波器高精度模型(精细模型(Fine Model, FM))仿真结果与目标理论特性几近完美拟合.与传统直接优化算法相比,本策略并非对精细模型直接进行迭代优化,而是对基于模匹配法的低精度模型(粗糙模型(Coarse Model,CM))迭代计算,精细模型仿真仅用于验证迭代优化粗糙模型生成的物理参数,时效性极高,同时也回避了单步渐进空间映射中粗糙模型必须实现极致拟合的严苛要求.本文以八阶切比雪夫型矩形波导滤波器(Bandpass Filter,BPF)和四阶双模圆波导滤波器为例,详细阐释了该策略的实施过程及效果.  
      关键词:波导滤波器;复合空间映射;精细模型;粗糙模型;模匹配法   
      39
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144599603 false
      更新时间:2026-04-24
    • 一种融合连续小波卷积与图嵌入的注意力网络

      张璐, 李明爱
      2025, 53(12): 4337-4348. DOI: 10.12263/DZXB.20250435
      摘要:基于深度学习模型解码运动想象脑电信号(Motor Imagery ElectroEncephaloGram,MI-EEG)是脑机接口(Brain-Computer Interface,BCI)技术领域的热点研究问题之一.针对MI-EEG的时频特点和个体差异性,众多研究对其进行时频分析并将其时频表示广泛用于MI-EEG解码.然而,现有方法大多忽略了MI-EEG的多电极空间分布特性,未能很好地挖掘和利用不同电极间的拓扑关系,从而影响了特征信息的完整性,限制了解码性能的改善.为自适应学习多电极MI-EEG间的拓扑信息,并有效增强其时频空特征信息,本文提出一种融合连续小波卷积与图嵌入的注意力网络(Attention Network with Continuous Wavelet Convolution and Graph Embedding,CWC-GEAN).该网络包含5个模块:多分支连续小波卷积模块(Multi-branch Continuous Wavelet Convolution Module,MCWCM)、多分支动态图嵌入模块(Multi-branch dynamic Graph Embedding Module,MGEM)、多分支特征通道注意力模块(Multi-branch Feature Channel Attention Module,MFCAM)、多分支特征通道-时间注意力模块(Multi-branch Feature Channel-Time Attention Module,MFCTAM)及特征融合与分类模块(Feature Fusion and Classification Block,FFCB).首先,将原始多电极MI-EEG信号输入多分支连续小波卷积模块,在4个分支中分别基于4个子频带(1~8 Hz、9~16 Hz、17~24 Hz、25~32 Hz)进行连续小波卷积,通过对尺度因子的动态学习获得最优多尺度频-空-时特征表示;其次,基于互信息构建包含电极间拓扑信息的先验邻接矩阵,并经由MGEM,从不同子频带对先验邻接矩阵进行自适应学习调整,并嵌入对应分支频-空-时特征表示中,得到蕴含电极间拓扑信息的图结构特征;再次,由MFCAM和MFCTAM针对各分支图结构特征进一步提取深层特征,并相继完成特征通道注意力向量和特征通道-时间注意力矩阵的自动获取与特征加权,得到多分支判别性特征;最后,由FFCB对多分支判别性特征进行融合,得到最终的分类结果.本文基于公开的BCI Competition IV 2a数据集和High-Gamma Dataset数据集对CWC-GEAN进行性能评估,平均分类准确率分别为85.45%和95.09%,平均Kappa值分别为0.806和0.934.结果表明,CWC-GEAN具有自适应学习、捕捉MI-EEG时频信息和电极拓扑信息,以及增强时-频-空特征的能力,且展现出较好的模型鲁棒性和分类结果的一致性,相对流行方法具有一定性能优势.  
      关键词:脑电信号;运动想象;连续小波卷积;拓扑信息;注意力;时频空特征   
      91
      |
      8
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 145195968 false
      更新时间:2026-04-24
    • 刘明杰, 吕梦琳, 刘平, 陈俊生, 朴昌浩, 康宗绪
      2025, 53(12): 4349-4363. DOI: 10.12263/DZXB.20250429
      摘要:雾霾天大气中的悬浮颗粒会导致可见光系统的成像质量显著降低,产生图像对比度下降、颜色失真、细节信息丢失等图像退化现象.这种退化会严重影响计算机视觉下游任务的性能.因此,通常会把图像去雾作为诸如目标检测、目标分割等高阶视觉任务的预处理过程,旨在为后续任务提供高质量的图像内容信息.基于U型网络的图像去雾架构因具有高效、注重细节特征、轻量化等特点而得到了广泛关注.然而,当前该类架构主要聚焦于通过提取图像的空间域特征达成去雾效果,忽略了频域特征对图像去雾的影响.U型结构中解码层采用的最近邻插值法上采样方法还会导致图像空间信息的丢失,进而影响深层语义信息向浅层的有效传递,使得重构的清晰图像不够理想.针对上述问题,本文以U-Net为基础结构提出一种双域特征交互和局部相关性上采样的单幅图像去雾方法.首先在特征提取部分设计了双域特征交互模块, 分别通过双路特征融合子模块和频域特征增强子模块针对图像的空间域与频域特征分别提取,并对这些特征进行交互通过引入频域信息提升模型对图像结构特征的捕捉能力.接着在解码层上采样部分设计局部相关性上采样模块,利用注意力机制捕捉每个特征图中局部信息的内在相关性,并将含有特征补偿的深层语义特征传递至浅层, 有效地实现了不同尺度特征中语义信息的提取和融合. 此外,为了直观表征算法的去雾性能,本文提出一种基于热力图的对比分析方法,即通过颜色梯度直观量化去雾效果差异,其可以有效反映各去雾方法在图像细节还原方面的性能差异.实验结果表明,本文提出的图像去雾方法在确保较低参数量和模型计算复杂度的同时,在客观指标和主观视觉效果上均取得了较好的效果,在SOTS-Indoor、SOTS-Outdoor和Haze4K3个数据上的峰值信噪比(Peak Signal Noise Ratio,PSNR)和结构相似性指数(Structural Similarity Index Measure,SSIM)分别达到了41.46 dB和0.994 3、37.73 dB和0.993 6、34.72 dB和0.993.  
      关键词:图像去雾;U型网络结构;空间域与频域特征交互;局部相关性上采样;信息融合   
      82
      |
      10
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 145792335 false
      更新时间:2026-04-24
    • 张顺外, 崔博宇
      2025, 53(12): 4364-4375. DOI: 10.12263/DZXB.20250611
      摘要:中继协作技术基本思想是单天线终端通过相互协作共享彼此的天线,形成虚拟多输入多输出(Multiple-Input Multiple-Output,MIMO)系统,是利用空间资源的一种有效途径.可重构智能超表面(Reconfigurable Intelligent Surfaces,RIS)技术利用信息超材料对无线电磁波的灵活调控能力,直接调控电磁波传播方向,可提供直达路径外辅助传输路径,在不引入自干扰情况下实现全双工传输,具有硬件成本低、能耗低、配置灵活、智能重构等优势.现有研究表明,RIS技术与传统中继技术两者之间不应仅是竞争关系,或者一方取代另一方,它们有类似功能但却有本质不同,两者之间完全有共存合作的必要与现实需求.有源主动式RIS(Active RIS,ARIS)技术与传统无源被动式RIS(Passive RIS,PRIS)不同,集成了主动元件可放大或处理信号,从而提供额外的功率控制和信号处理能力.为追求未来6G通信网络泛在连接、全域覆盖、绿色低碳、普惠智能等内在需求,进一步提升信息传输速率与增强信号覆盖范围,鉴于ARIS灵活的波束形成、整体功耗仍较低等优点,以及中继的稳定可靠性、已广泛部署等特点,本文结合ARIS与中继技术混合系统展开研究.建立ARIS辅助的多天线译码转发(Decode-and-Forward,DF)中继协作多用户多输入单输出(Multi-User Multiple-Input Single-Output,MU-MISO)系统模型,信源在半双工DF中继和ARIS的辅助下向多个单天线用户传输信息.为最大化系统的和速率,构建了信源发射波束形成矢量、中继发射波束形成矢量、中继接收波束形成矢量和ARIS有源波束形成矩阵的联合优化问题模型.由于波束形成变量之间高度耦合以及存在非凸约束使得原问题非凸且难于直接求解,利用交替优化(Alternating Optimization,AO)算法将原问题解耦成多个子问题,再通过连续凸近似(Sequential Convex Approximation,SCA)方法将其转换为半定规划(Semi-Definite Programming,SDP)问题求解.仿真结果表明,所提系统性能明显优于其他基准方案,如在ARIS元素数目为20时,所提系统的和速率比基准方案1、2、3、4分别提升约7.4%、11.2%、12.9%、8.4%.  
      关键词:ARIS;译码转发中继;MU-MISO;交替优化算法;和速率   
      89
      |
      11
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 145792368 false
      更新时间:2026-04-24
    • 面向大模型预训练的多模态行人轨迹预测隐私保护方案

      魏建好, 周渟森, 李闯, 文艳华, 李克勤
      2025, 53(12): 4376-4393. DOI: 10.12263/DZXB.20250638
      摘要:在城市级交通大模型应用中,稀疏、异构及强时空关联的多模态行人轨迹数据面临大模型预训练的隐私安全问题.然而,现有大模型隐私保护方法主要关注单一图像、文本或轨迹模态进行隐私保护,忽视了多模态之间在融合空间中的高维相关结构以及梯度中隐含的跨模态语义泄露风险,容易在模型反推或重构攻击下暴露用户真实轨迹模式和行为偏好,难以有效保护多模态融合数据和模型梯度关联性隐私.此外,现有大模型注意力机制主要针对密集数据,难以高效处理稀疏的多模态交通数据,导致模型预测精度不高.因此,本文提出了一种面向大模型预训练的多模态行人轨迹预测隐私保护方案(Privacy-preserving Multimodal Pedestrian Trajectory prediction scheme for Large model pre-training,PMPTL),实现了多模态数据和预训练模型的双重高效保护和高精度预测.具体而言,创新的设计基于Transformer与Mamba相结合的多模态稀疏轨迹流融合方法(Multimodal Sparse trajectory flow fusion method based on a combination of Transformer and Mamba,MSTM),采用Transformer机制对行人轨迹序列进行全局依赖建模,引入Mamba机制降低长序列建模的复杂度,高效融合稀疏时空特征.其次,提出基于分辨率网格划分的自适应加权差分隐私方法(Resolution-aware Grid partitioning-based Adaptive weighted Differential Privacy method,RGADP),根据网格分辨率和网格轨迹特征密度动态分配隐私预算,高可用保护融合特征隐私.接着,提出基于双分支自适应稀疏自注意力机制的多模态特征增强算法(Dual-Branch Adaptive Sparse self-attention mechanism,DBAS),设计双分支自注意力机制,动态调整权重以增强稀疏数据特征表征,确保大模型在稀疏场景下高效表征稀疏轨迹的关键特征,提升预训练效率.同时,采用自适应时空Top-K稀疏化的高效抖动量化隐私保护方法(Adaptive Spatiotemporal Top-K sparsification with Dithering Quantization method,ASDQ),减少梯度冗余,确保大模型预训练安全性.最后,基于自适应加权聚合的多模态稀疏行人轨迹预测优化方法(Adaptive Weighted aggregation-based Multimodal sparse Trajectory prediction method,AWMT),对不同模型参数进行动态加权,平衡隐私保护强度与行人轨迹预测精度,以实现高精度轨迹预测.通过理论分析论证了本文方案满足ϵ-差分隐私保护.在真实数据集上的实验结果表明,本文方案的预测误差较现有先进方法降低10%,通信效率提升18.43%.  
      关键词:大模型隐私保护;自适应差分隐私;行人轨迹预测;多模态数据高效融合;抖动量化;时空特征建模   
      101
      |
      19
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144607833 false
      更新时间:2026-04-24
    • 陈智雄, 颜宇豪, 周振宇
      2025, 53(12): 4394-4407. DOI: 10.12263/DZXB.20250501
      摘要:基于电力线通信(Power Line Communication,PLC)和无线通信的双模通信技术兼具覆盖广、可靠性高与接入灵活等优势,可显著提升数据传输的可靠性、速率与时延等性能,在计量网络通信等场景中受到广泛关注.但是实际应用中,双模媒体接入控制(Media Access Control,MAC)算法、突发业务流量以及混合信道衰落等算法及参数都会影响计量网络的时延等性能,使得系统时延边界性能的理论分析和计算面临较大挑战.为解决双模双媒质多参数条件下确定性时延分析难题,提出了一种基于峰值信息年龄违背概率(Peak Age of information Violation Probability,PAVP)的双模通信网络确定性时延性能计算和优化方法,为计量网络的时效性保障提供新思路.首先,针对计量网络周期业务与突发业务共存的特点,建立联合突发流量和周期流量的混合到达模型,接着考虑双模信道混合衰落、基于超帧的MAC层混合接入算法和业务优先级构建跨层服务模型.在此基础上,利用随机网络演算(Stochastic Network Calculus,SNC)理论,基于矩生成函数(Moment Generating Function,MGF)和最大加代数推导了双模通信网络PAVP的理论上界,实现对随机到达与随机服务系统的时延边界性能的计算和分析.考虑队列稳定性和功率约束条件,建立连续数据包的功率优化模型,并利用李雅普诺夫算法将时间平均优化问题转换为与当前时隙队列和峰值信息年龄(Peak Age of Information,PAoI)相关的实时优化问题,从而实现节点和信道发射功率的动态优化分配.最后,通过系统仿真分析采样周期、混合流量强度、设备数量、PAoI阈值以及MAC竞争窗口等关键环节和参数对系统时延边界性能的影响.结果表明,混合流量条件下存在最优采样周期使系统时延边界性能达到最优;当双模节点数量超过20个时,MAC层接入算法成为时延性能主要影响因素;对比单模通信和双模固定参数条件,基于李雅普诺夫算法的功率优化能够进一步提升系统时延边界性能,提升数据传输实时性.相关结论为双模通信在智能计量网络的工程应用提供了理论基础和技术参考.  
      关键词:双模通信;中继系统;信息年龄;随机网络演算;李雅普诺夫优化   
      81
      |
      19
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 146314973 false
      更新时间:2026-04-24
    • 赵楠楠, 杨帆, 王浩, 张佳萌, 吴若非, 赵彤轩, 师雨露, 张晓, 赵晓南, 黄志杰, 韩淑捷
      2025, 53(12): 4408-4428. DOI: 10.12263/DZXB.20250831
      摘要:云平台和微服务架构的快速发展,使弹性伸缩成为保障性能与资源效率的核心机制.现有研究虽在负载预测与组合建模方面取得了进展,但大多仍以 CPU、内存等资源利用率为预测目标,再通过阈值规则或控制逻辑间接触发副本调整.这种“预测-控制解耦”的设计带来多重不足:一方面,预测误差在规则映射过程中被放大,难以保证伸缩动作的准确性;另一方面,真实调度器中的滞回、冷却与离散动作机制难以刻画,使得预测结果难以直接落地.因此,直接对伸缩行为进行学习,即建模副本数的动态变化规律,成为一种更具控制导向和部署价值的思路.针对这一问题,本文提出一种多头注意力-残差修正容器伸缩行为学习模型.该模型首先利用自回归滑动平均模型(Auto Regressive Integrated Moving Average,ARIMA)对副本数序列进行趋势分解,再以双向长短期记忆(Bidirectional Long-Short Term Memory,BiLSTM)神经网络对残差序列建模,并引入多头注意力机制(Multi-Head Attention,MHA)自动捕获关键时序特征,通过残差修正(Residual Correction)提升预测精度与健壮性.基于Alibaba公开的cluster-trace-microservices-v2022真实数据集,系统对比了PETformer、SparseTSF、TFEGRU、GRU、Transformer、Seq2Seq-LSTM、Seq2Seq-GRU、Seq2Seq-Transfomer、GRU-LSTM、CNN-LSTM、CNN-LSTM-GRU等主流模型.实验结果表明,所提ARIMA-BiLSTM-MHA组合模型在均方误差(Mean Squared Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、决定系数(Coefficient of Determination,R²)等核心指标上,较各类基线方法分别取得了1.57%~71.56%(MSE)、0.72%~46.67%(RMSE)、1.57%~59.10%(MAE)、1.97%~60.48%(MAPE)、0.27%~15.70%(R²)的相对百分比性能提升,其中R²最高提升至0.954 3.进一步地,在基于DeathStarBench socialNetwork基准应用构建的容器副本伸缩控制实验中,行为学习驱动的伸缩策略相较于CPU阈值型HPA策略,在将平均 P99 延迟降低2.11%并有效抑制负载跃迁阶段尾延迟尖峰的同时,成功将平均副本数减少约17%,显著缓解了资源过度配置问题.结果证明,该方法能够更准确、稳定地学习伸缩动作并输出直接可用的控制语义,为云平台自动扩缩容提供高效、可靠的决策支持.  
      关键词:云平台;弹性伸缩;容器伸缩行为;多头注意力机制;残差修正;混合模型;深度学习;时序预测   
      67
      |
      14
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 147230835 false
      更新时间:2026-04-24
    • 基于重复感知与频率增强的动态图推荐研究

      吴国栋, 黄雯婧, 鲍宪立, 李景霞, 谢东辰
      2025, 53(12): 4429-4443. DOI: 10.12263/DZXB.20250654
      摘要:针对现有图神经网络推荐研究较少考虑历史交互重复行为模式及其时间维度上的频率特性,难以捕获节点交互随时间演变的“偏移”问题,融合重复感知邻居采样与频率域分析,设计了一种基于重复感知与频率增强的动态图推荐模型(Repetition and Frequency-enhance Dynamic Graph Recommendation,ReFDGRec).ReFDGRec引入一种重复感知邻居采样策略,不仅考虑单个节点的即时邻域,还能深入挖掘已发生过交互的节点对信息,以更精确地识别并挖掘用户与物品之间的高频交互模式,捕捉用户行为的动态演变,从而为模型提供更丰富的输入特征.同时,结合连续小波变换(Continuous Wavelet Transform,CWT)具有的多分辨率分析特征,可以在不同时间尺度上处理用户行为的非平稳性和动态变化,有效捕捉用户行为中的周期性趋势和突发性偏好.通过CWT将用户行为时间序列转换为频率域,以此捕获长周期趋势和短期波动,有效缓解了现有方法在处理用户行为非平稳性时的不足,提升了模型在处理用户突发性偏好和动态兴趣转移时的性能,以提供更精确的个性化推荐.为全面评估模型性能,分别在Wikipedia、UCI、MOOC和MovieLens四个公开数据集上进行了系统实验,涵盖了直推式预测与归纳式预测两种动态图推荐场景,并采用随机、历史及归纳三类负采样策略以确保评估严谨性与公平性.实验结果表明:在平均精度指标上,ReFDGRec相比DySAT、TGAT、TGN、GraphMixer及RepeatMixer等主流基线模型均取得显著的性能提升,实现了平均2.3%~6.9%的性能增益;消融实验验证了节点交互频率编码方法与连续小波变换增强模块在提升模型性能中的关键作用;时频分析方法对比结果显示,连续小波变换在处理非平稳行为序列方面明显优于离散傅里叶变换与短时傅里叶变换.本文通过理论引导的重复感知机制与信号处理驱动的频域增强技术,为动态图推荐系统研究提供了一种能够有效捕获兴趣演化与行为偏移的解决方案,具有一定的理论创新与实践价值.  
      关键词:动态图;推荐;重复感知;小波变换;频率增强   
      89
      |
      11
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 146562139 false
      更新时间:2026-04-24
    • 边缘侧检索增强生成系统高效缓存算法研究

      詹慧悠, 倪宏秋, 谈海生, 王天竹, 李向阳
      2025, 53(12): 4444-4459. DOI: 10.12263/DZXB.20250461
      摘要:随着大语言模型在边缘智能场景中的部署需求日益增长,检索增强生成(Retrieval-Augmented Generation, RAG)因其可降低模型依赖、提升领域知识覆盖与隐私保障能力而成为边缘侧部署的重要范式.然而,RAG系统在资源受限的边缘设备上仍面临显著挑战:大规模高维嵌入向量索引难以全量载入内存,频繁的缓存置换与低速存储访问导致检索延迟显著上升.当前嵌入向量获取主要依赖磁盘加载、在线生成和内存缓存三种路径,三者在延迟、计算开销与资源占用方面差异显著,缺乏统一高效的调度机制.针对上述挑战,本文提出一种专为资源受限边缘RAG系统定制的高效在线缓存算法——BP-Cache.该算法的核心创新在于引入了多路径访问代价建模与动态分级缓存管理机制,旨在通过细粒度的资源调度解决边缘侧的性能冲突.首先,本文通过分析揭示了边缘环境下嵌入向量访问的两个关键特性:一是向量生成代价呈现显著的长尾分布,大尺寸向量簇的在线计算延迟远超磁盘加载;二是访问模式存在极强的局部性与稀疏性,超过60%的向量在生命周期内仅被单次访问.基于此观测,BP-Cache引入轻量级准入过滤器机制,利用小缓存区作为“观察窗”暂存新到达向量,实现对低价值访问请求的快速旁路,有效遏制了缓存污染问题.同时,算法构建了代价-大小联合评分模型,将向量簇的在线生成计算代价、磁盘I/O读取延迟及其内存占用大小纳入统一评价体系,在缓存空间不足时,动态优先保留单位内存效益最高的向量簇,从而在无需预知未来访问序列的前提下逼近最优离线策略的性能.本文在基于NVIDIA Jetson AGX Orin的真实边缘平台上部署了该系统,并基于BEIR基准中的多个数据集开展了广泛的对比实验.实验结果表明,与EdgeRAG等当前最先进的边缘RAG方案相比,BP-Cache在多组数据集上平均降低检索延迟约29%,提升缓存命中率约21%,并显著优化了系统的长尾延迟表现.进一步的参数敏感性实验证实,该算法在不同缓存容量配置、小缓存配比及向量簇规模下均表现出优异的鲁棒性与适应性.  
      关键词:边缘计算;检索增强生成;缓存优化;在线算法;低延迟检索   
      73
      |
      12
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 147422416 false
      更新时间:2026-04-24
    • 常文文, 王亚俊, 郭晋成, 舒康, 马煜
      2025, 53(12): 4460-4473. DOI: 10.12263/DZXB.20250911
      摘要:针对癫痫脑电信号(ElectroEncephaloGram,EEG)发作前期(preictal)、发作期(ictal)和发作间期(interictal)三种状态下的检测和识别问题,提出了一种基于多头交叉注意力机制(Multi-Head Cross-Attention Mechanism,MHCA)融合脑电多域特征的分类识别模型.该模型通过连续小波变换(Continuous Wavelet Transform,CWT)对癫痫脑电信号生成的二维图像按照通道进行有序拼接,并利用浅层卷积神经网络(Convolutional Neural Network,CNN)对拼接后的时频图像进行特征提取以有效挖掘癫痫脑电信号的时频域特征.同时通过构建脑功能连接矩阵,刻画不同脑区之间的功能连接关系以捕捉癫痫发作过程中潜在的空域特征,最终采用MHCA实现时频特征与空域特征之间的全局交互与自适应融合,充分建模多维特征间的关联性与互补性,进而构建癫痫脑电信号在时域、频域与空域三个维度上的完整且统一的特征表征.实验结果表明,该模型在癫痫发作前期、发作期和发作间期的多被试分类中最高分类准确率可达92.49%,灵敏度可达92.48%,体现了其在跨被试场景下良好的泛化能力与稳定性;单被试分类中模型最高准确率为98.39%,灵敏度为98.04%,充分验证了该方法在个体化癫痫脑电识别任务中的有效性.消融实验最终也进一步证实了脑功能连接矩阵所表征的空域信息和多头交叉注意力机制在多域特征融合与判别特征增强中的关键作用,对模型的性能提升均具有正向贡献.本文针对癫痫脑电分类识别的有效性验证,不仅为临床脑电检测和识别提供了一种可靠且可行的技术手段,也为癫痫脑电信号中关键特征的提取、表征与建模提供了新的研究思路和方法参考.  
      关键词:癫痫检测;脑电信号;多域特征;连续小波变换;脑功能连接矩阵;多头交叉注意力机制   
      33
      |
      23
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148553652 false
      更新时间:2026-04-24
    • 大语言模型增强的抗灰洞攻击海域无人机路由算法

      李杰铃, 肖亮, 王鹏程, 雷妍, 陈乔鑫, 王成耀
      2025, 53(12): 4474-4484. DOI: 10.12263/DZXB.20250878
      摘要:无人机路由实现图像、音频和位置等多模态数据至部署大语言模型的船载目的节点的高效传输,支撑目标搜索等推断任务,适用于环境监测和搜索救援等海域业务.然而,在恶劣海域信道条件下,无人机网络拓扑快速变化,路由稳定性显著下降.同时,灰洞攻击选择性丢弃数据包,导致感知数据传输的丢包概率和时延大幅增加,甚至引发推断失败.为此,本文提出大语言模型增强的抗灰洞攻击海域无人机路由算法,根据大语言模型所推断出的环境特征以及相邻无人机成功转发的数据包数,建立路由信任体系,采用强化学习优化下一跳无人机和发射功率.面向海域业务服务质量需求,结合相邻无人机信任度,设计路由策略分布函数,适配无人机群的网络拓扑和信道变化,快速恢复中断路由.针对海上节点分布稀疏及信道快速变化导致的反馈丢失问题,在路由经验回放中引入反馈恢复机制,提升路由稳定性.搭建海域无人机路由系统,在船载目的节点部署参数量为70亿的大模型LLaVA-1.5,以图像和相邻无人机位置等信息为输入,识别环境特征并将结果反馈给无人机,增强路由策略优化.基于厦门欧厝海域实测信道数据,构建30架无人机防御具有不同丢包概率灰洞攻击的结果表明,所提算法可提升72.8%的数据包到达率,降低75.1%的端到端时延和64.7%的能耗,支撑海域大语言模型任务.  
      关键词:大语言模型;海域无人机路由;灰洞攻击;强化学习;多模态数据   
      68
      |
      40
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148553810 false
      更新时间:2026-04-24
    • 基于混合耦合的低剖面高选择性频率选择表面

      马骏, 陈欣然, 向凯燃, 陈付昌, 严俊杰
      2025, 53(12): 4485-4493. DOI: 10.12263/DZXB.20251023
      摘要:本文提出一种基于低剖面叠层贴片结构的高选择性频率选择表面(Frequency Selective Surface,FSS)设计方法.针对频率选择表面综合设计中因结构复杂而导致谐振模式与耦合机制难以准确调控,进而限制传输零点灵活配置的问题,本文提出基于混合电磁耦合理论的等效电路模型,并将其应用于频率选择表面的综合设计中.首先,本文设计并分析了一种弱耦合双层贴片频率选择表面,以阐明其工作机理.研究表明,两层贴片间的混合电磁(Electric and Magnetic,EM)耦合可引入一个可控的传输零点(Transmission Zero,TZ).在贴片上刻蚀单条或双条缝隙可有效调节耦合强度,从而灵活调控传输零点的位置.建立并验证了等效电路模型,以准确描述该耦合机理.基于此原理,进一步设计了两种在通带一侧具有传输零点的三阶频率选择表面和一种在通带两侧具有传输零点的四阶高选择性频率选择表面,显著提升了频率选择性.制作并测试了工作在4.72 GHz的实物样品,实测结果与仿真结果高度一致.所提出的频率选择表面具有优异的频率选择性,良好的入射角稳定性和低剖面,适用于空间滤波和电磁屏蔽应用.  
      关键词:频率选择表面;混合电磁耦合;传输零点;叠层贴片;等效电路;高选择性   
      38
      |
      37
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148553717 false
      更新时间:2026-04-24
    • 基于分层提议与解耦监督的目标检测增量学习

      梁嘉伟, 梁思源, 陈若愚, 刘宽融, 黄健杰, 操晓春
      2025, 53(12): 4494-4506. DOI: 10.12263/DZXB.20250673
      摘要:增量目标检测(Incremental Object Detection,IOD)旨在使模型从流式数据中持续学习新类别的识别与精确定位能力,同时有效保持对已学旧类别的检测性能.然而,当前主流目标检测器在增量训练过程中易遭遇灾难性遗忘问题:当仅利用新类别标注数据微调时,其对旧类别的检测性能显著退化.现有方法多依赖知识蒸馏或样本重放策略以缓解遗忘,但普遍忽视增量训练中的两个关键挑战:一是区域提议生成中的标签分配冲突,二是基于有限旧样本的硬标签监督所引发的过拟合风险.本文指出,现有方法在区域提议生成阶段采用不一致的标签分配策略:新类别与背景提议依据其与真实标注的交并比(Intersection over Union,IoU)匹配生成,而旧类别提议则依赖旧模型置信度进行推断.当两类提议在空间上重叠时,同一候选区域可能被赋予矛盾标签,导致分类与回归任务接收到冲突监督信号,干扰模型有效训练.此外,即使引入少量回放旧样本,若对其施加硬标签监督,模型仍易在小规模子集上过拟合,难以复现其在原始大规模旧数据集上获得的泛化能力,反而削弱旧知识保留效果.为此,本文提出一种面向增量目标检测的解耦学习框架.首先设计分层解耦的候选区域分配机制,依据“新类别→旧类别→背景类”提议的优先级顺序,对重叠区域进行互斥筛选,从源头消除标签冲突.进而引入双路径解耦监督策略:对新类别及背景区域采用真实标注训练,其中背景区域基于无偏背景定义进行监督;而对所有旧类别区域,无论是否在回放样本中显式标注,均仅通过知识蒸馏施加软监督,使其预测分布与旧模型输出对齐,避免硬标签诱导的局部过拟合,协同保障整个检测器训练过程的监督一致性与学习稳定性.在Pascal VOC与MS COCO标准基准上的实验表明,所提方法在单步及多步增量设置下均优于当前最先进(State-Of-The-Art,SOTA)方法,尤其在多步增量场景中,本文方法在平均精度(mean Average Precision,mAP)上分别提升2.0%和2.9%以上,有效验证了其在协同保留旧知识与学习新任务方面的优越性.本工作不仅提升了增量目标检测的持续学习能力,也揭示了区域提议生成与监督策略协同设计在缓解灾难性遗忘中的关键作用.  
      关键词:增量学习;目标检测;知识蒸馏;样本重放;灾难性遗忘   
      83
      |
      27
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148553960 false
      更新时间:2026-04-24
    • 基于图卷积与自适应Transformer的行人轨迹预测

      王芳芳, 刘明华, 渠连恩, 王贺, 李丹宁
      2025, 53(12): 4507-4517. DOI: 10.12263/DZXB.20250855
      摘要:行人轨迹预测是自动驾驶和机器人导航等领域的核心挑战之一,其关键在于如何有效建模行人间的复杂交互关系并提取多尺度时空特征.本文提出一种基于图卷积与自适应Transformer的行人轨迹预测方法(pedestrian trajectory prediction method based on Graph Convolution and Adaptive Transformer,GCAT),通过层次化的特征提取与自适应交互建模实现高精度的轨迹预测.模型以历史观测时间窗口内所有行人的位置与速度信息作为输入,首先通过线性投影与正弦-余弦位置编码将原始观测映射至高维特征空间,以显式保留时序顺序信息.随后,引入关系图卷积网络捕获行人之间的局部拓扑结构及空间交互强度,通过基于特征余弦相似度的自适应邻接矩阵实时构建交互图,使图结构能够根据场景特征自适应调整.同时,引入增强型多层卷积结构,通过可学习的残差权重自适应平衡不同层级特征的贡献,有效缓解深层网络的梯度消失问题,增强局部交互特征的表达能力.此外,模型进一步引入空间自适应Transformer建模全局时空依赖关系,该模块通过可学习的空间偏移量实现特征图上的连续采样.具体实现中,模型通过线性层从输入特征中生成空间偏移量和注意力权重,偏移量与参考点坐标相加后经归一化得到实际采样位置,利用双线性插值从特征图中提取对应位置的特征值,再通过注意力权重进行加权聚合,获得对局部几何变化与全局时序依赖的增强表达.这种连续采样策略使模型能够聚焦于对轨迹预测最相关的空间区域,自适应地应对不同场景的几何布局变化.同时,模型融合多粒度时序特征,逐步提取从局部交互到全局依赖的多层次时空表达,有效解决了现有方法在长程依赖建模、环境适应性以及多尺度特征融合等关键方面存在的问题.在实验验证方面,本文在两个广泛使用的公共行人轨迹预测数据集ETH和UCY上对所提出的方法进行了系统评估.相比现有基线模型,所提出模型在平均位移误差(Average Displacement Error,ADE)和最终位移误差(Final Displacement Error,FDE)指标上分别取得了5.1%和13.2%的性能提升,验证了模型在复杂交互关系建模和多尺度时空特征提取方面的有效性与先进性.  
      关键词:轨迹预测;局部拓扑结构;全局时序依赖;多尺度特征融合;预测性能   
      82
      |
      12
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148553439 false
      更新时间:2026-04-24
    • 何广鹏, 邸志雄, 邓雨姣, 陈旋, 张泽涛, 刘洋
      2025, 53(12): 4518-4526. DOI: 10.12263/DZXB.20250798
      摘要:在超大规模数字芯片(Very Large Scale Integration,VLSI)设计流程中,逻辑综合阶段是连接架构设计与物理实现的桥梁.然而,逻辑综合工具分析得出的初始时序瓶颈路径与布局布线(Placement and Routing,P&R)完成后的真实时序瓶颈之间往往存在显著差异.这种“时序不一致性”主要源于两个维度:首先,在综合阶段,由于物理布局信息缺失,电子设计自动化(Electronic Design Automation,EDA)工具通常采用线网负载模型估算互连线时延,难以捕捉深亚微米工艺下复杂的寄生参数效应;其次,现代芯片内部逻辑门种类繁多且拓扑连接高度复杂,这显著增加了在逻辑综合阶段进行准确静态时序分析(Static Timing Analysis,STA)的计算难度.为了解决上述挑战,本文提出一种面向大规模数字芯片的时序瓶颈预测模型——BottleneckNet.首先,在特征工程方面,针对大规模设计网表规模过大导致深度学习模型难以训练的问题,本文提出了一种基于寄存器子图(Register Sub-Graph,RSG)概念的网表特征提取方法.该方法通过对网表拓扑进行结构化剪枝,仅保留寄存器间的关键组合逻辑信息.该特征提取流程可以在On的时间复杂度下完成,从而满足了工业级大规模网表的处理需求.在模型架构方面,本文设计了一种基于图神经网络(Graph Neural Network,GNN)的双通道特征传播模型,该模型能够同时捕捉电路的全局特征与局部逻辑网络拓扑信息.通过融合双通道特征,BottleneckNet能够实现对布局布线后时序瓶颈的精准感知.本文基于多组开源大规模设计构建了完备的测试数据集,实验结果表明,本文提出的BottleneckNet模型展现出优异的综合性能.在处理效率方面,该方法能够在分钟级时间内完成百万门级设计的特征提取与推理任务.在预测精度方面,针对时序最差的5%~20%时序瓶颈路径,本文方法的预测准确率不仅显著优于轻量级梯度提升机(Light Gradient Boosting Machine,LightGBM)模型,且远高于工业界主流逻辑综合工具Synopsys公司的Design Compiler(DC)在综合阶段给出的计算结果.该研究成果对于指导逻辑综合阶段后的时序优化、缩短芯片研发迭代周期具有重要的理论意义与工程应用价值.  
      关键词:逻辑综合;布局布线;静态时序分析;寄存器子图;图神经网络;双通道特征;时序瓶颈   
      82
      |
      19
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148553402 false
      更新时间:2026-04-24
    • 扩散模型驱动的跨时间域通信辐射源个体增量识别方法

      赵东兴, 刘辉, 黄科举, 杨俊安
      2025, 53(12): 4527-4540. DOI: 10.12263/DZXB.20250843
      摘要:通信辐射源个体识别(Specific Emitter Identification,SEI)利用信号发射设备由于制造误差与器件老化等因素形成的细微硬件差异,在物理层完成身份区分与溯源.相较依赖协议与密钥的传统认证方式,它无需改动协议栈,对业务内容透明且部署成本低,已在频谱监管、无线安全、认知无线电与复杂电磁环境感知等场景展现重要价值.然而在真实无线环境中,跨时间与跨场景的信道变化会对射频指纹产生不稳定的调制与失真:多径衰落、频偏与相位噪声随时间漂移,使同一设备在不同时刻的信号表现差异显著,识别性能在目标域显著退化,成为落地应用的核心障碍.为缓解域间分布偏移,现有研究主要从迁移学习与领域自适应展开.迁移学习依赖目标域标注进行微调,虽可提升目标域性能,但易破坏源域已学知识并诱发灾难性遗忘;无监督领域自适应通过特征对齐、伪标签与熵最小化缩小分布差异,但因缺乏显式监督,提升幅度受限,且难以应对数据持续到来的在线场景.增量学习强调在不断接收新数据时兼顾“适应—记忆”的平衡,但多数方法仍需标注或额外存储,难以直接用于无线信号的无标注跨时间应用.生成式建模的发展为解决该问题提供了新契机.扩散模型以正向加噪、反向去噪的机制刻画复杂分布,具备建模“信道扰动—设备本征特征”叠加关系、从观测中恢复指纹的潜力,但既有工作多聚焦去噪或数据生成,尚未兼顾跨时间域识别与持续学习需求.为此,本文提出一种扩散模型驱动的跨时间域通信辐射源个体增量识别方法:在源域阶段以正向扩散显式建模信道扰动,在目标域通过反向扩散逐步恢复接近源域分布的判别性表示,以抑制特征漂移;在扩散网络中引入跨注意力,将个体信息注入去噪过程以增强类间可分性;进一步结合无监督增量学习,通过分布一致性与知识保持正则,仅依赖无标注目标样本实现持续自适应,并有效缓解遗忘.在WiSig数据集上,跨时间个体识别实验表明,所提方法在目标域识别准确率较典型领域自适应方法提升超过5个百分点,在源域性能保持方面较主流增量学习策略提升约10个百分点,验证了其信道还原与特征对齐能力,并体现出在动态信道条件下的鲁棒性与实用价值.  
      关键词:通信辐射源个体识别;跨时间域;扩散模型;增量学习;信号处理;跨注意力机制   
      37
      |
      11
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 148838278 false
      更新时间:2026-04-24
    • 谢雨农, 张志勇
      2025, 53(12): 4541-4559. DOI: 10.12263/DZXB.20250771
      摘要:氧化物半导体(Oxide Semiconductor,OS),特别是非晶氧化物半导体(Amorphous Oxide Semicondutor,AOS),因其适中的迁移率、极低的关态电流、优异的大面积均匀性以及与传统互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)工艺兼容的低温制备工艺,已成为突破硅基器件尺寸微缩物理极限的重要候选材料.近年来,AOS不仅在高端液晶显示(Liquid Crystal Display,LCD)与有机发光二极管(Organic Light-Emitting Diode,OLED)显示背板中实现了规模化应用,还在低功耗逻辑器件、高密度存储以及单片三维集成电路(Monolithic Three-Dimensional,M3D)等先进集成架构中展现出广阔的应用前景.尤其在M3D技术所要求的低热预算(<400 ℃)制造条件下,氧化物半导体在功耗、性能、面积与成本(Power-Performance-Area-Cost,PPAC)综合优化方面具备显著优势.在器件尺寸持续微缩的背景下,如何维持对沟道载流子的有效静电控制、抑制短沟道效应并保障器件长期可靠性,已成为制约氧化物半导体薄膜晶体管(Thin Film Transistors,TFTs)进一步发展的核心问题.其中,栅工程作为决定晶体管电学性能的关键环节,直接影响器件的阈值电压、亚阈值摆幅、漏电流以及偏置稳定性等重要指标.本文围绕氧化物半导体TFT的栅工程展开系统综述,重点从栅介质材料、栅结构设计以及栅-沟道界面工程三个方面总结近年来的研究进展与技术趋势.在栅介质层面,通过引入高介电常数(high-κ)材料及其复合结构,可在降低等效氧化层厚度的同时增强栅控能力、降低工作电压并有效抑制栅漏电流;在栅结构层面,采用鳍式晶体管、纳米线及全环绕栅(Gate-All-Aroud,GAA)等三维非平面结构,能够显著增强栅极对沟道的包裹性,从而缓解短沟道效应并提升器件在极限尺寸下的性能;在界面工程方面,通过界面钝化、能带调控及缺陷态调节等策略,可有效降低界面态密度,改善载流子输运特性,并显著提升器件的稳定性与可靠性.尽管氧化物半导体栅工程已取得显著进展,但仍面临若干关键挑战,包括器件可靠性机制的复杂性、现有界面优化策略在短沟道器件中的适用性,以及缺乏与n型氧化物半导体性能匹配且兼容后端工艺(Back End Of Line,BEOL)的高性能p型氧化物半导体材料.这些问题在一定程度上限制了互补电路及高密度集成应用的发展.总体而言,氧化物半导体作为后摩尔时代的重要技术路线,其发展潜力已得到学术界与产业界的广泛认可.随着栅工程相关材料、结构与界面调控技术的持续突破,氧化物半导体有望在未来高性能、低功耗电子器件与三维集成系统中发挥更加关键的作用.  
      关键词:氧化物半导体;薄膜晶体管;栅工程;栅介质;栅结构;界面工程;短沟道效应   
      73
      |
      17
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149004708 false
      更新时间:2026-04-24
    • 刘帅, 陈达, 潘以恒, 李前, 蔺琛皓, 沈超
      2025, 53(12): 4560-4574. DOI: 10.12263/DZXB.20250502
      摘要:基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)能够有效推动模型输出与人类偏好对齐,已被广泛用于抑制多模态大语言模型(Multimodal Large Language Models,MLLMs)在实际应用中出现的幻觉问题.其中,直接偏好优化(Direct Preference Optimization,DPO)方法通过避免显式奖励建模,以更稳定、高效的方式提升MLLMs的可信度与可用性,受到学术界与工业界的广泛关注.然而,DPO训练过程中仍存在若干挑战,如训练数据分布偏移、偏好数据构建过程中对指令事实性区分不足等,均可能加剧模型幻觉.此外,现有方法对视频等多图数据中伴随的音频信息利用不足,而音频可作为视觉理解的有效补充信号,具备缓解幻觉的潜力.针对上述问题,本文提出一种基于指令事实性判别与音频辅助的自对齐训练框架(Instruction Factuality and Audio Assistance,IFAA),通过四个核心模块生成高质量偏好数据,以抑制MLLMs的幻觉现象.具体包括:(1)同风格响应采样,有效降低直接偏好优化训练中的数据分布偏移;(2)长响应分割策略,提升模型自我判别的准确性;(3)指令事实性判别模块,构建更具事实依据的偏好数据;(4)音频辅助理解模块,通过融合音频信息提升偏好数据质量.最后通过直接偏好优化训练增强模型的可靠性.此外,创新性地引入基于ROC(Receiver Operating Characteristic)曲线的置信平衡点选择机制,以有效缓解多模态大型语言模型的过度自信问题.本文在五大主流MLLM评测基准上进行了实验,以验证所提框架的有效性与泛化能力.以LLaVA(Large Language and Vision Assistant)1.5模型为例,经本框架优化后,其在Object HalBench(Object Hallucination Benchmark)评测集上的句子级幻觉率降低43.1%,实例级幻觉率下降37.3%.此外,在其他前沿模型上的迁移实验表明,基于IFAA构建的偏好数据具有良好的泛化性,能够显著降低不同模型的幻觉率.该结果验证了本文框架在不同模型上的适用性,为MLLMs的幻觉抑制提供了新的有效途径.  
      关键词:多模态大语言模型;幻觉缓解;偏好学习;自我对齐;指令事实性;音频辅助   
      77
      |
      24
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149380592 false
      更新时间:2026-04-24
    • 面向移动机器人端边协同推理的混合数据流调度算法研究

      丁男, 方玺淇, 郝云涛, 胡创业, 许力
      2025, 53(12): 4575-4591. DOI: 10.12263/DZXB.20250674
      摘要:基于分区的深度神经网络(Deep Neural Network,DNN)端边协同推理技术通过将模型拆分并分别在移动机器人终端和边缘服务器上部署,能够有效缓解端设备的资源受限以及现有模型轻量级化技术导致的推理精度降低等问题.然而,该技术也为机器人操作系统(Robot Operating System2,ROS2)的通信调度提出了新的挑战:现有的通信策略难以在保障协同推理关键数据流有效传输的同时,兼顾其他应用数据流的传输需求.针对这一问题,本研究提出了机器人操作系统中面向移动机器人深度神经网络端边协同推理的混合数据流动态调度算法(Hybrid Data Flow Dynamic Scheduling Algorithm for Mobile Robot Deep Neural Network Edge-End Collaborative Inference in the Robot Operating System2,DRECHS).首先,基于端边协同推理的机理分析,定义了深度神经网络中间数据的最大允许传输时间边界条件,为传输优化提供了理论基础.结合边界条件,设计了一种基于混杂切换系统理论的调度模型,将流调度过程建模为包含优先级优先子系统和时间优先子系统的动态切换模型.在此基础上,提出了具体的混合数据流调度算法.该算法集成在机器人操作系统的数据分发服务(Data Distribution Service,DDS)流控制器中,能够依据计算出的队列状态指标动态生成输出队列,实现对底层数据传输顺序的细粒度控制,从而在满足推理任务数据传输要求的基础上,实现对不同优先级数据流的差异化服务质量(Quality of Service,QoS)优化,有效平衡了系统的整体传输性能.针对所采用的动态分区方法,设计不同带宽条件下的仿真实验,对比分析了所提算法与系统内置调度算法等在传输延迟和丢包率方面的性能差异.实验结果表明,本研究提出的调度算法通过混杂切换系统模型和动态调度策略,在满足高优先级数据传输需求的同时,成功实现了对不同优先级数据流的差异化服务质量优化.此外,本研究提出了相应的部署方案,并在真实设备上部署了该调度算法及深度神经网络端边协同推理框架,完成了系统验证.该部署方案为本研究所提算法及框架在真实场景中的部署提供了参考.  
      关键词:深度神经网络;端边协同;机器人操作系统;混合数据流调度;混杂切换系统理论   
      77
      |
      20
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149484805 false
      更新时间:2026-04-24
    • 基于模体的高低阶网络结构鲁棒性

      邢之尧, 项林英
      2025, 53(12): 4592-4606. DOI: 10.12263/DZXB.20250683
      摘要:现实中的多智能体网络系统普遍处于攻击与防御相互博弈的动态环境之中.攻击方通过破坏关键节点或交互结构削弱系统功能,而防御方则采取相应的修复与重构策略以维持系统整体性能,二者交替作用,形成复杂且高度非线性的对抗演化过程.此类多智能体系统通常可抽象为复杂网络模型,其中节点表示智能体,边刻画其相互作用关系.基于传统图结构的建模方法在描述节点之间的二元交互关系方面具有较强优势,已被广泛用于网络鲁棒性分析与攻防博弈研究.然而,该类方法在刻画多智能体之间普遍存在的多元协同、群体交互以及高阶耦合行为时仍存在一定局限,难以全面反映现实系统中复杂的协作机制.近年来,随着复杂系统研究的不断深入,高阶网络建模方法逐渐受到关注,并被引入多智能体系统分析框架中.相较于传统低阶网络,高阶网络为研究多智能体系统中复杂协同行为的形成机制与演化规律提供了更加丰富的结构表征手段.在此背景下,本文从复杂网络低阶结构出发,引入高阶网络建模框架,系统研究多智能体网络在攻防博弈条件下的结构鲁棒性演化问题.首先,围绕多智能体系统可能面临的攻击与防御场景,构建多种典型的攻击与防御策略,并在此基础上分析不同策略组合对高阶网络结构鲁棒性的影响.重点考察在不同攻击模式和防御机制下,高阶网络与对应低阶网络在鲁棒性演化过程中的差异特征,以及高阶结构在提升或削弱系统抗攻击能力中的作用机理.具体而言,本文从模体结构出发,深入分析高阶网络中不同类型模体对系统整体鲁棒性的影响机制,并进一步探讨低阶网络平均度等结构参数对高阶网络鲁棒性的调节作用.研究采用数值仿真与理论分析相结合的方法,选取四类典型低阶网络模型,构建其对应的高阶网络结构.在此基础上,引入四种具有代表性的攻击策略,对智能体节点的失效过程进行模拟,系统刻画攻防交互过程中网络结构的动态演化特征.通过计算网络最大连通分支的相对规模,定量评估不同攻防策略下网络鲁棒性的变化规律.结果表明,与传统低阶网络相比,高阶网络在面对攻击时呈现出显著不同的鲁棒性响应特征.系统鲁棒性不仅依赖于节点之间的二元连接关系,还受到高阶模体结构分布以及低阶网络平均度等因素的共同影响.合理的模体组织形式和适当的低阶结构参数能够在一定程度上增强系统对攻击的抵抗能力.本文的研究结论为揭示多智能体系统中多元协同行为的鲁棒性形成机制提供了新的理论视角,同时也为高阶网络结构设计及攻防策略的优化提供了有价值的参考依据.  
      关键词:高阶网络;结构鲁棒性;模体;多智能体系统   
      50
      |
      47
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149579857 false
      更新时间:2026-04-24
    • 一款低剖面超宽带低交叉极化紧耦合阵列

      耿源, 潘锦, 王凌霄, 刘思豪, 刘颜回, 杨德强
      2025, 53(12): 4607-4613. DOI: 10.12263/DZXB.20251010
      摘要:本文提出了一款低剖面超宽带低交叉极化紧耦合阵列.传统的紧耦合阵列通常会以牺牲阵列剖面高度的方式来扩展带宽.为了在不增剖面高度的情况下扩展紧耦合阵列的低频带宽,在低频引入一种可以等效为磁偶极子的电流环辐射模式.通过仿真分析可以发现Double-Y并非在所有频段都能实现良好的平衡变换,而非平衡馈电将会导致馈电网络中出现净垂直电流,通过利用Double-Y巴伦在低频为非平衡馈电的特性,让低频出现的净垂直电流驱动由偶极子、Double-Y巴伦、短路探针和地板形成的电流环.而且这种可以等效为磁偶极子电流环,可以实现有效辐射.因此,这一设计改善了阵列的低频带宽,也相当于降低了阵列剖面.紧耦合阵列中的传统宽角度阻抗匹配层作用通常相对单一,一般仅用来改善阵列的阻抗匹配和扫描能力.然而,本文提出了一款多功能宽角度阻抗匹配层.通过将超表面和极化栅格进行融合设计,宽角度阻抗匹配层不仅保留了原有改善阵列阻抗匹配和扫描能力的功能,而且可以改善阵列的交叉极化.最终,提出的阵列实现了电压驻波比(Voltage Standing Wave Ratio,VSWR)小于3时5∶1的带宽(0.8~4 GHz)和E面45°/H面45°的扫描.而且阵列的剖面高度为0.089个低频波长,阵列E面45°/H面45°扫描时交叉极化分别小于-54 dB和-30 dB. 为了验证该设计,制作了一个10 × 10的紧耦合阵列.  
      关键词:低剖面;超宽带;磁偶极子;超表面;低交叉极化;紧耦合阵列   
      37
      |
      41
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149579785 false
      更新时间:2026-04-24
    • 基于多通道特征增强与图文相似度感知的虚假新闻检测

      张仕斌, 蔡松睿, 杨敏, 陈世航
      2025, 53(12): 4614-4629. DOI: 10.12263/DZXB.20250650
      摘要:人工智能(Artificial Intelligence,AI)技术的快速发展在丰富互联网内容生态的同时,也加剧了多模态虚假新闻的广泛传播,特别是深度伪造技术的应用使得虚假信息在视觉与语义层面呈现出较高的逼真性,严重威胁网络公共空间的信任体系.尽管现有的多模态虚假新闻检测技术已利用跨模态注意力机制及大语言模型(Large Language Models,LLMs)实现了多模态语义对齐与推理增强,但这些方法在特定场景下仍面临挑战.一方面,通用大模型存在“幻觉”风险,且多局限于粗粒度的语义融合,难以精准捕捉图文实体间的不匹配冲突;另一方面,现有模型往往忽略了对图像频域物理伪影及文本情感操纵信号的挖掘,导致其在面对生成式AI高保真的伪造内容时鉴别力受限.针对上述问题,本文提出了一种基于多通道特征增强与图文相似度感知的图注意力网络(Multimodal Similarity-aware Graph Attention Network,MS-GAT).该方法首先设计了多通道特征提取模块,其利用双向编码器表征(Bidirectional Encoder Representations from Transformers,BERT)模型提取文本的深层语义与情感特征,并结合视觉Transformer(Vision Transformer,ViT)获取图像空间特征,同时引入快速傅里叶变换(Fast Fourier Transform,FFT)捕捉图像频域中的异常伪影,并通过自适应门控单元实现多通道特征的加权融合.在此基础上,本文构建了一个包含图文实体节点与模态枢纽节点的相似度感知异构图,利用对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)模型计算各节点在共享语义空间中的相似度,并以此显式地建模图文间的细粒度关联.最后,模型利用图注意力网络(Graph Attention Network,GAT)聚合邻域信息,通过注意力权重动态调整节点间的关联强度以聚焦图文不一致特征,并配合自适应的多任务损失函数解决联合学习中的优化不平衡问题.所提方法在Weibo17和CFND数据集上的准确率分别达到94.5%和87.6%,各项关键性能指标均优于现有主流基线.研究结果表明,本方法通过融合图文多通道特征与结构化推理机制,实现了对图文深层语义冲突的捕捉,为提升多模态虚假新闻检测的可解释性与鲁棒性提供了新的视角与技术支撑.  
      关键词:虚假新闻检测;多模态融合;图文相似度感知;多通道特征提取;图注意力网络;异构图   
      135
      |
      69
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149817910 false
      更新时间:2026-04-24
    • 多维未知输入时滞下工业软测量随机增量建模方法

      刘鑫, 刘小庆, 代伟
      2025, 53(12): 4630-4639. DOI: 10.12263/DZXB.20250927
      摘要:未知时滞是工业软测量建模过程中常见的难题,若忽略时滞变量的解析(尤其是多维未知时滞变量)可直接降低模型的可靠性及准确性,进而导致建模任务失败.基于此,本文在随机配置网络(Stochastic Configuration Network,SCN)的基础上,综合考虑多维未知输入时滞和网络模型参数的迭代优化求解问题,提出了一种多维未知输入时滞下工业软测量随机增量建模方法.首先,利用随机配置网络作为基础模型映射输入输出数据间的非线性关系,揭示传统最小二乘估计对时滞变量的敏感性,进而利用期望最大化(Expectation-Maximization,EM)方法搭建未知时滞和网络模型参数的概率求解框架,将多维未知时滞参数概率辨识问题公式化;其次,构建未知时滞变量的解空间,通过计算时滞变量的后验概率密度函数,量化时滞变量在解空间的概率分布;最后,通过迭代优化求解策略给出未知时滞和网络模型参数的联合求解公式,避免独立估计导致的误差累积,得到期望的软测量模型.在模型验证过程中,本文通过数值仿真和一个典型的磨矿过程的工业应用,证明了提出的软测量模型的有效性和可靠性.  
      关键词:软测量建模方法;随机配置网络;期望最大化算法;多维未知时滞   
      69
      |
      65
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149817875 false
      更新时间:2026-04-24
    • 杨欣卢, 王文波, 邢远秀, 邓钊
      2025, 53(12): 4640-4655. DOI: 10.12263/DZXB.20250893
      摘要:动态心电图(ElectroCardioGram,ECG)在临床监测与可穿戴健康评估中具有重要应用价值,但其信号幅值低、非平稳性强,在实际采集过程中易同时受到基线漂移(Baseline Wander,BW)、肌电伪迹(Muscle Artifact,MA)、电极运动(Electrode Motion,EM)及环境噪声(如高斯白噪声(White Gaussian Noise,WGN))等多源干扰的叠加污染,导致关键波形特征(P波、QRS波群与T波)失真,严重制约可穿戴设备自动分析与临床判读的可靠性.此外,现有ECG去噪方法多针对单一噪声类型或理想工况设计,在多源混合噪声及低信噪比条件下,仍面临噪声抑制不足与形态保真难以兼顾的问题.针对上述挑战,本文提出一种联合能量选择可调Q因子小波变换和改进奇异值分解的二次降噪方法(Energy-Selected Tunable Q-factor Wavelet Transform with Improved Singular Value Decomposition,ES-TQWT-ISVD).该方法首先利用TQWT的多分辨率分析能力,将含噪ECG信号分解为多个具有不同振荡特性的子带分量.在此基础上,依据混合噪声在时频域中的能量分布差异,构建子带能量占比与累计能量判据,自适应筛选信号主导子带,实现对噪声成分的初步抑制.随后,将筛选后的子带信号构造Hankel矩阵,并引入一种基于奇异值子集标准差突变检测的自适应定阶策略,以确定最优重构阶数,从而在无需经验阈值的条件下进一步削弱残余噪声并保持波形细节.基于MIT-BIH心律失常数据库与MIT-BIH噪声应力测试数据库构建的四种单一噪声(WGN、BW、MA、EM)及四种混合噪声(BW+MA、BW+EM、EM+MA、BW+MA+EM)实验,对所提方法在不同噪声强度和噪声组合条件下的去噪性能进行了系统评估.实验结果表明,在-5 dB的强噪声环境下,所提方法仍可实现12.46 dB的信噪比提升,同时保持较低的均方根误差(0.057)和较高的余弦相似度(91.07%),在噪声抑制效果与心电波形保持性方面均优于传统TQWT、自适应噪声完全集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)方法,并在多源混合噪声场景下表现出良好的综合性能.研究结果表明,该方法无需训练样本,计算复杂度适中,在特征波定位任务中表现出较高的检测一致性,适用于复杂动态环境下ECG信号的高质量去噪与临床前端处理.  
      关键词:可调Q因子小波变换;心电信号降噪;奇异值分解;混合噪声抑制;特征波定位   
      119
      |
      67
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149823143 false
      更新时间:2026-04-24
    • 蒋欣宇, 燕有杰, 王彬文, 张凯悦, 毕亮杰, 李海龙, 蒙林
      2025, 53(12): 4656-4664. DOI: 10.12263/DZXB.20250981
      摘要:本文基于时域方向图卷积方法与约束多目标优化算法,对高功率脉冲阵列天线的辐射特性重构问题展开系统研究.在满足辐射场幅值大于12 kV/m、脉冲宽度变化率小于20%的约束条件下,重点实现了天线波束方向图与辐射脉冲波形的可重构控制.为提升计算模型的可靠性,本文采用“小阵外推大阵”的策略,通过较小规模阵列的仿真结果合理推断大规模阵列的辐射行为,从而兼顾计算效率与模型精度.在此基础上,将计及互耦效应的严格数值分析工具与非支配排序遗传算法(Non-dominated Sorting Genetic Algorithm II,NSGA-II)相结合,构建了一套针对阵列天线延时布局的多目标优化流程,以实现对辐射脉冲特性的灵活重构.在实际工程应用中,设计者可根据具体任务需求,从优化所得的Pareto最优解集中选取最适宜的延时配置方案.高功率脉冲阵列天线在超宽带雷达、电磁对抗及生物电磁学等领域具有重要应用价值,其核心目标是在特定空间区域内形成满足特定时域与空域特性的辐射场分布.传统设计方法多侧重于频域或稳态性能,对瞬态脉冲波形的控制能力有限.本文提出的时域方向图卷积方法,能够直观反映激励延时对合成脉冲波形的影响机理,为时域辐射特性的精确调控提供了理论框架.通过引入脉冲宽度变化率作为关键约束条件,有效保障了辐射脉冲波形在目标区域内的时域一致性,避免因波形畸变导致的系统性能下降.在优化方法上,本文采用的NSGA-II算法具有良好的全局搜索能力与收敛性能,特别适合处理包含复杂非线性约束的多目标工程优化问题.通过将互耦影响嵌入个体适应度评估流程,确保了优化结果在实际物理系统中的可实现性.数值实验部分,本文重点考察了三种典型场景:辐射场幅值最大化;波束宽度最大化;在半功率波束宽度内,脉冲宽度变化率最小化.测试数据与仿真结果的高度一致性,验证了所建优化模型在同时处理时-空域约束方面的有效性与鲁棒性.  
      关键词:可重构;NSGA-II算法;时域方向图;脉冲阵列天线;脉冲宽度变化率;互耦   
      109
      |
      37
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 151032663 false
      更新时间:2026-04-24
    • 亚20 nm FinFET工艺温度传感器低温总剂量效应研究

      皮辉斌, 吴龙胜, 文溢, 罗登, 喻国芳
      2025, 53(12): 4665-4670. DOI: 10.12263/DZXB.20250733
      摘要:本文针对深空探测等极端环境下太空任务对电子器件的需求,研究了亚20 nm体硅FinFET工艺下温度传感器的低温总剂量(Total Ionizing Dose,TID)效应.该温度传感器核心电路为基于PNP双极晶体管构成的带隙基准电路.理论分析表明,290 K与110 K辐照下双极晶体管退化均表现为基极复合电流增大,但其主导机制存在本质差异:常温下界面陷阱密度增加主导复合过程,符合氢离子漂移致Si-H键断裂的经典模型;而在极低温环境下,氢离子的漂移运动被“冻结”,边界陷阱隧穿辅助复合机制成为退化的主要原因.由于110 K时边界陷阱浓度远大于290 K时界面陷阱浓度,导致明显的低温辐照损伤增强效应.电路分析与仿真验证表明,随着辐射诱导泄漏电流从0 nA增加至100 nA,带隙基准电压显著变化,导致输出温度码增加约21 bit,这从电路层面预言了辐照会导致温度码正向漂移.为验证理论分析,基于定制的低温总剂量效应测试系统,分别在110 K和290 K温度条件下,利用Co60γ射线源对测试芯片进行了累积1 Mrad(Si)总剂量辐照试验.实验结果表明,1 Mrad(Si)辐照后,110 K低温辐照下传感器的温度码累积增加值分别达到37 bit和30 bit,显著高于290 K室温辐照下的9 bit,明确验证了低温辐照损伤增强效应.本研究为极低温辐射环境下FinFET集成电路(特别是依赖双极器件的传感器)的设计与加固提供了重要的理论依据和实验参考.  
      关键词:FinFET;温度传感器;总剂量效应;低温;双极晶体管   
      126
      |
      47
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 151370240 false
      更新时间:2026-04-24
    • 自适应多样性驱动的粒子群优化算法

      张俐
      2025, 53(12): 4671-4685. DOI: 10.12263/DZXB.20250823
      摘要:针对粒子群优化算法在处理高维、多峰以及复杂优化问题时存在的种群多样性快速丧失与早熟收敛等固有缺陷,本文提出一种自适应多样性驱动的粒子群优化算法(Adaptive Diversity-Driven Particle Swarm Optimization,ADDPSO).该算法从初始化策略、多样性量化、参数自适应、信息交互结构与扰动机制五个维度进行系统化重构,以全面提升算法在复杂搜索空间中的全局探索能力、收敛精度与鲁棒性.首先,针对初始种群分布不均问题,设计基于Logistic混沌映射与均匀随机数的加权融合初始化策略,通过7∶3的比例兼顾序列遍历性与随机扰动性,显著提升初始解在高维空间中的覆盖均匀性.随后,引入基于平均欧氏距离的种群多样性量化指标,并定义多样性比率作为演化过程的实时反馈信号,为参数与策略的动态调整提供依据.在此基础上,提出时间递减规则与多样性比率双驱动的参数自适应机制,实现惯性权重与学习因子在探索与开发阶段间的平滑切换.进一步地,为克服传统速度更新对单一全局最优解的过度依赖,构建“个体认知-精英引导-种群分布”三层协同的速度更新架构.其中,精英引导通过维护精英档案并采用基于适应度的概率化选择策略,避免搜索方向趋同;种群分布项则引入基于适应度偏差的全局协同机制,通过均方根归一化与符号保留系数实现差异化引导.此外,算法融合多样性感知的模拟退火机制与多策略自适应变异操作,并引入双阈值接受准则,在维持收敛趋势的同时主动注入多样性,有效抑制早熟收敛.实验基于CEC2017测试集的12个高维复杂函数(包括混合函数F18、F19与复合函数F20~F29)及齿轮系设计问题进行系统验证.结果表明,ADDPSO在绝大多数函数上均取得最优或次优的平均值与标准差,尤其在F18、F20~F24、F27~F29等高度复杂函数上,其求解精度较主流PSO变体提升1~4个数量级,且表现出更优的稳定性.在齿轮系设计问题中,ADDPSO不仅稳定收敛至理论最优解,显著优于对比算法,充分验证其在工程优化中的可靠性与一致性.总之,ADDPSO通过多层次、多机制的协同设计,系统性地解决PSO在高维复杂优化中的多样性衰减与早熟收敛问题,展现出优异的综合性能与实际应用潜力.  
      关键词:粒子群优化算法;种群多样性;高维复杂;参数自适应;早熟收敛;全局优化   
      139
      |
      39
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 152063717 false
      更新时间:2026-04-24
    • 海上微弱目标雷达-红外多视角协同智能TBD技术

      孙殿星, 黄亚圣, 彭锐晖, 谭顺成, 王国宏
      2025, 53(12): 4686-4707. DOI: 10.12263/DZXB.20250887
      摘要:海上微弱目标检测通常面临目标雷达散射截面积小、红外对比度低、易受海杂波、漂浮物、岛礁及海鸟等背景干扰影响的难题,单一传感器检测方法受自身物理特性限制,在复杂海况下难以兼顾检测概率与虚警抑制性能.检测前跟踪(Track-Before-Detect,TBD)技术通过多帧联合处理能够有效提升微弱目标检测能力,但传统TBD方法多依赖先验运动模型,且主要针对单一传感器场景,在目标机动或背景复杂条件下适应性不足.针对上述问题,本文提出一种雷达-红外多视角协同智能TBD技术,实现复杂海面环境下微弱目标的高可靠检测.首先,针对雷达回波中背景杂波和噪声点迹密集的问题,引入雷达低门限预处理机制,在保留目标回波信息的同时剔除部分低幅值干扰点迹,降低后续处理的计算复杂度.随后,针对雷达与红外传感器在量测维度和空间表达上的异构性,构建雷达-红外异构数据空间映射模型,将雷达距离-方位量测映射至红外像平面,生成雷达-红外虚拟融合图像,实现两类传感器信息在统一像素空间内的对齐与融合,从而提升目标量测数据率并增强目标显著性.在融合图像构建基础上,采用最大值多帧累积策略对连续融合图像进行能量叠加,突出微弱目标的空时相关性并抑制随机噪声.同时,利用真实目标在雷达与红外两种传感器中均产生响应,而部分背景干扰仅在单一传感器中出现的跨模态差异特征,构建基于雷达-红外响应联合约束的目标潜在区域划定机制,有效排除海鸟、浮漂等非目标干扰,为后续检测提供可靠的空间约束,从而显著降低虚警率.在目标检测阶段,针对多帧累积融合图像中微弱目标尺度小、对比度低、航迹呈细长连续分布的特点,本文基于YOLOv11框架构建自适应多尺度特征增强网络(Adaptive Multi-Scale Feature Enhancement YOLOv11,AMSFE-YOLOv11),实现目标航迹检测与实例分割,并进一步抑制复杂背景干扰.该方法摆脱了传统TBD对先验运动模型的依赖,在目标发生机动的情况下仍能够有效提取航迹特征和空时相关性,实现稳定的能量累积,具有良好的鲁棒性和适用性.最后,基于海上实测雷达与红外数据对所提出方法进行了验证.结果表明,该方法对于微弱目标检测概率达到94.7%以上,虚警率为0.52%以下,相较于单一传感器检测方法表现出明显优势,验证了所提雷达-红外多视角协同智能TBD技术在复杂海面环境下的有效性和工程应用潜力.  
      关键词:微弱目标检测;雷达-红外;多视角协同;多帧累积;目标潜在区域;AMSFE-YOLOv11   
      165
      |
      36
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 152091943 false
      更新时间:2026-04-24
    • 面向非相干SIMO短包通信的多符号酉星座参数化设计

      李双志, 刘莹莹, 李璐琦, 郭新
      2025, 53(12): 4708-4718. DOI: 10.12263/DZXB.20250986
      摘要:针对高阶酉星座设计及在接收端检测复杂度高的问题,本文面向块瑞利衰落信道下的非相干单输入多输出短包通信系统,提出一种低复杂度的多符号高阶酉星座参数化设计方法,以实现在短包传输中高效利用时域分集,提升系统可靠性,并降低设计与检测开销.短包通信是支持超可靠低时延通信的关键技术之一,其传输块长度有限,传统信道编码与相干检测方案因需分配大量导频进行信道估计而导致频谱效率下降.非相干通信虽无需瞬时信道状态信息,但传统非结构化酉星座的设计与最大似然检测复杂度随调制阶数呈指数增长,难以应用于高阶调制或时延敏感场景.为此,本文通过引入参数化与结构化设计思想,在给定传输速率和平均功率约束下,将酉星座设计问题转化为以最大化不同发送信号间最小弦距为目标的混合离散-连续优化问题.本文所提方法的核心在于将长度为L的发送信号递归参数化为一系列独立的角度参数与相位参数,并假设二者分属不同的星座集合.这一结构化假设不仅将高维星座点优化问题解耦为对有限个参数的优化,极大降低了设计复杂度,也为接收端实现低复杂度递归检测算法奠定了结构基础.具体地,本文提出一种联合比特分配与星座结构优化的两步求解策略:首先,在给定比特分配下,通过最大化最小弦距特性推导出最优角度星座应具有算术序列结构、最优相位星座应为均匀分布的相移键控星座;其次,基于该结构通过离线搜索确定各参数子空间的最优比特分配,从而在保证结构规律性的同时最大化系统的最小弦距.在接收端,得益于星座的参数化与结构独立性,本文进一步提出一种低复杂度的递归最大似然检测算法.该算法将任意符号长度的检测问题递归分解为两符号检测,降低了计算复杂度.理论分析表明,所提检测算法的复杂度与各参数子空间的星座点数之和呈线性关系,避免了传统全局搜索算法随总调制阶数指数增长的问题,尤其适用于高阶调制与实时性要求高的短包通信场景.仿真结果表明,与基于导频的正交幅度调制和相移键控方案相比,所提结构化酉星座具有更优的误码性能,且在高速率场景下通过联合利用角度与相位维度进一步提升频谱效率.同时,所提递归检测器在误块率与误比特率性能上均接近全局搜索检测器,而计算复杂度降低超过95%,验证了其在保持优异性能的同时实现低复杂度处理的可行性.本文工作为单输入多输出系统下的非相干短包通信提供了一种高效、实用的星座设计与检测方案,有助于推动超可靠低时延通信在实际系统中的部署与应用.  
      关键词:SIMO系统;短包通信;星座设计;非相干空时调制;递归检测;最小弦距准则   
      97
      |
      38
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 152056108 false
      更新时间:2026-04-24

      综述评论

    • 隐匿信息检索技术现状与展望

      杜瑞颖, 黄正帝, 石闽, 周尔俊, 何琨, 陈晶
      2025, 53(12): 4719-4739. DOI: 10.12263/DZXB.20250525
      摘要:在数据驱动决策的时代,大数据分析与云计算的深度融合在释放数据价值的同时,也将数据安全与隐私保护推向了核心挑战的前沿.隐匿信息检索作为关键的多方安全计算技术,允许用户从远程数据库中检索特定信息而完全不泄露查询目标,为不可信环境下的数据查询提供了坚实的隐私保障.该技术已在医疗、金融等诸多领域展现出应用潜力,持续受到学术界与工业界的广泛关注.然而,随着数据规模与用户数量的激增,现有方案面临着效率与实用性之间的显著矛盾.早期基于信息论安全的多服务器方案依赖多不合谋的强安全假设,而基于计算安全的单服务器方案则在通信、计算和存储开销上面临严峻挑战.因此,在确保安全的前提下,如何全面提升检索效率已成为推动该技术落地的核心问题.本文系统性地梳理与总结了隐匿信息检索技术的研究现状.首先,我们明确了隐匿信息检索的形式化定义及其核心属性,并概述了实现该技术的主流密码学原语.其次,本文构建了一个以服务器数量为依据的技术分类框架,将现有方案划分为多服务器与单服务器两大脉络,并深入剖析了基于函数秘密共享、可穿刺伪随机函数、同态加密及不经意传输等不同技术路线的设计原理与性能权衡.进一步地,本文探讨了为适应具体功能要求而衍生的多种实用变体,包括批处理隐匿信息检索、对称隐匿信息检索、关键字隐匿信息检索和可更新隐匿信息检索,分析了它们各自解决的问题与设计特点.在应用层面,本文通过社交发现、匿名通信和广告投递等典型场景,具体阐述了隐匿信息检索如何解决实际的隐私保护痛点.最后,基于全面的综述分析,本文展望了该领域的未来发展趋势,指出研究重点应聚焦于进一步优化理论开销、设计支持多功能的统一灵活框架,以及通过系统级创新解决实际部署难题,从而推动隐匿信息检索技术从理论走向广泛的实际应用.  
      关键词:隐匿信息检索;安全多方计算;隐私保护;同态加密;函数秘密共享   
      116
      |
      13
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 146560764 false
      更新时间:2026-04-24
    • 数据中心可编程数据平面的调度机制研究综述

      刘敬玲, 何种, 汪子汐, 方浩, 崔睿, 黄家玮
      2025, 53(12): 4740-4755. DOI: 10.12263/DZXB.20250334
      摘要:数据中心承载着云计算、大数据分析与人工智能等业务,不同流量对时延和吞吐量的需求各异.时延敏感的任务要求极低延迟,而大规模备份和分析流量则更关注高吞吐量,为此数据中心网络通常采用高效的调度机制以满足不同应用需求.传统调度机制依赖定制网络设备实现来满足特定的应用需求,其开发成本高且可扩展性差,导致难以在网络中快速部署新的调度算法.随着可编程交换机等新型网络设备的出现,数据平面可编程能力得到显著提升,网络设备从功能固化转向灵活配置,这为在数据平面设计高性能的调度机制奠定了基础.近期研究者们提出了大量新颖的可编程调度机制,这些机制极大地提升了网络性能.本文综述了近年数据中心可编程调度机制的设计思想,并将它们划分为通用表达、高并发流量、公平保障、租户隔离4类机制.其中,通用表达型机制提供灵活抽象支持多种策略;高并发流量型机制强调海量并发流下的线速处理;公平保障型机制关注在流或租户间实现带宽公平;租户隔离型机制面向多租户环境提供强隔离和分层资源分配.4类调度机制各有侧重,可互补应对复杂场景需求.随后,本文分别介绍相应代表性调度机制,并进一步比较了各类调度机制的优缺点,最后展望了基于可编程数据平面的调度机制的未来发展方向.  
      关键词:数据中心网络;可编程数据平面;优先级调度;公平性;多租户;时延   
      54
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 144035967 false
      更新时间:2026-04-24
    • 多智能体强化学习:从基础理论到前沿算法

      韩光洁, 朱胜超, 林川, 江金芳
      2025, 53(12): 4756-4786. DOI: 10.12263/DZXB.20250418
      摘要:多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)作为处理复杂动态环境中智能体协作与竞争问题的重要框架,近年来在理论与应用上取得快速发展,并在自动驾驶、群体机器人、智能调度与对抗博弈等领域展现出广阔前景.然而,多智能体系统中普遍存在环境非平稳、策略强耦合、信用分配困难和安全约束复杂等问题,使得MARL相较于单智能体强化学习面临更大挑战.本文首先梳理了MARL的基础建模与理论框架,从马尔可夫博弈、部分可观测马尔可夫博弈等形式化描述出发,结合集中式训练、分布式执行和基于通信的协同决策等典型范式,对现有方法在信息利用、计算复杂度与收敛性质等方面进行对比分析,并围绕价值分解、策略梯度、多智能体信用分配和通信建模等核心技术进行归纳.在此基础上,本文重点总结了若干前沿研究方向:一是基于大语言模型(Large Language Model,LLM)的MARL,通过引入LLM的知识推理和高层规划能力,用于任务分解、策略引导及自然语言通信,以提升智能体在开放环境中的泛化与协作能力;二是基于元学习的MARL,面向多任务与分布迁移场景,关注策略对新任务、新队友或新对手的快速适应,通过学习“会学习的初始化”或适应规则提高样本效率;三是基于可解释性的MARL,利用注意力可视化、因果分析和规则抽取等方法增强决策过程透明度,为策略审计、人机协同与安全监管提供支持;四是大规模MARL的应用与部署,聚焦智能体数量和状态维度急剧增长带来的训练效率、通信开销与可扩展性问题,探索分层结构、群体建模和并行训练等机制;五是多智能体安全强化学习,从约束满足、风险控制和稳健性出发,研究在对抗扰动、不确定性和策略博弈下的安全决策.最后,本文结合协作与竞争两类典型应用场景,讨论了MARL在真实系统落地中面临的样本效率不足、仿真到现实迁移困难、公平性与稳态博弈分析不足等挑战,旨在为后续MARL的理论研究与工程应用提供系统参考.  
      关键词:多智能体强化学习;马尔可夫博弈;大语言模型;元学习;可解释性;多智能体安全强化学习   
      159
      |
      28
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 147995631 false
      更新时间:2026-04-24
    • 混洗差分隐私研究综述

      张啸剑, 王浩锋, 傅继彬
      2025, 53(12): 4787-4810. DOI: 10.12263/DZXB.20250017
      摘要:基于中心化差分隐私(Central Differential Privacy,CDP)与本地化差分隐私(Local Differential Privacy,LDP)的数据查询和分析已得到了研究者的广泛关注.数据查询与分析的解决方法在CDP/LDP下取得不断突破的同时也凸显出相应的局限性,其局限性源自CDP/LDP是针对收集者信任度变化而设置的两个极端模型.CDP假设用户完全信任收集者,收集者结合用户的原始数据产生噪声来响应分析者的查询,响应的误差较低.然而,该模型中的用户无法掌控自己的原始隐私数据.LDP假设用户不信任收集者,用户只是把本地扰动结果传输给收集者.然而,该模型下查询与分析的误差很高.混洗差分隐私(Shuffled Differential Privacy,SDP)模型的出现有效均衡了CDP与LDP之间的矛盾.本文对SDP的保护模型、实现机制、研究方向以及存在的问题进行系统地综述.首先介绍SDP的理论基础,主要包括SDP模型、SDP框架以及满足SDP算法的核心思想.重点介绍当前该领域的研究热点:聚集查询估计、直方图估计、频率/均值估计以及机器/联邦学习等,对相应的研究热点进行总结与归纳.在对已有技术深入对比分析的基础上,指出了混洗差分隐私保护技术的未来发展方向.  
      关键词:中心化差分隐私;本地化差分隐私;混洗差分隐私;数据查询;数据分析;机器学习   
      53
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 124975521 false
      更新时间:2026-04-24
    • 可见光-红外跨模态行人重识别研究综述

      励志勇, 姜伟, 刘浩杰
      2025, 53(12): 4811-4832. DOI: 10.12263/DZXB.20250800
      摘要:行人重识别(Person Re-identification,ReID)作为智能视频监控系统的核心技术,其核心任务是在非重叠视域的摄像头网络中实现对特定目标行人的高效检索与匹配.然而,传统仅依赖可见光图像的方法在夜间或低照度等复杂光照条件下性能显著下降.为应对这一挑战,可见光-红外行人重识别(Visible-Infrared Person Re-identification,VI-ReID)应运而生,旨在实现可见光图像与红外图像之间的交叉检索.该任务不仅继承了单模态行人重识别中姿态变化、视角差异和遮挡等固有难题,更需克服由成像机理不同所导致的巨大跨模态鸿沟.本文对近年来基于深度学习的可见光-红外跨模态行人重识别方法进行了系统性梳理、归纳与评述,将现有主流方法划分为三大核心类别:(1)基于跨模态网络结构设计的方法,通过精心构造网络架构以提取模态不变的身份特征,具体包括双流特征提取网络、身份信息解耦模块、细粒度特征对齐,以及利用网络结构搜索等设计方法;(2)生成式学习方法,旨在通过模态转换或数据增强弥合模态间差距,涵盖单向或双向图像生成、构建统一中间模态,以及在特征层面进行生成与补偿等策略;(3)基于跨模态相似度学习的方法,聚焦于损失函数与度量学习的设计,通过拉近跨模态正样本对的距离并推开负样本对,主要包括基于样本或中心(代理)的对比学习,以及针对测试阶段优化的跨模态重排序算法.此外,考虑到实际应用中标注成本高昂且标签可能存在噪声或缺失,本文进一步深入探讨了非完全有监督学习范式下的研究进展,系统总结了噪声标签学习、半监督学习及无监督学习等方向所面临的独特挑战与代表性解决方案.为全面评估各类算法的性能,本文在SYSU-MM01、RegDB和LLCM公开数据集上,对不同监督范式下的代表性算法进行了统一的性能对比与分析.最后,本文立足于当前研究的技术瓶颈,对未来发展趋势进行了展望,指出构建更贴近真实场景的多样化数据集、缓解模态数据不平衡问题、推动模型轻量化部署、探索可持续或终身学习机制,以及拓展至视频级或多源异构信息融合的行人重识别等方向将是该领域极具潜力的研究热点,旨在为后续学者提供有价值的理论参考与技术指引.  
      关键词:跨模态行人重识别;模式识别;深度学习;表征学习;网络结构设计;生成式学习;智能监控   
      92
      |
      12
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 145919666 false
      更新时间:2026-04-24
    • 区块链赋能可信数据空间安全的研究进展

      尚思远, 杜学绘, 刘敖迪, 王潇涵, 吴翔宇, 王娜
      2025, 53(12): 4833-4858. DOI: 10.12263/DZXB.20250617
      摘要:随着可信数据空间发展行动计划的提出,促进数据要素的交易与流通,解决大数据产业“数据孤岛”式困境,已经上升至国家战略高度.区块链技术作为一种融合多种现有技术的分布式计算和存储范式,能够通过其不可篡改、去中心化、可溯源等优良特性,为数据可信管理提供有力支撑.其不同于传统数据库的数据存储,而是通过不可篡改的数据结构与多方共识的信任机制为数据提供者与数据使用者建立信任纽带.如何将区块链技术优势应用于可信数据空间安全建设,为国家打造可信数据空间的战略目标提供有力支撑,已成为亟需解决的问题.目前,国内外已经有许多学者对区块链技术进行综述总结,包括具体技术组成,如共识机制、智能合约、网络拓扑等;具体领域应用,如信息安全、系统防护、数据管理等;以及对区块链的技术增强,如分片、跨链、隐私保护等.然而,仍缺少区块链技术赋能可信数据空间安全的体系化综述研究.基于此,本文从学术视角对区块链赋能可信数据空间安全研究进行综述分析.首先,对可信数据空间基础架构与技术需求进行分析,从数据全生命周期角度提炼可信数据空间所面临的安全问题及挑战,提出一种贯穿数据获取、数据验证、数据共享、数据溯源环节的基于区块链的可信数据空间安全技术框架.随后,将区块链技术与各类主流安全机制结合,从数据可信获取、数据合规验证、数据安全共享、数据联合溯源四个方面,系统梳理归纳区块链赋能可信数据空间安全的研究进展.最后,对区块链赋能可信数据空间安全的发展趋势进行总结与展望,根据可信数据空间作为数据基础设施的基本需求,整理了不同数据流转阶段现有研究的优势和不足.当前还需在链上数据检索、数据权属保护、数据法规落实等方面实现进一步技术突破,从而保障可信数据空间可信管控、资源交互、价值共创等核心能力,促进基于区块链的可信数据空间安全建设与技术发展.  
      关键词:区块链;可信数据空间;数据共享;数据安全;隐私保护;技术赋能   
      131
      |
      32
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 149484754 false
      更新时间:2026-04-24
    • 功率半导体器件电荷场调制机理

      章文通, 张波, 李肇基
      2025, 53(12): 4859-4866. DOI: 10.12263/DZXB.20250921
      摘要:功率半导体器件与微纳器件的本质区别在于前者具有承受高压的耐压层和终端区.本文将功率半导体器件电场分解为电离电荷产生的电荷场Eq和外加电势产生的电势场Ep,使得各类功率半导体器件的电场作用机理,均可通过其变化电荷产生的附加电荷场进行独立分析.据此,本文提出功率半导体器件电荷场调制机理,通过电荷场Eq对电势场Ep的多维调制,实现器件耐压层与终端区的电势和电场的全域优化.电荷场调制机理普适于硅基分立、集成功率半导体器件耐压层及其终端设计,并可推广应用于宽禁带功率半导体器件.未来,该机理还可进一步与人工智能技术融合,提升器件设计效率.  
      关键词:功率半导体器件;耐压层;电荷场Eq;电势场Ep;电荷场调制机理   
      57
      |
      36
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 152061934 false
      更新时间:2026-04-24
    0