2024年, 第52卷, 第7期 刊出日期:2024-07-25
  

  • 全选
    |
    学术论文
  • 陈喆, 王品清, 周培根, 陈继新, 洪伟
    电子学报. 2024, 52(7): 2161-2169. https://doi.org/10.12263/DZXB.20230645
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    本文基于45 nm互补金属氧化物半导体绝缘体上硅工艺(Complementary Metal Oxide Semiconductor Silicon On Insulator,CMOS SOI)设计了一款支持5G毫米波24.25~27.5 GHz和37~43.5 GHz双频段的低相位噪声压控振荡器(Voltage Controlled Oscillator,VCO).基于CMOS SOI工艺良好的晶体管开关特性,结合开关电容阵列及开关电感方案,提高宽带调谐电容、电感Q值,扩展VCO工作频段,降低相位噪声.同时,输出匹配网络也采用开关电容切换方式,实现了5G毫米波双频段良好阻抗匹配及稳定功率输出.流片测试结果表明该VCO可以完整覆盖5G毫米波双频段24.25~27.5 GHz和37~43.5 GHz,低频段输出功率-4.8~0 dBm,高频段输出功率-6.4~-2.3 dBm.在24.482 GHz载频,1 MHz频偏处的相位噪声为-105.1 dBc/Hz;在43.308 GHz载频,1 MHz频偏处的相位噪声为-95.3 dBc/Hz.VCO核心直流功耗15.3~18.5 mW,电路核心面积为0.198 mm2.低频段(高频段)的FoM(Figure of Merit)及FoMT优值分别达到-181.3 dBc/Hz(-175.4 dBc/Hz)、-194.3 dBc/Hz(-188.3 dBc/Hz).

  • 李泽超, 付孝德, 潘礼勇, 严锐, 唐金辉
    电子学报. 2024, 52(7): 2170-2182. https://doi.org/10.12263/DZXB.20230971
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    视频隐私保护是当前社会面临的重要挑战之一,对视频进行模糊处理是保护人们隐私权益的重要手段.由于模糊视频天然缺失视觉模态的信息,主流的视频动作识别算法无法取得令人满意的效果.模糊视频作为多模态介质不仅仅只有视觉模态信息,同时,也含有丰富的音频模态信息,从人类的认知角度而言,音频也是获取信息的重要来源.本文提出一种基于多模态融合的隐私视频动作识别方法,在保证不侵犯使用者隐私的前提下进行人类动作行为识别.具体来说,使用音频-视觉特征融合模块将音频模态特征图融入到视觉模态中,充分融合音视频模态的深层语义信息.除此之外,模型还引入清晰视频帧图像作为标签,在模型训练阶段监督动作识别网络的参数更新,为隐私视频动作识别网络提供清晰的语义信息.在多组隐私行为数据集上,通过大量消融和对比实验验证了所提方法的有效性.

  • 顾勇, 马杰, 刘奥, 黄润华, 刘斯扬, 柏松, 张龙, 孙伟锋
    电子学报. 2024, 52(7): 2183-2189. https://doi.org/10.12263/DZXB.20230782
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    本文提出了一种基于N衬底P外延晶圆的全碳化硅(Silicon Carbide,SiC)集成工艺平台,该工艺平台兼容低压互补金属氧化物半导体场效应晶体管(Complementary Metal Oxide Semiconductor field-effect transistor,CMOS)、横向扩散金属氧化物半导体(Laterally-Diffused MOS,LDMOS)以及高压二极管等器件.采用P型缓冲层技术调节器件垂直方向电场分布,使高压器件垂直方向耐受电压提高212.4%;在1 μm厚度的P型缓冲层和1 μm厚度的P型外延层上,实现LDMOS、高压二级管和高侧区域耐受电压大于300 V.基于该工艺平台,搭建了SiC CMOS反相器和反相器链电路,均实现了0~20 V轨至轨的电压输出;设计了半桥驱动电路,低压侧驱动电路由四阶反相器构成;高压侧驱动电路由电平移位电路和高侧区域反相器链电路组成,实现了180~200 V浮空栅极驱动信号输出.

  • 陈梁栋, 黄知涛, 王翔, 吴癸周
    电子学报. 2024, 52(7): 2190-2200. https://doi.org/10.12263/DZXB.20230720
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对传统两步定位法在固定无源单站定位精度不高的问题,提出一种基于角速度先验的固定无源单站直接定位方法.首先,给出定位场景及辐射源运动模型,根据雷达辐射源脉内、脉间以及空间采样特点,按照快时间、慢时间、快拍构建三维观测信号模型.将快时间变换至频域并提取一组最强信号,利用本文提出的空时对称自相关函数(Space Time Symmetric Autocorrelation Function,STSAF),消除影响定位精度的多余相位项;然后,将经上述处理的2次观测信号进行混频,构建定位模型并给出直接定位代价函数;同时,针对性提出一种基于位置选择的MUSIC(MUltiple SIgnal Classification)算法,根据慢时间域包含的距离信息及空间域包含的方位信息,对辐射源横、纵坐标进行搜索,实现对辐射源的直接定位.本文对算法计算复杂度和克拉美罗下界(Cramer-Rao Lower Bound,CRLB)进行了理论推导,分析了影响定位精度的因素,对比所提直接定位方法与传统两步定位法的均方根误差,绘制本文方法的GDOP(Geometric Dilution Of Precision)曲线.

  • 谢辉, 凌昕彤, 汪子涵, 王家恒
    电子学报. 2024, 52(7): 2201-2211. https://doi.org/10.12263/DZXB.20230063
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    无线接入网复杂化持续加剧,无线设备数量激增.为了提升未来网络容量和资源利用率,需要设计有效的拥塞控制手段和资源调配策略,平衡子网络之间负载,促进跨域资源协同共享.为此,本文在新近提出的哈希接入协议的基础上,设计了哈希接入动态优化策略,根据网络负载状况动态调整接入参数以缓解网络拥塞,并在跨网络场景下进一步提出了负载均衡方案与资源整合再调配方案,为无线接入网整合无线资源、均衡网络负载提供了有用的方法.仿真结果表明,本文提出的哈希接入动态优化策略在保证网络稳定的同时最大化网络吞吐量,资源调配方案能有效地调配失衡的网络负载,提升复杂融合网络性能和接入公平性.

  • 李青, 钟将, 倪航
    电子学报. 2024, 52(7): 2212-2218. https://doi.org/10.12263/DZXB.20231106
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    图异常检测作为一项重要的数据挖掘任务,专注于识别与大多数节点显著偏离的异常节点.随着无监督图神经网络技术的进步,现已开发出了基于密度估计、对抗生成网络等多种高效识别图数据中潜在异常的方法.然而,这些方法更注重无监督图异常检测生成高质量的表征,而往往忽略了图异常的特性.因此,本文提出了一个双通道异构图异常检测模型(Dual-channel Heterogeneous Graph Anomaly Detection,HD-GAD).其模型基础架构包括双通道的图神经网络:全局子结构感知的图神经网络和局部子结构感知的图神经网络,用于图异常检测捕获全局和局部子结构属性.同时,基于对偶推断引入了多超球体学习目标(Multi-Hypersphere Learning,MHL),从宏观和介观超球体角度,分别测量在整个图/社区结构中偏离的异常节点.HD-GAD模型利用相似度函数EmbSim优化训练目标,以缓解多超球面学习中的模型坍问题.最后,在五种不同的数据集上进行了全面的实验.其AUC(Area Under Curve)值在大多数情况下均超过了0.9,达到了行业领先水平,进一步证明了HD-GAD模型在图异常检测任务上的高效性与性能优势.

  • 刘兵, 李穗, 刘明明, 刘浩
    电子学报. 2024, 52(7): 2219-2227. https://doi.org/10.12263/DZXB.20231156
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有多样化图像描述生成方法受到隐空间表示能力和评价指标制约,很难同时兼顾描述生成的多样性和准确性.为此,本文提出了一种新的多样化图像描述生成模型,该模型由一个条件变分推断编码器和一个生成器组成.编码器利用全局注意力学习每个单词的隐向量空间,以提升模型对描述多样化的建模能力.生成器根据给定图像和序列隐向量生成多样化的描述语句.同时,引入内省对抗学习的思想,条件变分推断编码器同时作为鉴别器来区分真实描述和生成的描述,赋予模型自我评价生成的描述语句的能力,克服预定义评价指标的局限性.在MSCOCO数据集上的实验表明,与传统方法相比,在随机生成100个描述语句时,多样性指标mBLEU(mutual overlap-BiLingual Evaluation Understudy)提升了1.9%,同时准确性指标CIDEr(Consensus-based Image Description Evaluation)显著提升了7.5%.与典型多模态大模型相比,所提出方法在较小参数量的条件下更适用于生成多样化的陈述性描述语句.

  • 徐思雅, 郭佳惠
    电子学报. 2024, 52(7): 2228-2241. https://doi.org/10.12263/DZXB.20230065
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    联邦学习作为一种新兴的分布式机器学习架构,允许车联网中多个车辆终端进行本地模型训练,并在兼顾数据隐私保护的条件下实现模型的全局聚合,从而提供可靠的车联网服务.然而,在联邦学习训练过程中,车辆终端往往因其高移动性在不同区域间切换训练,导致全局模型精度低.此外,恶意终端频繁上传无效或错误模型数据将导致车联网服务可靠性差.因此,本文提出了一种基于双层联邦学习的高动态车联网业务边缘协作计算机制.首先,综合考虑车辆终端的移动性、计算能力和可靠性,构建了终端服务能力模型,并提出了基于深度强化学习的边缘协作计算域构建算法,通过将多个边缘节点覆盖下的车辆终端进行聚簇训练,降低了终端本地模型的切换概率,从而保证联邦学习模型训练的持续性.进而,构建了包含边缘协作计算域内聚合层和域间聚合层的双层联邦学习框架,分别采用基于自适应聚合因子的本地模型半异步聚合机制和基于数据量的区域模型异步聚合机制,提升了联邦学习系统的聚合效率.特别地,考虑终端高速移动引起的跨域问题,引入了本地模型部分条件更新机制,避免了高质量模型被低质量模型覆盖的情况,进一步提高了全局模型准确率和系统资源利用率.仿真结果表明,本文所提机制在模型精度和服务可靠性等方面均优于本地计算、同步联邦学习和异步联邦学习算法.

  • 陈羽中, 陈友昆, 林闽沪, 牛玉贞
    电子学报. 2024, 52(7): 2242-2256. https://doi.org/10.12263/DZXB.20230607
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    与从现实场景中拍摄的自然图像不同,屏幕内容图像是一种合成图像,通常由计算机生成的文本、图形和动画等各种多媒体形式组合而成.现有评估方法通常未能充分考虑图像边缘结构信息和全局上下文信息对屏幕内容图像质量感知的影响.为解决上述问题,本文提出一种基于边缘辅助和多尺度Transformer的无参考屏幕内容图像质量评估模型.首先,使用高斯拉普拉斯算子构造由失真屏幕内容图像高频信息组成的边缘结构图,然后通过卷积神经网络(Convolutional Neural Network,CNN)对输入的失真屏幕内容图像和相应的边缘结构图进行多尺度的特征提取与融合,以图像的边缘结构信息为模型训练提供额外的信息增益.此外,本文进一步构建了基于Transformer的多尺度特征编码模块,从而在CNN获得的局部特征基础上更好地建模不同尺度图像和边缘特征的全局上下文信息.实验结果表明,本文提出的方法在指标上优于其他现有的无参考和全参考屏幕内容图像质量评估方法,能够取得更高的主客观视觉感知一致性.

  • 敬小炜, 景建伟, 闫丽萍, 刘长军
    电子学报. 2024, 52(7): 2257-2261. https://doi.org/10.12263/DZXB.20230932
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着航空航天技术的快速发展,封闭腔体内的无线能量传输(Wireless Power Transmission,WPT)技术开始受到广泛关注.基于频率控制的WPT技术,可实现对电大封闭腔体(103× λ 3)内的多方位传感器进行可控和高效的无线充电.电大腔体内的电场分布对频率的变化敏感,利用频率变化实现对封闭腔体场分布控制.实验结果表明,在S波段的1 m3腔体最高WPT传输效率为96.6%.设计的宽带整流电路实测整流效率最高为80%,整流效率高于50%的带宽为1.65 GHz.在2.401~2.495 GHz频段实现控制双接收机的不同工作状态,展现其在航空航天器等封闭空间中为传感器无线供电的应用前景.

  • 黄俊炀, 陈宏辉, 王嘉宝, 陈平平, 林志坚
    电子学报. 2024, 52(7): 2262-2270. https://doi.org/10.12263/DZXB.20240090
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    场景文本图像超分辨率(Scene Text Image Super-Resolution, STISR)旨在提高文本在低分辨率图像中的分辨率和可读性.但是在空间变形或低分辨率的文本图像中,由于缺乏文本区域细节,语义线索和视觉特征信息难以与字符位置匹配对齐,文本识别效果不佳.针对该问题,本文提出多域字符距离感知的场景文本图像超高分辨率重建方法(Perceiving Multi-Domain Character distance super-resolution, PMDC),强化视觉语义特征,提高文本区域和纹理信息.首先,采用非对称卷积以及语义先验信息模块,提取文本图像的视觉和语义特征信息;其次,融合字符距离感知模块中的视觉和语义特征,得到增强位置编码感知字符间的间距变化和语义相似性;最后,结合引导线索和视觉特征对像素进行重组得到超分辨率文本图像.在公开数据集TextZoom上的实验结果,与最近TATT文本超分网络性能相比,在峰值信噪比指标上提高0.11 dB,有效提高文本清晰度和边缘纹理细节,同时提升1.5%的平均识别准确率,改进文本图像的可读性.

  • 种一宁, 李珏, 乔明
    电子学报. 2024, 52(7): 2271-2278. https://doi.org/10.12263/DZXB.20230845
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    本文利用半超结结构进行高压超结功率金属氧化物半导体(Metal Oxide Semiconductor,MOS)器件的设计,基于Sentaurus TCAD(Technology Computer Aided Design)仿真平台设计超结元胞结构并优化高压超结功率MOS器件的击穿电压与导通电阻,随后探究了寄生电容的特性.最后,基于多次外延工艺自主设计出一款器件结构仿真击穿电压1 658 V、工艺仿真击穿电压1 598 V、比导通电阻值303 mΩ·cm2的高压超结功率MOS器件,与相同耐压值器件相比,比导通电阻值下降约50%.同时探究了超结掺杂浓度与厚度以及电压支持层掺杂浓度与厚度4个主要结构参数对器件寄生电容特性的影响.

  • 刘文犀, 张家榜, 李悦洲, 赖宇, 牛玉贞
    电子学报. 2024, 52(7): 2279-2290. https://doi.org/10.12263/DZXB.20230668
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    伪装目标检测旨在检测隐藏在复杂环境中的高度隐蔽物体,在医学、农业等多个领域有重要应用价值.现有方法结合边界先验过分强调边界区域,对伪装目标内部信息的表征不足,导致模型对伪装目标的内部区域检测不准确.同时,已有方法缺乏对伪装目标前景特征的有效挖掘,使背景区域被误检为伪装目标.为解决上述问题,本文提出一种基于边界特征融合和前景引导的伪装目标检测方法,该方法由特征提取、边界特征融合、主干特征增强和预测等若干个阶段构成.在边界特征融合阶段,首先,通过边界特征提取模块获得边界特征并预测边界掩码;然后,边界特征融合模块将边界特征和边界掩码与最低层次的主干特征有效融合;同时,加强伪装目标边界位置及内部区域特征.此外,设计前景引导模块,利用预测的伪装目标掩码增强主干特征,即将前一层特征预测的伪装目标掩码作为当前层特征的前景注意力,并对特征执行空间交互,提升网络对空间关系的识别能力,使网络关注精细而完整的伪装目标区域.本文在4个广泛使用的基准数据集上的实验结果表明,提出的方法优于对比的19个主流方法,对伪装目标检测任务具有更强鲁棒性和泛化能力.

  • 王欣睿, 季渊, 张引, 陈鸿港, 穆廷洲
    电子学报. 2024, 52(7): 2291-2299. https://doi.org/10.12263/DZXB.20230049
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于超像素技术,针对彩色硅基OLED(Organic Light Emitting Diode)微显示器,提出一种数字驱动策略,通过复用相邻像素信息,使单像素用于多个相邻像素成像,大幅提高显示分辨率.设计了一种数字驱动彩色OLEDoS(Organic Light Emitting Diode on Silicon)微显示器驱动电路,在120 Hz帧频的条件下,可实现256级灰度和4K显示分辨率,且电路面积和每秒数据传输量仅为传统驱动方式的50%.经测试验证,该驱动电路可实现的OLED像素平均电流范围为13.1 pA~3.74 nA,可满足微显示器近眼显示需求.

  • 黄河, 马瑞华
    电子学报. 2024, 52(7): 2300-2306. https://doi.org/10.12263/DZXB.20240018
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    本文提出了一种低剖面的宽带双极化基站天线.该天线由两个相互交叉的扇形偶极子演变而来.首先,在扇形偶极子末端增加环形窄微带和金属化通孔,使天线端口输入阻抗增大,达到降低天线高度的目的.然后,增大扇形偶极子臂的张角,产生第二谐振点,提高天线带宽.该双极化天线工作在2.17~2.7 GHz频段,可提供22%的带宽.而且,由于两个偶极子围绕几何中心高度对称,该天线在工作频带内可以获得较高的隔离度和交叉极化鉴别度,其中隔离度仿真值可达51 dB,0°交叉极化鉴别度仿真值可达48 dB.该天线的峰值增益仿真值高达9.6 dBi.综上所述,该天线具有高隔离、高交叉极化鉴别度和高增益等优点,在基站系统中具有良好的应用前景.

  • 张换香, 彭俊杰
    电子学报. 2024, 52(7): 2307-2319. https://doi.org/10.12263/DZXB.20230037
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    方面级情感分析是一种细粒度的情感分类任务,具有广泛的应用前景,正因为如此,得到了广泛关注与研究,尤其是近年来,基于依赖树的图神经网络和基于注意力的网络模型的研究取得了较大进展.但是,由于在线评论表达的复杂性和依赖关系不易解析使得这些方法在情感分析的性能上得不到有效提升.为了克服这些挑战,本文提出了一种同时考虑句法语义和上下文语义的深度语义挖掘模型(Deep Semantic Mining Model,DSMM).具体地,为了深度挖掘句法背后隐含的深度语义,模型采用并行的图卷积和多头注意力机制挖掘丰富的语义;为了充分利用句法语义和上下文语义的内在关联关系,采用了关联注意力机制获取句法语义和上下文语义的相关性,并且采用自适应方面路由机制有效获取方面的情感语义,并在此基础上,通过引入基于依赖树的语义位置嵌入,进一步增强方面-意见词的关联.在三个公共数据集上的实验结果表明,该模型在复杂句情感分析中既能从不同语义空间挖掘句子的语义特征,也能有效利用句法特征强化句子的语义表征,在分类准确率和泛化能力上的表现优于相关工作.

  • 蔡奇, 朱浩慎, 曾丁元, 王希瑶, 薛泉, 车文荃
    电子学报. 2024, 52(7): 2320-2330. https://doi.org/10.12263/DZXB.20240026
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    文章提出了一种面向毫米波应用的基于谐波调谐的单片集成(Monolithic Microwave Integrated Circuit,MMIC)功率放大器(Power Amplifier,PA).通过在晶体管输入和输出端对谐波终端进行控制,MMIC PA可以在高频实现高效率性能.本文提出的输出网络在匹配基频阻抗的同时,可以控制二次和三次谐波阻抗.此外,为了进一步提升功放效率,输入端的二次谐波阻抗也进行了调谐.在0.15 μm碳化硅基氮化镓(Gallium Nitride on Silicon Carbide,GaN-on-SiC)工艺上对所提出的功放架构和设计方法进行了仿真和测试验证.测试结果表明,PA在21.4~23 GHz的频带范围内,功率附加效率(Power Added Efficiency,PAE)大于39.2%,输出功率大于33 dBm.而PA工作频率为22.2 GHz时,测试的漏极效率最大达到63.7%,对应的PAE为50.2%,输出功率为34.1 dBm,仿真和测试结果基本吻合.整体电路尺寸只有1.87 mm2,因此单位面积的输出功率为1.31 W/mm2.和其他工作相比,本文提出的功放实现了较高的效率和功率密度.

  • 李思聪, 王坚, 宋亚飞, 王硕
    电子学报. 2024, 52(7): 2331-2340. https://doi.org/10.12263/DZXB.20240162
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着网络威胁的日益严峻,恶意代码的检测与分类变得尤为关键.传统分析方法依赖手动特征提取,不仅耗时且难以跟上恶意代码的快速变异.相比之下,深度学习技术在恶意代码分类方面展现出巨大潜力.然而,模型复杂度和资源消耗仍是实际部署的难题.本研究提出了TriCh-LKRepNet(Triple-Channel Large Kernel Reparameterisation Network),该网络专注于轻量化设计,旨在确保检测性能的同时降低计算和内存需求.通过提出的三通道映射技术,将恶意代码的多维信息有效转换为图像通道,增强了特征的区分性.结合卷积神经网络(Convolutional Neural Networks,CNN)和Transformer的优势,设计了一个高效的深度学习架构,并通过重参数化技术优化了连接路径,以降低内存消耗并提升运行效率.此外,引入的线性训练时间过参数化和大卷积核技术进一步降低了模型的参数量和计算负担.通过实验证明,TriCh-LKRepNet在提升恶意代码分类精度的同时实现了模型的轻量化,与现有技术相比,展现出更佳的性能和更广泛的应用潜力,特别是在资源受限和需要实时检测的环境中,提供了一种有效的解决方案.

  • 樊琳, 龚勋, 郑岑洋
    电子学报. 2024, 52(7): 2341-2355. https://doi.org/10.12263/DZXB.20231135
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    结合胃镜超声和白光内镜可以更准确地识别胃肠道间质瘤.但是现有的多模态方法往往仅关注于图像特征,忽略了诊断文本信息中所包含的语义信息对于精确理解和诊断医学图像的重要性.为此,本文提出一种新的基于文本引导下的多模态医学图像分析算法框架(Text-guided Multi-modal Medical image analysis framework,TMM-Net).TMM-Net使用多阶段的诊断文本来引导模型学习,以提取图像中的关键诊断信息特征,然后通过交叉模态注意力机制促进多模态特征之间的交互.值得注意的是,TMM-Net通过预测病变属性来模拟临床诊断过程,从而增强了可解释性.验证实验在两个中心包含10 025个模态数据对的数据集上进行.结果表明,该方法相比目前最优的GISTs诊断方法精度提升7.7%,同时获得了最高的(Area Under the Curve,AUC)值:0.927,其可解释性可以更好地适合临床需求.

  • 蒋林, 李云飞, 雷斌, 汤勃, 刘奇, 郭宇飞
    电子学报. 2024, 52(7): 2356-2368. https://doi.org/10.12263/DZXB.20230358
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对目前原始自适应蒙特卡洛定位(Adaptive Monte Carlo Localization,AMCL)在相似环境下绑架检测容易出错且重定位极易失败等问题,提出基于墙角族语义尺寸链的改进AMCL算法.融合机器人多传感器信息和Gmapping算法构建二维栅格地图,基于Yolov5获取室内环境的目标检测框和类别信息,结合GrabCut算法和贝叶斯方法构建增量式语义映射地图;通过墙角的凸、凹和墙角相对于机器人的方位角对墙角进行分类,充分发掘语义映射地图中各墙角之间、墙角与室内物体之间的类别和位置关系,构建墙角族语义尺寸链和相应检索表;在定位过程中,基于墙角族语义尺寸链进行全局预定位,提出绑架检测机制进行绑架检测,在检测到绑架事件发生后,基于改进AMCL算法实现定位自恢复.最后,通过真实环境下的绑架实验验证了本文方法的有效性,实验表明,所提方法的全局定位准确率、全局定位速率、绑架检测准确率和绑架后定位准确率在相似环境下分别提升了42%、214%、88%和72%;在非相似环境下分别提升了44%、152%、12%和92%;在长走廊环境下分别提升了36%、426%、26%和68%.

  • 李广丽, 叶艺源, 吴光庭, 李传秀, 吕敬钦, 张红斌
    电子学报. 2024, 52(7): 2369-2381. https://doi.org/10.12263/DZXB.20230305
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    乳腺癌是女性最常见的癌症.单一网络在乳腺癌病理图像分类中存在缺陷,卷积神经网络无法提取全局上下文,而Transformer不能准确描述局部细节.本文提出联合多视角Transformer编码与在线融合互学习的乳腺癌病理图像分类模型(Multi-View Transformer Online Fusion Mutual Learning,MVT-OFML).采用ResNet-50(Residual Network-50)提取图像局部特征,设计多视角Transformer编码模块,捕获图像中全局上下文;联合Logits和中间特征层构建OFML框架,实现ResNet-50与多视角Transformer编码模块间双向传递知识,使2个网络优势互补以完成乳腺癌病理图像分类.实验表明,在BreakHis和BACH数据集上,MVT-OFML的准确率比最强基线分别提升0.90%和2.26%,F 1均值比最强基线分别提升4.75%和3.21%.

  • 康海燕, 冀珊珊
    电子学报. 2024, 52(7): 2382-2392. https://doi.org/10.12263/DZXB.20231158
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    现有分布式机器学习模型的相关激励机制大多基于单层服务器架构,难以适应当前异构无线计算场景,同时存在计算资源分配不平衡、通信成本高昂等问题.针对上述问题,创新地提出一种面向无线边缘网络的分层Stackelberg博弈群体激励方法(Hierarchical Stackelberg game Swarm Learning Incentive method for wireless edge network,HSISL),创新地将Stackelberg博弈机制引入群体学习模型中,依据各参与方性能差异,云端聚合平台、边缘簇节点、边缘计算节点三方进行动态博弈,通过双定价公平激励过程,共同制定个性化分层资源分配策略,得到模型训练的最优纳什解,有效引导边缘计算模型进行正向加速.通过理论与实验分析,HSISL能够有效提升模型公平性与训练效率,其在MNIST数据集上的准确率可达96.06%.

  • 姜文涛, 高原, 袁姮, 刘万军
    电子学报. 2024, 52(7): 2393-2406. https://doi.org/10.12263/DZXB.20240104
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了提取更具表达能力和区分度的重点特征,减少网络传递时关键特征的流失,提高神经网络图像分类能力,提出一种新的门控机制图像分类网络(image classification Network of Gating Mechanism,GMNet).首先,使用门控卷积提取浅层特征,通过门控机制选择性地进行卷积操作,提高网络对原始图像关键特征的提取能力;其次,设计了一种插值门控卷积(Interpolation Gated Convolution,IGC)模块,利用Lanczos插值与门控卷积相结合,强化浅层特征的同时提取更具区分度的特征,提高特征的非线性表达能力;然后,设计了大核门控注意力机制(Large kernel Gated Attention Mechanism,LGAM)模块,将大核注意力与门控卷积相融合,实现了特征的选择性增强和选择性融合,提高关键区域特征的贡献度;最后,将大核门控注意力机制模块嵌入到残差分支中,让模型更有效地学习输入数据的特征和上下文信息,减少关键特征在网络信息传递时流失,提高网络的分类能力.本文方法在图像数据集CIFAR-10、CIFAR100、SVHN、Imagenette、Imagewoof上分别达到了97.05%、83.68%、97.68%、90.60%、83.05%的分类准确率,与当前先进的方法相比分别平均提高了3.26%、7.08%、3.44%、2.65%、5.02%.与现有主流网络模型相较,本文门控机制图像分类网络能够增强特征的非线性表达能力,提取更具表达能力和区分度的重点特征,减少关键特征流失,提高关键区域特征的贡献度,有效地提高神经网络图像分类能力.

  • 付东来, 高泽安
    电子学报. 2024, 52(7): 2407-2417. https://doi.org/10.12263/DZXB.20230565
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    多图学习是一种非常重要的学习范式.与多示例学习相比,在多图学习中包表示一个对象,包中的每一个图对应一个子对象.这种数据表示方法能够表达子对象的结构信息.但是,现有的多图学习方法不仅隐含假设包内的图满足独立同分布,而且多采用将多图学习问题转变为多示例学习问题的技术思路.这类多图学习方法容易损失图自身及图间的结构信息.针对上述问题,本文提出一种基于结构感知的多图学习方法,有效学习图自身和图间的结构信息.该方法利用图核,通过计算图之间的相似度保留图自身的结构信息,通过生成包级图表达图间的结构信息,并且设计包编码器有效学习图间的结构信息.在NCI(1)、NCI(109)和AIDB三个多图数据集上的实验结果表明,所提方法相较于现有方法在准确率、精确率、F 1值和AUC上分别平均提高了5.97%、3.44%、4.48%和2.56%,在召回率上平均降低了2.12%.

  • 彭自然, 许怀顺, 肖伸平
    电子学报. 2024, 52(7): 2418-2428. https://doi.org/10.12263/DZXB.20240236
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    大部分光伏电站地处偏僻、地形复杂的区域,受到外界环境的影响,易发生各种故障.而传统的光伏阵列故障诊断方法存在精度不高以及光伏数据利用率低等问题.针对以上问题,本文先是通过引入Levy飞行策略和步长因子动态调整策略改进麻雀搜索算法(Sparrow Search Algorithm,SSA),降低SSA算法陷入局部最优的风险,提升SSA算法的寻优能力.然后采用改进的Levy步长调整麻雀搜索算法(Levy Adjustment Sparrow Search Algorithm,LASSA)对CatBoost模型关键超参数进行寻优,提出了一种基于CatBoost并以LASSA为优化策略的光伏阵列故障诊断模型LASSA-CatBoost,以实现光伏阵列的短路、开路、老化和阴影遮挡故障的精确诊断.实验结果表明,LASSA-CatBoost模型的故障诊断准确率为99.7%,相较于优化前的CatBoost模型,准确率提高了3.6%.与现有的光伏阵列故障诊断模型相比,LASSA-CatBoost模型的准确性和稳定性更高.

  • 王海荣, 王彤, 徐玺, 荆博祥, 陈芳萍
    电子学报. 2024, 52(7): 2429-2437. https://doi.org/10.12263/DZXB.20231160
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为解决多模态命名实体识别中存在的视觉语义理解和多模态语义的偏差问题,本文提出了置信学习引导标签融合的多模态命名实体识别方法.该方法调用BLIP-2预训练模型生成图像描述,将其与输入的文本拼接,进行图文联合编码实现多模态特征融合,对多模态表征和文本表征解码后得到候选标签和文本标签;在采用KL散度损失函数对齐两组标签的基础上,计算置信分数用来评估多模态表征质量,设置置信阈值辅助筛选出有偏差的候选标签,并使用相应位置的文本标签替换有偏差的候选标签,实现标签的融合,最终完成多模态命名实体识别.为了验证本文方法,在Twitter-2015和Twitter-2017多模态数据集上进行实验,并将实验结果与MSB、UMT等7种主流方法进行对比,实验结果证明了本文方法的有效性.

  • 柴蓉, 刘磊, 梁承超, 陈前斌
    电子学报. 2024, 52(7): 2438-2448. https://doi.org/10.12263/DZXB.20240107
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    多波束卫星通信系统由于其高吞吐量和高资源利用率而受到广泛关注.已有研究主要考虑多波束卫星通信系统的信道或功率分配问题,但较少考虑用户分组和动态资源分配策略的联合优化设计,导致系统性能受限.此外,现有研究往往假设固定的波束覆盖半径,忽略了波束覆盖半径可变性对波束覆盖性能提升的影响.本文研究了多波束卫星通信系统中的用户分组和资源分配问题,提出了一种两阶段资源管理方案.针对动态和多样化的用户服务需求,首先设计一种基于Voronoi图的迭代用户分组算法以实现分组之间的负载均衡,然后将子信道和功率分配问题建模为系统平均效用函数最大化问题.为解决该问题,将每个波束视为一个智能体,采用一种基于多智能体深度Q网络(Deep Q Network,DQN)的算法来确定子信道和功率分配策略.仿真结果表明,与K-均值用户分组方案相比,本文所提出的基于Voronoi图的迭代用户分组算法对应的用户组负载差异值可降低49.2%,体现了本文所提算法在实现用户组间负载均衡方面的优势.此外,本文所提两阶段资源管理方案与现有文献中所提算法相比,系统所提供容量与用户需求差值可降低83.43%,体现了本文所提算法在实现系统资源高效利用及用户服务需求保障方面的性能优势.

  • 方澄, 管方恒, 李天驰, 邹政峰, 杨磊
    电子学报. 2024, 52(7): 2449-2460. https://doi.org/10.12263/DZXB.20230536
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    合成孔径雷达(Synthetic Aperture Radar,SAR)图像探测经常遇到误差敏感和计算量大的问题,给SAR图像目标识别带来困难,为此研究人员针对SAR数据提出很多新颖高效的深度学习方法,但面向SAR目标识别的深度学习网络大多使用与光学实值处理相同的方法,直接将实值深度神经网络应用于SAR图像.实值的神经网络都不同程度丢失了相位信息,不能充分利用SAR数据复数特性.相位信息是SAR图像独有的数据特征,在SAR干涉测量、信息检索、目标识别等应用中起到至关重要作用.本文为了使网络更适合SAR复数数据特征提取,打破传统神经网络架构,将整体网络端到端复数化,提出一种新型的端到端全复数域多层级神经网络(Complex-valued mUltI-Stage convolutIonal Neural nEtworks,CUISINE)架构,从SAR复数图像数据的输入到卷积计算,再到分类标签,实现全网络复数域下的计算.通过在MSTAR(Moving and Stationary Target Acquisition and Recognition)公开数据集上实验对比表明,本文的方法在SAR数据目标分类上有很好表现,在相位误差为0 rad的测试集上正确率达到99.42%,在相位误差为50 rad的测试集上正确率达到88.05%.

  • 于新阔, 李建平, 秦玉文, 杨海林, 彭迪, 向梦, 许鸥, 付松年
    电子学报. 2024, 52(7): 2461-2467. https://doi.org/10.12263/DZXB.20230079
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于传统多模光纤的模式资源,来构建多维复用超大容量光纤传输系统可以有效提升通信系统传输容量,满足急剧增长的数据业务需求.在本文中,我们联合波分复用、偏振复用和模分复用技术,基于传统OM2光纤实现了40个波长信道(1 535.04~1 566.31 nm)×2个模式信道(LP01和LP11b)的60 G波特偏分复用16阶正交幅度调制(Polarization Division Multiplexing 16-ary Quadrature Amplitude Modulation,PDM-16QAM)信号的短距模分复用相干光传输.整个模分复用链路由一对基于多平面光转换(Multi Plane Light Conversion,MPLC)的模式复用/解复用器和20 m OM2光纤构成.由于高模式隔离度的模式信道特性( < - 20 dB),本系统无需相应数字信号处理算法进行模式解复用,而仅需2×2的多输入多输出(Multiple Input Multiple Output,MIMO)算法完成偏振解复用.在实验中,除了对系统关键参数,包括脉冲成型滤波器的滚降因子、削峰比及接收光功率进行了优化外,还引入了Volterra判决反馈均衡方案.该均衡方案不仅能够补偿调制器引入的非线性信号损伤,而且能够缓解前馈均衡方案导致的高频噪声增强问题.最终,实验结果显示所有80个信道的误码率皆低于20%软判决前向误码纠错(Soft Decision Forward Error Correction,SD-FEC)阈值 2.7 × 10 - 2,系统总容量达38.4 Tbit/s,表明基于多模光纤的模式复用相干光传输方案在未来超大容量短距光互联系统中具有应用潜力.

  • 王欣, 申滨, 黄晓舸
    电子学报. 2024, 52(7): 2468-2476. https://doi.org/10.12263/DZXB.20240004
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    近年来,基于张量补全的频谱制图得到了广泛研究.目前用于频谱制图的张量补全算法大多隐含地假设张量具有平衡特性,而对于非平衡张量,难以利用其低秩性估计完整的张量信息,导致补全算法性能受损.本文提出基于重叠Ket增强(Overlapping Ket Augmentation,OKA)和张量列车(Tensor Train,TT)的非平衡频谱制图算法,以解决非平衡张量在应用传统张量补全算法时性能下降的问题.首先使用OKA将低阶高维张量表示为高阶低维张量,在无信息损耗的情况下解决非平衡张量无法利用其低秩性进行张量补全的问题;然后使用TT矩阵化得到较平衡的矩阵,在维度较平衡条件下提高补全算法的精确度;最后利用高阶低维张量的低秩性,使用并行矩阵分解或基于F范数的无奇异值分解(Singular Value Decomposition Free,SVDFree)算法完成张量补全.仿真结果表明,针对非平衡张量,所提方案与现有的张量补全算法相比,可以获得更精确的无线电地图,同时所提SVDFree算法具有更低的计算复杂度.

  • 陈艺薇, 邸若海, 王鹏, 张新兰, 张欢, 许文
    电子学报. 2024, 52(7): 2477-2490. https://doi.org/10.12263/DZXB.20230268
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现有基于动态规划的贝叶斯网络结构学习算法复杂度高、无法在合理时间内学习大规模网络的问题,提出基于双重约束的最优贝叶斯网络(Bayesian Network,BN)结构学习算法.首先,利用最大信息系数和马尔科夫毯限制条件独立性(Conditional Independence,CI)测试的候选节点集合和约束集,得到邻居节点集合;其次,利用邻居节点集合约束父节点图的搜索过程,得到候选父节点集合,从候选父节点集合中取出每个节点的最优父集构造初始有向图;再次,利用Tarjan算法计算初始有向图中的强连通分量,得到节点块序;最后,利用节点块序约束节点序图的搜索过程,获得最优的BN结构.实验表明,相比于现有的5种基于动态规划的结构学习算法,本文提出的算法在精度稍微降低的前提下,极大幅度提高了算法的学习效率,如Sachs网络,本文提出的算法相对DPCMB(Dynamic Programming Constrained with Markov Blanket)算法降低了40.3%的时耗,算法精度下降了12.1%.

  • 余毅丰, 钱江波, 严迪群, 王翀, 董理
    电子学报. 2024, 52(7): 2491-2502. https://doi.org/10.12263/DZXB.20230622
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    对长序列的动画线稿帧进行着色是计算机视觉中一项具有挑战性的任务.一方面,线稿中包含的信息较为稀疏,需要着色算法对缺失的信息进行推断;另一方面,连续帧之间的色彩需要保持一致,以确保整个视频的视觉质量.现有的着色算法多数只针对单张图片进行着色,这类算法只给出一个开放性的符合合理范围的色彩结果,无法适用于帧序列着色.另一些基于参考帧的着色算法,并没有将2帧之间的关系有机地联系起来,导致着色效果不够出色.在同一镜头序列中,同一对象的特征往往不会发生太大变化,因此,可以设计一个根据给定参考帧,即可给线稿自动着色的模型.为此,本文提出了基于CNN(Convolutional Neural Networks)和Transformer相结合的模型Cross-CNN,该模型能够从参考帧中寻找并匹配颜色,从而保证时间维度上的特征一致性.Cross-CNN模型参考帧和线稿帧在通道维度叠加,输入预训练的Resnet50网络提取局部融合特征,将融合特征图传给Transformer结构进行编码以提取全局特征.在Transformer结构中设计了交叉注意力机制更好地匹配远距离特征.最后使用带有跳层连接的卷积解码器完成着色图片输出.本文在数据集方面从8部电影中截取画面并经过严格筛选,最终制作了一个包含20 000对二元组的数据集用于实验研究.Cross-CNN的SSIM(Structural SIMilarity)达到了0.932,高于SOTA算法0.014.本文算法代码链接:https://github.com/silenye/Cross-CNN.

  • 项秋艳, 訾玲玲, 丛鑫
    电子学报. 2024, 52(7): 2503-2514. https://doi.org/10.12263/DZXB.20230731
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    精确的在线异常检测方法是物联网行业发展的核心,其中,以复杂和动态数据流为对象的在线异常识别是研究热点.现有在线异常检测方法存在处理复杂性负载过重问题,离线深度异常检测方法则存在因数据分布变化导致概念漂移问题.针对上述问题,本文提出了改进自适应模型池的在线异常检测框架,该框架可以与基于自动编码器的异常检测方法协作实现在线异常检测.首先,利用基于自动编码器的异常检测模型进行基本异常识别;其次,以自适应模型池为基础,融合概念漂移检测算法准确识别概念漂移,适应动态变化的数据流,解决概念漂移现象;最后,优化自适应模型池的模型合并方法,提升在线异常识别能力.实验结果表明,相比自动编码器模型的流变体和原自适应模型池算法,提出的算法在异常检测精度指标上分别提升了20.2%和5.83%,同时,最佳精度指标高于现有在线异常检测算法约16.7%.

  • 郭艳, 王智文, 赵润星
    电子学报. 2024, 52(7): 2515-2528. https://doi.org/10.12263/DZXB.20230772
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着电子设备的广泛应用,印刷电路板(Printed Circuit Board,PCB)在电子制造行业中具有重要意义.然而,由于制造过程中的不完美和环境因素的干扰,PCB上可能存在微小的缺陷.因此,开发高效准确的缺陷检测算法对于确保产品质量至关重要.针对PCB微小缺陷检测问题,本文提出了一种基于多维注意力机制的高精度PCB微小缺陷检测算法.为降低网络的模型参数量和计算量,引入部分卷积(Partial Convolution,PConv),将ELAN(Efficient Layer Aggregation Network)模块设计为更加高效的P-ELAN,同时,为增强网络对微小缺陷的特征提取能力,引入多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM)的全维动态卷积(Omni-dimensional Dynamic Convolution,ODConv)并结合部分卷积,设计了POD-CSP(Partial ODconv-Cross Stage Partial)和POD-MP(Partial ODconv-Max Pooling)跨阶段部分网络模块,提出了OD-Neck结构.最后,本文基于(Youo Only Look Once version 7,YOLOv7)提出了对小目标更加高效的YOLO-POD模型,并在训练阶段采用一种新颖的Alpha-SIoU损失函数对网络进行优化.实验结果表明,YOLO-POD的检测精确率和召回率分别达到了98.31%和97.09%,并在多个指标上取得了领先优势,尤其是对于更严格的(mean Average Precision at IoU threshold of 0.75,mAP75)指标,比原始的YOLOv7模型提高28%.验证了YOLO-POD在PCB缺陷检测性能中具有较高的准确性和鲁棒性,满足高精度的检测要求,可为PCB制造行业提供有效的检测解决方案.

  • 综述评论
  • 仇晶, 陈荣融, 朱浩瑾, 肖岩军, 殷丽华, 田志宏
    电子学报. 2024, 52(7): 2529-2556. https://doi.org/10.12263/DZXB.20231057
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    网络攻击调查是实现主动防御、溯源反制的重要手段.面向高隐蔽、强对抗的现代网络攻击,研究高效率、自动化攻击调查方法,提升己方快速响应复杂网络攻击能力,是智能网络攻防关键技术之一.现有研究通过将系统审计日志建模成可表达攻击事件因果依赖关系的溯源图,利用溯源图强大的关联分析和语义表达能力,对复杂隐蔽网络攻击进行调查,相较传统方法效果提升显著.在全面收集分析基于溯源图的攻击调查研究工作的基础上,根据溯源图利用方式及特征挖掘维度的差异,将基于溯源图的攻击调查方法划分为基于因果分析、基于深度表示学习和基于异常检测三类,总结凝练每类方法具体工作流程和通用框架.梳理溯源图优化方法,剖析相关技术从理论向产业落地的能力演变历程.归纳攻击调查常用数据集,对比分析基于溯源图的攻击调查代表性技术和性能指标,最后展望了该领域未来发展方向.

  • 电子学报. 2024, 52(7): 2557.
    摘要 ( ) PDF全文 ( )   可视化   收藏