阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 学术论文
    才华, 易亚希, 付强, 冉越, 孙俊喜
    电子学报. 2024, 52(10): 3368-3381. https://doi.org/10.12263/DZXB.20240271
    摘要 (1953) PDF全文 (2100) HTML (1864)   可视化   收藏

    现有的视觉语言多模态预训练方法仅在图像和文本的全局语义上进行特征对齐,对模态间细粒度特征交互的探索不足.针对这一问题,本文提出了一种基于跨模态引导和对齐的多模态预训练方法.该方法在模态特征提取阶段,采用基于视觉序列压缩的双流特征提取网络,在视觉编码器中联合图像和文本信息逐层引导视觉序列压缩,缓解与文本无关的冗余视觉信息对模态间细粒度交互的干扰;在模态特征对齐阶段,对图像和文本特征进行细粒度关系推理,实现视觉标记与文本标记的局部特征对齐,增强对模态间细粒度对齐关系的理解.实验结果表明,本文方法能够更好地对齐视觉文本的细粒度特征,在图文检索任务中,微调后的图像检索和文本检索的平均召回率分别达到了86.4%和94.88%,且零样本图文检索的整体指标相较于经典图文检索算法CLIP(Contrastive Language-Image Pre-training)提升了5.36%,在视觉问答等分类任务中,准确率也优于目前主流多模态预训练方法.

  • 面向无人系统的智能视觉算法
    谷美颖, 李航, 张家伟, 百晓, 郑锦
    电子学报. 2025, 53(3): 651-685. https://doi.org/10.12263/DZXB.20240699
    摘要 (1574) PDF全文 (1039) HTML (1523)   可视化   收藏
    CSCD(1)

    随着无人机(Unmanned Aerial Vehicle,UAV)成本的降低,无人机引起了越来越多的研究兴趣.其应用领域广泛,包括农业、消防、测绘、航拍以及娱乐应用.这些应用需要无人机在精准的自我定位下进行自主飞行,通常高度依赖于全球导航卫星系统(Global Navigation Satellite System,GNSS).然而,GNSS在长距离无线电通信方面存在多种缺陷(如非视距接收、多路径效应、欺骗信号),这推动了补充或取代卫星导航新方法的发展.基于视觉的无人机定位与导航方法利用无人机搭载的视觉传感器,实现自主定位与导航,成为解决这一问题的重要途径.本文的贡献在于系统性地梳理了基于视觉的无人机定位与导航技术,全面总结了该领域的研究现状和发展趋势.首先,介绍了无人机视觉定位的方法,主要分为图像检索和图像匹配两类,并对其技术特点、适用场景以及相关数据集和评价指标进行了分析.其次,详细阐述了无人机视觉导航的方法,根据导航功能的不同分为障碍物检测与规避方法以及路径规划方法,揭示了现有技术的优势和局限.最后,进一步讨论了基于视觉的无人机定位与导航方法在公共可用数据集、硬件加速、环境复杂性、实时性要求、能源限制以及模拟器到真实世界的泛化等方面可能面临的挑战.

  • 学术论文
    蔡美玲, 罗迪, 肖敬日, 李婧妍, 刘金平
    电子学报. 2024, 52(10): 3291-3300. https://doi.org/10.12263/DZXB.20240466
    摘要 (1446) PDF全文 (854) HTML (1249)   可视化   收藏

    工业过程数据涵盖离散和连续变量,它们之间内在的统计分布特性是揭示系统运行状况的关键.然而,现有的监测模型多聚焦于高斯假设下的连续过程变量,忽略了离散变量、连续变量的多模分布特性以及数据中的噪声、离群点对模型的影响,难以精准反映数据的真实分布特性,对非高斯、非平稳过程的异常检测效果欠佳.因此,本文提出一种鲁棒的工业过程异常检测方法——连续和离散变量协同分析的变分贝叶斯混合判别方法(Continuous and Discrete Variables-Concurrent Analysis-based Variational Bayesian Mixture Discriminant,CDVCA-VBMD).通过构建基于变分贝叶斯推断的面向连续变量的混合学生分布模型与面向离散多变量的混合多项分布模型,有效解决过程变量非高斯分布特性难以有效提取的问题,实现了过程变量复杂相关性的高效处理与分析;同时,在过程监测中引入了持续学习的理念,确保对非平稳时变工业过程异常的有效检测.以数值仿真系统和田纳西·伊斯曼过程为例,进行了大量验证性和对比性实验.结果表明,CDVCA-VBMD能准确估计非平稳工业过程多变量的混合多模分布特性,并对数据中的噪声和离群点具有较强的鲁棒性,从而实现工业异常的准确检测,为非高斯复杂工业过程的长期、鲁棒监测提供了有力支持.

  • 综述评论
    童率, 王继良
    电子学报. 2024, 52(10): 3623-3642. https://doi.org/10.12263/DZXB.20240471
    摘要 (1417) PDF全文 (1888) HTML (1315)   可视化   收藏

    物联网的快速发展催生了大量新型的应用模式和互联生态,推动了产业数字化和智能化发展.物联网通过连接传感器、可穿戴设备、智能表计等低数据率、低功耗终端,赋予大量普通设备计算和联网的能力.随着应用场景和系统规模的扩展,传统无线技术难以适应物联网大规模、低功耗、远距离的设备组网要求.如何降低设备接入门槛、实现设备低功耗远距离连接,是当前物联网面临的重要挑战.LoRa(Long Range)作为一种代表性的低功耗广域网技术,有效解决了低功耗设备远距离连接问题,已成为物联网的核心支撑技术.然而LoRa在规模化应用中仍面临以下三方面重要挑战:(1)大规模连接场景高并发传输导致信号冲突,设备并发接入困难;(2)远距离无线链路信号衰减剧烈,弱信号可靠传输困难;(3)物联网共享信道异构协议干扰问题突出,广域异构共存困难.本文概述了现阶段低功耗广域物联网技术研究进展,重点阐述现有技术在实际应用场景中面临的三方面研究挑战及对应的技术方案.针对高并发冲突问题,现有研究提出冲突避免和并发解码方法;针对弱信号问题,现有研究在弱信号增强传输和接收端解码优化两个方面展开探索;针对异构协议竞争问题,现有研究设计了多种设计跨协议通信机制.本文综述了LoRa低功耗广域网最新相关研究,分析现有工作的创新点和局限性,并指出了低功耗广域网未来研究和发展的方向.

  • 学术论文
    李景聿, 陈拓潮, 李明哲, 徐栩海, 张铖, 徐子晨, 刘譞哲, 黄罡, 冯云, 许辰人
    电子学报. 2024, 52(11): 3643-3656. https://doi.org/10.12263/DZXB.20220677
    摘要 (1416) PDF全文 (597) HTML (1225)   可视化   收藏

    移动增强现实应用中,用户频繁地与环境中不同的智能物体交互完成任务,其完成效率和用户体验由所采用的定向交互技术决定.然而,从交互手段上来说,现阶段定向交互依赖于Wi-Fi、BLE等无线技术,其信号全向传播的特点使其不能利用用户的空间环境(即位置和方向)来缩短互动时间,带来了不必要的时间成本;从交互界面上来说,现阶段基于视觉的界面存在可靠性低、扩展性低等问题,进一步限制了系统的通用性.本文介绍了 RetroAR——基于可见光逆反射通信的定向交互系统.RetroAR利用了光的定向传播特性来保留用户的空间环境,并依靠逆反射通信实现用户与目标设备之间无连接的快速定向交互.系统实验表明,RetroAR最远可在4 m距离支持100°视角的交互,同时实现厘米级的六自由度(6-Degrees Of Freedom,6-DoF)三维跟踪.用户研究表明,与基于Wi-Fi的解决方案相比,RetroAR将非接触式控制的交互时间减少了2倍,并且具有更好的用户体验.RetroAR借助可见光逆反射通信来利用用户空间环境,保持交互过程中的直观性.用户可以“所指即所控”的方式与多个目标进行互动,实现类似自然交互的快速定向交互.

  • 学术论文
    高思华, 李军辉, 李建伏, 刘宝煜
    电子学报. 2024, 52(11): 3699-3710. https://doi.org/10.12263/DZXB.20230299
    摘要 (1393) PDF全文 (523) HTML (1312)   可视化   收藏

    针对无人机(Unmanned Aerial Vehicle,UAV)辅助WSN(Wireless Sensor Networks)数据采集和能量补充工作中存在的数据来源单一和能量补充不均衡现象,本文首先提出数据采集和能量补充公平性问题并进行数学建模.其次,本文设计一种DPDQN(Double Parametrized Deep Q-Networks)强化学习算法,规划无人机的飞行路线和悬停位置,优化数据采集和能量补充效果.DPDQN学习离散动作与多种连续动作相混合的动作选择策略,算法网络模型包括离散动作网络和连续动作网络两部分.前者规划无人机访问数据采集节点的顺序,后者优化无人机在数据采集节点周围的悬停位置.仿真实验结果显示,本文算法在数据采集公平性、能量补充公平性、飞行距离和四种影响公平性的因素比较中均优于三种现有对比算法,并具有良好的鲁棒性和稳定性.

  • 学术论文
    宋艳涛, 路云里
    电子学报. 2024, 52(11): 3835-3846. https://doi.org/10.12263/DZXB.20230904
    摘要 (1392) PDF全文 (685) HTML (1294)   可视化   收藏

    超声图像分割在疾病诊断和治疗中扮演着关键的角色,但由于超声图像的低对比度、噪声干扰以及病灶在形状、大小和位置上的差异等特点,导致准确地分割出感兴趣的区域仍然是一个具有挑战性的任务.为了解决这一问题,本文提出了一种双通道自注意力机制U型网络(SwinT-Unet),该网络利用Swin-Transformer与Unet编码器同时进行特征提取.为了有效融合Swin-Transformer和Unet编码器提取到的不同层级的特征,本文还提出了一个门控双层特征融合模块(Gated Dual-layer Feature Fusion,GDFF),通过门控机制实现了整体特征与局部特征的有效融合,从而提高分割结果的精确度和鲁棒性.本文在2个不同的超声图像分割数据集上进行了实验,结果表明,本研究所提出的模型在分割准确性和鲁棒性方面均优于现有的卷积神经网络和基于Transformer的网络模型.本文为超声图像分割领域提供了一种新的方法,并为临床医学诊断和治疗提供了更准确、可靠的支持.

  • 学术论文
    钱忠胜, 黄恒, 万子珑
    电子学报. 2024, 52(11): 3684-3698. https://doi.org/10.12263/DZXB.20231084
    摘要 (1389) PDF全文 (579) HTML (1292)   可视化   收藏

    图卷积网络因其强大的高阶协作信号学习能力被广泛地应用在多行为推荐系统中.然而,目前大多数基于图卷积的多行为推荐方法未能有效建模不同用户/项目节点与各行为间的关系,且目标行为的稀疏性也困扰着多行为推荐算法性能的进一步提升.基于此,提出一种融合自注意力机制的多行为图对比学习推荐模型(Multi-Behavior Graph Contrastive Learning recommendation method with Self-Attention mechanism, SA-MBGCL).该方法将用户/项目节点嵌入与行为嵌入相结合,并使用自注意力机制增强嵌入表示,以有效建模不同节点与各行为间的依赖关系.同时,构建一种图对比学习方式,将同一用户的目标行为与辅助行为视为正例对,而不同用户的视为负例对,以强化不同用户的行为差异,达到缓解目标行为稀疏性的目的.将非采样的推荐任务与多行为图对比学习进行多任务联合优化,在Beibei与Taobao这2个公开数据集上,和6个单行为模型与10个多行为模型进行对比,结果表明,所提模型SA-MBGCL在HR(Hit Ratio)和NDCG(Normalize Discounted Cumulative Gain)这2个指标上分别平均提升5.21%和8.30%,说明本文方法是有效的.

  • 学术论文
    雷天亮, 吉立新, 王庚润, 刘树新, 巫岚
    电子学报. 2024, 52(11): 3741-3750. https://doi.org/10.12263/DZXB.20221225
    摘要 (1311) PDF全文 (782) HTML (1185)   可视化   收藏

    用户轨迹识别作为一项重要的时空数据挖掘任务,广泛应用于基于位置的个性化服务推荐、行程规划、犯罪行为检测和目标跟踪等领域,但依然面临预测精度不高的问题,主要原因是轨迹数据低采样且稀疏、轨迹类别数量巨大等.针对上述问题提出了基于可拓展自注意力时空图卷积神经网络的用户轨迹识别模型(Expandable Self-Attention Spatio-Temporal Graph Convolutional Neural Networks,ESAST-GCNN),该模型采用时空图卷积神经网络方式,深度挖掘时序特征与空间特征关系,并进行预测与拓展,结合自注意力机制获取用户轨迹特征向量内部相关性,最终根据该特征向量进行用户轨迹身份识别.在两个真实数据集上进行测试后发现,ESAST-GCNN相较于TULER-GRU(TUL via Embedding and RNN)在Geolife与Gowalla中准确率分别提高了13.95%、10.63%,实验结果表明ESAST-GCNN优于其他模型,识别效果更好,适用范围更广.

  • 学术论文
    王文涛, 叶晨, 田军
    电子学报. 2024, 52(11): 3780-3797. https://doi.org/10.12263/DZXB.20230382
    摘要 (1239) PDF全文 (660) HTML (1159)   可视化   收藏

    三维无人机路径规划问题旨在满足安全性条件的前提下为无人机规划出一条最佳的飞行路径.本文通过数学建模的方式构建出无人机路径规划的成本函数,从而无人机路径规划问题转化为多约束的优化问题,并使用元启发式算法来求解该问题.针对人工兔优化算法收敛慢以及易陷入局部最优的缺陷,本文开发了一种基于Levy飞行、自适应柯西变异以及精英群遗传策略改进的人工兔优化算法(Artificial Rabbit Optimization algorithm based on Levy flight,adaptive Cauchy mutation, and elite population Genetic strategy,LCGARO).将LCGARO与6个经典和先进的元启发式算法在29个CEC2017测试函数和6个复杂度不同的三维无人机路径规划地形场景中进行多方面对比实验.对比实验结果证明,在CEC2017测试函数的对比实验中,本文提出的LCGARO算法在22个测试函数中具有更优的寻优精度.在无人机路径规划实验中,LCGARO算法在5个地形场景中能够规划出总成本函数值最小的飞行路径.

  • 学术论文
    贺前华, 陈永强, 郑若伟, 黄金鑫
    电子学报. 2024, 52(10): 3482-3492. https://doi.org/10.12263/DZXB.20240048
    摘要 (1189) PDF全文 (303) HTML (1077)   可视化   收藏

    当前语音关键词检测主流技术为端到端的深度学习方法,研究重点为网络结构优化、建模单元选取及搜索策略等,并取得较快进展,但对模型训练效率的关注相对较少.本文针对深度学习模型训练效率问题,提出了一种样本类不确定性抽样(Class Uncertainty Sampling,CUS)的样本应用策略加速收敛进程.其核心思想是在模型训练中后期,利用网络的前向输出层对样本评价信息进行样本类不确定性度量,并转化成样本选用概率,随机抽取训练样本子集用于后续训练.由于简单样本的类确定度高,它们参与后续训练的概率降低,但不影响模型的区分能力,增强对判决边界样本的关注,达到提高模型训练效率的目标.基于AISHELL-1普通话数据集的实验结果表明,相对常规训练策略,平均训练时长缩短60%,收敛时长缩短47.5%.虚警率(False Alarm Rate,FAR)为0.5 FP/h时,该方法的错误拒绝率(False Reject Rate,FRR)从4.75%降至3.65%,相对下降30.1%,最大关键词加权值(Maximum Term Weighted Value,MTWV)由0.837 4升至0.853 1.通过分析错标样本参与训练的行为,证实了该方法具有屏蔽掉大部分错误标注样本的能力,减少错标样本对训练的损害.基于大规模AISHELL-2普通话数据集的实验进一步证实了提出方法的有效性.

  • 学术论文
    连晓娟, 蒋纪元, 万相, 肖宛昂, 王磊
    电子学报. 2024, 52(11): 3886-3898. https://doi.org/10.12263/DZXB.20230948
    摘要 (1146) PDF全文 (256) HTML (1075)   可视化   收藏

    相变集成光子器件具有带宽大、延迟低、多路复用和抗干扰性好等性能优势,因此被广泛视作传统电子器件的有力竞争者.然而,当前相变光子器件编程所需的能耗较高,从而对其商业应用前景造成了严重的损害.为了解决这一问题,本文创造性地提出了一种非常有前景的二氧化硅(SiO2)/氟化镁(MgF2)基光子架构以取代当前主流的硅基器件.该器件采用目前已得到广泛应用的相变材料Ge2Sb2Te5(GST)和氧化铟锡(ITO)合金分别作为功能层和片上加热器材料,并通过自主开发的电热和相场耦合模型实现其数据编程和读取过程的模拟.仿真结果表明该器件在晶化和非晶化过程中所产生的能耗分别为78 aj/nm3和90 aj/nm3,远低于其他大多数硅基器件.同时其在近红外波段(如1 550 nm)也保持了良好的光学传输特性,并展现出超过5个中间态的多值存储特性和50 ns的短脉宽编程时间.除此之外,进一步研究表明使用该器件所搭建的光学神经网络可用于鸢尾花数据集识别,其准确率高达90%,接近于传统人工神经网络的识别准确率(约为94.7%).上述工作为具有低功耗、存内计算和神经形态计算功能的新兴相变光子器件开发提供了新的研究思路,对于实现一种兼具电子和全光信息器件性能优势的通用非冯诺依曼计算体系有着重大的意义.

  • 学术论文
    闫莉, 许高添, 张廷豪
    电子学报. 2024, 52(10): 3472-3481. https://doi.org/10.12263/DZXB.20240059
    摘要 (1114) PDF全文 (262) HTML (1069)   可视化   收藏

    多级子图像融合是加速合成孔径雷达(Synthetic Aperture Radar,SAR)时域成像的关键手段.然而,机动平台SAR的大斜视采集增强了频谱支持区域的不规则特性,降低图像融合的效率和精度.针对这些问题,本文设计了一种改进的混合坐标系,在此基础上开发了大斜视俯冲机动平台SAR快速时域成像算法.得益于改进混合坐标系中建立的等效斜距模型,频谱对斜视角的敏感度降低,消除了频谱空变现象.因此,设计频谱预处理函数可以有效压缩和拼接频谱,提升图像融合的效率和精度.通过仿真和原始数据处理,验证了提出算法性能的优越性.

  • 学术论文
    王巍, 解慧, 魏忠诚, 赵继军, 彭力
    电子学报. 2024, 52(10): 3552-3561. https://doi.org/10.12263/DZXB.20240444
    摘要 (1111) PDF全文 (795) HTML (1014)   可视化   收藏

    灾害场景下依托无人机配送资源应用前景广阔,但应急场景环境复杂多变,各类突发事件在时空上的不确定性会导致目标点对资源需求评估的不准确,进而影响到资源配送中无人机任务分配方案.针对此问题,在无人机任务分配模型中引入两阶段鲁棒优化方法.模型通过将无人机分配和任务分配相结合,充分利用无人机集群资源,实现需求变化最大化时的任务分配成本最低.本文对受伤人数等级与资源需求变化关系建模,将资源需求划分为3 个等级,实现了任务分配总成本变化的精确化表达,并采用列和约束生成(Column-and-Constraint Generation,C&CG)算法实现了资源需求不确定条件下的无人机任务分配.最后设计了3 种类型的实验,仿真结果验证了算法的有效性和优越性,相比确定性模型,该算法在应对需求变化时展现出更好的鲁棒性.

  • 学术论文
    贺超波, 成其伟, 程俊伟, 杨佳琦, 程颢, 汤庸
    电子学报. 2024, 52(11): 3757-3768. https://doi.org/10.12263/DZXB.20230239
    摘要 (1111) PDF全文 (384) HTML (1024)   可视化   收藏

    动态属性网络的语义社区发现及演化分析具有重要研究价值,其包含动态社区发现、社区语义解释及社区演化分析三个任务,但现有方法均难以同时实现.针对该问题,提出一种基于联合非负矩阵分解的方法DAN-NMF(NMF for Dynamic Attributed Networks). DAN-NMF可以统一集成网络拓扑结构信息、节点属性信息及社区演化平滑约束信息,并利用最大最小化优化框架推导相关因子矩阵的迭代更新规则,从而可以直接获得动态社区发现、社区语义解释及社区演化分析结果.在人工合成和真实的动态属性网络进行大量相关实验,结果表明DAN-NMF比最优的基准方法在准确性指标上至少提高了7.3%.此外,在真实动态属性网络上的相关数据分析结果也表明DAN-NMF能够有效地发现动态社区的演化模式,并提供丰富的社区语义解释.

  • 学术论文
    陆庆阳, 袁广林, 朱虹, 秦晓燕, 薛模根
    电子学报. 2024, 52(10): 3448-3458. https://doi.org/10.12263/DZXB.20230364
    摘要 (1108) PDF全文 (446) HTML (1031)   可视化   收藏

    一阶段视觉定位方法由于其快速性而受到广泛关注,该方法利用图像与文本的融合特征预测目标框,但是现有方法在特征融合前没有进行图像与文本特征的对齐,限制了视觉定位的精度.为了解决这一问题,本文提出一种基于对比学习大模型的视觉定位方法.该方法采用基于对比学习的大规模预训练模型CLIP(Contrastive Language-Image Pre-training)提取图像和文本特征,利用Transformer编码器融合图像文本特征,使用多层感知机和融合特征预测目标框.该方法能够解决视觉定位方法上述不足的原因在于:借助CLIP模型的编码器可以提取高度语义对齐的图像和文本特征,同时使用全局注意力交互融合图像与文本的上下文特征.在5个数据集上,对本文提出的方法进行实验验证,实验结果表明:相比于现有视觉定位方法,本文方法取得了综合精度的提升.

  • 学术论文
    刘宗昊, 彭文杰, 代港, 黄双萍, 刘永革
    电子学报. 2024, 52(10): 3347-3358. https://doi.org/10.12263/DZXB.20240286
    摘要 (1088) PDF全文 (1035) HTML (993)   可视化   收藏

    甲骨文识别对于了解中国历史和传承中华文化都有重要的价值.目前,人工识别甲骨文需要具备丰富的专家经验并耗费大量的时间,而自动识别甲骨文的方法绝大部分受制于闭集假设,在甲骨文这种陆续发现新字符的现实场景下适用范围受限.为此,有研究者提出零样本甲骨文字符识别,其从视觉匹配的角度出发,将字模图像作为字符类别参考,通过拓片图像与字模图像的相似度匹配实现拓片图像的字符识别,然而其忽略了甲骨文拓片图像样本类内方差大的难点,仍存在因字形多变而容易匹配错误的不足.本文提出了一种两阶段的语义增强零样本甲骨文字符识别方法.第一阶段为域无关的字符语义学习阶段,通过提示学习从甲骨文拓片和字模图像中提取字符语义,解决甲骨文字符缺乏语义的问题.为应对拓片与字模之间的域差异,我们分别设置可学习的域提示信息和字符类别提示信息,通过解耦两者的语义实现更准确的特征提取.第二阶段为语义增强的字符图像视觉匹配阶段,模型通过两个分支分别提取类内共享特征和类间差异特征.第一个分支使用对比学习,将同一字符类别的不同字形视觉特征对齐到字符语义,引导模型关注类内共享特征;第二个分支使用损失函数N-Pair,增强模型对不同字符类别间差异特征的学习.在测试阶段,模型无须语义特征,通过训练中学到的类内相似性和类间差异性特征,实现更准确的拓片与字模匹配,提升零样本识别性能.我们在拓片数据集OBC306和字模数据集SOC5519上进行实验验证,实验结果表明,本文提出的方法在零样本甲骨文识别准确率比基准方法性能提升超过25%.

  • 学术论文
    李鸣, 许善智, 尹雨晴, 杨旭, 牛强, 李子龙
    电子学报. 2024, 52(11): 3858-3864. https://doi.org/10.12263/DZXB.20230715
    摘要 (1086) PDF全文 (158) HTML (980)   可视化   收藏

    物联网设备的爆发式增长推进了异构无线设备互联互通的进程,跨网通信技术(Cross-Technology Communication,CTC)允许同一频段下遵循不同底层协议的无线设备在无需网关的前提下实现直联,但移动状态下的双向跨网通信方法仍缺乏系统的研究.本文提出了一种基于能量感知的跨网通信方案——MobiCTC,它支持WiFi与ZigBee设备移动状态下的双向跨网通信.WiFi到ZigBee方向,该方案利用RSSI(Received Signal Strength Indicator)作为解码信息,基于能级映射实现信息解码;ZigBee到WiFi方向,该方案采用CSI(Channel State Information)作为解码信息,充分挖掘CSI的幅度与相位信息,利用机器学习方法实现分类解码.最后,本文使用TelosB节点和USRP X310平台对MobiCTC方案进行了实验验证.实验结果表明,移动状态下WiFi到ZigBee方向的系统吞吐量为139.535 bps,较WiZig提高了1.82倍,符号错误率为0.016,与WiZig基本持平;ZigBee到WiFi方向的系统吞吐量为250 bps,较FreeBee提高了15.7%,符号错误率为0.0516,较ZigFi下降了23.21%.

  • 学术论文
    冯锦元, 陈敏, 李俊影, 陈加乐, 蒲志强, 陈敏杰, 孙方义
    电子学报. 2024, 52(11): 3809-3822. https://doi.org/10.12263/DZXB.20230985
    摘要 (1085) PDF全文 (469) HTML (983)   可视化   收藏

    人工智能技术的迅速发展赋予了空战自主对抗策略超越人类专家的潜力.现有智能空战对抗策略依据驱动方式主要包含两类:其中,基于知识规则的策略对应用场景和专家知识依赖性强,而以强化学习为代表的数据驱动的策略可解释性差、泛化性弱.本文以全国智能空中博弈大赛多机协同空战为背景,提出了一种知识数据协同的多对手的空中博弈策略设计方法.其中,知识驱动部分基于专家知识设计一种参数化、风格化的策略,以生成高质量离线数据及初始化策略;数据驱动部分基于图注意力网络对队友、对手的信息进行针对性表征,提升训练效率及收敛性能.进一步,以动态对手匹配机制进行多对手强化学习训练,进一步提升策略泛化性.该策略与大赛16强中的12支队伍对抗,达到70%以上的统计胜率,这些队伍均采用最新的知识或数据驱动方法,风格各异,同时具有较强的作战能力.

  • 学术论文
    杜明晶, 吴福玉, 李宇蕊, 董永权
    电子学报. 2024, 52(10): 3459-3471. https://doi.org/10.12263/DZXB.20231146
    摘要 (1080) PDF全文 (458) HTML (1020)   可视化   收藏

    基于密度的聚类是一种经典的聚类分析方法,它能够在不指定类簇数目的情况下发现非球形类簇.但真实复杂数据集中存在类簇边界模糊、数据密度不均、数据分布复杂等问题.当前,能够同时应对这三种问题的研究工作相对较少.对此,本文从自然世界的侵蚀现象中汲取灵感,提出侵蚀聚类(Erosion Clustering,EC)算法.本算法引入动态密度估计方法和侵蚀策略,逐层识别和剔除位于类簇边界上的数据,进而发现各个类簇潜在的核心区域;采用基于互可达图的聚类方法实现核心区域的聚类;设计基于局部密度峰值的分配方式完成边界数据的划分.在12个基准数据集上的实验结果表明,EC算法的聚类性能比7种对比算法分别在修正兰德指标、修正互信息、F 1分数上平均提高了96%、53%和36%.

  • 学术论文
    林知心, 郑玉棒, 马天宇, 王蕊, 李恒超
    电子学报. 2024, 52(10): 3541-3551. https://doi.org/10.12263/DZXB.20240477
    摘要 (1030) PDF全文 (822) HTML (943)   可视化   收藏

    近年来,基于卷积神经网络的深度学习模型已经在高光谱图像分类领域取得优异表现.然而,模型性能的提升通常依赖于更深、更宽的网络结构,导致参数量和计算量增长,从而限制了模型在机载或星载载荷中的实际部署.为此,本文提出基于轻量级全连接张量映射网络的高光谱图像分类方法.根据全连接张量网络分解的映射思想以及高光谱图像“图谱合一”的结构特点,本文设计两种张量映射卷积单元,通过使用多个具有全连接结构的小尺寸卷积核代替原始卷积核,降低了卷积层的时间和空间复杂度.此外,基于新单元构建残差双分支张量模块.双分支结构共享同一组权重参数,并采用通道分割操作减少特征通道数,提升特征提取过程的实时性.本文所提模型通过使用新单元和新模块充分挖掘高光谱图像的局部空谱信息和全局光谱信息,有效提高了分类性能并减少硬件资源消耗.在三个常用高光谱图像数据集上的实验结果表明,所提模型相较于其他现有工作具有更高的分类性能以及更低的参数量和计算量.

  • 学术论文
    林丽群, 暨书逸, 何嘉晨, 赵铁松, 陈炜玲, 郭宗明
    电子学报. 2024, 52(11): 3727-3740. https://doi.org/10.12263/DZXB.20230283
    摘要 (1023) PDF全文 (523) HTML (948)   可视化   收藏

    由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特性,较少考虑人类记忆特性对视觉信息的存储和表达能力,以及视觉感知和记忆特性之间的相互作用.而用户观看长视频的时候,其质量评价需要动态评价,除了考虑感知要素外,还要引入记忆要素.为了更好地衡量长视频的质量评价,本文引入深度网络模型,深入探讨了视频感知和记忆特性对用户观看体验的影响,并基于两者特性提出长视频的动态质量评价模型.首先,本文设计主观实验,探究在不同视频播放模式下,视觉感知特性和人类记忆特性对用户体验质量的影响,构建了基于用户感知和记忆的视频质量数据库(Video Quality Database with Perception And Memory,PAM-VQD);其次,基于PAM-VQD数据库,采用深度学习的方法,结合视觉注意力机制,提取视频的深层感知特征,以精准评估感知对用户体验质量的影响;最后,将前端网络输出的感知质量分数、播放状态以及自卡顿间隔作为三个特征输入长短期记忆网络,以建立视觉感知和记忆特性之间的时间依赖关系.实验结果表明,所提出的质量评估模型在不同视频播放模式下均能准确预测用户体验质量,且泛化性能良好.

  • 学术论文
    陈爽, 田烨, 付莹
    电子学报. 2024, 52(10): 3600-3612. https://doi.org/10.12263/DZXB.20230343
    摘要 (1017) PDF全文 (606) HTML (931)   可视化   收藏

    量子图像传感器(Quanta Image Sensor,QIS)具有超高的单光子灵敏度与空间分辨率,因此其有望成为替代CMOS的下一代图像传感器.然而,从QIS获取的原始数据是二进制的图像帧,因此需要采用图像重建算法从二进制观测值中恢复原始场景.现有的方法包括基于模型的QIS图像重建和基于深度学习的QIS图像重建,其中基于模型的QIS图像重建通常需要进行大量的优化迭代,且对内部参数选择高度敏感.而基于深度学习的QIS图像重建则往往需要对每个具有细微不同的任务设计和训练单独的网络模型,灵活性欠缺并在很大程度上限制了其实用性.为了解决上述QIS图像重建方法的局限性,本文提出一种基于强化学习的免调参即插即用单光子图像重建方法.该方法能够自适应地对不同输入图像、不同过采样倍率和重建所处的不同迭代轮次动态选取合适的参数,实现更好的重建效果.具体地,本文将即插即用框架下的QIS图像重建任务中需要手动调整的参数建模为序列决策问题,引入结合无模型强化学习和基于模型强化学习思想的算法学习一个最佳策略,以实现对于不同输入图像在每次优化迭代时的最优超参选择.在合成和真实数据集上的实验结果表明,本文提出的方法可以在过采样倍率为4、6、8三种情况下,在峰值信噪比上相较现有先进方法提高约0.44~0.60 dB,在重建的视觉效果上也能够保留更多的纹理细节.真实极暗光QIS图像数据已在https://github.com/ying-fu/Real-SPAD-Dataset公开.

  • 学术论文
    李江敏, 乔少杰, 韩楠, 吴涛, 高瑞玮, 彭钰寒, 谢添丞, 冉黎琼
    电子学报. 2024, 52(11): 3751-3756. https://doi.org/10.12263/DZXB.20230724
    摘要 (977) PDF全文 (555) HTML (897)   可视化   收藏

    数据库参数调优是提高数据库性能的重要任务之一.数据库参数可按照作用域范围和功能进行分类,探究某一类参数之间的相互影响以及不同类别之间的相互影响是非常重要的,但是现有方法尚未考虑这一方面.提出面向数据库参数调优的协作型多智能体模型DBT-MADDPG(DataBase Tuning-Multi-Agent Deep Deterministic Policy Gradient),设计单智能体预训练模型SA(Single Agent)、多智能体联合训练模型JAM(Joint Action Model)以及基于概率选择的联合训练模型JAPM(Joint Action Probability Model),分阶段对数据库参数进行调优.实验结果表明,DBT-MADDPG模型能够分功能、分参数级别对数据库参数进行调优,在SA模型训练阶段便能到达主流算法的性能,且比主流算法快17.85%获得较佳配置.

  • 学术论文
    王汉灵, 柯逍, 江澳鑫, 郭文忠
    电子学报. 2024, 52(10): 3562-3577. https://doi.org/10.12263/DZXB.20240533
    摘要 (968) PDF全文 (1215) HTML (888)   可视化   收藏

    光场图像作为一种能够捕获场景每个位置光线信息的图像类型,在电子成像、医学影像和虚拟现实等领域具有广泛的应用前景.光场图像质量评估(Light Field Image Quality Assessment,LFIQA)旨在衡量此类图像的质量,但当前方法面临视觉效果与文本模态间异构性的重要挑战.为解决上述问题,本文提出了一种基于文本-视觉的多模态光场图像质量评估模型.具体来说,在视觉模态方面,我们设计了多任务模型,结合边缘自动阈值算法有效丰富了光场图像的关键表示特征.在文本模态方面,基于输入噪声特征与预测噪声特征的对比,准确识别光场图像的噪声类别,并验证了噪声预测对优化视觉表示的重要性.基于上述研究,进一步提出了一种优化的通用噪声文本配置方法,并结合边缘增强策略,显著提升了基线模型在光场图像质量评估中的准确性和泛化能力.此外,通过消融实验,评估了各组件对整体模型性能的贡献,验证了本文方法的有效性和稳健性.实验结果表明,该方法不仅在公开数据集Win5-LID和NBU-LF1.0的实验中表现出色,还在融合数据集中展示出优秀的实验结果,与现有最优算法相比,本文所提方法在两个数据库中的性能分别提升了2%和6%.本文提出的噪声验证策略和配置方法不仅为图像质量评估中的噪声预测任务提供了有价值的参考,也可用于其它噪声预测类型的辅助任务.

  • 学术论文
    田胜景, 韩一男, 赵宪通, 刘秀平, 张明
    电子学报. 2024, 52(10): 3527-3540. https://doi.org/10.12263/DZXB.20231009
    摘要 (960) PDF全文 (635) HTML (888)   可视化   收藏

    稀疏卷积在处理激光雷达点云单目标跟踪时的潜力尚未得到充分发掘.目前,绝大多数点云跟踪算法使用基于球邻域的骨干网络,其显存计算资源占用大并且目标感知的关系建模不充分.针对此问题,本文提出一种基于稀疏卷积结构的LiDAR(Lightlaser Detection And Ranging)点云跟踪算法,并创新性地融合了空间点与体素双通道的关系建模模块,以高效适应稀疏框架下目标判别信息的嵌入.首先,本文采用3D稀疏卷积残差网络来分别提取模板和搜索区域的特征,并利用反卷积来获取逐点特征来保证跟踪任务中对空间位置特性的要求.其次,关系建模模块进一步在模板与搜索区域特征之间计算相似度语义查询表.为了捕捉到模板与搜索区域间细粒度的关联性,该模块一方面在空间点通道中利用近邻算法找出每个搜索区域点的模板近邻点,并根据语义查询表提取对应特征;另一方面,在体素通道中以每个搜索区域点为中心构建局部多尺度体素,并根据落入体素单元的模板点索引计算语义查询表中值的累计和.最后,将双通道的特征融合并送入基于鸟瞰图的候选包围盒生成模块来回归目标包围盒.为了验证所提出方法的优越性,本文在KITTI和NuScenes数据集进行了测试,对比其他使用稀疏卷积的算法,本文方法平均成功率和精确率分别提升了11.0%和12.0%.本文方法在继承了稀疏卷积高效特点的同时还实现了跟踪精度的提高.

  • 学术论文
    胡林, 刘锡炎, 齐倩, 陈前斌
    电子学报. 2024, 52(10): 3359-3367. https://doi.org/10.12263/DZXB.20240456
    摘要 (956) PDF全文 (675) HTML (887)   可视化   收藏
    CSCD(1)

    在不完美信道状态信息(Channel State Information,CSI)和不完美串行干扰消除(Successive Interference Cancellation,SIC)的场景下,研究了可重构智能表面(Reconfigurable Intelligent Surface,RIS)辅助多用户非正交多址接入(Non-Orthogonal Multiple Access,NOMA)网络的鲁棒资源分配问题.在考虑两类用户(信息用户和能量用户)服务质量(Quality of Service,QoS)和信息用户SIC约束下,建立了基站发射功率最小化的优化问题.该问题是一个多变量耦合的非凸优化问题.为了求解该问题,本文使用松弛变量、线性近似、S-程序、符号定性法转化该问题的非凸约束.然后将优化问题分解为两个子问题,最后使用交替优化方法迭代求解两个子问题,直到发送功率收敛.仿真结果表明:该文算法具有较好的收敛性,实现了资源的鲁棒分配,同时有效地降低基站发射功率.

  • 学术论文
    彭博, 王明阳, 淦作腾, 刘林杰, 杜平安
    电子学报. 2024, 52(11): 3899-3906. https://doi.org/10.12263/DZXB.20230998
    摘要 (955) PDF全文 (237) HTML (877)   可视化   收藏

    芯片热流密度持续增加对封装散热提出了新的挑战,液冷微流道散热技术是解决封装热控制问题的重要研究方向.针对陶瓷封装高功耗芯片散热需求,本文提出在陶瓷基板上嵌入微流道,以缩短芯片与热沉距离,降低热阻,同时减小热控系统体积,实现热控、电气互连与结构的集成.嵌入式微流道结构设计的关键是如何考虑基板上的密集布线和通孔,避免布线、通孔和微流道的相互干涉.考虑布线和通孔的微流道结构,提出了微流道-布线-通孔的陶瓷基板一体化工艺方法.测试结果表明,微流道层位置的影响大于结构参数影响,微流道入口主流道汇流层与散热层应设计在同一结构层.设计的微流道陶瓷基板满足功耗100 W的芯片散热要求.

  • 学术论文
    杨赟辉, 程虎, 魏敬和, 刘国柱, 桑贤侦
    电子学报. 2024, 52(10): 3301-3311. https://doi.org/10.12263/DZXB.20240435
    摘要 (942) PDF全文 (505) HTML (859)   可视化   收藏

    基于Transformer的大语言模型(Large Language Models, LLM)和视觉Transformer(Vision Transformers, ViTs)分别在自然语言处理、机器视觉任务上实现了最为先进的性能.但是ViTs和LLM的常用激活函数GELU(Gaussian Error Linear Unit)、Swish在Transformer全量化推理中存在精度不足、计算效率低的问题,限制了它们在资源受限的边缘端设备上的部署和应用.本文提出了一种基于分段二次多项式拟合的激活函数高精度近似计算方法(Segmented Quadratic Polynomial Fitting,SQPF)及其量化推理过程,以实现端侧非线性激活函数的高性能部署.SQPF采用最小二乘法和粒子群优化方法求解非线性激活函数拟合优化问题,给出最优的二次多项式拟合系数和区间划分.得到的二次多项式拟合采用动态精度定点对称量化方法进行纯整数推理,推理过程仅包含移位操作和乘加运算.本文使用SQPF计算了GELU和Swish的二次多项式拟合Si-GELU和Si-Swish,并评估了量化推理精度.实验结果表明,在标准数据集ImageNet上,Si-GELU引起的ViTs(ViT、DeiT和Swin)模型分类任务准确率衰减仅为0.09%,是其他同类方法的27.3%;在主流的大语言模型评测数据集MMLU上,Si-Swish引起的子类别精度衰减不超过0.77%,大类别精度衰减不超过0.23%.极小的精度损失表明SQPF计算得到的最优分段二次多项式拟合可以直接替换Transformer模型中全精度浮点激活函数,不必进行参数微调或者重训练.

  • 学术论文
    廖磊瑶
    电子学报. 2024, 52(11): 3847-3857. https://doi.org/10.12263/DZXB.20240024
    摘要 (940) PDF全文 (737) HTML (837)   可视化   收藏

    现有基于深度神经网络的高距离分辨(High Range Resolution,HRR)雷达目标识别方法是纯数据驱动模型,是1个飞行事故记录器结构,特征不具可解释性,在方位缺失情况下特征泛化性差,模型识别率急剧下降.对此,本文设计了一种物理可解释自编码模型(Physical Interpretable Auto-Encoder Model,PIAEM),解码网络结合雷达目标的散射点模型,利用编码网络挖掘雷达数据具有明确物理含义的散射中心特征,从成像角度描述目标的物理结构特性,如尺寸、轮廓等,在方位缺失情况下具有稳健的物理特性.设计了基于最小重构误差的分类准则,实现雷达目标识别.基于实测高距离分辨雷达回波数据的实验结果表明,本文方法提取的特征具有明确物理含义,且在方位缺失4/5的情况下,PIAEM比现有基于传统目标识别方法的准确率提升了10.27%,验证了本文方法具有方位稳健识别性能.

  • 综述评论
    刘宏岩, 张栋, 吴春明
    电子学报. 2024, 52(10): 3613-3622. https://doi.org/10.12263/DZXB.20240199
    摘要 (932) PDF全文 (558) HTML (855)   可视化   收藏

    灰色故障是指对生产网络产生细微影响的交换机故障.然而,当这些轻微故障相互叠加或与新增故障叠加时,可能会导致整个生产网络的瘫痪.因此,检测灰色故障对生产网络的稳定性至关重要.传统解决方案关注的是在控制平面收集数据平面交换机中的流记录,并对其进行处理以检测灰色故障.然而,此类解决方案存在着不足:(1)缓存和处理大量的流记录会引入庞大的资源开销;(2)较高的检测时延无法保证灰色故障检测的时效性.近年来,可编程交换机的出现为灰色故障检测技术带来了新机遇:网络管理员可以将灰色故障检测算法部署运行至可编程交换机的线速ASIC流水线上,从而支持低开销、低时延、高精度的网内灰色故障检测技术.本文针对基于可编程交换机的网内灰色故障检测技术进行综述,在对灰色故障的概念、普遍性及对生产网络的危害进行描述的基础上,分析与讨论了现有基于可编程交换机的网内灰色故障检测技术的研究现状与进展,详细介绍每项技术的工作原理及流程,搭建真实的实验平台评估各项技术的检测指标,在文末指出了现有技术所面临的问题与挑战.

  • 学术论文
    孟昭逸, 黄文超, 张威楠, 熊焰
    电子学报. 2024, 52(11): 3669-3683. https://doi.org/10.12263/DZXB.20230642
    摘要 (912) PDF全文 (136) HTML (837)   可视化   收藏

    安卓虚拟化应用作为宿主程序,支持以插件形式动态加载用户所需功能模块.恶意开发者可利用上述应用特性将其真实攻击意图隐藏在插件程序的执行中,以躲避针对宿主程序的检测.然而,插件程序数量众多且难以获取与分析,并且现有基于既定模式的安卓恶意虚拟化应用检测方案存在可检测应用类型有限的问题.本文提出一种条件上下文敏感的安卓恶意虚拟化应用检测方法并实现了原型工具MVFinder.该方法以安卓虚拟化应用代码中触发插件程序加载或调用行为的上下文环境为切入点,挖掘出隐藏的恶意性,避免耗费大量资源去尝试实时获取不同种类的插件程序或逐一解析插件的加载与运行模式.同时,该方法利用异常检测技术,发现与大多数善意应用的条件上下文存在较大差异的数据样本,进而识别出目标恶意应用,避免基于既定规则进行检测的局限性.实验结果表明,本方法对安卓恶意虚拟化应用检测的准确率和F1分数均优于当前学术界的代表性方案VAHunt、Drebin与Difuzer.此外,相较于VAHunt,MVFinder可识别出HummingBad和PluginPhantom恶意应用家族的变种.

  • 学术论文
    孙航, 付秋月, 李勃辉, 但志平, 余梅, 万俊
    电子学报. 2024, 52(11): 3711-3726. https://doi.org/10.12263/DZXB.20230821
    摘要 (904) PDF全文 (493) HTML (854)   可视化   收藏

    近年来,基于U型结构的卷积神经网络在去雾领域取得了显著的成果.然而,大多数基于U型结构的去雾网络将编码层特征直接传递到对应尺度的解码层,忽略了不同层次特征信息的有效利用.此外,去雾网络中广泛使用的通道注意力受感受野的限制,没有充分地利用上下文信息,从而对通道权重的学习起负面作用,使得重构的清晰图像不够理想.为了解决上述问题,本文提出了一种跨层注意力特征交互和多尺度通道注意力的去雾算法.具体来说,跨层注意力特征交互模块利用编码层的多尺度跨层特征学习层级权重,然后将这些跨层特征聚合传递到对应解码层,从而减少了去雾网络重构清晰图像过程中的特征稀释.此外,为了挖掘对于去雾网络非常重要的特征通道信息,本文设计了多尺度通道注意力机制,利用不同空洞率的空洞卷积提取多尺度特征信息,形成一个多尺度上下文并行学习的通道注意力机制,可以更有效地为去雾网络的特征分配权重.实验结果表明,本文提出的去雾算法在4个公开的数据集上相比现有的12种去雾方法取得了较好的客观评价指标和视觉效果.本文的代码已上传至https://github.com/bohuisir/AAFMAN.

  • 学术论文
    吕建行, 李玉榕, 陈建国, 高宁
    电子学报. 2024, 52(10): 3493-3506. https://doi.org/10.12263/DZXB.20230886
    摘要 (903) PDF全文 (893) HTML (798)   可视化   收藏

    心电信号广泛应用于心脏疾病的医学检测中,可穿戴动态心电监测设备可以实现对心律失常的风险识别并预警.相比于静息心电信号,动态心电信号在采集过程中会受到更大运动伪迹的干扰,这些干扰会覆盖心电信号的关键信息,限制其临床应用.本文兼顾心电信号局部和全局特征,利用其周期性,研究了一种将心电信号低频PT波和高频QRS波群分开处理的两步式自适应阈值滤波算法,适用于单通道心电信号中的运动伪迹滤除.第一步先通过多分辨率阈值初步抑制心电信号低频部分中的运动伪迹;第二步,对受运动伪迹影响而不平衡的QRS波进行自适应阈值修复,通过对QRS波形调节,减少心电信号中高频部分运动伪迹,同时设置自适应阈值对心电信号P波、T波对应的小波系数进行处理,超出自适应阈值范围的小波系数通过波形缩放进行调整,进一步抑制低频运动伪迹.研究通过不同心电数据库评估算法的性能.在输入信噪比从-10 ~10 dB时,心电信号信噪比提升了10.912 2 dB和4.391 2 dB,滤波后心电信号与纯净心电信号的相关系数分别为0.687 6和0.978 3,提取的运动伪迹与原运动伪迹相关系数分别为0.953 0和0.852 9.实验结果表明,算法在不同噪声水平下,利用自适应阈值的优点,能有效复原受运动伪迹污染的心电信号波形特征,最大限度保留心电信号的临床信息,可作为可穿戴心电设备滤除运动伪迹的有效工具.

  • 学术论文
    杨传广, 陈路明, 赵二虎, 安竹林, 徐勇军
    电子学报. 2024, 52(10): 3435-3447. https://doi.org/10.12263/DZXB.20230976
    摘要 (889) PDF全文 (860) HTML (819)   可视化   收藏

    知识蒸馏的核心思想是利用1个作为教师网络的大型模型来指导1个作为学生网络的小型模型,提升学生网络在图像分类任务上的性能.现有知识蒸馏方法通常从单一的输入样本中提取类别概率或特征信息作为知识,并没有对样本间关系进行建模,造成网络的表征学习能力下降.为解决此问题,本文引入图卷积神经网络,将输入样本集视为图结点构建关系图,图中的每个样本都可以聚合其他样本信息,提升样本的表征能力.本文从图结点和图关系2个角度构建图表征知识蒸馏误差,利用元学习引导学生网络自适应学习教师网络更佳的图表征,提升学生网络的图建模能力.相比于基线方法,本文提出的图表征知识蒸馏方法在加拿大高等研究院(Canadian Institute For Advanced Research,CIFAR)发布的100种分类数据集上提升了3.70%的分类准确率,表明本文方法引导学生网络学习到了更具有判别性的特征空间,提升了图像分类能力.

  • 学术论文
    袁正道, 崔建华, 刘飞, 孙鹏, 王忠勇
    电子学报. 2024, 52(10): 3507-3516. https://doi.org/10.12263/DZXB.20230975
    摘要 (878) PDF全文 (672) HTML (823)   可视化   收藏

    在6G通信系统中,随着天线规模的增大,菲涅尔区逐步扩展,现有的远场通信假设会引入严重的能量扩散,即角度域不再稀疏.近场通信利用球面波前进行建模,其信道模型与用户到达基站的角度和距离相关,在通信的同时可以估计角度和距离,实现通信感知一体化(Integrated Sensing And Communication,ISAC).本文针对近场环境下ISAC问题,提出了基于极坐标的近场模型,通过非均匀网格划分将ISAC转化为稀疏估计问题,进而提出基于稀疏贝叶斯学习模型和消息传递算法的ISAC算法,同时完成活跃用户检测、位置感知和通信.此外,所提算法采用差分调制,在通信和感知中无需利用导频,即可实现盲ISAC,有效提升通信系统的频谱效率.仿真结果表明,相对于均匀区域划分和文献现有方法,本文提出的ISAC算法可获得更高的感知精度和误码率性能.

  • 学术论文
    温立强, 熊冠铭, 王宇, 陈一朴, 李伟平, 赵文
    电子学报. 2024, 52(10): 3578-3588. https://doi.org/10.12263/DZXB.20221188
    摘要 (873) PDF全文 (652) HTML (820)   可视化   收藏

    本文提出了一种子图转述的方法用于解决知识图谱问题生成中的未见谓词问题. 传统的问题生成方法主要利用标注的问答数据(问题-逻辑形式对)生成问题,然而标注数据难以覆盖知识图谱中所有的谓词,如何对未见的谓词生成问题依然是一个挑战. 本文提出了一种基于子图结构的语义解耦方法,通过将复杂问题对应的知识图谱子图分解为原子级子图,从而将包含未见谓词的多跳子图拆分为易于处理的单跳子图. 并且本文设计了一种子图转述方法,通过对数据集中的谓词进行采样,得到子图描述文本,并在大规模无监督数据上训练得到子图转述器,能够为包含未见谓词的子图提供自然语言形式的表述,为生成问题提供了有效的信息. 本文定量分析了在不同的难度级别下模型的性能表现,在GrailQA等数据集上的实验结果表明,本文的方法达到了最先进的性能.

  • 学术论文
    于浩淼, 刘炜, 孟流畅, 陈开睿, 宋友
    电子学报. 2024, 52(10): 3382-3391. https://doi.org/10.12263/DZXB.20240346
    摘要 (856) PDF全文 (487) HTML (802)   可视化   收藏

    金融欺诈对经济和社会稳定造成了严重的威胁,因此开发有效的欺诈检测算法对于保护金融系统的完整性至关重要.目前已有多种基于图学习的欺诈检测算法应用于实际场景当中,这些方法或针对图的结构信息开展分类,或通过图卷积神经网络学习节点的嵌入式表示进行欺诈检测工作,关注角度相对单一,无法完备地在非平衡多关系图上开展欺诈检测分析.针对以上问题,本论文提出了一种结合随机游走下的特征增强与子核分解的图神经网络欺诈检测算法(Random Walk feature enhancement and Kcore subkernel decomposition Graph Neural Network,RWK-GNN),该算法能够高效地挖掘出多关系不平衡图中节点层级与全局网络层级的拓扑信息,并通过子核分解算法优化图结构特征在社区演进角度上的传播与聚合,最终完成欺诈检测与识别.为验证RWK-GNN算法性能,本文使用了图神经网络欺诈检测任务常用的公开数据集进行模型训练与测试.实验结果表明,在同一评价指标下,该方法较相关机器学习算法与图神经网络算法有着较大提升,与CARE-GNN算法相比,该方法的AUC值提升了17%;与PC-GNN算法相比,该方法的AUC值提升了8%;与SIGN算法相比,该方法的AUC值提升了7%.

  • 学术论文
    孙中彬, 刁宇轩, 马苏洋
    电子学报. 2024, 52(10): 3392-3408. https://doi.org/10.12263/DZXB.20240210
    摘要 (842) PDF全文 (575) HTML (700)   可视化   收藏

    多标签分类任务广泛存在于现实生活中,然而其经常存在不均衡数据问题,严重影响了分类性能.目前解决该问题的主流技术为重采样方法,主要分为过采样和欠采样,过采样通过生成与少数类标签相关的样本,欠采样则是通过删除与多数类标签相关的样本.然而,这些方法都专注于解决一种不均衡问题,即标签内不均衡或标签间不均衡,导致在解决一种不均衡的同时可能引入另一种不均衡.针对该问题,本文提出一种基于安全欠采样的不均衡多标签数据集成学习方法ESUS(Ensemble learning method based on Safe Under-Sampling).首先通过标签划分将多标签不均衡数据集划分成单标签数据集和标签对数据集,针对单标签数据集,提出一种安全欠采样方法解决标签内不均衡问题,并利用采样后的均衡数据集构建二分类模型.对于标签对数据集,进行数据剪枝后利用集成学习解决标签间不均衡问题,在保持分类性能的同时降低时空复杂度.最后将单标签数据集模型和标签对数据集模型集成为最终的分类模型.在六个多标签不均衡数据集上的实验结果表明:和七种对比方法相比,ESUS方法在四个评价指标上更稳定有效.

  • 学术论文
    胡九川, 程建聪, 万良易, 吴楠士, 叶笑春, 严龙
    电子学报. 2024, 52(10): 3589-3599. https://doi.org/10.12263/DZXB.20231115
    摘要 (820) PDF全文 (322) HTML (772)   可视化   收藏

    处理器片上寄存器的分布形态与数量规模对处理器的整体计算性能有直接影响,这种影响表面上看是波及处理器片上缓存结构的改进和优化,本质上是时间要素与空间要素交织在一起的综合反映.因此,从时间和空间上确保处理器内核对片上缓存的局部化访问必将进一步提高处理器的整体计算性能.为了认识处理器片上缓存中存在的时间与空间及时局部性,以由传统缓存耦合而成的渗透缓存为工具来分析处理器内核访问片上缓存的时间与空间局部性,仿真实验表明渗透缓存因具备容纳时间与空间局部性的结构提高了处理器访问片上缓存的命中率,客观上缩短访存延迟,从而为提高处理器性能创造了有利条件.