最新刊期

    2025年第53卷第9期

      大模型与互联网

    • 基于大语言模型的时空数据零样本插补

      梅雅欣, 秦慧玲, 梁玉珠, 张广学, 王田
      2025, 53(9): 3047-3059. DOI: 10.12263/DZXB.20250473
      摘要:物联网感知数据由于部署成本、环境约束、设备故障等多重因素普遍存在数据稀疏问题,严重制约智能感知系统的整体性能.现有插补方法大多依赖标注数据进行监督训练,在面对新场景“冷启动”时泛化能力严重不足,难以满足物联网快速部署和跨域应用的实际需求.本文首次将大语言模型的内在推理能力引入时空数据插补领域,提出了基于多智能体协同推理的ZeroImpute框架,实现了从传统“数据驱动学习”向“知识驱动推理”的范式转换.该方法构建了由专门化任务的大语言模型智能体组成的协同推理系统:时序分析智能体负责复杂时间依赖关系的语义理解与推理,通过双向序列建模捕获前向演化趋势和后向约束条件;空间分析智能体专注于动态空间关系的建模与解析,基于时序上下文指导实现时变空间相关性的精准识别;插补决策智能体整合多源语义知识,运用自适应权重融合算法完成最终的智能插补决策.各智能体通过语义化的知识表达与逻辑推理实现对复杂时空模式的深度理解,将传统的数值计算问题转化为多智能体可协同处理的语义推理任务,突破了单一模型处理复杂时空关系的局限性.该框架具备一定的技术优势:首先,实现了真正的零样本泛化能力,无需任何领域特定的训练数据即可直接部署;其次,通过多智能体分工,提升了复杂时空模式的识别精度和推理质量;再次,具备良好的可解释性,智能体推理过程透明化,增强了系统的可信度;最后,即插即用部署大幅降低了实际应用的技术门槛和部署成本.在三个真实物联网数据集的综合评测中,ZeroImpute在完全零样本、零训练的严格设置下相比最优的专用深度学习模型在平均绝对误差MAE (Mean Absolute Error)指标上实现了至少4.5%的性能提升.此外,该方法在不同缺失率场景下均展现出鲁棒性,能够有效解决新部署区域快速上线、跨域数据插补泛化以及资源受限环境高效部署等关键实际问题.本研究开辟了多智能体协同推理的时空计算新范式,为时空数据插补领域提供了全新的技术路径,为推动物联网技术在更广泛领域的产业化应用提供了关键的技术支撑和理论基础.  
      关键词:物联网感知;数据稀疏;冷启动;时空数据插补;大语言模型;零样本   
      139
      |
      20
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 134125552 false
      更新时间:2025-12-27
    • 基于大模型辅助的云边协同工作流调度算法

      黎广镕, 李广军, 尚晶, 吴文泰, 王泽平, 龙赛琴
      2025, 53(9): 3060-3077. DOI: 10.12263/DZXB.20250494
      摘要:工作流在云边协同环境中执行可以减少云与终端设备之间的数据传输时延.由于云计算节点、边缘设备在计算能力、存储资源及通信延迟等方面存在显著差异,加之边缘服务器计算资源受负载压力、性能退化等因素影响具有动态性,同时工作流应用内部复杂的拓扑依赖关系进一步增加了调度约束条件,使得该场景下的工作流调度问题被证明为NP-hard问题.针对上述问题,本文提出了基于大模型辅助的云边协同工作流调度算法(Large Language Model-Assisted Cloud-Edge Collaborative Workflow Scheduling Algorithm,LAWS).该算法通过知识图谱结构化表征推理过程的思维链(Chain-of-Thought,CoT),将调度问题分解成多个子问题,并提取出子知识图谱作为子问题的思维链引导大模型协同推理调度决策.实验结果表明,与传统算法相比,该算法使得工作流执行时延降低3%~83%,计算能耗降低2.4%~66.0%.  
      关键词:工作流调度;云边协同;大模型;知识图谱;思维链;问题分解   
      90
      |
      10
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 135713101 false
      更新时间:2025-12-27
    • 基于大语言模型的SDN网络自动化配置研究

      杨兴源, 田乐, 姚莹, 潘璠, 胡宇翔
      2025, 53(9): 3078-3088. DOI: 10.12263/DZXB.20250463
      摘要:传统网络依赖人工配置,在应对规模激增、需求复杂化及实时性要求提升的现代网络环境时,效率低下且成本高昂.大语言模型(Large Language Model,LLM)凭借其出色的自然语言理解能力,在网络自动化配置中展现出巨大的潜力.面向软件定义网络(Software Defined Networking,SDN),本文提出了一种基于LLM的轻量级自动化配置方法.在数据平面,提出了一种基于检索增强生成(Retrieval-Augmented Generation,RAG)技术的代码自动生成方法RetroP4,支持基于用户意图生成P4代码;在控制平面,提出了一种基于任务分解的流表自动生成方法CtrlSynth,支持基于用户意图和数据平面P4代码生成流表配置.实验结果表明:相较于通用大模型,RetroP4生成的P4代码的语法正确性提高了25%,语义正确性提高了87.5%;CtrlSynth能够准确生成与P4代码匹配的流表信息,在流量意图不超过300条时,准确率可达100%.  
      关键词:大语言模型(LLM);网络配置;软件定义网络(SDN);可编程协议无关报文处理;检索增强生成(RAG)   
      92
      |
      12
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 129995001 false
      更新时间:2025-12-27
    • 胡睿, 吴昊, 潘宇轩, 张琳, 刘雨, 朱孔林
      2025, 53(9): 3089-3102. DOI: 10.12263/DZXB.20250451
      摘要:大语言模型(Large Language Model,LLM)驱动的开放域问答(Open-Domain Question Answering,ODAQ)系统,如GIST(Generating Identifiers and Selecting chunks for Tables)框架,在处理海量表格数据时展现出巨大潜力,受到了广泛关注.然而,当ODQA系统需要整合多方私有表格数据进行Top-K候选筛选等环节时,传统方法需要访问全部原数据,这在数据隐私、计算透明度及参与方行为可信度方面面临挑战.虽然现有研究采用零知识证明和基于权益的机制实现了公开可验证性,但在大规模场景下生成和验证单个证明的开销过高,而传统的基于权益的机制在公平性和对动态环境的适应性方面也存在局限性.对此,本文基于多方安全计算(Multi-Party Computation,MPC)、可公开聚合审计与动态信誉机制,提出了一种面向LLM开放域问答中多方私有表格筛选的增强方法.将Top-K多方私有表格筛选过程通过MPC完成,以保护多方私有数据隐私.同时,引入高效的聚合审计机制,将零知识证明技术与随机抽样、聚合证明构造、基于时间窗口的批处理和错误定位相结合,确保评分与排序过程的正确性可以被批量、公开验证.基于区块链的动态信誉反馈机制的集成也增强了系统的公平性,并约束了恶意行为.实验评估表明,本文的Top-K候选筛选方法在保证隐私的同时与GIST原有筛选方法在结果上达到0.91的Top-50平均召回率和0.83的平均Jaccard指数,具有高度一致性,不会影响ODQA端到端任务性能.同时,大规模任务下可公开审计的证明和验证效率均得到提升,与单独的证明相比节省了约87%的证明时间.反馈机制的适应性和公平性也得到了增强.  
      关键词:开放域问答;大语言模型;多方安全计算;可公开审计;零知识证明;区块链   
      27
      |
      6
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 132134897 false
      更新时间:2025-12-27
    • 面向环状RNA-疾病关联预测的物态分析优化算法

      王政, 王磊, 尤著宏, 王磊, 赵博伟
      2025, 53(9): 3103-3116. DOI: 10.12263/DZXB.20250436
      摘要:大量研究表明,环状RNA(circRiboNucleic Acid)作为一种内源性非编码RNA,在多种人类复杂疾病的发生和发展中扮演着关键角色.它们通过充当分子海绵、调节基因转录或与蛋白质相互作用等多种机制参与疾病相关信号通路的调控.解析环状RNA与疾病间的关联关系,对于深入理解疾病发生机制、发现新型生物标志物以及推动精准医疗的发展具有至关重要的科学价值.然而,传统实验方法成本高、周期长、通量有限,严重制约了环状RNA与疾病间关联关系的大规模解析.因此,发展高效、低成本的计算方法,对推动环状RNA与疾病关联的解析研究至关重要.本文据此提出了一种基于演化计算的预测模型ES-NMGCDA.该模型首先构建了多种环状RNA与疾病的多源相似性网络,随后加入物态分析优化算法(State Analysis Optimization Algorithm,SAOA)对多源相似性网络进行融合与优化,最终利用因果森林分类器实现环状RNA-疾病关联关系的精准预测.ES-NMGCDA通过将物态分析优化算法的强大搜索优势与因果森林的卓越推理能力相结合,实现了对环状RNA与疾病间潜在关联的高精度、高稳健性预测.为全面评估ES-NMGCDA模型的性能,我们在广泛使用的公共基准数据集CircR2Disease上进行了严格的5折交叉验证.实验结果表明,本模型在测试中达到了93.80%的预测准确率,同时在精确率、敏感率等多项指标上均表现优异,显著优于多种现有基线方法.此外,为进一步验证模型在真实生物医学场景下的实用价值,我们还开展了两项案例研究:在环状RNA与疾病间关联性的案例研究中,模型预测得分最高的前20个环状RNA-疾病关联对中,有18个获得了最新文献的支持;而在针对乳腺癌的案例研究中,模型预测出的前50个环状RNA中有43个已被证实与乳腺癌密切相关.这些结果一致表明,ES-NMGCDA模型不仅能够为后续分子生物学实验提供高可信度的候选环状RNA分子清单,显著缩短研究周期并降低实验成本,也为深入理解环状RNA在复杂疾病中的作用机制提供了新的数据支持和理论依据.  
      关键词:多源相似性网络;环状RNA-疾病;演化计算;物态分析优化算法;因果森林;潜在关联   
      62
      |
      5
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 135713213 false
      更新时间:2025-12-27
    • JURIS:基于理解增强型指令微调的司法命名实体识别方法

      彭晗, 阮日青, 胡颖, 刘琼林, 张震
      2025, 53(9): 3117-3133. DOI: 10.12263/DZXB.20250656
      摘要:命名实体识别(Named Entity Recognition,NER)是法律文本结构分析和语义理解的基础任务,能够极大提高司法效率,促进司法公正.然而,受限于法律文本的高度复杂性与专业性,传统NER方法难以充分理解法律文书中的上下文关联,较多依赖于浅层的词级预测,缺乏实体角色解析与深层语境推理能力,尤其在面对司法文本中频繁出现的嵌套实体、细粒度实体以及模糊的实体边界时存在明显的局限性.为解决上述问题,本文基于理解增强的建模范式,提出了一种面向中文法律场景的新型命名实体识别框架——JURIS(Judicial Understanding-enhanced Reasoning via Instruction-tuned Strategies for named entity recognition).该框架将实体识别重新建模为基于语境理解的条件生成任务,通过采用创新性的上下文感知的嵌入式标注策略,在保留文本原始语义结构的同时有效增强上下文信息建模能力,从而提升复杂语境下的实体识别效果.同时,JURIS构建了一个由规范模块、知识引导模块和类比学习模块组成的三元理解增强模块(Tri-aspect Understanding Enhancement Module,Tri-UEM),分别从输出一致性、领域知识注入与语境类比迁移3个维度协同提升模型对法律领域实体语义的深层理解与判别能力.实证结果表明,JURIS在CAIL2021、Drug和CSKS2019等多个领域数据集上均超过现有强基线模型,取得了当前最佳性能,改善了嵌套实体处理与细粒度识别表现,并展现出其在垂直领域信息抽取任务中的广泛适用性与推广潜力.  
      关键词:司法命名实体识别;理解增强;指令微调;信息抽取   
      75
      |
      8
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 135616294 false
      更新时间:2025-12-27

      学术论文

    • 最佳吻合下变形反射面天线电性能机电解耦计算方法

      张树新, 梁昌艺
      2025, 53(9): 3134-3146. DOI: 10.12263/DZXB.20250286
      摘要:多源载荷作用下反射面天线机电耦合分析、设计与调控是大口径反射面天线设计的难点.现有机电耦合计算方法采用积分运算模型,无法将结构变形进行解耦,导致积分运算复杂,计算耗时.针对多源载荷作用下变形反射面天线机电耦合计算复杂,难以开展电性能快速评估、调控等问题,提出了一种最佳吻合下变形反射面天线电性能机电解耦计算方法.以最佳吻合操作后的天线状态为基准,采用最佳吻合获得的法向偏差作为电性能计算的结构输入;利用相位项二阶展开近似方法,将结构变形分离出原有积分运算之外,使得原有积分运算转换为矩阵相乘模型;通过结构变形的分离与机电解耦,建立了最佳吻合下变形反射面天线电性能机电解耦计算模型,实现了最佳吻合下电性能快速解耦运算.以8 m反射面天线为典型案例,以假设结构变形、不同仰角下的重力与风载荷变形信息为结构输入,开展了多源载荷作用下天线电性能机电解耦计算方法的验证.仿真案例表明,在多源载荷作用下反射面天线电性能计算结果中,所提机电解耦计算方法可以获得与原有积分运算模型相吻合的天线方向图,且增益损失偏差在0.1 dB以内,具有较高的计算精度,满足天线设计要求.与原有积分模型相比,所提模型在保证计算精度的情况下,多源载荷作用下变形反射面天线电性能计算效率可提升95%,从而为电性能快速评估、调控等奠定基础.  
      关键词:最佳吻合;反射面天线;电性能;法向偏差;机电解耦   
      271
      |
      13
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 126427486 false
      更新时间:2025-12-27
    • 跨模态渐进式知识迁移SAR目标检测技术

      赵国威, 蒋嘉庆, 董刚刚
      2025, 53(9): 3147-3162. DOI: 10.12263/DZXB.20250417
      摘要:随着光/SAR传感器的投入使用,如何挖掘异源数据信息、提高遥感图像解译与信息获取效率,是当前亟待解决的科学问题.对此,论文提出了一种基于光/SAR(Synthetic Aperture Radar)图像渐进式知识迁移的跨模态目标检测方法(Progressive Crossmodal Knowledge Transfer,PCKT),充分挖掘可见光图像丰富的纹理细节信息,改善SAR图像目标检测性能.第一,针对可见光遥感与SAR截然不同的成像机理导致模态差异大、信息融合难的问题,提出从可见光图像到SAR图像的跨域生成技术,利用可见光图像语义信息引导构建伪SAR中间域,实现光学辐射特征与SAR散射特性的语义融合;第二,针对可见光与SAR图像之间存在的语义鸿沟、跨模态学习效果差的问题,设计光/SAR多尺度特征对齐学习策略,实现可见光源域-伪SAR中间域语义特征、伪SAR中间域-SAR目标域散射特性分布的高效对齐,形成分阶段的跨模态知识迁移学习框架;第三,针对光/SAR模态离群样本对跨模态学习的不利影响,提出基于质量感知的动态权重分配机制,根据域分类器置信度衡量动态量化合成样本的可靠性,在训练过程中优先学习高置信度样本,从而抑制离群中间域图像产生的不利影响.最后,利用SpaceNet6、SSDD(SAR Ship Detection Dataset)、HRSID(High-Resolution SAR Images Dataset)等典型异源数据进行了大量跨模态学习实验验证,结果表明所提方法能充分挖掘可见光图像的重要信息,改善SAR图像目标检测效果,与源域无迁移方法相比,论文所提出方法在SpaceNet同源知识迁移结果提升平均检测精度为21.5个百分点,与次优基线方法相比平均检测精度提升为3.3个百分点,很好地验证了跨模态知识迁移在SAR目标检测任务中的可行性.  
      关键词:合成孔径雷达;目标检测;知识迁移;对抗学习;多尺度对齐;伪标签学习   
      43
      |
      12
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 126427336 false
      更新时间:2025-12-27
    • 蒋春生, 霍亦康, 化麒麟, 宋树祥, 潘立阳, 许军
      2025, 53(9): 3163-3172. DOI: 10.12263/DZXB.20250400
      摘要:基于原子阈值开关的二维沟道材料场效应晶体管(Two-Dimensional Atomic Threshold Switching Field-Effect-Transistor,2D ATS-FET)凭借其超低关态电流、极小亚阈值摆幅、极低工作电压、紧凑的器件结构以及与主流CMOS(Complementary Metal-Oxide-Semiconductor)工艺相兼容等优势,在后摩尔时代低功耗逻辑计算、选通器和神经形态计算等领域具有重要的应用前景.2D ATS-FET可以视为由一个原子阈值开关(Threshold Switching,TS)器件和一个基准2D FET器件串联而成.本研究首先基于导电细丝(Conductive Filament,CF)演化动力学和隧穿机制建立了TS器件的电流-电压(current-Voltage,I-V)特性模型.其次,基于漂移-扩散输运机制,构建了基准2D FET器件的I-V特性模型.最后,基于两串联器件的导通电流必然相等的原理,使用Verilog-A编程语言,获得了与主流商业电路仿真器相兼容的标准SPICE(Simulation Program with Integrated Circuit Emphasis)模型.解析模型的计算结果与实验测试数据具有良好的一致性,验证了本文所提出理论模型的正确性.此外,基于这一解析模型,本文系统地研究了2D ATS-FET的电学特性及其工作机理.该解析模型为2D ATS-FET器件的工作机理研究、性能优化设计和电路仿真设计提供了可靠的理论基础和有效的研究工具.  
      关键词:原子阈值开关(TS);二维(2D)沟道材料;场效应晶体管;亚阈值摆幅;解析模型   
      50
      |
      6
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 127069968 false
      更新时间:2025-12-27
    • 基于位置感知的RIS辅助叠加导频传输

      赵贲, 夏文超, 赵海涛, 倪艺洋, 朱洪波
      2025, 53(9): 3173-3191. DOI: 10.12263/DZXB.20250195
      摘要:可重构智能表面(Reconfigurable Intelligent Surface,RIS)技术在提高定位精度和数据传输速率方面有巨大的潜力. 在移动用户设备(User Equipment,UE)位置和信道状态信息(Channel State Information,CSI)均未知前提下,本文研究了RIS辅助的位置感知与叠加导频(Superimposed Pilot,SP)传输. 在这项工作中,首先,设计了由多个位置相干间隔组成的传输帧结构,每个位置相干间隔包括纯导频传输时间和叠加导频-数据传输时间. 前者用于估计用户设备位置,后者用于同时传输数据和导频信号. 其次,推导了位置参数估计误差的克拉美-劳界,并采用快速傅里叶逆变换算法得到位置估计结果. 然后,基于位置估计结果进行信道估计,并推导了SP传输的可达速率的闭式解. 在此基础上,提出了块坐标下降算法联合优化用户发射功率和RIS相移,以提高用户加权和速率,并分析了算法的收敛性和复杂度. 最后,仿真结果验证了用户设备位置估计算法的性能,并通过与常规导频方案相比,验证了所提SP传输方案的优越性.  
      关键词:通信感知一体化;可重构智能表面;叠加导频;位置感知;信道估计   
      42
      |
      6
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 132134944 false
      更新时间:2025-12-27
    • 双向叠加BCH码及其高性能译码

      钟卓宏, 王千帆, 王义文, 宋林琦, 马啸
      2025, 53(9): 3192-3201. DOI: 10.12263/DZXB.20250582
      摘要:本文面向高可靠低时延通信(High-Reliability and Low-Latency Communication,HRLLC)场景的实际需求,提出了一种基于BCH(Bose,Chaudhuri and Hocquenghem,BCH)码的双向叠加编码与低复杂度译码方案.编码方面,采用BCH码作为成分码,基于双向叠加编码传输(Twisted-Pair Superposition Transmission,TPST)框架,构造了双向叠加BCH(TPST-BCH)码:上层BCH码字经随机变换后叠加至下层BCH码字,叠加版本进一步交织并反馈叠加至上层BCH码字,实现码长扩展与可靠性提升.译码方面,基于串行干扰消除思想,结合局部约束顺序统计译码(Ordered Statistics Decoding with Local Constraints,LC-OSD),先对上层码字生成一系列候选,给定上层候选后对下层码字进行LC-OSD译码,并最终选取后验概率最大的候选作为译码输出.为降低复杂度,我们提出了针对译码的提前终止设计,包括层内提前终止(用于提前终止层内LC-OSD搜索)和跨层提前终止(用于跳过某个上层码字给定后的整个下层LC-OSD搜索).结果显示,所提终止设计可以极大降低搜索次数,且几乎不损失性能.与现有编码方案相比,所提TPST-BCH码(采用所提译码)误帧率优于同码长码率的BCH码(采用LC-OSD算法)、5G LDPC(Low Density Parity Check)码(采用置信传播译码),与5G Polar码(采用串行干扰消除列表译码)误帧率相当或稍优,但在中高信噪比区域相对于5G Polar码具有更低的译码操作数和译码时延.  
      关键词:信道编码;BCH码;双向叠加传输;局部约束顺序统计译码   
      40
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 137631534 false
      更新时间:2025-12-27
    • 一种用于片上时钟系统的单粒子不敏感振荡器

      桑浩, 袁珩洲, 郭阳, 刘胜, 陈小文, 徐炜遐
      2025, 53(9): 3202-3210. DOI: 10.12263/DZXB.20250667
      摘要:随着先进半导体工艺的持续演进,芯片集成度与复杂度显著提升,系统时钟设计正逐步从片外晶振向片上时钟系统转变.基于LC压控振荡器(Inductor-Capacitor Voltage-Controlled Oscillator,LCVCO)的锁频环(Frequency-Locked Loop,FLL)时钟基准产生电路凭借其优异的噪声抑制特性和强抗辐照能力,成为高可靠性电子系统的关键技术.然而,现有LCVCO架构中的电容阵列与尾电流源对单粒子效应高度敏感,这在太空辐射环境中极易引发系统故障,严重制约了其在航天领域的应用前景.本文针对上述问题,提出一种新型LCVCO架构,旨在提升高可靠片上时钟系统的鲁棒性.该架构引入动态自偏置反馈技术,通过振荡信号实时动态调节尾电流源的偏置电压,有效抑制1/f噪声并实现输出幅度的自稳定控制.基于脉冲灵敏度函数(Impulse Sensitivity Function,ISF)对振荡器的相位噪声和单粒子敏感性进行评估和对比,仿真结果表明,本文设计的LCVCO在关键节点处的ISF曲线具有更低的幅值和良好的对称性,显著提升了噪声性能与抗SET特性.此外,谐振腔采用低阻抗泄放路径的NMOS型电容阵列单元,该单元结构能快速泄放单粒子瞬态电流,降低其带来的频率波动.本设计基于鳍形场效应晶体管(Fin Field-Effect Transistor,FinFET)工艺实现,芯片面积为0.06 mm²,功耗为9.6 mW.在26 MHz输出时钟条件下,相位噪声优化为-136 dBc/Hz@1MHz,品质因数(Figure of Merit,FoM)值为154.5 dBc/Hz@1MHz,周期抖动均方根值为5.93 ps.激光实验结果表明,本文设计的LCVCO激光触发阈值提升至1.5 nJ,较传统结构提高114.3%,大幅降低了单粒子效应的影响,重离子辐照实验在86.1 MeV·cm²/mg的线性能量转移(Linear Energy Transfer,LET)值下进行,结果显示最大频率偏移低于4.5%.仿真和实测结果充分验证了该电路在太空辐射环境中的高可靠性,为航天电子设备提供了更稳健的时钟解决方案.  
      关键词:振荡器;锁相环;时钟;相位噪声;单粒子瞬态;脉冲灵敏度函数   
      34
      |
      6
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 132286338 false
      更新时间:2025-12-27
    • 基于漏极电压和源极电压检测的SiC MOSFET过流保护芯片

      李强, 杨媛, 文阳, 赵天阳, 李亚兰, 茹逍
      2025, 53(9): 3211-3222. DOI: 10.12263/DZXB.20241156
      摘要:为解决碳化硅金属氧化物半导体场效应晶体管(SiC Metal Oxide Semiconductor Field Effect Transistor,SiC MOSFET)硬开关故障(Hard Switch Fault,HSF)、负载故障(Fault Under Load,FUL)和过载故障(OverLoad fault,OL)的问题,本文提出了一种基于SiC MOSFET漏极电压和源极电压检测的过流保护方法(OverCurrent Protection method based on the Drain-voltage and Source-voltage Detection,DSD-OCP).该方法通过检测电路实时监控SiC MOSFET的漏极电压和源极电压来准确识别短路故障和过载故障,并利用驱动电路控制SiC MOSFET的开通和关断,从而实现快速短路保护和自适应过载保护,同时还集成软关断功能.基于0.5 µm双极型-互补金属氧化物半导体-双扩散金属氧化物半导体(Bipolar-CMOS-DMOS,BCD)工艺,设计了DSD-OCP电路并进行流片,芯片面积为2.8 mm².采用研制的芯片搭建1200 V/80 mΩ SiC MOSFET测试平台,并验证了DSD-OCP方法的有效性.实验结果表明,SiC MOSFET在DSD-OCP芯片保护下的HSF和FUL持续时间分别为88 ns和105 ns.在不同母线电压下,DSD-OCP芯片能够为SiC MOSFET提供自适应的过载保护.因DSD-OCP芯片具有软关断功能,SiC MOSFET在过流保护时的漏极电压过冲不超过110 V.  
      关键词:SiC MOSFET;漏极电压和源极电压检测;快速短路保护;自适应过载保护;软关断功能   
      27
      |
      3
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 132286392 false
      更新时间:2025-12-27
    • 刘唤, 李郴, 蔡捷玎, 骆新江, 胡元云, 游彬, 徐魁文, 宋开新, 李文钧
      2025, 53(9): 3223-3232. DOI: 10.12263/DZXB.20250710
      摘要:随着第五代(5th Generation,5G)移动通信向第六代(6th Generation,6G或Beyond 5th Generation,B5G)移动通信毫米波频段演进,通信网络面临频谱重构与系统性能挑战.毫米波通信因具备带宽充足和高速率优势,已成为支撑高容量、低时延服务的关键技术.作为射频链路中的核心无源器件,带通滤波器承担通带信号选择与带外干扰抑制的重要功能.在高频高密度通信环境中,滤波器需兼顾频率复用、高集成度与紧凑封装,实现高选择性、低插入损耗与小型化的协同优化,这对结构设计与封装技术提出更高要求.低温共烧陶瓷(Low-Temperature Cofired Ceramics,LTCC)工艺因具备多层三维集成、高精度结构控制及优异介电性能,成为无源器件封装与集成的重要技术路径.基于LTCC工艺,本文提出了一种新型高选择性、低损耗且小型化的毫米波带通滤波器.该滤波器采用弯折式半波长与四分之一波长阶梯阻抗谐振器(Stepped Impedance Resonators,SIRs),并利用LTCC的多层集成优势有效减小其尺寸.为提高选择性,在部分交叉耦合拓扑的基础上引入额外交叉耦合路径,构建全向交叉耦合拓扑,并通过耦合矩阵综合和等效电路进行理论分析,实现通带附近形成三个传输零点.为降低损耗,滤波器选用低介电损耗的K7的LTCC材料,并通过金属化通孔侧壁构建屏蔽结构,以抑制表面波泄漏与寄生辐射.为验证滤波器设计方法的有效性,基于多层LTCC工艺,采用HFSS软件对工作于毫米波段的滤波器结构进行仿真和优化,并完成原型器件的制造和测试.测试结果表明:滤波器在中心频率28 GHz处的插入损耗仅为0.9 dB,通带内最小损耗低至0.61 dB;通带两侧边频滚降分别达到25.5 dB/GHz和10.47 dB/GHz,频率选择性显著增强.器件有效电路尺寸仅为1.44 mm × 1.0 mm(0.134 λ0 × 0.093 λ0),实现毫米波频段下的小型化.针对毫米波表面贴装(Surface-Mount Technology,SMT)式LTCC滤波器测试中难以准确提取本征性能的问题,本文引入多线式通-反射-线(Multiline-Thru-Reflect-Line,MTRL)校准测试方法.通过在测试板上安装LTCC滤波器,并结合自制MTRL标准件,将其编辑为矢量网络分析仪校准算法文件,可有效消除互连过渡带来的系统误差,从而获得更加准确可靠的S参数测量结果.该方法为毫米波LTCC无源器件的性能评估提供了一种通用且有效的解决方案.综上,本文展示了一种6G(B5G)毫米波通信用LTCC滤波器,基于耦合矩阵综合和等效电路,详细阐述了滤波器的设计原理.该滤波器采用全向交叉耦合拓扑和弯折式半波长与四分之一波长SIRs谐振器设计,实现了小型化、低损耗和高选择,还通过引入MTRL测试方法解决了毫米波滤波器本征性能的提取难题.该研究为6G毫米波通信系统中的高性能无源器件开发提供了有益的技术参考.  
      关键词:6G/B5G;毫米波;交叉耦合;低温共烧陶瓷;带通滤波器   
      63
      |
      8
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 134270862 false
      更新时间:2025-12-27
    • 面向超大规模多天线传输的时空乘积编码技术

      姜明, 刘祎萌, 徐悦, 孔令军, 魏岳军
      2025, 53(9): 3233-3244. DOI: 10.12263/DZXB.20241180
      摘要:由于充分挖掘了超大规模多天线系统的空间维度资源,时空二维编码可以有效解决极低时延约束下短块长编码传输性能严重劣化的问题,但目前该编码方案与等效大块长近香农限编码性能仍有较大差距.针对现有时空二维编码采用的交织串行级联结构在实际编译码中遇到的性能劣化等问题,本文提出一种适用于高效迭代译码的新型时空二维并行级联编码(时空乘积码).该编码方案在并行级联的乘积编码之后再进行特定的时域/空域映射,提高了编码交织深度并适用于高并行的迭代译码,从而提高了整体编译码的效率和可靠性.此外,本文所提编码方案充分利用了多天线在空间维度的优势,通过配置乘积码的不同分量码和不同的时域/空域映射方式,进一步提升传输性能并降低处理时延.论文具体引入单奇偶校验码作为空间维度的乘积级联分量码构造时空乘积码,仿真研究了时域/空域映射、分量码码长码率和调制方式对时空乘积码译码性能的影响,并详细分析了相应的传输和译码时延.仿真结果表明,本文所提时空乘积码方案相比于现有时空二维编码方案在误帧率为10-3下能实现0.4~2.3 dB的性能增益,同时所提方案更适合并行迭代译码和极低时延传输.  
      关键词:信道编码;多天线传输;并行级联编码;时空二维编码;不规则乘积码   
      44
      |
      11
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 126427618 false
      更新时间:2025-12-27
    • 无简并超混沌驱动三维星座加密的EWFRFT通信方法

      贠彦直, 孟庆微, 王晗, 马志强
      2025, 53(9): 3245-3255. DOI: 10.12263/DZXB.20250135
      摘要:为进一步增强无线通信的安全性,提出了一种无简并超混沌驱动三维星座加密的扩展加权分数傅里叶变换(Extended Weighted Fractional Fourier Transform, EWFRFT)通信方法.该方法构建了一种无简并超混沌,运用其产生的混沌序列控制缩放、罗德里格斯旋转的参数,生成随机的缩放矩阵、罗德里格斯旋转矩阵,对每个星座点实施先缩放再旋转的三维星座加密;随后,将加密星座点组合为I/Q信号,再进行EWFRFT处理.同时,给出了三维星座加密的数学模型和密码原语,证明了其具有完全保密性,且每个星座点均有8个相互独立的因素控制加密,变换后的位置更加随机不可预测.仿真结果表明,所提方法加密后不仅扰乱了原本分布规律的星座图,提升了无线信号的抗截获能力,而且传输信息呈现良好的随机性分布,能够对抗穷举、统计等常见攻击.  
      关键词:物理层安全;无简并超混沌;三维缩放;罗德里格斯旋转;扩展加权分数傅里叶变换   
      37
      |
      14
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 134127460 false
      更新时间:2025-12-27
    • 基于时序-脉幅聚类的未知雷达辐射源信号分选方法

      林进健, 黄明军, 孙慧博, 林梓涵, 谢恺
      2025, 53(9): 3256-3273. DOI: 10.12263/DZXB.20250341
      摘要:在复杂电磁环境中,多个未知雷达辐射源发射的脉冲在时域高度交织,其射频、脉宽等参数彼此高度相似,导致常规的分选方法性能下降.相比之下,脉冲幅度(Pulse Amplitude,PA)受雷达天线方向图、波束扫描方式等物理机制影响,特别是在机械扫描型雷达,呈现出可识别的包络变化规律,可为分选提供补充判别信息.基于此,本文提出一种基于到达时间(Time Of Arrival,TOA)与脉冲幅度的雷达信号分选方法.本文首先分析PA在不同雷达工作模式下的时序变化规律,借鉴密度聚类思想,在TOA-PA 2维空间中,结合邻域半径与局部斜率变化约束,识别具有相似几何形态的脉冲子集,生成初始聚类路径组.为解决因漏脉冲或噪声干扰导致的同源轨迹断裂问题,提出了聚类路径融合方法.通过时间重叠率筛选候选路径对,计算全局及局部斜率熵以评估PA趋势一致性,并采用Hausdorff距离度量路径间空间相似性度量,实现相似路径融合,构建了具有物理可解释性的PA包络轨迹.最后,对融合后的TOA序列构建一阶差分直方图,结合关联脉冲对方法完成脉冲重复间隔(Pulse Repetition Interval,PRI)候选分组与参数统计.实验在4种仿真场景下进行,涵盖10%~50%不同组合的漏脉冲率与噪声脉冲率.以纯度、F值、福尔克斯-马洛斯指数和调整兰德系数4项指标评估聚类性能,并与7种主流聚类算法对比.结果表明,所提方法在综合性能上显著优于对照组;路径融合机制有效抑制“增批”问题,提升聚类时序连续性与辐射源对应一致性;PRI估计平均相对误差不超过0.6%.本文研究了基于TOA与PA联合特征的初分选,引入基于时空相似度的路径融合策略,利用TOA一阶差分直方图进行PRI主分选,完成对PRI的检测.该方法适用于非合作电子侦察中未知辐射源的分选问题.后续研究可聚焦于聚类超参数的自适应整定、多节拍分选结果的证据融合机制,以及在实测脉冲描述字(Pulse Descriptive Word,PDW)数据集上的泛化性能验证.  
      关键词:时序-脉幅;聚类;未知雷达辐射源;信号分选;融合   
      150
      |
      13
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 135616343 false
      更新时间:2025-12-27
    • 一种条件集动态加权的因果结构学习算法

      曹冬蕾, 曹付元, 王雲霞, 高小方
      2025, 53(9): 3274-3286. DOI: 10.12263/DZXB.20250637
      摘要:基于约束的因果结构学习算法具有不依赖特定函数模型假设的优势且计算效率较高,但其对撞结构定向阶段高度依赖特定条件集的条件独立性检验(Conditional Independence Test,CIT)结果. 尽管近来有研究者提出Shapley-PC算法利用Shapley值整合多个条件集检验以降低CIT误差的影响,但仍未充分考虑不同条件集对定向决策的具体影响,忽略部分关键条件集的重要性,降低定向准确性. 为此,本文提出一种条件集动态加权的因果结构学习算法(Dynamically Weighted Causal Structure Learning,DW-CSL). 该方法核心机制为针对相同规模的条件集通过归一化p-value与Shapley值构建动态权重,细粒度地量化不同条件集对定向决策的贡献差异,从而显著抑制CIT误差在对撞结构中的定向传播. 具体而言,该方法首先基于PC-Stable框架构建因果骨架;其次在对撞结构定向阶段,基于Shapley值提出条件集动态加权的定向决策规则,通过归一化p-value量化条件集贡献差异,使不同条件集的CIT结果具有可比性,再将归一化值作为Shapley边际贡献的权重,实现对未遮蔽三元组的精准定向;最后通过Meek规则定向剩余无向边. 实验结果表明,在合成与基准数据上,该方法较对比方法在对撞结构识别准确性上平均提高4.75%,在边定向准确性上平均提高5.5%,有效提高了因果结构学习的稳定性和准确性.  
      关键词:因果结构学习;条件独立性检验;条件集动态加权;归一化p-value;Shapley值   
      32
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 136278175 false
      更新时间:2025-12-27
    • 基于动态关系原型的持续关系抽取技术

      钟将, 戴启祝, 李雪
      2025, 53(9): 3287-3298. DOI: 10.12263/DZXB.20240472
      摘要:持续关系抽取(Continuous Relation Extraction,CRE)在理解和适应不断变化的数据环境中扮演着至关重要的角色.传统的CRE技术通常面临两大难题:一是关系模式的持续演变,二是遗忘之前学习的关系的风险.尽管存储和重放旧关系典型示例的做法在减少遗忘方面已被证明是有效的,但反复重放这些固定且有限的样本可能导致过拟合.为了解决这一问题,本文提出了一种基于动态原型的持续关系抽取方法.该方法结合了密度聚类和生成式大型语言模型,以应对上述挑战,本文将其命名为密度聚类和生成式大型语言建模(Continuous Relation Extraction with Density based Clustering and Generative Large Language Model,CRE-DCGLLM).具体而言,本文采用了密度聚类技术来提取记忆样本,缓解对先前任务的遗忘问题,并基于全量样本和记忆样本设计了动态关系原型.此外,本文通过生成式大语文模型为记忆样本生成伪样本用于重放训练,以解决因多次重放导致的模型过拟合问题.同时,本文还运用焦点知识蒸馏技术,以提升对变化中关系模式的适应性能.通过在FewRel数据集和TACRED数据集上进行的一系列实验,本文验证了该方法的有效性.实验结果显示,本文的方法在持续关系抽取的准确性和效率方面都取得了显著的提升,特别是在处理相似关系、防止知识遗忘以及克服过拟合等方面表现出了卓越的性能.  
      关键词:持续关系抽取;聚类;大语言模型;密度峰值;动态原型   
      44
      |
      7
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 130454422 false
      更新时间:2025-12-27
    • 基于非一般类算子融合方法及硬件架构设计

      王莹, 高岚, 张哲, 刘昕, 武毅雄, 张伟功
      2025, 53(9): 3299-3309. DOI: 10.12263/DZXB.20250312
      摘要:针对传统算子融合算法在异构计算系统跨计算单元时的失效性问题,本文提出一种优化后的算子融合策略,并针对新型融合算法进行了硬件设计实现.论文基于传统算子融合算法的设计初衷,在端侧异构计算系统部署深度学习算法时,分析算子融合覆盖率对推理任务计算性能的影响,挖掘跨计算单元算子融合的可能性,设计可以提升算子融合覆盖率的改进算法模型;同时,通过构建以CPU(Central Processing Unit)+GPU(Graphics Processing Unit)+DLA((Deep Learning Accelerator))组成的异构计算平台,为改进后的算子融合策略提供结构更加耦合的多层级存储共享结构.实验结果表明,与优化前的算子融合算法相比,改进后的算子融合策略可以有效提升算子融合覆盖率,部署在Xilinx公司FPGA(Field-Programmable Gate Array)开发板上进行目标检测网络推理实验.结果表明,本文提出的设计方案,针对YOLOX-Nano的推理过程可实现62.67%推理计算性能提升,计算加速比为2.68;针对YOLOv5s的推理过程可实现71.10%推理计算性能提升,计算加速比为3.46.  
      关键词:深度学习;算子融合;卷积神经网络;异构计算;FPGA;GPU   
      69
      |
      12
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 129093805 false
      更新时间:2025-12-27
    • 基于稀疏平滑自蒸馏的差分隐私深度学习方法

      赵登峰, 薛大暄, 赵素云, 陈红
      2025, 53(9): 3310-3318. DOI: 10.12263/DZXB.20250133
      摘要:为了减少深度学习中隐私泄露的风险,许多研究利用差分隐私技术来训练神经网络.然而,这些隐私保护方法通常会导致模型性能显著下降.为了在隐私保护与模型效用之间实现平衡,本文提出了一种基于稀疏平滑自蒸馏的差分隐私深度学习(Differentially Private learning with sparse and smooth Self-Distillation,DP3SD)方法,通过双温度缩放机制来增强隐私保护深度学习的效用.具体而言,该方法设计了一种由稀疏分类损失和光滑蒸馏损失组成的双温度缩放损失函数.通过将较低温度应用于分类损失,能够使学生模型的类别预测分布更加锐化,从而减少低概率类别的影响,这些类别通常可能是由噪声引起的.相反,较高温度应用于蒸馏损失,能够平滑教师模型和学生模型的预测分布,从而在差分隐私约束下实现稳定和高效的知识迁移.在差分隐私随机梯度下降的严格隐私保障下,本文提出的双重缩放机制能够减轻噪声带来的扰动,提升学生模型的泛化能力.在三个公开数据集上的大量实验表明:本文提出的方法能够在确保严格数据隐私的同时,增强模型的可用性.  
      关键词:深度学习;差分隐私;隐私保护;知识蒸馏;随机梯度下降   
      58
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 129308902 false
      更新时间:2025-12-27
    • 基于多分支融合复数网络的全息图像失真矫正

      陈逸飞, 刘延伟, 刘金霞, 古晓艳
      2025, 53(9): 3319-3330. DOI: 10.12263/DZXB.20250549
      摘要:全息显示技术可以再现出包含物体全部信息的三维成像,能为用户带来高度逼真的视觉体验,被认为是目前最理想的裸眼三维显示技术.全息显示带来的独特三维沉浸式体验使得全息通信在医疗、教育、虚拟现实等领域具有广泛的应用前景.但全息通信技术的大规模商业化应用还面临众多问题.其中,影响全息通信质量的一个主要问题就是在通信过程中压缩噪声与信道干扰等导致的多重混叠失真.现有图像失真矫正技术大多聚焦单一失真类型,难以应对复杂场景下的全息混合失真问题,严重制约全息技术的实际应用效果.针对这一难题,本文提出一种基于多分支复数注意力网络的全息图像失真矫正方法,通过构建分层并行的多分支网络结构,实现对全息图像多尺度、多维度特征的深度提取与协同融合;同时提出复数域自适应注意力机制,强化网络对相位畸变、振幅衰减等关键失真特征的感知与抑制能力,从而实现对压缩、传输等全链路失真的精准矫正.在包含压缩和信道噪声等混合类型的全息失真矫正实验中,相较于现有先进的深度学习失真矫正方法SCUNet(Swin-Conv-UNet),本文方法在峰值信噪比指标上提升0.41 dB以上,结构相似性指标提升0.006以上,有效抑制了振幅失真导致的亮度异常,矫正了相位畸变,显著提升了全息图像的重建质量.  
      关键词:全息图像;失真矫正;复数网络;复数注意力机制;多分支融合网络   
      48
      |
      6
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 133183153 false
      更新时间:2025-12-27
    • 薛伟, 陈创慧, 杜明洋, 钟平, 郑啸
      2025, 53(9): 3331-3344. DOI: 10.12263/DZXB.20250642
      摘要:医学图像分割是智慧医疗领域的关键技术,旨在精准识别并分割影像中的器官或病变区域,为临床诊断与治疗决策提供可靠的量化依据.近年来,基于卷积神经网络(Convolutional Neural Network,CNN)的医学图像分割方法因其优异的局部特征提取能力得到广泛应用.然而,受限于卷积操作固有的局部感受野,CNN在建模长距离空间依赖和全局上下文信息方面仍存在不足.尽管基于Transformer的方法通过自注意力机制实现了对全局特征的建模,但计算复杂度随序列长度的平方增长,制约了其实际应用效率.针对上述问题,本文提出一种新的医学图像分割网络,该网络包含交叉视觉状态空间(Cross-Vision State Space,C-VSS)和多分支交互注意力(Multi-Branch Interactive Attention,MBIA)两个核心模块.C-VSS模块融合卷积操作的局部感知优势与状态空间的长序列建模能力,通过双分支协作策略,在保持线性计算复杂度的同时,实现对局部和全局特征的有效提取与融合.MBIA模块则通过多分支架构增强多尺度上下文信息的表征能力,并在编码器与解码器之间建立双向信息交互通道,实现跨层特征的动态融合,从而提升模型对复杂结构的感知能力.为验证所提方法的有效性,在CVC-ColonDB、ISIC2017、ISIC2018和COVID-19这4个公开医学图像分割数据集上开展试验.结果表明:与次优方法相比,本文方法在交并比(Intersection over Union,IoU)指标上分别提升了约0.94、0.83、1.04和2.28个百分点,在Dice相似系数(Dice Similarity Coefficient,DSC)指标上分别提升了约0.63、0.50、1.56和1.51个百分点.此外,平均数(Average,Avg)指标在4个数据集上分别达到91.51%、91.74%、91.30%和88.78%,均优于所有对比方法,展现出最优性能,充分验证了所提方法在分割性能上的优越性.进一步开展消融实验以验证核心模块的作用,实验表明:单独移除C-VSS模块后,IoU指标分别下降3.62、2.15、1.69和2.13个百分点,DSC指标分别下降2.25、1.29、1.02和1.40个百分点;单独移除MBIA模块后,IoU指标分别下降10.11、0.50、1.08和1.97个百分点,DSC指标分别下降6.54、0.30、0.65和1.30个百分点.实验结果充分证明C-VSS与MBIA模块的有效性,且MBIA模块对性能提升的贡献更为显著,二者协同作用可进一步优化模型性能.  
      关键词:医学图像分割;交叉视觉状态空间(C-VSS);多分支交互注意力(MBIA);动态特征融合;卷积神经网络(CNN);Transformer   
      59
      |
      13
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 134450152 false
      更新时间:2025-12-27
    • 张苏恺, 陈鹏, 董紫颖, 王威
      2025, 53(9): 3345-3357. DOI: 10.12263/DZXB.20250475
      摘要:针对在复杂海况下,雷达海杂波模拟所面临的全局特征建模不足、多模态生成能力受限以及评估体系单一等挑战,本文提出了一种基于多头自注意力机制增强的高保真生成对抗网络(Self-Attention HIgh FIdelity Generative Adversarial Network,SA-HIFIGAN).该模型在生成器与判别器中嵌入了多头自注意力模块,以增强对海杂波长程时空相关性的建模能力,并设计了具有分类功能的多尺度与多周期判别器结构.同时,本文构建了一个融合分布相似性、频谱误差和统计稳定性的混合评估体系,实现了对生成杂波的多维质量控制.通过采用X波段雷达实测数据集进行实验,验证了模型在幅度概率密度、功率谱密度和时空相关性等指标上的有效性.实验结果显示,SA-HIFIGAN在上述指标上与实测数据高度吻合,不仅能根据海况等级生成对应特性的杂波数据,还在综合评分上优于深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Network,DCGAN)和变分自编码器(Variational Auto-Encoder,VAE)等现有的杂波生成方法.  
      关键词:多头注意力机制;生成对抗网络;海杂波模拟;条件控制   
      75
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 133069229 false
      更新时间:2025-12-27
    • 基于共享提示与Mamba适配器的遥感图像文本检索方法

      杜文亮, 许晓宇, 赵佳琦, 刘兵, 周勇
      2025, 53(9): 3358-3370. DOI: 10.12263/DZXB.20250326
      摘要:遥感图像文本检索旨在根据给定的图像或文本,从海量遥感图像文本数据库中快速、准确地检索出与之语义匹配的文本或图像.随着对地观测技术的飞速发展,该技术在城市规划、灾害应急响应、环境监测等领域的应用价值日益凸显,已成为当前多模态信息处理领域的研究热点.基于通用数据预训练的视觉语言预训练模型,通过实现图像与文本之间的高效语义对齐,为通用图像文本检索任务奠定了技术基础.然而,通用数据与遥感数据之间存在显著的领域鸿沟,导致基于通用数据预训练的视觉语言预训练模型在直接应用于遥感任务时性能受限.因此,需要通过微调使该视觉语言模型适应遥感领域独特的数据分布.然而,现有微调方法应用到遥感领域时面临着两大核心挑战.其一,跨模态对齐不足:现有微调方法缺乏显式的跨模态信息交互机制,难以充分建模图文之间的内在关联;其二,细粒度语义表征困难:现有方法往往难以捕捉遥感图像中目标尺度差异悬殊、地物类别间相似度高、空间拓扑关系复杂等精细化的语义信息.尤其在处理小目标或由相似地物引发的语义混淆问题时性能受限,显著降低了检索准确性.本文针对遥感图像文本检索任务中跨模态对齐不足与细粒度语义表征困难的问题,提出基于共享提示与Mamba适配器的微调方法.该方法首先通过设计跨模态共享提示生成模块,建立图像与文本特征的显式交互机制;然后构建面向遥感场景的图像与文本的双分支Mamba适配器微调模块,分别实现图像与文本特征的细粒度表征;最后,采用对比损失与隶属损失,缓解由遥感图像小目标或相似地物引起的语义混淆问题.实验结果表明,本方法在遥感图像描述数据集(Remote Sensing Image Captioning Dataset,RSICD)和遥感图像文本匹配数据集(Remote Sensing Image-Text Match Dataset,RSITMD)数据集上平均召回率分别达到37.3%和48.05%,相较于当前最优的适配器微调方法分别提升3.68%和1.52%.此外,消融实验验证了共享提示生成模块与Mamba适配器的有效性.  
      关键词:图像文本检索;遥感图像;Mamba适配器;视觉语言模型微调   
      113
      |
      15
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 128555389 false
      更新时间:2025-12-27
    • 基于元权重网络的跨场景点预测人群计数方法

      徐昕, 谭卓林, 高陈强, 席跃
      2025, 53(9): 3371-3383. DOI: 10.12263/DZXB.20250285
      摘要:跨场景人群计数由于光照、尺度、拍摄角度和人群密度等因素引起的数据分布差异,导致在不同场景下的计数精度下降.针对现有人群计数模型在跨场景应用时存在的问题,本文提出了一种基于元学习的场景感知重新加权方法.该方法通过设计点预测计数模型直接预测每个行人的精确坐标,避免了传统密度图方法的定位模糊问题.元权重网络从元数据中学习显式点预测损失的加权方案,通过场景感知分支将每个场景视为一个单独的学习任务,利用不同场景的内在特征实现自适应的加权方案,降低标注噪声对模型跨场景泛化能力的影响.此外,针对现有数据集在教学领域的局限性构建了新的校园多场景人群计数数据集(Multi-Scene Crowd counting dataset,MS-Crowd),为跨场景研究提供了更全面的评估基准.实验结果表明该方法在MS-Crowd和户外公开数据集ShanghaiTech上的平均绝对误差(Mean Absolute Error,MAE)分别降低了19.7%和10.7%,验证了方法的有效性.  
      关键词:人群计数;人群定位;元学习;跨场景   
      19
      |
      3
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 132200375 false
      更新时间:2025-12-27
    • 基于Diffusion-Mamba和尺度不变损失的渐进式图像生成方法

      李豪, 郝文宁, 邹世辰, 谢晓宇
      2025, 53(9): 3384-3396. DOI: 10.12263/DZXB.20250308
      摘要:扩散模型在图像生成领域由于精度高而受到了广泛关注,其骨干网络经历了从U-Net到Transformer的演变.然而,由于Transformer的运算量与序列长度的平方成正比这一特性,导致扩散模型在处理高分辨率图像时存在计算复杂度高的问题.为了解决这一问题,本文提出一种基于Diffusion-Mamba和尺度不变损失的渐进式图像生成方法.该方法利用多方向扫描机制和轻量级局部结构增强模块融合了Mamba的高效特性以及扩散模型的建模能力,并通过渐进式级联扩散过程实现了从低分辨率图像向高分辨率图像的高效转换.此外,设计基于对比学习的尺度不变损失函数,通过最大化同一目标在不同分辨率下的互信息,实现了跨尺度特征表示的对齐与增强.在ImageNet(FID = 1.67)数据集上的实验结果表明:本文方法取得了综合精度的提高,充分验证了该方法的有效性和高效性.  
      关键词:图像生成;扩散模型;状态空间模型;对比学习;尺度不变损失   
      87
      |
      11
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 129984171 false
      更新时间:2025-12-27
    • 黄辰, 刘会杰, 张龑, 杨超, 宋建华
      2025, 53(9): 3397-3409. DOI: 10.12263/DZXB.20250533
      摘要:多模态方面级情感分析(Multimodal Aspect-Based Sentiment Analysis,MABSA)旨在从多模态输入数据中准确识别方面术语并判定其情感极性.现有研究致力于融合多模态信息以提升情感分析性能.然而,在面临多方面和多情感场景时,它们仍然面临两个关键挑战:(1)缺乏对多模态输入数据中方面术语的全面感知;(2)存在情感语义偏差,现有模型倾向于关注与特定方面术语关联性强的情感语义,而忽略了关联性较低但同样重要的情感语义.为了克服这些问题,本文提出了一种结合自适应噪声和方面图关联学习的新型多模态方面级情感分析方法(Adaptive Noise and Aspect Graph Association Learning,ANAGAL),旨在增强多方面和多情感场景下的分析性能.具体而言,通过专门设计的自适应噪声增强模块以补充方面信息,从而增强模型对方面术语的感知能力,并提高模型鲁棒性.此外,设计方面图关联学习模块来关联所有方面术语,并学习与之相关的情感语义.同时,引入额外的参数进行情感校准,使模型能够学习更多常见的情感语义偏差,从而更准确地捕捉方面术语及其对应的情感极性.在公共数据集上的大量实验评估表明,ANAGAL在克服这些挑战方面表现优异.与现有基线模型相比,ANAGAL在Twitter-2015和Twitter-2017数据集上将精确率分别提升了1.46个百分点和1.56个百分点,在MASAD(Multimodal Aspect Sentiment Analysis Dataset)和EmoMeta数据集上将精确率提升了2.48个百分点和1.55个百分点.  
      关键词:多模态;方面级情感分析;预训练语言模型;噪声增强;方面图关联学习;图注意力网络   
      36
      |
      6
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 126427287 false
      更新时间:2025-12-27
    • 面向时序异常检测的可变视距多向扫描方法

      黄昱哲, 管永原, 魏松杰
      2025, 53(9): 3410-3424. DOI: 10.12263/DZXB.20250385
      摘要:基于时序分析的网络异常检测,已经引起学术界和工业界的广泛关注.为了突破现有相关工作的训练成本高、检测效率低等限制,本文提出了一种基于Mamba-DSCNN架构的时间序列分类模型ScanMamba.通过设计的可变视距多向扫描机制和时空特征融合机制,ScanMamba显著提升了对复杂网络流量时间序列数据的建模能力.首先,融合Mamba状态空间模型与深度可分离卷积网络(Depthwise Separable Convolutional Neural Networks,DSCNN),在多时间分辨率下通过下采样实现视距的动态变化,可以捕捉不同尺度上的时序依赖特征.其次,采用多方向扫描融合策略,增强了对长期依赖关系和非线性模式的建模能力.随后,设计了多尺度池化模块,并结合注意力机制进行特征加权融合,有效提升了分类性能.最后,将残差连接与深度监督机制引入训练过程中,缓解了梯度消失问题,加速了模型收敛并提升了泛化能力.基于CIC-IDS2017的实验结果表明,ScanMamba在准确率、召回率、F1值上分别达到0.983 1、0.984 9、0.983 7,在准确率上较Mamba-ECANet提高了约3%;针对高强度攻击,F1值分别达到0.998 0和0.984 7,在DDoS检测上较传统LSTM(Long Short-Term Memory)方法提升了3.3%.降低状态空间维度可使训练时间减少约10%,且性能仅下降0.25%.ScanMamba的平均单条数据推理耗时约为6.3 ms,相较于传统LSTM模型的11.2 ms与Transformer类结构的9.6 ms具备明显优势.  
      关键词:时序数据;Mamba;网络流量;异常检测;深度学习;特征融合   
      59
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 133636004 false
      更新时间:2025-12-27

      科研通信

    • 基于蚁群优化与准实时密钥池的生存性虚拟网络映射方法

      刘焕淋, 刘博, 陈勇, 马冰, 邱艳, 陈浩楠
      2025, 53(9): 3425-3432. DOI: 10.12263/DZXB.20240963
      摘要:为增强弹性光网络的区域故障场景下虚拟网络映射的安全性与抗灾难性,本文提出基于蚁群优化与准实时密钥池的生存性虚拟网络映射(Ant Colony Optimization and Quasi-real-time Key Pool based on Survivability Virtual Network Embedding,ACOQKP-SVNE)方法.为降低密文传输路径潜在风险程度,设计基于蚁群优化的密文传输路径映射策略,为提高密钥利用率,设计基于准实时密钥池的量子密钥分发路径映射策略;当区域故障发生时,采用基于不同物理组件的受损感知故障恢复策略对受影响的物理组件进行重映射.仿真结果表明,与对比算法相比,所提ACOQKP-SVNE的带宽阻塞率最高可降低约为16%.  
      关键词:弹性光网络;生存性虚拟网络映射;蚁群优化;量子密钥分发;带宽阻塞率   
      20
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 126331165 false
      更新时间:2025-12-27

      综述评论

    • 木基感能电子器件及融合微系统研究综述

      曾绪, 黄睿来, 涂程, 张翼, 张晓升
      2025, 53(9): 3433-3453. DOI: 10.12263/DZXB.20250623
      摘要:木材作为地球上最丰富的可再生资源之一,具有天然多孔结构、优异的力学性能及生物相容性,赋予其在绿色电子学中巨大的应用潜力.不同于传统的高分子或无机基底,木材独特的纤维取向及孔洞微纳结构,使其在电荷传输、离子迁移以及界面调控等方面展现出独特的优势,为构筑可再生、可降解的木基电子器件奠定了良好基础.近年来,随着智能感知技术、自供能系统及柔性电子的迅速发展,研究者们开始通过结构设计与材料功能化手段,赋予木材导电性、柔性、透光性等新特性,使其在绿色电子领域焕发新生.本文首先概述了木基材料的物理结构和化学组成特征,并从木基材料电子功能化的角度归纳了常见的改性与处理方法,包括去木质素、化学掺杂、碳化处理及仿生结构设计等.在此基础上,多类型的高性能木基电子器件被研究人员构建出来,其中能量采集器件如蒸发电器件、摩擦电器件能够有效采集转化环境能量;多功能传感器件则实现了压力、湿度、气体等信号的灵敏感知;储能器件如超级电容器则展现出优异的能量存储与供电能力.进一步地,本文探讨了木基电子微系统的集成化构建方式,即通过能量管理模块、传感单元与无线通信模块的有机融合,实现“传感功能+微纳供能”一体化的集成微系统.这类系统不仅展现了良好的信号响应能力和稳定性,也契合绿色可持续发展的需求.最后,本文展望了木基感能电子器件及集成微系统未来发展所面临的机遇与挑战.  
      关键词:木基电子;木基传感器;纳米发电机;木基蒸发电器件;木基超级电容器;木基微系统   
      40
      |
      6
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 135693083 false
      更新时间:2025-12-27
    • 语音大模型:架构、训练与挑战分析

      张亚洲, 刘祈蒙, 戎璐, 赵彬, 李爱军
      2025, 53(9): 3454-3472. DOI: 10.12263/DZXB.20250367
      摘要:大型语言模型(Large Language Models,LLMs)凭借其卓越的指令跟随能力与上下文学习能力在众多下游自然语言处理(Natural Language Processing,NLP)任务上取得巨大成功.鉴于人类智能的多模态属性,这种研究热态自然地蔓延到其他模态,特别是视觉模态和语音模态.在视觉领域,以GPT-4V、LLaVa为代表的视觉大模型使用基础语言模型作为“大脑”执行视觉理解和视觉推理任务,展现出跨越 “任务壁垒”的能力.对比而言,语音大模型(Speech Large Language Models,SLLMs)研究同样受到学术界与工业界的高度关注.涌现出以Whisper、Qwen-Audio为代表的一系列模型,在语音识别、语音理解和语音合成等任务上不断突破性能边界,展现出令人瞩目的发展潜力.本文旨在系统梳理和总结语音大模型的最新研究进展.文章深入阐述语音大模型的基本框架,并详尽探讨相关核心概念,包括模型组件、训练策略、数据构建以及评估方法.在此基础上,本文进一步分析了当前研究中的主要挑战,并展望了未来可能的发展方向.  
      关键词:语音大模型;大型语言模型;指令跟随;语音理解;预训练   
      102
      |
      26
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 128530793 false
      更新时间:2025-12-27
    0