摘要:传统网络依赖人工配置,在应对规模激增、需求复杂化及实时性要求提升的现代网络环境时,效率低下且成本高昂.大语言模型(Large Language Model,LLM)凭借其出色的自然语言理解能力,在网络自动化配置中展现出巨大的潜力.面向软件定义网络(Software Defined Networking,SDN),本文提出了一种基于LLM的轻量级自动化配置方法.在数据平面,提出了一种基于检索增强生成(Retrieval-Augmented Generation,RAG)技术的代码自动生成方法RetroP4,支持基于用户意图生成P4代码;在控制平面,提出了一种基于任务分解的流表自动生成方法CtrlSynth,支持基于用户意图和数据平面P4代码生成流表配置.实验结果表明:相较于通用大模型,RetroP4生成的P4代码的语法正确性提高了25%,语义正确性提高了87.5%;CtrlSynth能够准确生成与P4代码匹配的流表信息,在流量意图不超过300条时,准确率可达100%.
摘要:大语言模型(Large Language Model,LLM)驱动的开放域问答(Open-Domain Question Answering,ODAQ)系统,如GIST(Generating Identifiers and Selecting chunks for Tables)框架,在处理海量表格数据时展现出巨大潜力,受到了广泛关注.然而,当ODQA系统需要整合多方私有表格数据进行Top-K候选筛选等环节时,传统方法需要访问全部原数据,这在数据隐私、计算透明度及参与方行为可信度方面面临挑战.虽然现有研究采用零知识证明和基于权益的机制实现了公开可验证性,但在大规模场景下生成和验证单个证明的开销过高,而传统的基于权益的机制在公平性和对动态环境的适应性方面也存在局限性.对此,本文基于多方安全计算(Multi-Party Computation,MPC)、可公开聚合审计与动态信誉机制,提出了一种面向LLM开放域问答中多方私有表格筛选的增强方法.将Top-K多方私有表格筛选过程通过MPC完成,以保护多方私有数据隐私.同时,引入高效的聚合审计机制,将零知识证明技术与随机抽样、聚合证明构造、基于时间窗口的批处理和错误定位相结合,确保评分与排序过程的正确性可以被批量、公开验证.基于区块链的动态信誉反馈机制的集成也增强了系统的公平性,并约束了恶意行为.实验评估表明,本文的Top-K候选筛选方法在保证隐私的同时与GIST原有筛选方法在结果上达到0.91的Top-50平均召回率和0.83的平均Jaccard指数,具有高度一致性,不会影响ODQA端到端任务性能.同时,大规模任务下可公开审计的证明和验证效率均得到提升,与单独的证明相比节省了约87%的证明时间.反馈机制的适应性和公平性也得到了增强.
摘要:命名实体识别(Named Entity Recognition,NER)是法律文本结构分析和语义理解的基础任务,能够极大提高司法效率,促进司法公正.然而,受限于法律文本的高度复杂性与专业性,传统NER方法难以充分理解法律文书中的上下文关联,较多依赖于浅层的词级预测,缺乏实体角色解析与深层语境推理能力,尤其在面对司法文本中频繁出现的嵌套实体、细粒度实体以及模糊的实体边界时存在明显的局限性.为解决上述问题,本文基于理解增强的建模范式,提出了一种面向中文法律场景的新型命名实体识别框架——JURIS(Judicial Understanding-enhanced Reasoning via Instruction-tuned Strategies for named entity recognition).该框架将实体识别重新建模为基于语境理解的条件生成任务,通过采用创新性的上下文感知的嵌入式标注策略,在保留文本原始语义结构的同时有效增强上下文信息建模能力,从而提升复杂语境下的实体识别效果.同时,JURIS构建了一个由规范模块、知识引导模块和类比学习模块组成的三元理解增强模块(Tri-aspect Understanding Enhancement Module,Tri-UEM),分别从输出一致性、领域知识注入与语境类比迁移3个维度协同提升模型对法律领域实体语义的深层理解与判别能力.实证结果表明,JURIS在CAIL2021、Drug和CSKS2019等多个领域数据集上均超过现有强基线模型,取得了当前最佳性能,改善了嵌套实体处理与细粒度识别表现,并展现出其在垂直领域信息抽取任务中的广泛适用性与推广潜力.
摘要:本文面向高可靠低时延通信(High-Reliability and Low-Latency Communication,HRLLC)场景的实际需求,提出了一种基于BCH(Bose,Chaudhuri and Hocquenghem,BCH)码的双向叠加编码与低复杂度译码方案.编码方面,采用BCH码作为成分码,基于双向叠加编码传输(Twisted-Pair Superposition Transmission,TPST)框架,构造了双向叠加BCH(TPST-BCH)码:上层BCH码字经随机变换后叠加至下层BCH码字,叠加版本进一步交织并反馈叠加至上层BCH码字,实现码长扩展与可靠性提升.译码方面,基于串行干扰消除思想,结合局部约束顺序统计译码(Ordered Statistics Decoding with Local Constraints,LC-OSD),先对上层码字生成一系列候选,给定上层候选后对下层码字进行LC-OSD译码,并最终选取后验概率最大的候选作为译码输出.为降低复杂度,我们提出了针对译码的提前终止设计,包括层内提前终止(用于提前终止层内LC-OSD搜索)和跨层提前终止(用于跳过某个上层码字给定后的整个下层LC-OSD搜索).结果显示,所提终止设计可以极大降低搜索次数,且几乎不损失性能.与现有编码方案相比,所提TPST-BCH码(采用所提译码)误帧率优于同码长码率的BCH码(采用LC-OSD算法)、5G LDPC(Low Density Parity Check)码(采用置信传播译码),与5G Polar码(采用串行干扰消除列表译码)误帧率相当或稍优,但在中高信噪比区域相对于5G Polar码具有更低的译码操作数和译码时延.
摘要:为解决碳化硅金属氧化物半导体场效应晶体管(SiC Metal Oxide Semiconductor Field Effect Transistor,SiC MOSFET)硬开关故障(Hard Switch Fault,HSF)、负载故障(Fault Under Load,FUL)和过载故障(OverLoad fault,OL)的问题,本文提出了一种基于SiC MOSFET漏极电压和源极电压检测的过流保护方法(OverCurrent Protection method based on the Drain-voltage and Source-voltage Detection,DSD-OCP).该方法通过检测电路实时监控SiC MOSFET的漏极电压和源极电压来准确识别短路故障和过载故障,并利用驱动电路控制SiC MOSFET的开通和关断,从而实现快速短路保护和自适应过载保护,同时还集成软关断功能.基于0.5 µm双极型-互补金属氧化物半导体-双扩散金属氧化物半导体(Bipolar-CMOS-DMOS,BCD)工艺,设计了DSD-OCP电路并进行流片,芯片面积为2.8 mm².采用研制的芯片搭建1200 V/80 m SiC MOSFET测试平台,并验证了DSD-OCP方法的有效性.实验结果表明,SiC MOSFET在DSD-OCP芯片保护下的HSF和FUL持续时间分别为88 ns和105 ns.在不同母线电压下,DSD-OCP芯片能够为SiC MOSFET提供自适应的过载保护.因DSD-OCP芯片具有软关断功能,SiC MOSFET在过流保护时的漏极电压过冲不超过110 V.
摘要:持续关系抽取(Continuous Relation Extraction,CRE)在理解和适应不断变化的数据环境中扮演着至关重要的角色.传统的CRE技术通常面临两大难题:一是关系模式的持续演变,二是遗忘之前学习的关系的风险.尽管存储和重放旧关系典型示例的做法在减少遗忘方面已被证明是有效的,但反复重放这些固定且有限的样本可能导致过拟合.为了解决这一问题,本文提出了一种基于动态原型的持续关系抽取方法.该方法结合了密度聚类和生成式大型语言模型,以应对上述挑战,本文将其命名为密度聚类和生成式大型语言建模(Continuous Relation Extraction with Density based Clustering and Generative Large Language Model,CRE-DCGLLM).具体而言,本文采用了密度聚类技术来提取记忆样本,缓解对先前任务的遗忘问题,并基于全量样本和记忆样本设计了动态关系原型.此外,本文通过生成式大语文模型为记忆样本生成伪样本用于重放训练,以解决因多次重放导致的模型过拟合问题.同时,本文还运用焦点知识蒸馏技术,以提升对变化中关系模式的适应性能.通过在FewRel数据集和TACRED数据集上进行的一系列实验,本文验证了该方法的有效性.实验结果显示,本文的方法在持续关系抽取的准确性和效率方面都取得了显著的提升,特别是在处理相似关系、防止知识遗忘以及克服过拟合等方面表现出了卓越的性能.
摘要:为了减少深度学习中隐私泄露的风险,许多研究利用差分隐私技术来训练神经网络.然而,这些隐私保护方法通常会导致模型性能显著下降.为了在隐私保护与模型效用之间实现平衡,本文提出了一种基于稀疏平滑自蒸馏的差分隐私深度学习(Differentially Private learning with sparse and smooth Self-Distillation,DP3SD)方法,通过双温度缩放机制来增强隐私保护深度学习的效用.具体而言,该方法设计了一种由稀疏分类损失和光滑蒸馏损失组成的双温度缩放损失函数.通过将较低温度应用于分类损失,能够使学生模型的类别预测分布更加锐化,从而减少低概率类别的影响,这些类别通常可能是由噪声引起的.相反,较高温度应用于蒸馏损失,能够平滑教师模型和学生模型的预测分布,从而在差分隐私约束下实现稳定和高效的知识迁移.在差分隐私随机梯度下降的严格隐私保障下,本文提出的双重缩放机制能够减轻噪声带来的扰动,提升学生模型的泛化能力.在三个公开数据集上的大量实验表明:本文提出的方法能够在确保严格数据隐私的同时,增强模型的可用性.
摘要:为增强弹性光网络的区域故障场景下虚拟网络映射的安全性与抗灾难性,本文提出基于蚁群优化与准实时密钥池的生存性虚拟网络映射(Ant Colony Optimization and Quasi-real-time Key Pool based on Survivability Virtual Network Embedding,ACOQKP-SVNE)方法.为降低密文传输路径潜在风险程度,设计基于蚁群优化的密文传输路径映射策略,为提高密钥利用率,设计基于准实时密钥池的量子密钥分发路径映射策略;当区域故障发生时,采用基于不同物理组件的受损感知故障恢复策略对受影响的物理组件进行重映射.仿真结果表明,与对比算法相比,所提ACOQKP-SVNE的带宽阻塞率最高可降低约为16%.
摘要:大型语言模型(Large Language Models,LLMs)凭借其卓越的指令跟随能力与上下文学习能力在众多下游自然语言处理(Natural Language Processing,NLP)任务上取得巨大成功.鉴于人类智能的多模态属性,这种研究热态自然地蔓延到其他模态,特别是视觉模态和语音模态.在视觉领域,以GPT-4V、LLaVa为代表的视觉大模型使用基础语言模型作为“大脑”执行视觉理解和视觉推理任务,展现出跨越 “任务壁垒”的能力.对比而言,语音大模型(Speech Large Language Models,SLLMs)研究同样受到学术界与工业界的高度关注.涌现出以Whisper、Qwen-Audio为代表的一系列模型,在语音识别、语音理解和语音合成等任务上不断突破性能边界,展现出令人瞩目的发展潜力.本文旨在系统梳理和总结语音大模型的最新研究进展.文章深入阐述语音大模型的基本框架,并详尽探讨相关核心概念,包括模型组件、训练策略、数据构建以及评估方法.在此基础上,本文进一步分析了当前研究中的主要挑战,并展望了未来可能的发展方向.