摘要:大语言模型(Large Language Models,LLMs)凭借其庞大的参数规模和强大的语义表达能力,在自然语言处理、计算机视觉等领域取得突破性进展,并逐渐成为智能系统的关键基础.然而,随着模型轻量化、本地化定制及场景专用化需求持续增强,面向特定任务开发的专有化模型快速涌现.这类模型通常在局部领域具备能力优势,但难以独立覆盖多任务、多领域的复杂推理需求,从而推动了多模型协作推理的研究.现有研究多侧重于模型融合或单一协作范式,难以充分挖掘各模型间的优势互补潜力,且在协作结构和路径机制方面缺乏系统性的探索.为此,本文提出一种面向模型互联场景的多模型协作结构推理方法,构建了由线性链式结构向多路径组合结构演进的协作推理体系.在基础协作层面,设计了串联推理(Serial Inference,SI)与并联推理(Parallel Inference,PI)两种核心范式,分别通过阶段式信息传递与多模型并行处理增强推理过程中的语义收敛性与信息覆盖度.在此基础上,进一步从协作范式层面提出了“先串后并”(Serial-to-Parallel,S2P)与“先并后串”(Parallel-to-Serial,P2S)两种组合策略,实现协作路径在深度与广度之间的动态调度,拓展了多模型协作的结构表达能力与推理能力边界.本文在数学推理、知识理解和符号推理三类典型任务上搭建了系统实验框架,对四类协作策略进行了全面评估.实验结果表明,四类协作策略相较于单模型推理在平均准确率上分别提升了24.33、16.66、26.66和25.33个百分点.进一步分析发现,组合协作策略在融合串联与并联结构优势的同时,能够有效压缩整体推理时延,并在相较于最优单模型可接受的时延增量条件下,实现了更高的推理准确率,展现出在多任务场景下更优的性能-效率的权衡.此外,本文还系统分析了不同模型路径配置在协作过程中的表现差异,为多模型组网结构设计、协作机制优化及大规模模型互联体系的构建提供了理论依据与实证支撑.
摘要:在跨平台、跨语言的社交网络环境中,虚假信息的传播具有高隐蔽性和跨文化性,给舆情治理与社会信任体系带来了严峻挑战.由于不同语言和文化背景下文本的表达方式存在显著差异,传统基于深度学习的检测方法在跨域泛化与语义建模方面普遍存在性能退化问题,表现为跨域特征对齐不足、语义表示缺失以及对隐喻、情感和文化语境的理解能力受限.针对这些问题,本文提出一种大语言模型(Large Language Model,LLM)增强的自监督域自适应(Domain Adaptation,DA)检测框架,通过融合LLM的深层语义建模能力与对比学习(Contrastive Learning,CL)的判别特征学习机制,实现高鲁棒性与高泛化性的跨语言虚假信息检测.该方案构建一个从语义增强到特征对齐再到反馈优化的闭环体系.首先,通过基于Prompt的跨语言文本增强机制,引导LLM在生成数据时保持语义完整性与文化适配性,从而在保留原始语义核心的同时,生成符合目标语言风格的高质量文本样本,有效缓解跨语言场景中的语义鸿沟.随后,设计双维度对比策略,在词元层面对齐局部词汇特征,在语句层面对齐全局语义逻辑,从不同层面统一源域与目标域的数据表示,以提升特征分布一致性与跨语言检测的稳定性.最后,构建LLM辅助的跨语言联合训练机制,利用对比损失作为动态反馈信号,引导LLM在迭代微调过程中不断优化生成策略,促使增强样本的分布逐步靠近CL检测器的判别边界,从而实现跨语言数据增强与特征学习的协同演化.在中文社交平台数据集Weibo与英文突发事件数据集PHEME上的实验结果表明,所提方法在精确率和F1指标上显著优于商业LLM直接检测(如ChatGPT-4o)、主流深度学习模型(包括LSTM、TextCNN、RCNN、HAN)及LLM增强检测方法(如LACL).在跨语言检测中,所提方法的平均检测精度相比基准方法提升幅度超过10个百分点.特征可视化分析进一步表明,所提方法能压缩类内特征差异、扩大类间判别间隔,从而获得更清晰的特征边界与更高的判别置信度.
摘要:随着工业互联网、车联网、远程医疗等新型服务的快速发展,多模态网络应运而生.该架构基于“技术体制与网络环境分离”的设计思想,使多种网络模态能够在同一基础平台上共生共存.然而,现有研究多集中于多模态网络的环境构建、编译优化与网元设计,缺乏对分布式控制平面负载均衡的系统研究.部分借鉴SDN(Software-Defined Networking)的交换机迁移与动态重分配机制虽可缓解控制器过载,但需在控制器间频繁同步状态信息,迁移开销大、响应延迟高,难以满足多模态网络的实时性与可扩展性要求.针对上述问题,本文通过对数据平面流量路由的合理规划,优化多模态网络中控制平面的负载分布,提出一种对多种网络模态的流量路由与多模态网元-控制器分配进行联合优化(Joint optimization of Routing and polymorphic network Element Controller Allocation,JRECA)方法.该方法将不同模态的控制信息规模差异显式纳入优化框架,综合考虑网元分配、路由选择、控制器处理能力与链路带宽等约束.对于多模态网络的异构特性,本文提出将不同模态控制信息规模差异纳入控制器负载约束的负载均衡机制,构建了同时实现控制平面负载均衡与数据平面吞吐量最大化的统一模型,实现控制平面负载与数据平面吞吐的协同优化,弥补既有研究中两平面割裂求解的不足,并进一步设计具有严格理论保证的“两步走”算法框架.首先,设计基于最大负载优先的多模态网元-控制器分配算法,确定多模态网元与控制器之间的匹配关系,并通过近似比证明严格界定了算法性能边界;然后,在动态流量环境下,设计基于原始-对偶方法的在线路由算法,并通过竞争比分析给出在线优化的理论性能下界.在Fat-Tree和ARPANet两种典型拓扑上的仿真实验表明,本文提出的算法在IPv4、IPv6、工控标识、命名数据标识和身份标识5种网络模态下均取得显著性能提升.与对比算法相比,本文提出的算法可降低17.56%~20.97%的控制器负载,并提高13.86%~29.82%的系统吞吐量.
摘要:蛋白质功能预测是生物信息学核心任务之一.现有方法虽能实现蛋白质多模态特征的融合,但仍存在预测准确率不足、依赖有限的实验数据导致适用范围受限等问题.为解决此类问题,本研究提出基于序列与跨模态对齐的蛋白质功能预测模型(Sequence-based and Cross-Modal Alignment Model for Protein Function Prediction,SCMAGO),以蛋白质序列作为唯一输入,通过主流工具AlphaFold2、InterProScan分别预测三级结构和家族结构域信息;使用蛋白质大语言模型(Evolutionary Scale Model Cambrian,ESMC)实现序列嵌入,并采用几何向量感知机图神经网络(Geometric Vector Perceptron Graph Neural Network,GVP-GNN)提取三级结构特征,再通过广播嵌入方法获取家族结构域表示;模型SCMAGO设计两步跨模态对齐方法:基于双向交叉注意力,在残基层面对序列和结构特征进行对齐;结合图注意力池化方法,进一步融合家族结构域特征.实验结果表明,SCMAGO在Swiss-Prot数据集上的性能优于现有的基准方法,在生物过程(Biological Process,BP)、分子功能(Molecular Function,MF)和细胞组分(Cellular Component,CC)三方面的Fmax分别为0.487、0.739和0.736,AUPR则分别达到0.507、0.760、0.800.此外,对序列一致性低于40%的蛋白质,仍能保持稳定的预测性能.
摘要:建立精准的交通流量预测模型,对于优化交通系统管理、缓解城市交通拥堵、提升路网运行效率具有至关重要的作用.然而,实际交通流呈现出显著的非平稳特性与复杂的时空依赖关系,尤其是由突发事件、早晚高峰、节假日等引起的流量分布偏移,以及交通拥堵在路网中传播的延迟效应,给传统预测方法带来了严峻挑战.现有模型大多基于平稳性假设或采用静态时空建模方式,难以有效捕捉交通数据中的动态演化规律与异质性延迟依赖,导致预测精度受限、工程适用性不足.针对上述问题,本文提出一种基于延迟时空依赖的非平稳时间序列交通流量预测模型(Non-Stationary time series Forecasting Model,NSFM),旨在从频域和空域双重角度深入刻画交通流的动态演变机制.该模型首先利用傅里叶变换将非平稳时间序列分解为时变组分与时不变组分,分别刻画局部动态波动与全局稳态趋势,并通过正交性证明确保两类成分的独立性,为后续差异化建模奠定理论基础.在此基础上,模型进一步构建带有时延特征提取机制的特征融合模块,结合逐点卷积与位置编码,将交通流量、空间邻接关系、时间周期信息与延迟传播特征进行深度融合,从而精准捕捉站点间交通状态的时空演化与滞后响应规律.为建模离散站点间的空间自相关结构,本文引入Moran算子构建函数对函数回归预测框架,通过基函数展开与正交化处理,实现连续函数空间与离散观测站点之间的一致性映射,有效量化区域间的空间依赖强度,提升模型在复杂路网中的预测鲁棒性.为验证NSFM模型的有效性与泛化能力,我们在四个真实世界交通流量数据集(PEMS03、PEMS04、PEMS07、PEMS08)上进行了系统实验,实验表明,NSFM在多个评估指标上均显著优于现有主流模型,其中平均绝对百分比误差(MAPE)相较于SOTA模型,分别降低了7.48%、9.86%、3.20%、1.73%,展现出在非平稳场景下更优的预测精度与稳定性.
摘要:由于卫星通信系统中高功率放大器的非线性失真与多径信道的线性衰落效应相互耦合会引发传输性能恶化问题,而传统的盲均衡算法(如恒模算法)虽在应对多径引起的线性符号间干扰时具有一定效果,但无法有效补偿高阶调制信号中的非线性失真,尤其是在没有训练序列的盲均衡场景下,传统方法难以提供足够的监督信息.为了克服这一挑战,本文提出一种基于判决重构的非线性卫星信道盲均衡算法(blind Equalization Algorithm for Nonlinear satellite channels based on Decision-Reconstruction,DR-NEA),DR-NEA采用判决-插值-重构模式生成参考信号,从而实现无监督条件下的非线性与线性失真联合补偿.首先,算法通过恒模算法对接收到的信号进行线性均衡,消除多径效应引起的线性失真.随后,通过判决、插值和重构生成参考信号,该参考信号为非线性均衡器参数辨识提供监督信息.最后,DR-NEA使用拟牛顿法在最小均方误差准则下对Wiener型均衡器的参数进行辨识,进而实现对信道中的线性与非线性失真联合补偿.仿真结果表明,在高阶调制模式(32APSK、32QAM、64QAM)下,DR-NEA相较于传统线性均衡算法,显著提升了性能,在误码率为时,较传统线性均衡算法性能增益超4 dB,体现了该算法在高阶调制下较强的非线性补偿能力.此外,当判决误码率低于9.44%时,DR-NEA依旧保持稳定且输出性能几乎不受影响,进一步验证了本文算法的鲁棒性.DR-NEA通过创新性地引入基于判决重构的参考信号生成方法,解决了传统盲均衡算法无法提供足够监督信息的问题.同时,采用拟牛顿法进行Wiener模型参数辨识,实现了高效的非线性均衡器优化.实验结果验证了该算法在非线性与线性失真补偿方面的优越性能,特别适用于高阶调制信号的传输.综上所述,DR-NEA算法有效解决了卫星通信中非线性失真与多径衰落的联合干扰问题,具有重要的理论意义和广泛的实际应用前景,特别是在高速率、高阶调制的卫星通信场景中,能够显著提升系统的传输性能.