摘要:当前基于深度学习的中文长文本摘要生成的研究存在以下问题:(1)生成模型缺少信息引导,缺乏对关键词汇和语句的关注,存在长文本跨度下关键信息丢失的问题;(2)现有中文长文本摘要模型的词表常以字为基础,并不包含中文常用词语与标点,不利于提取多粒度的语义信息. 针对上述问题,本文提出了融合引导注意力的中文长文本摘要生成(Chinese Long text Summarization with Guided Attention,CLSGA)方法. 首先,针对中文长文本摘要生成任务,利用抽取模型灵活抽取长文本中的核心词汇和语句,构建引导文本,用以指导生成模型在编码过程中将注意力集中于更重要的信息. 其次,设计中文长文本词表,将文本结构长度由字统计改变至词组统计,有利于提取更加丰富的多粒度特征,进一步引入层次位置分解编码,高效扩展长文本的位置编码,加速网络收敛. 最后,以局部注意力机制为骨干,同时结合引导注意力机制,以此有效捕捉长文本跨度下的重要信息,提高摘要生成的精度. 在四个不同长度的公共中文摘要数据集LCSTS(大规模中文短文本摘要数据集)、CNewSum(大规模中国新闻摘要数据集)、NLPCC2017和SFZY2020上的实验结果表明:本文方法对于长文本摘要生成具有显著优势,能够有效提高ROUGE-1、ROUGE-2、ROUGE-L值.
摘要:可见光通信与非正交多址技术结合,是满足室内高速通信和宽带数据接入的重要方法.由于室内密集设备通信需求增长,小区间干扰和资源紧缺日趋严重,为了降低小区间干扰,进一步增强室内用户设备高速通信的用户体验质量(Quality of Experience,QoE)和提高可见光通信的频谱资源利用率,提出室内基于非正交多址接入的可见光通信(Visible Light Communication-Non-Orthogonal Multiple Access,VLC-NOMA)协作多点用户接入和功率分配算法.在用户接入阶段,设计基于QoE和多接入点协作的用户接入(User Access algorithm based on User Experience Quality and Coordinated Multipoint,UA-UEQCM)算法,根据用户需求的最小速率、推荐速率值和VLC-NOMA提供的可达速率,评估用户的QoE值和等效的用户满意度值;然后,基于VLC-NOMA中用户需求的平均意见评分(Mean Opinion Score,MOS)和VLC接入点协作可用资源,设计NOMA用户组的效用函数优化用户设备与多个接入点协作接入的双向选择,提高VLC-NOMA网络的MOS值;在功率分配阶段,采用改进教与学优化方法优化NOMA组的功率分配,设计VLC-NOMA的总MOS值为适应度函数值,采用自适应更新和学习模式,优化NOMA组的功率分配因子.仿真结果显示,与其他接入算法和功率分配比较,当用户数目为26时,本文提出的接入算法和功率分配分别比VLC-NOMA网络的总MOS值提高18.06%和10.94%.
摘要:探地雷达(Ground Penetrating Radar, GPR)作为一种非破坏性的电磁探测技术,已广泛应用于市政工程、交通、军事等领域的探测.复杂的地下环境中,电磁波传播规律变得复杂,背景介质的介电常数难以准确获得.后向投影(Back Projection,BP)成像算法需要预知背景介质的相对介电常数,且需逐个计算各成像网格的散射强度值,计算效率低.本文提出一种基于深度学习的探地雷达自聚焦后向投影(Deep learning based Auto focusing BP,DABP)成像方法,设计了目标感兴趣区域(Region Of Interest,ROI)的检测模块,基于地下目标的空间稀疏特征,将YOLOX网络和BP成像机理相结合,快速检测出目标潜在区域,仅对该区域中的成像网格进行成像处理,避免全域的后向投影计算,大幅降低运算量.其次,针对介电常数未知情况下BP成像难以聚焦的问题,设计了一个自聚焦后向投影(Auto Focusing BP,AF-BP)成像模块,构建了BS-YOLOv5网络和相应的数据集,实现基于改进二分法的地下介质介电常数估计和自聚焦成像.然后,设计了一个基于双阈值和积分聚焦的伪影抑制(artifact suppression based on Double Threshold and Integral Focusing,DTIF)模块,进一步提高成像结果的聚焦度.开展了仿真和实测数据的成像处理和对比分析,与BP成像方法相比,仿真数据成像结果的ISLR指标下降了250%、SCR指标提升了131%;实测数据成像结果的ISLR指标下降了322%、SCR指标提升了72%,仿真实验和实测实验的成像速度均提升了300%,验证了所提方法在提高GPR成像效率和成像质量方面的有效性.
摘要:信息超材料是一种人工结构阵列,其能够通过设计单元参数的排列方式定制等效材料和媒质属性,实现对电磁场和电磁波的灵活调控,带来全新的物理现象.基于信息超材料孔径的微波计算成像(Microwave Computational Imaging based Information Metamaterial Aperture, IMA-MCI)技术可以不依靠于雷达平台与目标之间的相对运动,在波束内实现目标的高分辨率成像.在微波成像过程,由于信息超材料天线的制作工艺限制,可能会导致相位误差的产生,IMA-MCI在有相位误差的情况下,对目标场景的重构能力不足.针对该问题,本文构建了基于反射式信息超材料天线的微波计算成像模型,提出一种结合深度展开网络和相位恢复算法的成像技术.该算法在相位恢复算法的基础上引入了动态超网络为原有网络生成阻尼因子,能够根据输入场景不同进行调整,在线生成阻尼因子,在系统的参数发生变化时仍然具有较好的性能.实验结果显示,该方法具有较好的成像性能和鲁棒性.
摘要:由于航空目标相对地面目标具有更快的运动速度、更广的运动范围,对航空目标的三维精确定位极具挑战性.本文提出了一种多传感器组网的航空目标三维定位算法,以两个高空无人飞艇各载一部光学传感器设备,无人机-艇载双基地两坐标雷达,多平台协同实现对航空目标的精确定位为研究背景,解决了由于各传感器量测维度欠完备、无法独立获得目标三维空间精确位置,导致传统点迹关联、目标定位方法失效等问题.首先,在空间对准的基础上提出了基于角度-距离两级点迹关联算法,实现多传感器缺维量测的有效关联;其次,通过目标引导点构建、椭球空间Nelder-Mead欧氏距离寻优、方位面空间投影,在各空间量测模型上确定目标初始定位点;最后,通过无迹变换和同源数据压缩得到目标精确定位点.仿真结果表明,该算法实现了缺维情况下雷达-双光学量测数据的稳定关联,且对航空目标的最优定位误差可达到115.7 m.
摘要:针对小型机器人在复杂环境中进行实时定位与建图时,存在机载端CPU(Central Processing Unit)计算资源不足,建图精度差、探索效率低的问题.本文提出一种基于同时定位与建图(Simultaneous Localization and Mapping,SLAM)、截断符号距离函数(Truncated Signed Distance Function,TSDF)实时的三维重建方法.该方法基于深度相机或双目相机获取重建目标及场景的RGB(Red Green Blue)图和深度图,同时基于ORB_SLAM2获取位姿信息;采用基于特征点云数据的表面重建算法TSDF与深度图相结合,实现一种实时三维场景重建;为了降低三维重建模型与真实场景的误差,提出一种采用光线碰撞检测融合特征点的方法,并结合优化策略减小光线投影距离与体素到物体表面距离的误差.通过优化后的TSDF值,保证了重建场景的完整性.在ASL(Autonomous Systems Lab)开源数据集上,相比于Voxblox、Voxfield和VDBblox,该系统三维重建模型的均方根误差分别下降了55.6%、47.11%、21.7%,相比于Voxblox、Voxfield,系统地图更新速率分别提升了9.7%和12.9%.最后,将该系统用于室内场景实验,地图平均每帧更新速率为7.35 ms/帧,验证了所提系统的可行性和有效性.
摘要:针对医学图像分割领域长期存在的多目标尺度变化大和边界模糊以致分割困难的问题,提出了一种新型的基于混洗特征编码和门控解码的双分支混合网络框架用于多器官精准分割.为了充分利用卷积神经网络(Convolutional Neural Network,CNN)在局部信息提取方面和Transformer在长程依赖关系建模方面的优势,采用U-Net和Swin-Unet构建双分支网络.该方法的创新之处在于对不同网络分支的多个阶段学习到的高维特征进行混洗操作,通过双支路通道交叉融合的方式实现局部信息与全局信息的高效融合,加强了双分支网络在不同阶段间的信息交互,从而解决了图像目标轮廓模糊引起的分割精度受限的问题.此外,为了解决多器官尺度变化大的问题,进一步提出了一种全新的基于多尺度特征图的门控解码器(Gated Decoder based on Multi-scale Feature,GDMF).该解码器能够学习网络不同阶段的多尺度高维特征并进行自适应特征增强,采用注意力机制和特征映射来辅助获取精准目标信息.实验结果表明,与现有主流医学图像分割方法相比,所提方法在ACDC(Automated Cardiac Diagnosis Challenge)和FLARE21(Fast and Low GPU memory Abdominal oRgan sEgmentation challenge 2021)数据集上均表现出更优的性能,有效解决了医学图像中多目标尺度变化大和边界模糊问题.
摘要:横摆稳定性是分布式驱动电动汽车(Distributed Drive Electric Vehicle,DDEV)稳定性研究中的重要难题.为解决DDEV横摆稳定性结构复杂、强耦合等问题,基于DDEV轮毂电机的独立可控性,本文提出一种基于多目标并行混沌优化的DDEV横摆稳定性控制系统.该控制系统由2个部分组成;上层控制器利用多目标优化策略,通过多目标并行混沌优化算法来计算DDEV维持横摆稳定所需的理想横摆角速度和期望滑移率;下层控制器为执行单元,根据上层控制器输出的最优期望变量,采用2个模糊控制器分别修正主动前轮转向角和分配驱/制动转矩,改善DDEV横摆稳定性.模型构建和仿真过程在Matlab/Simulink平台上完成,结果表明:该控制系统优化协调主动前轮转向角和驱/制动转矩,保证了DDEV横摆稳定性.