目标检测是计算机视觉领域中最基础且最重要的任务之一,是行为识别与人机交互等高层视觉任务的基础.随着深度学习技术的发展,目标检测模型的准确率和效率得到了大幅提升.与传统的目标检测算法相比,深度学习利用强大的分层特征提取和学习能力使得目标检测算法性能取得了突破性进展.与此同时,大规模数据集的出现及显卡计算能力的极大提高也促成了这一领域的蓬勃发展.本文对基于深度学习的目标检测现有研究成果进行了详细综述.首先回顾传统目标检测算法及其存在的问题,其次总结深度学习下区域提案和单阶段基准检测模型.之后从特征图、上下文模型、边框优化、区域提案、类别不平衡处理、训练策略、弱监督学习和无监督学习这八个角度分类总结当前主流的目标检测模型,最后对目标检测算法中待解决的问题和未来研究方向做出展望.
伴随信息社会向网络化、泛在化、智能化持续发展,现有地面通信网络已经无法支持日益增长的宽带业务需求、泛在海量的物联接入需求、隐蔽可靠的安全传输需求.未来通信网络要求在全球范围内实现既纵深宽广又细致入微的全方位无线接入,其进一步演进亟需突破包括网络架构和空口技术等在内的底层技术.相比于地面通信网络,空天通信网络不受地形的限制,可实现包括海洋、森林、边远地区等的立体全覆盖,可在多维度多层次尺度实现全空间范围内的信息交互,将成为满足海量异构用户泛在连接需求的关键使能技术.本文综述了空天通信网络的关键技术,首先给出了空天通信网络现有系统及未来智慧社会业务的多元化应用场景,然后从空-天-地三网、物理-网络-应用三层、有效传输-资源管理-安全防护三域出发,给出了一种空天通信网络的整体架构.本文随后从组网与接入、物理层以及资源管理与切换等角度出发分别总结了关键技术.最后,本文指出了未来空天通信网络的技术发展挑战和趋势.
随着大规模集成电路器件复杂度与容量的不断提升,现场可编程门阵列(Field Programmable Gate Array, FPGA)以高度的并行、可定制和可重构的特性得到了广泛的关注与应用. 在制约FPGA发展的众多因素中,最为关键的便是电子设计自动化(Electronic Design Automation, EDA)技术,作为FPGA EDA流程中的关键环节,布局和布线技术的研究对于FPGA的重要性不言而喻. 本文综述了面向FPGA的布局和布线技术,包括基于划分的布局、基于启发式的布局、基于解析式的布局、FPGA串行布线和FPGA并行布线等技术,分析对比了不同技术方法的优缺点,在此基础上,本文还展望了未来FPGA布局和布线技术的发展趋势,将为FPGA未来健康可持续的发展提供有力支撑.
作为众多医学图像处理的前提和关键,医学图像关键点检测具有重要的理论研究和应用价值.由于个体间差异性和个体内歧义性的影响,以及更高的临床应用定位精度的要求,医学解剖关键点检测面临着巨大的挑战.鉴于深度学习技术在医学图像关键点检测乃至整个医学图像处理领域都表现出了强大的实力,本文全面检索发表于顶级医学期刊和会议论文集中的医学图像关键点研究成果并进行了详细的梳理和综述.从计算机视觉任务角度简述医学图像关键点检测及其存在的难点;总结了深度学习技术在医学图像关键点检测中的基本框架,详细论述了医学图像关键点检测的分类问题和回归分析两种不同类型的解决思路;最后探讨了医学图像关键点检测深度学习方法面临的挑战、主要应对策略和开放的研究方向.
行人轨迹预测是视频监控的重要组成部分,因现有方法未充分利用场景特征信息造成其预测轨迹不符合生活常识,导致行人轨迹预测精度较低出现明显偏离真实轨迹的情况.针对上述不足本文提出一种基于Transformer动态场景信息生成对抗网络(Generative Adversarial Network,GAN)的行人轨迹预测方法.该方法利用动态场景特征提取模块的卷积神经网络(Convolutional Neural Networks,CNN)模型对目标行人的动态场景信息进行特征提取,同时生成器网络中的编码器利用Transformer对行人的社会交互信息特征以及轨迹信息特征进行建模.在ETH和UCY数据集上的实验结果表明,与Social GAN模型相比,本文方法在多个场景下的平均位移误差准确率提高了25.61%,最终位移误差准确率提高了38.44%.
显著性目标检测旨在对图像中最显著的对象进行检测和分割,是计算机视觉任务中重要的预处理步骤之一,且在信息检索、公共安全等领域均有广泛的应用.本文对近期基于深度学习的显著性目标检测模型进行了系统综述,从检测粒度的角度出发,综述了将深度学习引入显著性目标检测领域之后的研究成果.首先,从三个方面对显著性目标检测方法进行了论述:稀疏检测方法,密集检测方法以及弱监督学习下的显著性目标检测方法.然后,简要介绍了用于显著性目标检测研究的主流数据集和常用性能评价指标,并对各类主流模型在三个使用最广泛的数据集上进行了性能比较分析.最后,本文分析了显著性目标检测领域目前存在的问题,并对今后可能的研究趋势进行了展望.
构建空天地一体化信息网络是第六代通信系统(the Sixth Generation,6G)的重要目标,无线光通信相较于射频(Radio Frequency,RF)通信技术具有容量大、速率高、抗干扰能力强等优势,已成为建立全球无缝覆盖空间网络的重要技术.本文综述了基于自由空间光通信(Free Space Optical Communication,FSOC)的空天地一体化网络国内外建设及相关标准化现状,相较于现有综述文献,涵盖了更多最新研究工作,并针对物理层和上层指出一体化FSOC网络设计需要关注的重要因素,对大气信道建模、“捕获、瞄准和跟踪”(Acquisition Pointing and Tracking,APT)、拓扑控制、路由、资源分配、可靠传输协议、微波协作传输几种重要通信技术进行总结和分析,并指出其未来发展趋势和面临的挑战.
基于视频数据的深度预测学习(以下简称“深度预测学习”)属于深度学习、计算机视觉和强化学习的交叉融合研究方向,是气象预报、自动驾驶、机器人视觉控制等场景下智能预测与决策系统的关键组成部分,在近年来成为机器学习的热点研究领域.深度预测学习遵从自监督学习范式,从无标签的视频数据中挖掘自身的监督信息,学习其潜在的时空模式表达.本文对基于深度学习的视频预测现有研究成果进行了详细综述.首先,归纳了深度预测学习的研究范畴和交叉应用领域.其次,总结了视频预测研究中常用的数据集和评价指标.而后,从基于观测空间的视频预测、基于状态空间的视频预测、有模型的视觉决策三个角度,分类对比了当前主流的深度预测学习模型.最后,本文分析了深度预测学习领域的热点问题,并对研究趋势进行了展望.
分子通信是一种利用微小粒子编码、传输和接收信息的通信范式,具有生物兼容性好、尺寸小等特点,是用来构建纳米网络的非常有潜力的通信方案之一.分子通信的概念一经提出就吸引了广泛关注,众多学者的参与使其迅猛发展.目前,分子通信理论已经被广泛研究,相关实验也有了进展.尽管如此,构建实际的分子通信系统还有大量问题亟须解决.为促进分子通信领域更好发展,对分子通信的理论基础和当前研究进展进行系统性的总结是必要的.因此,本文对基于扩散的分子通信的基本概念和研究进展进行了阐述,包括信道模型、信号的编码调制机制以及接收机制;此外,还介绍了分子通信系统的同步机制、移动分子通信系统,以及分子通信实验系统的最新研究进展,并对分子通信未来的研究方向进行了展望.
全参考图像质量评价(Full Reference Image Quality Assessment, FR-IQA)是IQA领域广为研究的类型之一.本文回顾了FR-IQA的发展历程,对FR-IQA应用现状和通用FR-IQA问题的构建进行综述,以及对FR-IQA算法进行总结和梳理.并在此基础上,重点分析了现有研究中存在的问题,包括问题构建的合理性、建模的全面性问题、知识驱动与数据驱动结合的问题等.基于对主观评价过程的深入分析,结合现有研究存在的问题,探讨了主观评分采用模糊建模和知识与数据联合驱动构建算法两个可能的研究方向,以期对后续的研究者提供参考.
为了提高分析信号的信噪比,本文提出了一种基于变分模态分解的变步长归一化最小均方自适应滤波降噪方法.该方法对原信号进行变分模态分解并区分信号分量和噪声分量,再对噪声分量进行间隙阈值降噪处理并将其作为参考信号输入自适应滤波器,通过自适应算法迭代处理得到降噪后的信号分量,并通过重构算法得到最终降噪后的信号.本文还在变分模态分解的基础上使用小波阈值降噪和间隙阈值降噪方法按不同方案进行降噪处理并得到最佳算法,将其与所提算法进行对比.实验结果表明,本文所提自适应滤波降噪方法的降噪效果比阈值降噪最佳方法效果更好.
由于多智能体所处环境动态变化,并且单个智能体的决策也会影响其他智能体,这使得单智能体深度强化学习算法难以在多智能体环境中保持稳定. 为了适应多智能体环境,本文利用集中训练和分散执行框架Cen?tralized Training with Decentralized Execution(CTDE),对单智能体深度强化学习算法Soft Actor?Critic(SAC)进行了改进,引入智能体通信机制,构建Multi?Agent Soft Actor?Critic(MASAC)算法. MASAC中智能体共享观察信息和历史经验,有效减少了环境不稳定性对算法造成的影响.最后,本文在协同以及协同竞争混合的任务中,对MASAC算法性能进行了实验分析,结果表明MASAC相对于SAC在多智能体环境中具有更好的稳定性.
异常检测对电力行业的发展有着重要的影响,如何根据大规模电力数据进行异常检测是重要的研究热点.目前,大多数研究通过聚类或神经网络进行异常检测. 但是这些方法忽略了时序数据之间潜在的关联关系及某些特点的重要信息,没有充分挖掘出数据的潜在价值. 因此,提出了一种基于图注意力和Transformer的异常检测模型. 该模型首先根据数据中台中获取的电力数据(主要包括用户ID、电能表ID、用户类型、电流、电压、功率等数据)构建一个异构信息网络;然后,为了减少模型参数和避免出现过拟合的现象,在图卷积网络(Graph Convolutional Network,GCN)模型的基础上,引入非负矩阵分解(Non-Negative Matrix Factorization,NNMF)的方法来进行相似性学习;最后采用图注意力网络(Graph Attention Network,GAT)和Transformer共同捕获数据间的相互关联关系,从而提高检测精度. 以中国某地区的电力数据为基础进行验证, 实验结果表明所提出的方法可以有效进行异常检测.
微波光子学是一门研究光与微波相互作用的新型交叉学科,旨在利用现代光学技术实现高频宽带微波信号产生、传输、处理和测量.其中,微波光子传感是微波光子学一个重要的研究领域,它采用光学传感器实现温度、应变、压力等传感参量光域感知,基于微波光子技术实现光域传感信息到微波域的线性映射和转换,结合微波信号处理技术实现传感信号解调,具有传感精度高、测量速度快等显著优势.本文系统性地回顾了微波光子传感技术最新研究进展,介绍了各类微波光子传感技术的基本工作原理,并展望了未来的研究方向和发展趋势.
针对合成孔径雷达(Synthetic Aperture Radar,SAR)图像中飞机目标散射点离散化程度高,周围背景干扰复杂,现有算法对飞机浅层语义特征表征能力弱等问题,本文提出了基于注意力特征融合网络(Attention Feature Fusion Network,AFFN)的SAR 图像飞机目标检测算法.通过引入瓶颈注意力模块(Bottleneck Attention Module,BAM),本文在AFFN中构建了包含注意力双向特征融合模块(Attention Bidirectional Feature Fusion Module,ABFFM)与注意力传输连接模块(Attention Transfer Connection Block,ATCB)的注意力特征融合策略并合理优化了网络结构,提升了算法对飞机离散化散射点浅层语义特征的提取与判别.基于自建的Gaofen-3 与TerraSAR-X 卫星图像混合飞机目标实测数据集,实验对AFFN与基于深度学习的通用目标检测以及SAR图像特定目标检测算法进行了比较,其结果验证了AFFN对SAR图像飞机目标检测的准确性与高效性.
近年来,群体智能作为一项多学科融合的新技术在各领域的研究成果斐然,例如共享出行、蜂群无人机系统、水下多智能体平台等,但与水下场景结合的群体智能技术缺乏系统的归纳,有必要对水下群体智能技术的发展现状和趋势进行讨论和分析.本文对群体智能理论进行了详尽的分析,给出了群体智能的完整概念、具体算法以及应用领域.文中指出,为解决海洋复杂环境对探测、通信等造成的一系列困难,需要将群体智能技术应用于水下场景.本文就国内外水下群体智能技术的研究现状进行了总结,对水下群体智能存在的环境复杂、通信受限、信息获取困难、系统能力不足以及能量供应受限的难点进行了评述.针对这些难点,本文对结合群体智能理论的时变环境感知技术、传感网络设计、协同导航定位技术、路径规划技术、水下编队控制以及分布式自主决策技术进行了分析,并在文末给出水下群体智能技术未来在跨域通信、多平台异构、自主作业能力革新方面的发展趋势和展望.
地图匹配是许多位置服务与轨迹挖掘应用的基础.随着定位技术和位置服务应用的发展,地图匹配研究不断演进,从早期基于高采样率GPS(Global Position System)的实时匹配,到近期基于低采样率GPS轨迹的离线匹配、再到当前非GPS定位数据或高精度地图匹配。迄今已有许多地图匹配算法相继提出,但鲜有研究对这些算法进行全面总结.为此,对近十年提出的地图匹配算法进行调研,归纳出地图匹配算法的统一框架及常用时空特征.从模型或实现技术角度分类发现:现有算法大都采用HMM(Hidden Markov Model)模型,其次是最大权重模型;深度学习技术近期开始用于地图匹配,将是未来高精度地图匹配研究的趋势.
为了提高氮化镓半桥结构的抗dv/dt特性,提出了一种适用于氮化镓半桥结构的高可靠性差分电流补偿新颖电平移位电路.该电路在自举电容作用下,将0V~5V输入电压转换为35V~40V输出电压,并且在浮点电压快速变化过程中,输出的驱动电压均保持稳定.电路采用电流镜结构传输信号,能够实现电平信号的快速传递,有效地减小传输延迟.对于浮点电压的快速变化导致移位电平器输出变化的问题,采用新颖的差分电流结构进行电流补偿,提高电路的抗dv/dt特性,获得高可靠性的输出电压.本电路基于标准0.35μm BCD工艺40 V的LDMOS耐压器件,对该电平移位电路在1MHz频率下进行验证.结果表明上升沿响应延迟为587.184ps,下降沿响应延迟为832.144ps,抗正的dv/dt变化为116V/ns以及对负dv/dt变化不敏感,该电路具有高速,高可靠性优点.
图像超分辨率重建是计算机视觉中的基本图像处理技术之一,不仅可以提高图像分辨率改善图像质量,还可以辅助其他计算机视觉任务. 近年来,随着人工智能浪潮的兴起,基于深度学习的图像超分辨率重建也取得了显著进展. 本文在简述图像超分辨率重建方法的基础上,全面综述了基于深度学习的单帧图像超分辨率重建的技术架构及研究历程,包括数据集构建方式、网络模型基本框架以及用于图像质量评估的主、客观评价指标,重点介绍了根据网络结构及图像重建效果划分的基于卷积神经网络的方法、基于生成对抗网络的方法以及基于Transformer的方法,并对相关网络模型加以评述和对比,最后依据网络模型和超分辨率重建挑战赛相关内容,展望了图像超分辨率重建未来的发展趋势.
图像描述旨在通过提取图像的特征输入到语言生成模型中最后输出图像对应的描述,来解决人工智能中自然语言处理与计算机视觉的交叉领域问题——智能图像理解.现对2015—2020年间图像描述方向有代表性的论文进行汇总与分析,以不同核心技术作为分类标准将图像描述大致划分为基于Encoder-Decoder框架的图像描述、基于注意力机制的图像描述、基于强化学习的图像描述、基于生成对抗网络的图像描述和基于新融合数据集的图像描述五大类.使用NIC、Hard-Attention和Neural Talk三个模型在真实数据集MS-COCO数据集上进行实验,并从BLEU1、BLEU2、BLEU3、BLEU4四处平均评分对比分析,展示三个模型效果.本文点明了未来图像描述的发展趋势,并指出了图像描述将要面临的挑战和可深入挖掘的研究方向.
传统雷达系统的发射机与接收机采用开环工作模式,在动态复杂环境下探测目标时缺乏灵活性和稳健性.借鉴生物认知学习过程,认知雷达可以感知动态环境和目标信息,通过发射和接收端闭环反馈控制,实现全自适应探测和信号处理.本文介绍了认知雷达波形优化的基本框架,递进地梳理了面向检测、跟踪、成像、分类任务以及抗干扰认知波形优化的主要研究内容和研究进展,为面向单一任务及联合多任务的波形优化技术研究提供了纵向和横向的对比视角.在已有研究的基础上,本文分析了认知雷达波形优化的优势和挑战,指出认知波形优化技术中潜在的研究方向,包括知识有效性评价、人工智能认知波形优化、通用度量准则、知识辅助的高效优化算法等方面.
硅基光电晶体管在高频通信、自动控制、电力系统领域具有广泛的应用前景.从系统验证和仿真的角度,迫切需要建立光电晶体管的等效电路模型,该模型需要包含电学特性和光学特性.本文提出了一种高频(100MHz~1GHz)硅基光电晶体管的SPICE(Simulation Program with Integrated Circuit Emphasis)等效模型,包含器件的主要光电特性,通过TCAD(Technology Computer Aided Design)仿真建立了模型中关键电学和光学参数的提取方法.基于所建立的高频光电晶体管的SPICE模型等效电路进行仿真,所得到的仿真结果能够完整描述光电晶体管的电学特性和光学特性,并验证了模型在器件模拟与电路应用上的可行性,表明本文所提出的SPICE模型和参数提取方法,对于基于高频光电晶体管的系统仿真,具有参考价值.
车辆路径作为经典的组合优化问题一直是研究的热点与难点,无论是在应急管理工作还是物流配送中,对它的合理规划都至关重要.为了今后更好地开展相关工作,本文回顾了精确算法、启发式算法和机器学习算法在车辆路径优化问题中的研究进展,并基于Solomon标准数据集对六种经典算法的求解性能进行了比较分析;分别从局部最优和收敛速度间的平衡关系、个体评价函数、动态车辆路径问题以及机器学习算法在车辆路径问题中的应用等四个方面对其发展趋势进行了展望.
基于深度学习的生物医学图像分割由于其精度的提高,可以更好地辅助医生做精确的诊断.目前主流的基于U-Net的分割模型通过多层卷积进行局部特征的提取,缺失了全局信息,使分割过于局部化而产生误差.本文通过自注意力机制和分解卷积策略对U-Net模型进行改进,提出一种新的深度分割网络SAU-Net,使用自注意力模块增加全局信息,将原U-Net中的级联结构改为逐像素相加,减小维度,降低计算量;提出一种快速简洁的分解卷积方法,将传统卷积分解为两路一维卷积,并加入残差连接强化上下文信息.在BRATS和Kaggle两个脑肿瘤数据集上进行的实验结果表明,SAU-Net在参数量和Dice系数上都有更优的性能.