本文设计了一种基于石墨烯片的频率可调太赫兹天线,采用了折叠缝隙结构并使用共面波导馈电方式,以更好地实现阻抗匹配.通过调控在缝隙之间添加的4个石墨烯片的电导率,改变缝隙天线的等效长度,使天线在两种不同工作模式下的谐振频率分别为230.5 GHz和270.5 GHz.除此之外,在天线下方加载了方形封闭谐振环(Closed-Ring Resonator,CRR)构成的超表面,并使其谐振频率与天线的谐振频率匹配,将z轴负方向的辐射进行反射,使天线在两种工作模式下的增益提高至5.41 dBi和7.63 dBi,与无反射结构时相比分别增长2.48 dBi和3.55 dBi.
随着数字经济时代算力供给模式的变革,以算力为核心的新型网络基础设施已成为实现算力资源共享、支撑数字经济转型的重要动力.在算力网络中,多元异构用户终端通过多种方式高频接入网络以随时随地获取算力服务,网络的开放性和动态性增大,算力网络将面临更严峻的安全挑战.然而,基于传统网络的安全防御模式通常针对具体安全问题静态式增补安全防护组件,无法主动适配用户需求灵活调整防御策略,难以应对算力网络中的安全风险.因此,本文面向新型算力网络安全需求,将安全功能作为网络内部属性,基于智算融合网络提出一种多维协同自主防御范式.结合智算融合网络“三层”“三域”的设计思想,在“三层”中,以广义服务层定义安全固有服务,以映射适配层智慧适配安全功能,以融合组件层执行安全策略;在“三域”中,以实体域先导资源适配,以知识域驱动安全服务流程,以感控域实施具体安全技术,构建“检测”“溯源”“防御”三维一体的完整基础管控流程,其中安全策略与技术可根据场景扩展性与业务安全性进行灵活调整.最终,通过仿真实验对所提范式有效性进行了验证,为未来智算融合安全的进一步研究和应用提供参考.
本文基于槽线结构提出了一种具有前后向扫描能力的圆极化漏波天线.每个漏波单元由槽线及两根条带上加载的4个短路槽组成.每个短路槽的长度是侧射频率对应的半个导波波长,以实现前后向连续的波束扫描特性.通过设计每个短路槽的加载位置以及与传播方向的夹角,实现了漏波天线的圆极化特性.为了验证所设计的圆极化漏波天线的有效性,本文设计并加工了一款侧射频率为10 GHz的天线原型.仿真和测量结果都表明,该天线具有良好的圆极化特性和波束扫描能力.在9~11 GHz的频率范围内,该天线在上半空间为左旋圆极化,实现了-27°~+25°的扫描范围,增益变化为7.0~10.9 dBic;对称地,该天线在下半空间为右旋圆极化,实现了-153°~±180°~+155°的扫描范围,增益变化为8.4~12.3 dBic.与同类型的天线相比,本文提出的圆极化漏波天线具有更简单的单平面结构,且所采用的短路槽设计,实现了较低的通带内传输系数.
基于深度学习的中医舌色分类模型具备良好的性能,但是依赖大量正确标注的样本.由于人工标注样本费时费力,不可避免地存在错误标注,导致模型在训练过程中对噪声样本过拟合,使其泛化能力变差.为此,本文提出了一种基于噪声样本渐近修正的中医舌色分类方法.首先,根据舌色分类的特点,提出了一种全局-局部特征融合方法,将其嵌入到ResNet18骨干网络中,构建了舌色分类网络,并采用集成学习范式,提高分类模型的可靠性和稳定性;其次,针对噪声样本下的舌色分类网络训练问题,提出了样本注意力机制和噪声样本标签重新标注机制,在训练过程中对干净样本和噪声样本加以区分,赋予不同的权重,并逐步对噪声样本标签进行修正;最后,采用Boostrapping损失函数降低模型对噪声样本的关注度,抑制噪声样本对分类性能的影响.将提出的方法在两个自建的舌色分类数据集上进行了实验验证,结果表明,该方法通过渐进地对噪声标签进行校正,可以获得比现有的有噪样本下图像分类方法更高的分类精度,Acc指标分别达到了94.6%和93.65%.
回旋电子辐射涡旋电磁波量子的理论模型是量子态涡旋电磁波技术的关键.本文为“论回旋电子与涡旋电磁波量子”的第二部分,建立“涡旋电磁波量子辐射”相关理论模型.电子通过能级跃迁能够辐射单个携带内禀OAM(Orbital Angular Momentum)的电磁波量子.为了给出这一辐射机理,推导了非相对论和相对论效应中电子在朗道能级的跃迁概率.由于非相对论效应中朗道能级与内禀OAM模态值的线性关系,电子无论以何种初始状态跃迁都只能辐射平面波量子.相对论效应情况正好相反,可以得到丰富内禀OAM模态值的电磁波量子.在实际工程上,可用特定回旋装置作为产生单个涡旋电磁波量子的辐射源;模态选择上,根据不同内禀OAM模态间具有频率差的特性,利用虹膜嵌入式波导滤波器进行频率筛选,同时选择出特定内禀OAM模态的电磁波量子.最后分析强调了量子态和统计态涡旋电磁波的差异,以及二者在无线传输应用时的优缺点.
长磁透镜是展宽型分幅相机的重要部件,使用大电流激励长磁透镜可在漂移区产生强磁场,从而提高相机空间分辨率.由于焦耳热效应的影响,长磁透镜无法长时间工作在大电流环境下.本研究基于串并联Marx结构,设计了应用于长磁透镜的电流脉冲发生器,研究了充电电压、储能电容、负载以及电路串、并联级数对输出电流脉冲的影响.当充电电压增大,储能电容值增大,负载减小,串联级数增加时,脉冲峰值电流增大;并联级数增加时,峰值电流呈先增后减的变化趋势.当储能电容值增大,负载增大,串联级数减少,并联级数增加时,脉冲半高宽增大.建立长磁透镜模型,模拟了长磁透镜轴上磁场强度分布.长磁透镜内径越大,轴上磁感应强度越弱;激励电流越大,磁感应强度越强.采用四级串联、两路并联的Marx脉冲电路产生了峰值457 A,半高宽6.76 ms的电流脉冲.该电流脉冲激励长磁透镜,获得了53.72 μm的空间分辨率.
静态随机存取存储器(Static Random-Access Memory,SRAM)物理不可克隆函数(Physical Unclonable Function,PUF)利用参数设计完全相同的晶体管在制造过程中存在的工艺偏差,生成每块芯片无法克隆的密钥响应.由于SRAM-PUF内部错误分布的随机性,密钥重构需要使用纠错码,而纠错电路的面积与其纠错能力呈正相关,为了降低SRAM-PUF错误分布,减小纠错电路面积,本文通过对SRAM数据残留特性的研究,提出一种数据残留预选算法,对SRAM单元进行筛选,提高PUF响应稳定性,使用区块择优算法筛选SRAM区块,减小响应的分散度,以更短的时间和资源消耗生成SRAM-PUF响应,测试结果表明,在不同温度(-40 ℃~80 ℃)和±10%电压波动下,256位SRAM-PUF响应拥有99.8%的稳定性及 的误码率,相对于通用的临时多数表决(Temporal Majority Voting,TMV)算法提升了1.7%的稳定性,降低 倍误码率,与1 000次TMV相比,时间复杂度从O(2 000n)线性降低到O(900n).经过72小时老化测试后,采用数据残留算法预选的SRAM-PUF稳定性仅下降0.2%.
本文提出了一种基于体Dirac半金属(Bulk Dirac Semimetal,BDS)的动态超材料结构极化偏转器.与传统的极化偏转器不同,该偏转器可以通过改变费米能级来动态控制偏振转换率和不对称传输.模拟结果表明,当BDS的费米能级调整为90 meV时,偏转器的偏振转换率在1.085~1.872 THz频率范围内都保持在90%以上(带宽为0.787 THz),在1.159 THz处偏振转换率达到峰值98%.该偏振转换器的不对称传输参数在1.229~1.831 THz大带宽范围内大于60%.本文还研究了偏振旋转角、椭圆度角、表面电流和电场分布情况以阐明该器件的极化转换特性和物理机制;通过施加栅极电压控制BDS费米能级,实现了对该极化偏转器的偏振转换率以及不对称传输的动态调谐.该极化偏转器的可调谐不对称传输特性,为基于动态不对称传输所设计的多路复用器、太赫兹二极管等设备的制造提供了新的思路.
针对当前广义频分复用(Generalized Frequency Division Multiplexing,GFDM)系统时变信道估计精度低的问题,提出基于稀疏贝叶斯学习的GFDM系统联合信道估计与符号检测算法.具体地,采用无干扰导频插入的GFDM多重响应信号模型,在稀疏贝叶斯学习框架下,结合期望最大化算法(Expectation-Maximization,EM)和卡尔曼滤波与平滑算法实现块时变信道的最大似然估计;基于信道状态信息的估计值进行GFDM符号检测,并通过信道估计与符号检测的迭代处理逐步提高信道估计与符号检测的精度.仿真结果表明,所提算法能够获得接近完美信道状态信息条件下的误码率性能,且具有收敛速度快、对多普勒频移鲁棒性高等优点.
为了解决低轨卫星网络高动态拓扑、大数据传输量、多信令开销的问题,满足全球覆盖和海量移动用户日益增长的需求,在研究不同业务性能指标体系的基础上,构建了高低轨卫星协同的软件定义卫星网络架构及虚拟拓扑模型;设计了综合考虑业务到达率和等待时长的优先级赋值函数,并提出一种基于业务感知与调度的联合星间路由算法,该算法包括针对高QoS需求业务的低复杂度轨道内优先转发路由算法和针对低QoS需求业务的链路加权路由算法.仿真结果表明,所提算法在平均端到端时延、丢包率和吞吐量等方面比传统算法均有显著的改善.
由于通信任务的多样化需求,同一系统中会集成多个不同频段的天线.相邻天线不可避免地会相互影响,导致天线端口的互隔离度下降.为提高双频段天线端口之间的互隔离度,本文提出了一种加载于低频单元上的平面、宽带耦合抑制结构(Planar/Wideband Coupling Suppression Structure,PWCSS),该耦合抑制结构谐振在高频段,可以有效减小低频单元在高频段的雷达散射截面(Radar Cross Section,RCS),使低频单元辐射的高频能量被吸收,进而提升两天线单元在高频段的端口互隔离度.本文提出的PWCSS有以下优点:不会给低频单元带来额外的增益损失、不会对天线原有辐射方向图产生影响;不需要分层加工,成本低,集成度高;包含不同长度、不同位置的开路微带,可以有效地扩展耦合抑制的作用带宽.对天线进行了仿真、加工和测试.结果表明,采用PWCSS可使高频范围内平均互隔离度、最大互隔离度分别提高16.6 dB和30 dB.该耦合抑制方法可用于基站、探测、雷达等多天线系统,具有良好的应用前景.
随着对高速、超紧凑数据信号管理需求的日益增长,光子集成电路(Photonics Integrated Circuits,PIC)在先进的光子信号处理中受到广泛关注,其中可编程光芯片因其特有的通用性、可重构特性逐渐受到开发者的青睐.本文依托联合微电子中心有限责任公司(United MicroElectronics Center Co. Ltd,CUMEC)的绝缘体上硅(Silicon-On-Insulator,SOI)自主工艺平台,设计并制备了包含9个六边形单元的3×3六边形架构可编程光芯片,利用迭代扫描法实现了消光比高达30 dB的开关电压标定,并通过扁平化版图优化设计使芯片尺寸降低了21%;采用此可编程光芯片进一步完成了典型功能验证:通过对输入输出端的可调基本单元(Tunable Basic Unit,TBU)耦合系数进行调谐,可实现消光比、谐振波长、自由光谱范围可调的马赫曾德尔干涉仪(Mach-Zehnder Interferometer,MZI)/ 微环谐振腔(Micro-Ring Resonator,MRR),消光比可高达42.3 dB/28 dB;可实现延时量大范围可调谐的延时线及任意输入/输出端口之间的路由.该芯片是目前世界上规模最大的六边形架构可编程光芯片,并实现了与有源单元的单片集成,在微波光子信号处理、化学生物传感、量子信息、光计算领域具有广阔的应用前景.
为在小型化、低成本的硬件平台实现正交匹配追踪(Orthogonal Matching Pursuit,OMP)算法,针对OMP算法中最小二乘法的问题,该文构造一个确定性的传感矩阵,提出一种低复杂度、低资源的权重化QR分解的OMP(Weighted QR decomposition OMP,WQR-OMP)算法硬件结构,在ZYNQ 7020型号芯片上搭建WQR-OMP SOC系统.WQR-OMP算法在传感矩阵进行QR分解后,根据三角矩阵 中元素的分布特性,通过权重化运算只保留主对角线上的元素而其他余元素归零,得到对角矩阵 ,然后近似计算稀疏向量的解.实验结果表明:与基于QR分解的OMP(QR decomposition OMP,QR-OMP)和Batch-OMP算法的硬件结构相比,WQR-OMP算法硬件结构的重构速度更快、存储资源更少.在压缩率为0.25的条件下,WQR-OMP SOC系统对256×256分辨率图像的重构时间为400 ms左右,其速率比仅使用ARM处理器的重构速率提高了约6.3倍.与其他现有研究对比,该系统在Block RAM存储资源消耗较少的情况下,进一步提升了重构速度,适用于存储资源受限的硬件平台.
通过范德华尔斯作用将单层石墨烯(Graphene)、单层二硫化钒(VS2)和单层氮化硼(BN)构建成Graphene/VS2/BN范德华三层异质结构,并将其与不同数量的锂结合,研究了其作为锂离子电池(Li-Ion Batterys,LIBs)中阳极电极材料的可行性.Graphene/VS2/BN范德华三层异质结构具有 eV/Å2的形成能,具有较强的稳定性,理论上可实现合成.同时,计算了Graphene/VS2/BN范德华异质结构的平面内刚度,得出的杨氏模量(Y)为886.88 N/m,高于单层VS2的Y(82.5 N/m),具有较好的力学性能.Graphene/VS2/BN范德华三层异质结构表面和界面上吸附Li的吸附能( )远大于相应单层的吸附能,表明其对Li具有较好的吸附性能. Li在Graphene/VS2/BN范德华三层异质结构的不同表面和界面处迁移时的扩散势垒非常小(0.3~0.6 eV),对电池速率性能极为有利.Graphene/VS2/BN范德华三层异质结构在LIBs的阳极电极材料方面的应用具有广泛的前景.
基于少模光纤的模式复用系统利用单根纤芯中的正交模式实现各独立信道的并行传输,能够有效提升系统容量,解决单模光纤系统的容量危机.本文联合使用模式复用、波分复用与偏振复用技术,基于六模渐变型光纤实现了80个波长通道下32 Gbaud四模双偏振16阶正交振幅调制信号的1 000 km相干传输,并在接收端使用时频域联合数据辅助8×8多输入多输出最小均方算法,以补偿由光纤传输导致的模式耦合及模间色散等线性损伤.与传统的纯时域或纯频域多输入输出最小均方均衡算法相比,该算法分别实现了57.1%的收敛速度提升与25.1%的收敛误差下降.经过1 000 km少模光纤传输后,80通道每个模式及偏振态的误码率均低于开销为20%的软判决前向纠错编码阈值 ,系统净速率达68.2 Tbit/s.
针对移相器和功分器的功能融合设计,提出了一种基于慢波基片集成波导(Slow-Wave Substrate Integrated Waveguide,SW-SIW)的小型化移相功分器,两个输出分支等长带宽,可实现30°相移量.其中一个输出分支通过基片集成波导(Substrate Integrated Waveguide,SIW)实现,而另一个输出分支将互补开口谐振环(Complementary Split-Ring Resonator,CSRR)加载在上层金属表面,代替传统SIW连续的金属表面,该CSRR由经典CSRR结构演变而来,同时为了降低由CSRR加载所造成的相位上的不稳定,在CSRR内部添加金属化通孔,实现SW-SIW,使得截止频率和相速度降低.测试结果表明,移相功分器在9.0~11.8 GHz频带范围内反射系数|S11|小于 dB,相对工作带宽为26.9%,插入损耗小于1.3 dB.两个输出端口的相位差稳定在 ,幅度差小于1.4 dB,实现了等功率分配.所设计的移相功分器具有较小的尺寸和低制造成本,适合应用在相控阵天线中.
时间反转技术特有的时空聚焦特性使其具有抗窃听能力.本文对提高时间反转正交频分复用系统安全性能的优化方案进行研究.首先,通过应用时间反转预滤波的时空聚焦特性来提高合法接收端相对于窃听端的信号强度;然后,以最大化保密速率为目标对子载波的功率分配进行优化.为进一步提升系统保密传输能力,利用循环前缀提供的自由度实现零空间人工噪声,在对窃听端形成有效干扰的同时,不对合法接收端造成影响.通过对子载波功率分配和人工噪声协方差阵进行联合优化,最大化系统的保密传输速率.仿真结果表明,所提优化方案能显著提高系统的保密速率.
为满足中低压消费电子的市场需求,小尺寸高密度Bipolar-CMOS-DMOS技术得到了蓬勃发展,低损耗和高可靠成为Bipolar-CMOS-DMOS技术中横向双扩散金属氧化物半导体场效应管(Lateral Double-diffused Metal-Oxide-Semiconductor field effect transistor,LDMOS)设计的重点和难点.本文介绍了一种基于高温氧化层(High Temperature Oxidation layer,HTO)结构的LDMOS,并对其热载流子注入退化机制进行了研究分析,利用高温氧化层结构改善了传统浅槽隔离(Shallow Trench Isolation,STI)结构中氧化物台阶嵌入半导体内部对器件热载流子注入造成的不利影响,提高器件可靠性,同时还缩短了器件导通情况下的电流路径长度,降低损耗.此外本文还提出了对P型体区的工艺优化方法,利用多晶硅作为高能量离子注入的掩蔽层,改善阱邻近效应对器件鲁棒性的影响,同时形成更深的冶金结,可以辅助漂移区杂质离子耗尽,降低漂移区表面电场,在不需要额外增加版次的情况下提高了器件击穿电压.最终得到的基于HTO结构的LDMOS击穿电压为43 V,比导通电阻为9.5 mΩ·mm2,线性区电流在10 000 s之后的退化量仅为0.87%.
针对背沟道刻蚀(Back Channel Etch,BCE)技术的非晶铟镓锌氧化物(a-IGZO)薄膜晶体管(Thin Film Transistor,TFTs),建立了一种高浓度掺杂态密度模型(High Concentration Doping Density Of States model,HCD-DOS model),并通过数值模拟研究态密度关键参数对器件性能的影响,以此揭示a-IGZO TFTs中制备工艺对导电沟道修复的物理机理.首先,采用结合强度较高的钼/铜双层结构作为栅/源/漏电极,引入BCE方法制备了底栅顶接触(Bottom-Gate Top-Contact,BG-TC) TFTs.其次,建立了适用于BCE技术的a-IGZO TFTs的HCD-DOS模型.随后,基于TCAD(Technology Computer Aided Design)仿真器对态密度关键参数进行数值研究,结果表明,不同态密度参数对a-IGZO TFTs器件转移特性曲线、电学特性以及沟道内部电子浓度分布的影响有所差异.最后,基于HCD-DOS模型探索SiO x 钝化层沉积和N2O等离子体处理对器件内部机理的影响.研究发现,N2O等离子体处理对态密度分布和沟道载流子浓度有显著影响,进而导致阈值电压正向漂移.
在模分复用系统的数字信号处理单元中,多输入多输出(Multi-Input Multi-Output,MIMO)均衡技术可用来补偿由各类模式相关噪声引起的信号误码率(Bit Error Rate,BER)劣化问题.而MIMO均衡算法的工作性能严重依赖于步长因子μ以及抽头数K,因此在固化均衡器之前,确定MIMO均衡算法中μ-K参数组合的最优值至关重要.为提高参数优化效率,提出了一种基于遗传算法(Genetic Algorithm,GA)的MIMO均衡参数优化方案,即遗传-MIMO(GA-MIMO),在保证最小BER输出的同时降低参数优化过程所需的计算开销.为验证GA-MIMO的工作性能,构建了基于10 km六模光纤的点对点通信实验系统,使用新方案补偿并行通信的六路数据,并与最速下降法和迭代算法进行性能比较.实验结果表明,所提GA方案可实现MIMO均衡中最高99.98%的最优μ-K参数命中率,且GA-MIMO算法的全局搜索性使其相比于最速下降法和迭代算法可最多分别节省86.14%和90.3%的均衡算法调用次数,有效降低了确定最优μ-K参数组合时的计算开销.
目前网络谣言的检测方法主要是从传播路径中寻找信息,大多只采用文本信息作为初始传播特征,因此难以捕捉到丰富的传播结构表示.本文根据谣言的传播路径,提取文本和用户可信度特征,构建一种基于传播树的多特征谣言检测模型.模型通过图卷积网络聚合文本传播信息,使用多头注意力机制挖掘文本传播树的层内依赖关系,同时对用户传播树中的每个用户构建可信度序列,并采用M-Attention模块捕获有效的用户可信度特征.实验结果表明,本文提出的方法在Twitter15、Twitter16和Weibo数据集上的检测准确率达到89.3%、91.7%和96.4%,相比当前最优的传播树模型Bi-GCN(Binary Graph Convolutional Network)分别提升4.8%、4.2%和3%.
基因与表型间的关联分析对揭示生物的内在遗传关联具有重要意义.随机游走算法可以融合多组学数据,聚合一阶或高阶邻居的标签信息,对网络中不同节点间关联信息进行补全,提高关联预测的准确度,进而发现基因和表型间潜在的遗传关联.但现有随机游走算法通常平等地对待每个节点,忽略了不同节点的重要性,使非重要节点过度传播,降低了模型性能.为此,本文提出了一种基于多组学数据融合的个性化随机游走算法(individual Multiple Random Walks,iMRW),在由基因、miRNA及表型节点构建的多组学异质网络上,基于网络拓扑结构,设计个性化多元随机游走策略,为不同重要程度的节点分配不同的游走步长,并结合高斯相互作用属性核相似性与随机游走,对网络不同节点及节点间关联信息进行补全,最终实现多源基因-表型关联矩阵的融合,准确获取基因-表型关联预测矩阵.在不同实验设置下,与主流算法的对比实验结果均显示iMRW能够取得更优的预测性能.在玉米光合作用能力和淀粉含量表型的实验分析结果也进一步证实了iMRW在识别潜在的基因-表型关联的实用性与有效性.
RISC-V指令集架构(Instruction Set Architecture,ISA)作为一种新兴的精简ISA,因免费、开源、自由等特点而得到快速发展.由于国内外对RISC-V的研究主要集中在硬件开发,软件生态相较于成熟ISA还很薄弱,实现一套RISC-V指令集高性能基础数学库可以进一步丰富RISC-V软件生态.本文基于自动化移植技术实现申威数学库到RISC-V的移植,为RISC-V指令架构提供首个使用向量指令优化的基础数学库系统.本文提出向量寄存器自动分支查表法与路径标记插入法,重点解决不同架构间寄存器映射过程中的寄存器复用问题,实现寄存器正确高效映射,并依据不同指令等价转换策略自动化移植数学函数69个.测试结果表明,RISC-V基础数学库函数可实现正确计算,最大误差为1.90ULP,函数性能平均为157.03节拍.
元胞自动机被广泛认为是基于分子自组装技术制造量子计算机、纳米计算机的基本架构,而元胞自动机的复杂度直接影响其并行分布式计算效率以及物理实现的可行性.现有复杂度最低的异步元胞自动机使用3个元胞状态和3条变迁规则能够构造所有逻辑电路,具备与图灵机等价的计算通用性(图灵通用性).为进一步降低通用异步元胞自动机的复杂度,本文提出新型电路元件以及基于该元件的逻辑电路设计方法.不同于同步电路的逻辑门元件,新型电路元件能够有效处理信号的随机波动,对单电子隧道晶体管等纳米材料技术有积极的应用价值.据此,本文提出新的异步元胞自动机模型,该模型仅需3个元胞状态和2条规则,比现有的通用模型复杂度低.除图灵通用性外,本文通过设计大规模分布式逻辑电路,进一步证明所提的异步元胞自动机具备与所有同步元胞自动机同等的计算能力.
由于传统文本评论情感分类方法通常忽略用户性格对于情感分类结果的影响,提出一种基于用户性格和语义-结构特征的文本评论情感分类方法(User Personality and Semantic-structural Features based Sentiment Classification Method for Text Comments,BF_BiGAC).依据大五人格模型能够有效表达用户性格的优势,通过计算不同维度性格得分,从评论文本中获取用户性格特征.利用双向门控循环单元(Bidirectional Gated Recurrent Unit,BiGRU)和卷积神经网络(Convolutional Neural Network,CNN)可以有效提取文本上下文语义特征和局部结构特征的优势,提出一种基于BiGRU、CNN和双层注意力机制的文本语义-结构特征获取方法.为区分不同类型特征的影响,引入混合注意力层实现对用户性格特征和文本语义-结构特征的有效融合,以此获得最终的文本向量表达.在IMDB、Yelp-2、Yelp-5及Ekman四个评论数据集上的对比实验结果表明,BF_BiGAC在分类准确率(Accuracy)和加权macro F 1值(F w)上均获得较好表现,相对于拼接BiGRU、CNN的情感分类方法(Sentiment Classification Method Concatenating BiGRU and CNN,BiGRU_CNN)在Accuracy值上分别提升0.020、0.012、0.017及0.011,相对于拼接CNN、BiGRU的情感分类方法(Sentiment Classification Method Concatenating CNN and BiGRU,ConvBiLSTM) Fw 值上分别提升0.022、0.013、0.028及0.023;相对于预训练模型BERT和RoBERTa,BF_BiGAC在保证分类精度的情况下获得了较高的运行效率.
针对当前交通场景下自监督单目深度估计存在特征表达能力弱、深度图局部细节模糊、深度估计精度低的问题,提出一种基于双注意力机制和自适应代价卷的自监督单目深度估计方法.该方法首先利用双注意力机制的特征提取网络,结合通道注意力和空间注意力,对提取的场景特征进行自适应加权,增强特征表达能力.其次,根据提取的全局特征自适应的构建代价卷,引导网络学习精细的深度特征,提升网络模型对深度图局部细节的学习能力,解决现有方法深度估计精度低的问题.在自动驾驶公开数据集KITTI、Cityscapes上的实验结果表明,本文方法优于目前主流方法.
多项式乘法运算制约着基于格的后量子密码在现实中的应用.为提高后量子密码Crystal_Kyber算法的性能效率,减少运行时间,降低多项式乘法的影响,本文设计了一种新的蝶形运算单元对素模 =3 329的Kyber方案进行优化.首先,采用16路并行调度新型蝶形运算单元的方式执行算法,缩短了计算周期;其次,使用流水线技术以及改进的K2RED算法,设计实现新型蝶形运算单元,用于降低资源消耗;最后,利用多RAM的方式存储数据,并且多通道优化RAM,允许数据交替存储在RAM中,提高资源复用率.实验结果表明,本文优化后的数论变换(Number Theoretic Transform,NTT)、逆数论变换(Inverse NTT,INTT)、点对位相乘(Point-Wise Multiplication,PWM)的效率达到200 MHz,合并执行Kyber效率达到175 MHz,优于其他方案,具有良好的性能.
针对高动态车联网环境中基站难以收集和管理瞬时信道状态信息的问题,提出了基于多智能体深度强化学习的车联网频谱分配算法.该算法以车辆通信延迟和可靠性约束条件下最大化网络吞吐量为目标,利用学习算法改进频谱和功率分配策略.首先通过改进DQN模型和Exp3策略训练隐式协作智能体.其次,利用迟滞性Q学习和并发体验重放轨迹解决多智能体并发学习引起的非平稳性问题.仿真结果表明,该算法有效载荷平均成功交付率可达95.89%,比随机基线算法提高了16.48%,可快速获取近似最优解,在降低车联网通信系统信令开销方面具有显著优势.
针对现有基于伪点云的3D目标检测算法精度远低于基于真实激光雷达(Light Detection and ranging,LiDar)点云的3D目标检测,本文研究伪点云重构,并提出适合伪点云的3D目标检测网络.考虑到由图像深度转换得到的伪点云稠密且随深度增大逐渐稀疏,本文提出深度相关伪点云稀疏化方法,在减少后续计算量的同时保留中远距离更多的有效伪点云,实现伪点云重构.本文提出LiDar点云指导下特征分布趋同与语义关联的3D目标检测网络,在网络训练时引入LiDar点云分支来指导伪点云目标特征的生成,使生成的伪点云特征分布趋同于LiDar点云特征分布,从而降低数据源不一致造成的检测性能损失;针对RPN(Region Proposal Network)网络获取的3D候选框内的伪点云间语义关联不足的问题,设计注意力感知模块,在伪点云特征表示中通过注意力机制嵌入点间的语义关联关系,提升3D目标检测精度.在KITTI 3D目标检测数据集上的实验结果表明:现有的3D目标检测网络采用重构后的伪点云,检测精度提升了2.61%;提出的特征分布趋同与语义关联的3D目标检测网络,将基于伪点云的3D目标检测精度再提升0.57%,相比其他优秀的3D目标检测方法在检测精度上也有提升.
高光谱图像(HyperSpectral Images,HSIs)具有高光谱分辨率和丰富的光谱信息,其具有的大量窄波段电磁波有利于获取感兴趣目标的理化信息,并根据对应的光谱特征对不同物质进行有效区分,从而完成目标检测任务.然而有限样本、少量先验信息、高维相似背景及不同类别差异小所导致的目标和背景混淆问题使得高光谱目标检测(Hyperspectral Target Detection,HTD)面临挑战.为此,本文提出结合区域引导和双注意力机制的高光谱目标检测判别式学习网络(Region-guided and dual-Attention Discriminative learning Network,RADN),以缓解标记样本少的条件下不同类别相似度高和相同类别差异性大导致的背景和目标不易区分的问题,减少高维冗余特征带来的计算复杂度,同时提升检测精度.本文使用经验性区域引导网络训练,采用光谱约束的无监督聚类方法确定网络输入,选择性地关注高光谱图像中的显著性特征和感兴趣区域.此外,本文在网络中添加双通道注意力机制来辅助复杂背景分布的估计,并在网络中引入不同类别光谱先验损失函数,进一步减少高维复杂背景以及光谱变化对于目标的干扰.实验结果和分析表明,RADN在不同数据集上的性能优于现有先进的算法.
人体关键点检测是计算机视觉的热点研究领域.目前,对于体操动作关键点检测,仍存在检测精度不足及缺乏细节部位检测能力等问题.为了提升检测精度,本文设计了一种多分辨率网络,该网络在浅层具备较大感受野,同时能够利用高分辨率通道增强细节特征的提取能力.为实现对手部及脚部关键点的检测,设计了一种增量学习网络.该网络融合了多分辨率网络的浅层特征并利用自建数据集计算深层特征以提升网络对手部及脚部关键点的检测能力.最后对两个网络输出结果进行合并.计算机仿真表明,多分辨率网络在COCO2017关键点检测数据集上达到了94.4%的准确率,并且增量学习网络能够在训练数据较少的情况下实现对细节部位关键点的准确检测.
无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算法的局限性等,伪标签中会引入大量噪声,严重误导模型优化过程,导致模型性能退化.为了减轻伪标签噪声的影响,本文提出了一种新的伪标签正则化损失函数,用伪标签的置信度分数和样本相似度对伪标签噪声进行约束.具体来说,本文首先提出了一种聚类引导的注意力机制,根据伪标签与聚类中心的语义相关程度来估计伪标签的置信度,以此来识别噪声标签并给正确标签分配更多的权重,有效降低伪标签噪声在总体损失函数中的作用.同时,为了充分利用伪标签的判别能力,本文利用伪标签进行在线软样本挖掘,构建mini-batch中的正负样本对并为每个正负样本对计算一个连续的权重分数.通过将以上两种权重引入到对比损失中,本文提出的伪标签正则化损失函数可以有效抑制伪标签噪声的影响,减轻标签噪声对训练过程的影响,提高模型的准确性和鲁棒性.在多个公开行人数据集上的实验结果验证了本文方法的有效性,在Market1501、DukeMTMC-reID和MSMT17数据集上mAP分别达到了85.9%、75.1%和29.3%.
在当今数字化时代,海量数据的生成和积累呈现出爆炸式增长的趋势,因此对存储容量的需求急速上升.传统磁记录磁盘CMR因其高容量和低成本而被视为解决海量数据存储的首选.然而,由于超顺磁效应的制约,CMR(Conventional Magnetic Recording)磁盘面密度的提升已触及极限.为了突破这一限制,叠瓦式磁记录技术SMR(Shingled Magnetic Recording)应运而生.基于传统硬盘架构,该技术以重叠磁道的方式,显著提升了磁盘面密度.但SMR磁盘在处理随机写时,会产生不可预测的写放大效应,从而严重影响I/O性能.为解决这一问题,业界随即提出了交错式磁记录技术IMR(Interlaced Magnetic Recording),利用优化的磁道布局和热辅助磁记录技术,有效实现了存储容量与性能的平衡.本文首先详细介绍了SMR和IMR的技术原理和磁盘类型,并量化分析了影响设备I/O性能的关键问题.然后,重点介绍了设备级优化方案,分析并总结了不同策略的优缺点与优化目标.接着,概述了面向设备的系统级和应用级设计方案,如文件系统、独立磁盘阵列技术和数据库等.最后讨论了在未来优化SMR磁盘和IMR磁盘性能可能的研究方向.
随着晶体管缩小速度的减缓,单GPU(Graphics Processing Units)的性能提升已经变得越来越具有挑战性,因此,多GPU系统成为了提高GPU系统性能的主要手段.然而,由于片外物理设计的制约,多GPU系统中处理器间的带宽不均衡导致了非一致存储访问(Non-Uniform Memory Access,NUMA)问题,严重影响多GPU系统的性能.为了减少非一致存储访问所导致的性能损失,本文首先分析了非一致存储访问出现的原因,并对现有的非一致存储访问解决方案进行了对比.针对不同维度的非一致存储访问,本文从减少远程访问流量和提升远程访问性能两个方向出发,对非一致存储访问的优化方案进行了总结.最后,结合这些方案的优缺点,提出了未来多GPU系统非一致存储访问优化的发展方向.