摘要:本文针对一个新的、具有挑战性的问题,即实现源域、中间域到单个目标域的知识转移,其中目标域的每个类别仅有少量标记样本.此种情况下的知识转移过程面临以下两个困难:一是目标数据极其稀缺,从而导致没有足够的目标域特征分布;二是现有的少样本学习方法无差别地提取每部分特征,从而导致少样本目标检测性能不佳.为解决上述问题,本文提出一种少样本多源域目标检测方法.提出一种新的元优化机制,通过引入的混合域将源域和目标域对齐,用以缓解目标域稀缺特征分布的问题.具体而言,首先利用图像级混合生成混合图像,和相应的标签共同构成第一个混合域;然后通过双通道注意力机制生成细粒度特征,再利用特征级混合生成特征级混合特征,和相应的标签共同构成第二个混合域;最后通过区域建议网络和感兴趣区域网络生成感兴趣区域特征,再利用感兴趣区域特征级混合生成ROI(Region Of Interest)级混合ROI特征,和相应的标签共同构成第三个混合域.生成的三个混合域共同用于计算损失函数,完成元优化过程.提出一种包含卷积层和特征校准的双通道注意力机制,用以学习更具判别性的深度特征表征,其中卷积层用于防止关键空间信息的丢失,特征校准用于选择性地增强重要特征并削弱非重要特征.具体而言,首先利用卷积层子模块生成粗粒度特征表示;其次,利用特征校准子模块根据特征间的相关性建立注意力权重,并将这些注意力权重与原始特征进行整合,从而有选择地强化重要区域,同时抑制不重要区域.COCO数据集和PASCAL-VOC数据集的大量实验结果证明了本文提出的跨域元优化和双通道注意力结合的少样本多源域目标检测方法的有效性和鲁棒性.在检测效果上超越了同领域内其他方法,同时在不同数据集上保持了良好的泛化性能,此外模型的参数量在同领域内相比其他方法有显著优势.
摘要:在众多现实场景中数据以流的形式持续产生,由于流数据具有动态变化的特点,在生成过程中可能产生新的类别,也被称为概念演化.概念演化是流数据挖掘模型预测性能衰退甚至预测失效的主要原因.因此,能及时发现类空间变化并提醒模型做出适应性调节的概念演化检测方法受到广泛关注.然而,目前多数概念演化检测方法基于特征空间静态不变的假设构建算法.在现实场景中,特征空间同样具有动态性,属于开放的空间.具体来说,随时间推移可能出现部分特征消失和新特征产生的现象,从而破坏上述假设并导致已有算法失效.针对这一问题,本文提出一种面向开放特征空间的概念演化检测方法(Concept evolution Detection method for Open Feature space,CD_OF).该方法通过构建微簇集成模型对新进实例分类,对于开放特征空间中的旧特征消失问题,通过利用转移矩阵将旧特征中包含的信息转换到共享特征中;对于新出现的特征,拓展共享特征空间并重构集成模型.在此基础上,根据样本的共享邻域信息定义样本间相似度以检测概念演化,并建立动态衰减模型,以解决开放特征空间下的类消失和类循环问题.实验结果表明,本文所提出的方法能够对开放特征空间中特征的变化作出及时响应,增强概念演化检测的能力,在特征空间变化的真实流数据中与现有方法相比,错误率降低了1.7%~11.4%.
摘要:随着数字经济的高速发展,数据存储已成为数据要素全生命周期管理的核心环节,在完整性、隐私性、可用性等安全属性上面临多重挑战.区块链依托分布式账本数据结构与密码学共识机制,构建起覆盖数据全生命周期可信存储的基座,为破解安全挑战提供创新技术路径.然而现有区块链技术在可扩展性、效率优化和安全加固等方面仍存在局限,亟需系统梳理区块链赋能数据安全的技术路径与能力边界.本文围绕数据安全服务“数据上链、服务访问、授权管理、生态运营”等关键业务,系统性调研区块链赋能数据安全研究进展,并面向数据安全利用和价值流通等数据产业安全发展指明技术发展趋势.具体地,本文首先从数据上链存储环节出发,分析影响数据完整性的共识机制、可编辑区块链以及完整性审计技术现状;其次在服务访问环节,分析拒绝服务(Denial-of-Service,DoS)攻击和低效率功能两类威胁的攻击原理,并对比当前存储可用性方案的优缺点;面对授权管理环节,从身份管理和密文存储两方面讨论数据跨域和非法访问问题及分析现有解决方案;面对数据存储安全服务生态运营需求,探索可扩展性的共识协议和分片机制两类技术,分析其成本、效率与适配性等方面瓶颈;最后,讨论区块链在数据安全领域赋能大语言模型(Large Language Model,LLM)安全的能力,并展望区块链在抗量子密码算法的能效优化机制、基于联邦学习的区块链弹性扩展架构,以及可信数据要素驱动的大语言模型等研究方向的发展趋势.