期刊首页 在线期刊 专题

专题

论文数据共享支持计划网站发布

为进一步扩大刊发论文的影响力,《电子学报》开展论文数据共享支持计划,鼓励作者分享论文成果相关代码及数据。

凡《电子学报》录用但未正式出版(含网络首发)的论文,均属数据共享支持计划。

如果作者愿意,可针对论文提供数据源码或分享链接并提交至编辑部。

专栏内含文章以开启数据共享。

Please wait a minute...
  • 全选
    |
  • 学术论文
    陈爽, 田烨, 付莹
    电子学报. 2024, 52(10): 3600-3612. https://doi.org/10.12263/DZXB.20230343
    摘要 (824) PDF全文 (280) HTML (779)   可视化   收藏

    量子图像传感器(Quanta Image Sensor,QIS)具有超高的单光子灵敏度与空间分辨率,因此其有望成为替代CMOS的下一代图像传感器.然而,从QIS获取的原始数据是二进制的图像帧,因此需要采用图像重建算法从二进制观测值中恢复原始场景.现有的方法包括基于模型的QIS图像重建和基于深度学习的QIS图像重建,其中基于模型的QIS图像重建通常需要进行大量的优化迭代,且对内部参数选择高度敏感.而基于深度学习的QIS图像重建则往往需要对每个具有细微不同的任务设计和训练单独的网络模型,灵活性欠缺并在很大程度上限制了其实用性.为了解决上述QIS图像重建方法的局限性,本文提出一种基于强化学习的免调参即插即用单光子图像重建方法.该方法能够自适应地对不同输入图像、不同过采样倍率和重建所处的不同迭代轮次动态选取合适的参数,实现更好的重建效果.具体地,本文将即插即用框架下的QIS图像重建任务中需要手动调整的参数建模为序列决策问题,引入结合无模型强化学习和基于模型强化学习思想的算法学习一个最佳策略,以实现对于不同输入图像在每次优化迭代时的最优超参选择.在合成和真实数据集上的实验结果表明,本文提出的方法可以在过采样倍率为4、6、8三种情况下,在峰值信噪比上相较现有先进方法提高约0.44~0.60 dB,在重建的视觉效果上也能够保留更多的纹理细节.真实极暗光QIS图像数据已在https://github.com/ying-fu/Real-SPAD-Dataset公开.

  • 学术论文
    田胜景, 韩一男, 赵宪通, 刘秀平, 张明
    电子学报. 2024, 52(10): 3527-3540. https://doi.org/10.12263/DZXB.20231009
    摘要 (781) PDF全文 (267) HTML (743)   可视化   收藏

    稀疏卷积在处理激光雷达点云单目标跟踪时的潜力尚未得到充分发掘.目前,绝大多数点云跟踪算法使用基于球邻域的骨干网络,其显存计算资源占用大并且目标感知的关系建模不充分.针对此问题,本文提出一种基于稀疏卷积结构的LiDAR(Lightlaser Detection And Ranging)点云跟踪算法,并创新性地融合了空间点与体素双通道的关系建模模块,以高效适应稀疏框架下目标判别信息的嵌入.首先,本文采用3D稀疏卷积残差网络来分别提取模板和搜索区域的特征,并利用反卷积来获取逐点特征来保证跟踪任务中对空间位置特性的要求.其次,关系建模模块进一步在模板与搜索区域特征之间计算相似度语义查询表.为了捕捉到模板与搜索区域间细粒度的关联性,该模块一方面在空间点通道中利用近邻算法找出每个搜索区域点的模板近邻点,并根据语义查询表提取对应特征;另一方面,在体素通道中以每个搜索区域点为中心构建局部多尺度体素,并根据落入体素单元的模板点索引计算语义查询表中值的累计和.最后,将双通道的特征融合并送入基于鸟瞰图的候选包围盒生成模块来回归目标包围盒.为了验证所提出方法的优越性,本文在KITTI和NuScenes数据集进行了测试,对比其他使用稀疏卷积的算法,本文方法平均成功率和精确率分别提升了11.0%和12.0%.本文方法在继承了稀疏卷积高效特点的同时还实现了跟踪精度的提高.

  • 学术论文
    余毅丰, 钱江波, 严迪群, 王翀, 董理
    电子学报. 2024, 52(7): 2491-2502. https://doi.org/10.12263/DZXB.20230622
    摘要 (1191) PDF全文 (512) HTML (1145)   可视化   收藏

    对长序列的动画线稿帧进行着色是计算机视觉中一项具有挑战性的任务.一方面,线稿中包含的信息较为稀疏,需要着色算法对缺失的信息进行推断;另一方面,连续帧之间的色彩需要保持一致,以确保整个视频的视觉质量.现有的着色算法多数只针对单张图片进行着色,这类算法只给出一个开放性的符合合理范围的色彩结果,无法适用于帧序列着色.另一些基于参考帧的着色算法,并没有将2帧之间的关系有机地联系起来,导致着色效果不够出色.在同一镜头序列中,同一对象的特征往往不会发生太大变化,因此,可以设计一个根据给定参考帧,即可给线稿自动着色的模型.为此,本文提出了基于CNN(Convolutional Neural Networks)和Transformer相结合的模型Cross-CNN,该模型能够从参考帧中寻找并匹配颜色,从而保证时间维度上的特征一致性.Cross-CNN模型参考帧和线稿帧在通道维度叠加,输入预训练的Resnet50网络提取局部融合特征,将融合特征图传给Transformer结构进行编码以提取全局特征.在Transformer结构中设计了交叉注意力机制更好地匹配远距离特征.最后使用带有跳层连接的卷积解码器完成着色图片输出.本文在数据集方面从8部电影中截取画面并经过严格筛选,最终制作了一个包含20 000对二元组的数据集用于实验研究.Cross-CNN的SSIM(Structural SIMilarity)达到了0.932,高于SOTA算法0.014.本文算法代码链接:https://github.com/silenye/Cross-CNN.

  • 学术论文
    李飞, 郭绍忠, 郝江伟, 侯明, 宋广辉, 许瑾晨
    电子学报. 2024, 52(5): 1633-1647. https://doi.org/10.12263/DZXB.20220375
    摘要 (903) PDF全文 (579) HTML (856)   可视化   收藏

    RISC-V指令集架构(Instruction Set Architecture,ISA)作为一种新兴的精简ISA,因免费、开源、自由等特点而得到快速发展.由于国内外对RISC-V的研究主要集中在硬件开发,软件生态相较于成熟ISA还很薄弱,实现一套RISC-V指令集高性能基础数学库可以进一步丰富RISC-V软件生态.本文基于自动化移植技术实现申威数学库到RISC-V的移植,为RISC-V指令架构提供首个使用向量指令优化的基础数学库系统.本文提出向量寄存器自动分支查表法与路径标记插入法,重点解决不同架构间寄存器映射过程中的寄存器复用问题,实现寄存器正确高效映射,并依据不同指令等价转换策略自动化移植数学函数69个.测试结果表明,RISC-V基础数学库函数可实现正确计算,最大误差为1.90ULP,函数性能平均为157.03节拍.

  • 学术论文
    乔通, 陈彧星, 谢世闯, 姚恒, 罗向阳
    电子学报. 2024, 52(3): 924-936. https://doi.org/10.12263/DZXB.20220711
    摘要 (969) PDF全文 (773) HTML (892)   可视化   收藏

    当前,生成对抗网络(Generative Adversarial Networks, GAN)合成的逼真图像难以识别,严重危害国家网络安全及社会稳定.与此同时,多数基于深度神经网络模型设计的检测器需要大规模训练样本,且存在模型可解释度不高、泛化性能差等问题.为了克服上述亟待解决的关键性难题,本文提出一种多色彩通道特征融合的GAN合成图像检测方法.首先,探索分析真实自然图像和GAN合成图像在不同色彩空间相邻像素之间的差异,并设计差异度量算法,完成色彩通道选择.其次,利用图像像素间的高度相关性,在八个方向上通过二阶马尔可夫链对相邻像素之间的差分数组进行建模,提取差分像素邻接矩阵特征.最后,利用上述特征,设计一种简单且高效的集成分类器完成GAN合成图像的检测任务.在基于StyleGAN模型合成的伪造人脸数据集中,所提出方法的检测准确率高达100.00%;在小样本训练约束条件下,正负样本对数仅仅为2时,检测准确率高达99.65%;在单类样本训练约束条件下,正样本数仅仅为50时,检测准确率高达92.84%.在基于更先进的StyleGAN2和PGGAN模型合成的伪造场景数据集中,所提出方法的检测准确率达到99.96%以上.以上大量实验表明,本文所提出的方法明显优于比较的GAN合成图像检测方法.本文方法已经开源:https://github.com/cyxcyx559/ccss.

  • 学术论文
    李帆, 张小恒, 李勇明, 王品
    电子学报. 2024, 52(3): 751-761. https://doi.org/10.12263/DZXB.20220712
    摘要 (632) PDF全文 (255) HTML (635)   可视化   收藏

    集成方法是不平衡学习方法的重要分支,然而,现有不平衡集成方法均作用于原样本而没考虑样本的结构信息,因此其效能仍然有限.样本的结构信息包括局部和全局结构信息.为了解决上述问题,本文提出了一种基于深度样本包络网络(Deep Instance Envelope Network, DIEN)和分级结构一致性机制(Hierarchical Structure Consistency Mechanism, HSCM)的不平衡集成学习算法.该算法在考虑局部流形和全局结构信息的情况下,通过多层样本聚类,生成高质量的多层包络样本,从而实现类平衡化.首先,算法基于样本近邻拼接和模糊C均值聚类算法,设计DIEN来挖掘样本的结构信息,得到深度包络样本.然后,设计局部流形结构度量和全局结构分布度量来构建HSCM用于增强层间样本的分布一致性.接着,将DIEN和HSCM结合起来,构建出优化后的深度样本包络网络——DH (DIEN with HSCM). 之后,将基分类器应用于包络样本.最后,设计bagging集成学习机制来融合基分类器的预测结果.文末组织了多组实验,采用了十多个公共数据集和有代表性的相关算法进行验证比较.实验结果表明,本文算法在AUC(Area Under Curve), F-measure等四个性能指标上显著最优.本文完整实验结果与分析参见链接:https://pan.baidu.com/s/15lZ9GztB95ySrNwEmtrCfA,提取码:1111

  • 学术论文
    陈君毅, 蒋德琛, 王智铭, 曹佳禾, 王勇
    电子学报. 2023, 51(8): 2179-2187. https://doi.org/10.12263/DZXB.20211410
    摘要 (529) PDF全文 (512) HTML (392)   可视化   收藏

    本文提出了一种基于调频连续波(Frequency Modulated Continuous Wave,FMCW)雷达回波信号的手势识别算法:首先,提出一种双维度滤波算法,在距离和速度维度对手势回波信号进行滤波,有效地降低了系统的静态噪声;其次,将数据经过动目标检测(Moving Target Indicator,MTI)算法滤除时间维度噪声;然后,提出了时间自适应定长化的方法,在减少势信息损失的前提下保证了每个手势样本帧数的一致性;最后,建立距离多普勒网络(Range Doppler Net,RD-Net)进行训练分类.该算法在谷歌开源的deep­soli数据集中取得了98.28%的准确率,比数据集提出者的算法的准确率提升了11.11%.该算法在实时推理实验中取得了90.8%的准确率,具有更好的泛化能力.本文采集的数据集开源地址为https://gitee.com/xiao_chens_classmates/Radar_Gesture_Data.git