您当前的位置:
首页 >
文章列表页 >
基于vGPU性能干扰感知的大模型推理负载资源高效配置方法
大模型与互联网 | 更新时间:2026-02-10
    • 基于vGPU性能干扰感知的大模型推理负载资源高效配置方法

    • Resource-Efficient Configuration Method for Large Model Inference Loads Based on vGPU Performance Interference Awareness

    • 电子学报   2025年53卷第11期 页码:3836-3851
    • DOI:10.12263/DZXB.20250468    

      中图分类号: TP391;
    • 收稿:2025-06-01

      录用:2025-11-14

      纸质出版:2025-11-25

    移动端阅览

  • 张虎, 孙明辉, 刘杨, 等. 基于vGPU性能干扰感知的大模型推理负载资源高效配置方法[J]. 电子学报, 2025, 53(11): 3836-3851. DOI:10.12263/DZXB.20250468

    ZHANG Hu, SUN Ming-hui, LIU Yang, et al. Resource-Efficient Configuration Method for Large Model Inference Loads Based on vGPU Performance Interference Awareness[J]. Acta Electronica Sinica, 2025, 53(11): 3836-3851. DOI:10.12263/DZXB.20250468

  •  
  •  
icon
试读结束,您可以激活您的VIP账号继续阅读。
去激活 >
icon
试读结束,您可以通过登录账户,到个人中心,购买VIP会员阅读全文。
已是VIP会员?
去登录 >

0

浏览量

14

下载量

0

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

从博弈论视角解构去噪扩散概率模型的视觉概念生成机制
基于有向超图的工作流资源分配均衡优化方法
低温光致发光微计算机测试系统
Xe1v离子激光感生荧光用于医用X射线ZnCdS:Ag荧光屏的性能研究
YGG:Cr晶体的光谱特性

相关作者

徐勇军
黄礼泊
赵二虎
侯娜
林晗
葛亚维
耿浩棒
刘超一

相关机构

中国科学院计算技术研究所
军事科学院
中国人民解放军32801部队
哈尔滨工业大学计算机学院
0