电子学报 ›› 2018, Vol. 46 ›› Issue (7): 1617-1624.DOI: 10.3969/j.issn.0372-2112.2018.07.011

• 学术论文 • 上一篇    下一篇

基于深度增强学习的数据中心网络coflow调度机制

马腾, 胡宇翔, 张校辉   

  1. 国家数字交换系统工程技术研究中心, 河南郑州 450002
  • 收稿日期:2017-03-17 修回日期:2017-06-13 出版日期:2018-07-25 发布日期:2018-07-25
  • 通讯作者: 马腾
  • 作者简介:胡宇翔,男,1982年生,河南周口人,国家数字交换系统工程技术研究中心副研究员,主要研究方向为网络体系结构;张校辉,男,1979年生,河南洛阳人,国家数字交换系统工程技术研究中心讲师,主要研究方向为网络体系结构、网络安全.
  • 基金资助:
    国家973重点基础研究发展计划(No.2013CB329104);国家863高技术研究发展计划(No.2013AA013505)

Deep Reinforcement Learning Based Coflow Scheduling in Data Center Networks

MA Teng, HU Yu-xiang, ZHANG Xiao-hui   

  1. National Digital Switching System Engineering & Technology Research Center, Zhengzhou, Henan 450002, China
  • Received:2017-03-17 Revised:2017-06-13 Online:2018-07-25 Published:2018-07-25

摘要: 最小化语义相关流的平均完成时间是数据中心网络流量管理面临的难题之一.受人工智能领域深度增强学习方向的最新研究进展启发,本文提出一种的新的语义相关流调度机制.将带宽约束的语义相关流调度问题转化为连续的学习过程,通过学习以往策略实现最佳调度.引入反向填充和有限复用机制,保证系统的工作保持性和无饥饿性.仿真结果表明,在不同的网络负载下,本文提出的调度机制均使得语义相关流的平均完成时间小于其他调度机制,尤其是网络负载较大时,相比最先进的调度机制,性能提升约50%.

关键词: 数据中心网络, 语义相关流, 流调度

Abstract: Coflow completion time minimization is one of the challenges of traffic management in data center networks.Inspired by the newest research progress in deep reinforcement learning,which is one direction of artificial intelligence,this paper proposes a novel coflow scheduling mechanism.It translates the coflow scheduling problem with bandwidth constraint into a continuous learning process.By learning the previous decisions,the best scheduling is obtained.By introducing back filling and limited multiplexing mechanisms,the system is work-conserving and starvation-free.Simulation results show that,under different network load,compared with other scheduling mechanisms,the average coflow completion time is reduced.Especially when the network load is heavy,the proposed mechanism achieves about 50% performance improvement than the state-of-the-art scheduling mechanism.

Key words: data center network, coflow, flow scheduling

中图分类号: