电子学报 ›› 2017, Vol. 45 ›› Issue (10): 2416-2424.DOI: 10.3969/j.issn.0372-2112.2017.10.015

• 学术论文 • 上一篇    下一篇

云环境下面向跨域作业的调度方法

李焱1, 郑亚松1, 李婧2, 朱春鸽1, 刘欣然1   

  1. 1. 国家计算机网络应急技术处理协调中心, 北京 100029;
    2. 中国盲文出版社, 北京 100050
  • 收稿日期:2016-04-28 修回日期:2016-10-17 出版日期:2017-10-25
    • 作者简介:
    • 李焱,男,1984年2月生,湖北随州人.2016年在中国科学院计算技术研究所获工学博士学位.主要研究方向为分布式计算、云计算等.E-mail:liyan@ncic.ac.cn;郑亚松,男,1987年9月生,河南濮阳人.2014年在中国科学院计算技术研究所获工学博士学位.现在国家互联网应急中心工作,主要研究方向为大数据分析.E-mail:zys_2009@163.com
    • 基金资助:
    • 国家自然科学基金 (No.61402464,No.61602467)

A Scheduling Strategy for Jobs Across Geo-Distributed Datacenters in Cloud Computing

LI Yan1, ZHENG Ya-song1, LI Jing2, ZHU Chun-ge1, LIU Xin-ran1   

  1. 1. National Computer Network Emergency Response Technical Coordination Center, Beijing 100029, China;
    2. China Braille Press, Beijing 100050, China
  • Received:2016-04-28 Revised:2016-10-17 Online:2017-10-25 Published:2017-10-25

摘要: 云环境下,因数据局部性或是任务对资源的特殊偏好,一个作业所包含的任务往往需要在不同的数据中心局点上运行,此类作业称为跨域作业.跨域作业的完成时间取决于最慢任务的执行效率,即存在木桶效应.针对各域资源能力异构条件下不合理的调度策略导致跨域作业执行时间跨度过长的问题,本文提出一种面向跨域作业的启发式调度方法MIN-Max-Min,优先选择期望完成时间最短的作业执行.通过实验表明,与先来先服务的策略相比,该方法能将跨域作业平均执行时间跨度减少40%以上.

关键词: 云计算, 跨域数据中心, 跨域作业

Abstract: In cloud computing,tasks in a job often need to run on different datacenters due to the input data locality or special preference for resources,that is,the job runs across geo-distributed sites.The different tasks in a job have to be scheduled in different domain (data center) to execute for their personalization requirements,so the job completion time depends on the slowest task,which is called "barrel effect".As geo-distributed scheduling strategy without regard to heterogeneous resources leads too long execution time span,this dissertation proposes an optimization strategy for geo-distributed scheduling named MIN-Max-Min.The strategy gives priority to select the expectation shortest completion job to execute by heuristic rule.Experiments show that compared with first come first service strategy,the strategy can reduce cross domain average execution time span to less than 40% under the simulation load.

Key words: cloud computing, geo-distributed data centers, jobs across geo-distributed data centers

中图分类号: