工作流笔记(八)

工作流系统中尚未解决的问题

Posted by Nino Lau on July 5, 2019

据说WFMS的期末考试可能会考一个开放题,大概思路就是让描述一下工作流系统中尚未解决的问题。于是我在这里简要概括一下前一段时间我们小组做的云工作流的调度课题中,尚存的发展空间。

Unresolved

云工作流系统中,大部分QoS-awared的调度方案都关注于SaaS服务模式中的完工期(makespan)和成本(cost)指标,为了提升PaaS和IaaS云服务的质量,云工作流系统中容错性(fault tolerance)、负载均衡(load balance)和安全性(security)等各种指标也应该纳入考虑。

Background

云计算有高灵活性、可扩展性和高性价比的优势,所以将云计算技术应用到工作流系统中是一种良好的方案。云工作流中,调度问题(将任务分配给资源)是一个常见问题,因为这关乎系统资源能够有效利用,对大型工作流系统(科学工作流系统)很重要。现阶段对这个问题的研究主要分为三个方法:启发式(max-min、min-min等)、元启发式(GA和一些群智算法等)和混合类。

Cause

云工作流有很多独特的性质,这决定了传统的调度方案如FIFO、轮询调度等无法照搬到这个系统。不同的服务类型中各种角色关注点也不一样,因此是无法提出一种通用的适用于所有问题的框架的(多数论文没有描述清楚问题适用的场景)。而目前的大部分工作都只集中于SaaS,因此只关注完工期(makespan)和成本(cost)。显然这些算法无法直接迁移到其他服务类型中去,因为中间商或者服务商还需要考虑云工作流的容错性、负载均衡和安全性等QoS指标(以上问题近两年来都只能搜到不超过5篇SCI期刊)。

Idea

  • 首先,论文应该有明确场景和清晰的定位——应用在哪种服务类型、从谁的利益出发、需要考虑哪些指标,这样论文才有实际应用的可能)。
  • 另外,针对于IaaS的服务场景:可以思考工作流系统中的隐患和攻击方式,并通过机器学习等方法对云服务提供商制定一套预测策略,来增强安全性;在预测之后提供思考相应的补救方案来提升容错率;另外,也应该将负载均衡和绿色计算等时下概念想结合。