HCLOUD: RESOURCE-EFFICIENT PROVISIONING IN SHARED …kozyraki/publications/2016.h... · 2016. 4....

Christina Delimitrou1 and Christos Kozyrakis2

1Stanford/Cornell University, 2Stanford University/EPFLhttp://mast.stanford.edu

ASPLOS– April5th 2016

HCLOUD: RESOURCE-EFFICIENT PROVISIONING IN SHARED CLOUD SYSTEMS

¨ Problem: cloud provisioning is difficult

¤ Many resource offerings à resource/cost inefficiencies

¤ Interference from other users à performance jitter

¨ HCloud: resource-efficient public cloud provisioning

¤ User provides resource reservations performance goals

¤ Automatic selection of instance type and configuration

¤ Adjust allocations between reserved and on-demand

¤ High utilization and low performance jitter

Executive Summary

Motivation

t2.nanot2.micro t2.small t2.medium t2.largem4.large m4.xlarge m4.2xlargem4.4xlargem4.10xlargem3.medium m3.large m3.xlarge m3.2xlargec4.largec4.xlarge c4.2xlargec4.4xlarge

n1-standard-1n1-standard-2n1-standard-4n1-standard-8n1-standard-16n1-standard-32n1-highmem-2n1-highmem-4n1-highmem-8n1-highmem-16n1-highmem-32n1-highcpu-2n1-highcpu-4n1-highcpu-8n1-highcpu-16n1-highcpu-32f1-microg1-small

A0A1A2A3A4A5A6A7A8A9A10A11D1D2D3D4D11D12

t2.nanot2.micro t2.small t2.medium t2.largem4.large m4.xlarge m4.2xlargem4.4xlargem4.10xlargem3.medium m3.large m3.xlarge m3.2xlargec4.largec4.xlarge c4.2xlarge

A0A1A2A3A4A5A6A7A8A9A10A11D1D2D3D4D11

t2.nanot2.micro t2.small t2.medium t2.largem4.large m4.xlarge m4.2xlargem4.4xlargem4.10xlargem3.medium m3.large m3.xlarge m3.2xlargec4.largec4.xlarge c4.2xlargec4.4xlargec4.8xlargec3.large c3.xlarge c3.2xlarge c3.4xlarge c3.8xlarger3.large r3.xlarge

A0A1A2A3A4A5A6A7A8A9A10A11D1D2D3D4D11D12D13D14D1 v2D2 v2D3 v2D4 v2D5 v2D11 v2

Cost, predictability, availability, flexibility, spin-up overheads,

retention time, load fluctuation, external load, sensitivity to interference, …

Cloud Provisioning Goals

✗ Determine appropriate instance size/type

✗ Determine appropriate instance configuration

✗ Dynamically adjust allocation decisions at runtime

Cloud Provisioning Scenarios

¨ Batch analytics, latency-critical applications, and scientific workloads in all scenarios¤ Batch: 50%¤ Latency: 40%¤ Scientific: 10%

Provisioning Baselines¨ All reserved (SR):

¤ 16vCPU instances on GCE, no external load¤ Predictable performance, high cost, low flexibility¤ Applications provisioned for peak requirements

¨ All on-demand: ¤ Largest instances (OdF): only 16vCPU instances¤ Mixed instances (OdM): mix of large and smaller instances¤ Interference, low cost, high flexibility

¨ Resource management: ¤ Least-loaded scheduler

Extracting Resource Preferences

¨ Exhaustive characterization is infeasible

Heterogeneity

Interference

Resources per server

Resource ratio

10 servers40 apps

100 servers300 apps

1000 servers1200 apps

Combinations

1,000,000

1,000,000,000

Systems

Number of servers

Application params

Quasar Overview [ASPLOS’14]

Profiling

Cluster

QoS Scheduler

UserApp

Resourcepreferences

Data mining

Cluster

Scheduler

Greedy scheduler

Profiling

User Resourcepreferences

Data mining Resource selection

Cluster

Scheduler

Greedy scheduler

Profiling

User Resourcepreferences

Data mining Resource selection

Profiling[5-30sec]

Data mining[20msec]

Resource selection[50msec-2sec]

Cluster

Scheduler

Greedy schedulerUser

Resourcepreferences

Evaluation

✔ Determine appropriate instance size/type

✗ Determine appropriate instance configuration

Hybrid Cloud Resource Allocation

¨ Insight: ¤ Combine reserved and on-demand resources

¨ Challenge: ¤ Separate applications between reserved (~private) and

on-demand (public) resources

Hybrid Allocation Policies

P1 P2 P3 P4 P5 P6 P7 P8556065707580859095

) On-Demand Resources

P1 P2 P3 P4 P5 P6 P7 P875

) Reserved Resources

✗ Account for application interference sensitivity

P1 P2 P3 P4 P5 P6 P7 P875

P1 P2 P3 P4 P5 P6 P7 P8556065707580859095

P1 P2 P3 P4 P5 P6 P7 P875

✗ Do not overload reserved resources

✓ Account for application interference sensitivity

P1 P2 P3 P4 P5 P6 P7 P875

P1 P2 P3 P4 P5 P6 P7 P8556065707580859095

P1 P2 P3 P4 P5 P6 P7 P875

✗ Dynamic decisions (e.g., utilization limits)

✓ Do not overload reserved resources

HCloud

¨ Insights: ¤ Account for interference sensitivity¤ Set load limits dynamically

Reserved On-demand

AppApp

HCloud

Reserved On-demand

AppApp

HCloud

Reserved On-demand

AppApp

HCloud

Reserved On-demand

AppApp

¨ Insights: ¤ Account for interference sensitivity¤ Set load limits dynamically (feedback loop on queue length)

HCloud

Reserved On-demand

AppApp

¨ Insights: ¤ Account for interference sensitivity¤ Set load limits dynamically (feedback loop on queue length)

¨ What signals a sensitive job?

HCloud

¨ What signals a sensitive job?

Reserved On-demand

AppApp

P1 P2 P3 P4 P5 P6 P7 P875

P1 P2 P3 P4 P5 P6 P7 P8556065707580859095

P1 P2 P3 P4 P5 P6 P7 P875

✓ Do not overload reserved resources

✓ Dynamic decisions (e.g., utilization limits)

Evaluation

✔ Determine appropriate instance size/type

✔ Determine appropriate instance configuration

Adjusting Allocations at Runtime

¨ Runtime: monitor app performance¤ Remove co-scheduled apps¤ Move to larger instance within cluster¤ Move to reserved cluster

Reserved On-demand

Conclusions

¨ HCloud: hybrid cloud provisioning (reserved & on-demand)¤ Account for interference sensitivity¤ Account for performance-cost tradeoffs¤ Adjust to load fluctuations¤ 2.1x better performance than on-demand, 50% lower cost than

reserved

¨ See paper for: ¤ Performance unpredictability analysis on EC2 and GCE¤ Sensitivity studies on system & app parameters

n Spin-up overheads, cost, retention time, load, app characteristics, external load, …

¤ Further workload scenarios

¨ HCloud: hybrid cloud provisioning (reserved & on-demand)¤ Account for interference sensitivity¤ Account for performance-cost tradeoffs¤ Adjust to load fluctuations¤ 2.1x better performance than on-demand, 50% lower cost than

reserved

¨ See paper for: ¤ Performance unpredictability analysis on EC2 and GCE¤ Sensitivity studies on system & app parameters

n Spin-up overheads, cost, retention time, load, app characteristics, external load, …

¤ Further workload scenarios

Questions??

Thank you

Questions??

Resource Efficiency

HCLOUD: RESOURCE-EFFICIENT PROVISIONING IN SHARED …kozyraki/publications/2016.h... · 2016. 4....

Documents

Transcript of HCLOUD: RESOURCE-EFFICIENT PROVISIONING IN SHARED …kozyraki/publications/2016.h... · 2016. 4....

DRP: Dynamic Resource Provisioning - IIT-Computer …iraicu/research/reports/2006_DRP_overview_v2.pdf · DRP: Dynamic Resource Provisioning October 30th, 2006 Page 1 of 9 DRP: Dynamic

Optimization of Resource Provisioning Cost in Cloud Computing

Reducing the price of resource provisioning using EC2 spot ...zaguan.unizar.es/record/87681/files/texto_completo.pdf · Reducing the Price of Resource Provisioning using EC2 Spot

An On Demand Resource Provisioning ... - archive.sap.com

Resource Provisioning in Spot Market-based Cloud Computing ... · Resource Provisioning in Spot Market-based Cloud Computing Environments WilliamVoorsluys Submittedintotalfulﬁlment

Optimizing Resource Provisioning in Shared Cloud …delimitrou/papers/2014.techreport.hybrid.pdfOptimizing Resource Provisioning in Shared Cloud Systems Abstract Cloud computing promises

MINERVA: An Automated Resource Provisioning Tool for Large-Scale Storage …buu1/teaching/fall05/papers/minerva.pdf · 2005-09-20 · MINERVA: An Automated Resource Provisioning Tool

Resource Provisioning and Scheduling Algorithms …Resource Provisioning and Scheduling Algorithms for Scientiﬁc Workﬂows in Cloud Computing Environments Maria Alejandra Rodriguez

PROVISIONING OF HUMAN RESOURCE OUTSOURCED SERVICES/ … · 2020. 10. 23. · PROVISIONING OF HUMAN RESOURCE OUTSOURCED SERVICES/ STAFF FOR PSEB OFFICES 5 Job Description: • Build

Model-Based Resource Provisioning in a Web Service Utility

Resource Provisioning in Clouds via Non-Functional Requirements

Autonomous Resource Provisioning for Multi-Service Web Applications

Enhancing Rules For Cloud Resource Provisioning Via ... Rules For Cloud Resource Provisioning Via Learned Software Performance Models Mark Grechanik University of Illinois at Chicago

Adaptive Resource Provisioning for Virtualized Servers ...Adaptive Resource Provisioning for Virtualized Servers Using Kalman Filters ... of the data center. A physical server is transformed

Model-Based Resource Provisioning in a Web Service Utility ¡ ¢ £ ¥ ¦ §

Meta-heuristic Based Cloud Resource Provisioning Approach · Meta-heuristic Based Cloud Resource Provisioning Approach. Agenda for Today •Introduction ... –Algorithms that help

Cloud Computing for on-Demand Resource Provisioning

Automated, Elastic Resource Provisioning for NoSQL clusters Using TIRAMOLA

Aneka Platform and QoS-Driven Resource Provisioning for Elastic ...

Resource Provisioning Framework for MapReduce Jobs with ... · Resource Provisioning Framework for MapReduce Jobs with Performance Goals Abhishek Verma, Ludmila Cherkasova, Roy H.