Differential approximation and sprinting for multi-priority big data engines

Birke R.; Rocha I.; Pérez, Juan F.; Schiavoni V.; Felber P.; Chen L.Y.

doi:https://doi.org/10.1145/3361525.3361547

Ítem

Solo Metadatos

Differential approximation and sprinting for multi-priority big data engines

Mostrar el registro sencillo de la publicación

dc.creator	Birke R.	spa
dc.creator	Rocha I.	spa
dc.creator	Pérez, Juan F.	spa
dc.creator	Schiavoni V.	spa
dc.creator	Felber P.	spa
dc.creator	Chen L.Y.	spa
dc.date.accessioned	2020-05-25T23:57:04Z
dc.date.available	2020-05-25T23:57:04Z
dc.date.created	2019	spa
dc.description.abstract	Today’s big data clusters based on the MapReduce paradigm are capable of executing analysis jobs with multiple priorities, providing differential latency guarantees. Traces from production systems show that the latency advantage of high-priority jobs comes at the cost of severe latency degradation of low-priority jobs as well as daunting resource waste caused by repetitive eviction and re-execution of low-priority jobs. We advocate a new resource management design that exploits the idea of differential approximation and sprinting. The unique combination of approximation and sprinting avoids the eviction of low-priority jobs and its consequent latency degradation and resource waste. To this end, we designed, implemented and evaluated DiAS, an extension of the Spark processing engine to support deflate jobs by dropping tasks and to sprint jobs. Our experiments on scenarios with two and three priority classes indicate that DiAS achieves up to 90% and 60% latency reduction for low- and high-priority jobs, respectively. DiAS not only eliminates resource waste but also (surprisingly) lowers energy consumption up to 30% at only a marginal accuracy loss for low-priority jobs. © 2019 Association for Computing Machinery.	eng
dc.format.mimetype	application/pdf
dc.identifier.doi	https://doi.org/10.1145/3361525.3361547
dc.identifier.uri	https://repository.urosario.edu.co/handle/10336/22595
dc.language.iso	eng	spa
dc.publisher	Association for Computing Machinery, Inc	spa
dc.relation.citationEndPage	214
dc.relation.citationStartPage	202
dc.relation.citationTitle	Middleware 2019 - Proceedings of the 2019 20th International Middleware Conference
dc.relation.ispartof	Middleware 2019 - Proceedings of the 2019 20th International Middleware Conference,(2019); pp. 202-214	spa
dc.relation.uri	https://www.scopus.com/inward/record.uri?eid=2-s2.0-85078012099&doi=10.1145%2f3361525.3361547&partnerID=40&md5=8daf0251625a159a239e3b82ad74d3a6	spa
dc.rights.accesRights	info:eu-repo/semantics/openAccess
dc.rights.acceso	Abierto (Texto Completo)	spa
dc.source.instname	instname:Universidad del Rosario	spa
dc.source.reponame	reponame:Repositorio Institucional EdocUR	spa
dc.subject.keyword	Electric sparks	spa
dc.subject.keyword	Energy conservation	spa
dc.subject.keyword	Energy utilization	spa
dc.subject.keyword	Engines	spa
dc.subject.keyword	Middleware	spa
dc.subject.keyword	Differential approximations	spa
dc.subject.keyword	Latency reduction	spa
dc.subject.keyword	Priorities	spa
dc.subject.keyword	Production system	spa
dc.subject.keyword	Resource management	spa
dc.subject.keyword	Resource wastes	spa
dc.subject.keyword	Spark processing	spa
dc.subject.keyword	Sprinting	spa
dc.subject.keyword	Big data	spa
dc.subject.keyword	Differential approximation	spa
dc.subject.keyword	Energy savings	spa
dc.subject.keyword	Priorities	spa
dc.subject.keyword	Spark	spa
dc.subject.keyword	Sprinting	spa
dc.title	Differential approximation and sprinting for multi-priority big data engines	spa
dc.type	conferenceObject	eng
dc.type.hasVersion	info:eu-repo/semantics/publishedVersion
dc.type.spa	Documento de conferencia	spa

Colecciones

Artículos

Differential approximation and sprinting for multi-priority big data engines

Archivos

Colecciones

Políticas

Portales

Gestionado por

Enlaces directos

Nuestros programas

Servicios académicos

Protección de datos

Comprometidos
con la calidad