Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer

Actualmente la tendencia para obtener una gran cantidad de cómputo, es mediante la computación paralela, un claro ejemplo radica en el hecho que los computadores más rápidos del mundo son clústeres, formados por aceleradores y procesadores. Los clústeres HPC ofrecen una capacidad computacional para...

Full description

Bibliographic Details
Main Author:	Guamán Rivera, Brayme Lino
Other Authors:	Solano Quinde, Lizandro Damián
Format:	bachelorThesis
Language:	spa
Published:	2017
Subjects:	Hpc Cuda Opencl Escalabilidad Cluster Informatica
Online Access:	http://dspace.ucuenca.edu.ec/handle/123456789/28554

_version_	1785802351635857408
author	Guamán Rivera, Brayme Lino
author2	Solano Quinde, Lizandro Damián
author_facet	Solano Quinde, Lizandro Damián Guamán Rivera, Brayme Lino
author_sort	Guamán Rivera, Brayme Lino
collection	DSpace
description	Actualmente la tendencia para obtener una gran cantidad de cómputo, es mediante la computación paralela, un claro ejemplo radica en el hecho que los computadores más rápidos del mundo son clústeres, formados por aceleradores y procesadores. Los clústeres HPC ofrecen una capacidad computacional para solventar requerimientos de alto costo computacional en áreas como: predicción climática y aprendizaje automático. Sin embargo para tener un rendimiento óptimo en aplicaciones que hacen uso del paralelismo, es necesario analizar requerimientos como: carga de comunicaciones, plataformas de paralelización, entre otras. El objetivo de este estudio es analizar la escalabilidad del modelo de predicción climática WRF en clústeres HPC en base a las comunicaciones y procesos MPI; y el rendimiento del algoritmo Horizontal Diffusion en aceleradores XeonPhi y TeslaKepler, usando OpenCL y CUDA. Los resultados muestran una dependencia de la escalabilidad del WRF con las comunicaciones, debido a que, se obtuvo una aceleración máxima para InfiniBand FDR de 25.9, QDR 21.42 y Ethernet 6.4 veces más con respecto a una ejecución secuencial. El acelerador TeslaK40m muestra un rendimiento 6 veces mayor que XeonPhi, debido a que el algoritmo no utiliza la vectorización eficientemente. OpenCL tiene una curva de aprendizaje mayor que CUDA debido a sus propiedades multiplataforma, en cuanto a rendimiento CUDA es un 6% mejor, debido a que está orientado a GPUs NVIDIA, y posee configuraciones que mejoran el desempeño, por otro lado OpenCL no es afectado en gran medida por ser multiplataforma, y es una opción cuando los requerimientos, están orientados hacia la portabilidad.
format	bachelorThesis
id	oai:dspace.ucuenca.edu.ec:123456789-28554
institution	Universidad de Cuenca
language	spa
publishDate	2017
record_format	dspace
spelling	oai:dspace.ucuenca.edu.ec:123456789-285542020-08-03T17:05:09Z Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer Guamán Rivera, Brayme Lino Solano Quinde, Lizandro Damián Hpc Cuda Opencl Escalabilidad Cluster Informatica Actualmente la tendencia para obtener una gran cantidad de cómputo, es mediante la computación paralela, un claro ejemplo radica en el hecho que los computadores más rápidos del mundo son clústeres, formados por aceleradores y procesadores. Los clústeres HPC ofrecen una capacidad computacional para solventar requerimientos de alto costo computacional en áreas como: predicción climática y aprendizaje automático. Sin embargo para tener un rendimiento óptimo en aplicaciones que hacen uso del paralelismo, es necesario analizar requerimientos como: carga de comunicaciones, plataformas de paralelización, entre otras. El objetivo de este estudio es analizar la escalabilidad del modelo de predicción climática WRF en clústeres HPC en base a las comunicaciones y procesos MPI; y el rendimiento del algoritmo Horizontal Diffusion en aceleradores XeonPhi y TeslaKepler, usando OpenCL y CUDA. Los resultados muestran una dependencia de la escalabilidad del WRF con las comunicaciones, debido a que, se obtuvo una aceleración máxima para InfiniBand FDR de 25.9, QDR 21.42 y Ethernet 6.4 veces más con respecto a una ejecución secuencial. El acelerador TeslaK40m muestra un rendimiento 6 veces mayor que XeonPhi, debido a que el algoritmo no utiliza la vectorización eficientemente. OpenCL tiene una curva de aprendizaje mayor que CUDA debido a sus propiedades multiplataforma, en cuanto a rendimiento CUDA es un 6% mejor, debido a que está orientado a GPUs NVIDIA, y posee configuraciones que mejoran el desempeño, por otro lado OpenCL no es afectado en gran medida por ser multiplataforma, y es una opción cuando los requerimientos, están orientados hacia la portabilidad. Currently the tendency to obtain a large amount of computing, is through parallel computing, a clear example lies in the fact that the fastest computers in the world are clusters for high performance computing, formed by accelerators and multiprocessors. HPC clusters offer an important computational capacity to solve high computational cost requirements, in areas such as: weather prediction, machine learning. However, to achieve optimal performance is necessary to analyze their requirements, such as: communications, parallelization platforms. The objective of this study is to analyze the scalability of the climate prediction model WRF in HPC clusters based on inter-node communication and MPI processes; and the performance of the Horizontal Diffusion algorithm on XeonPhi and TeslaKepler accelerators, using OpenCL and CUDA. The results show a dependence of the scalability of the WRF with communications, since; a maximum acceleration was obtained for InfiniBand FDR of 25.9, QDR 21.42 and Ethernet 6.4 times more than sequential execution. The accelerator Tesla K40m shows a performance 6 times greater than XeonPhi, since the algorithm does not efficiently use vectorization Intel property, in addition Intel OpenCL drivers for its architecture manycore, they are deprecated. OpenCL has a higher learning curve than CUDA due to its multiplatform properties, in terms of performance CUDA shows a 6% improvement since it is oriented to NVIDIA GPUs, and has configurations that improve the performance, on the other hand OpenCL is not very affected by its multiplatform property, and is an option to consider if the requirements are oriented towards portability. Ingeniero en Sistemas Cuenca 2017-11-23T13:07:43Z 2017-11-23T13:07:43Z 2017 bachelorThesis http://dspace.ucuenca.edu.ec/handle/123456789/28554 spa TS;248 application/pdf application/pdf
spellingShingle	Hpc Cuda Opencl Escalabilidad Cluster Informatica Guamán Rivera, Brayme Lino Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title	Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_full	Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_fullStr	Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_full_unstemmed	Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_short	Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_sort	análisis de rendimiento de un clúster hpc y, arquitecturas manycore y multicorer
topic	Hpc Cuda Opencl Escalabilidad Cluster Informatica
url	http://dspace.ucuenca.edu.ec/handle/123456789/28554
work_keys_str_mv	AT guamanriverabraymelino analisisderendimientodeunclusterhpcyarquitecturasmanycoreymulticorer

Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer

Similar Items