Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer

Actualmente la tendencia para obtener una gran cantidad de cómputo, es mediante la computación paralela, un claro ejemplo radica en el hecho que los computadores más rápidos del mundo son clústeres, formados por aceleradores y procesadores. Los clústeres HPC ofrecen una capacidad computacional para...

Full description

Bibliographic Details
Main Author: Guamán Rivera, Brayme Lino
Other Authors: Solano Quinde, Lizandro Damián
Format: bachelorThesis
Language:spa
Published: 2017
Subjects:
Online Access:http://dspace.ucuenca.edu.ec/handle/123456789/28554
_version_ 1785802351635857408
author Guamán Rivera, Brayme Lino
author2 Solano Quinde, Lizandro Damián
author_facet Solano Quinde, Lizandro Damián
Guamán Rivera, Brayme Lino
author_sort Guamán Rivera, Brayme Lino
collection DSpace
description Actualmente la tendencia para obtener una gran cantidad de cómputo, es mediante la computación paralela, un claro ejemplo radica en el hecho que los computadores más rápidos del mundo son clústeres, formados por aceleradores y procesadores. Los clústeres HPC ofrecen una capacidad computacional para solventar requerimientos de alto costo computacional en áreas como: predicción climática y aprendizaje automático. Sin embargo para tener un rendimiento óptimo en aplicaciones que hacen uso del paralelismo, es necesario analizar requerimientos como: carga de comunicaciones, plataformas de paralelización, entre otras. El objetivo de este estudio es analizar la escalabilidad del modelo de predicción climática WRF en clústeres HPC en base a las comunicaciones y procesos MPI; y el rendimiento del algoritmo Horizontal Diffusion en aceleradores XeonPhi y TeslaKepler, usando OpenCL y CUDA. Los resultados muestran una dependencia de la escalabilidad del WRF con las comunicaciones, debido a que, se obtuvo una aceleración máxima para InfiniBand FDR de 25.9, QDR 21.42 y Ethernet 6.4 veces más con respecto a una ejecución secuencial. El acelerador TeslaK40m muestra un rendimiento 6 veces mayor que XeonPhi, debido a que el algoritmo no utiliza la vectorización eficientemente. OpenCL tiene una curva de aprendizaje mayor que CUDA debido a sus propiedades multiplataforma, en cuanto a rendimiento CUDA es un 6% mejor, debido a que está orientado a GPUs NVIDIA, y posee configuraciones que mejoran el desempeño, por otro lado OpenCL no es afectado en gran medida por ser multiplataforma, y es una opción cuando los requerimientos, están orientados hacia la portabilidad.
format bachelorThesis
id oai:dspace.ucuenca.edu.ec:123456789-28554
institution Universidad de Cuenca
language spa
publishDate 2017
record_format dspace
spelling oai:dspace.ucuenca.edu.ec:123456789-285542020-08-03T17:05:09Z Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer Guamán Rivera, Brayme Lino Solano Quinde, Lizandro Damián Hpc Cuda Opencl Escalabilidad Cluster Informatica Actualmente la tendencia para obtener una gran cantidad de cómputo, es mediante la computación paralela, un claro ejemplo radica en el hecho que los computadores más rápidos del mundo son clústeres, formados por aceleradores y procesadores. Los clústeres HPC ofrecen una capacidad computacional para solventar requerimientos de alto costo computacional en áreas como: predicción climática y aprendizaje automático. Sin embargo para tener un rendimiento óptimo en aplicaciones que hacen uso del paralelismo, es necesario analizar requerimientos como: carga de comunicaciones, plataformas de paralelización, entre otras. El objetivo de este estudio es analizar la escalabilidad del modelo de predicción climática WRF en clústeres HPC en base a las comunicaciones y procesos MPI; y el rendimiento del algoritmo Horizontal Diffusion en aceleradores XeonPhi y TeslaKepler, usando OpenCL y CUDA. Los resultados muestran una dependencia de la escalabilidad del WRF con las comunicaciones, debido a que, se obtuvo una aceleración máxima para InfiniBand FDR de 25.9, QDR 21.42 y Ethernet 6.4 veces más con respecto a una ejecución secuencial. El acelerador TeslaK40m muestra un rendimiento 6 veces mayor que XeonPhi, debido a que el algoritmo no utiliza la vectorización eficientemente. OpenCL tiene una curva de aprendizaje mayor que CUDA debido a sus propiedades multiplataforma, en cuanto a rendimiento CUDA es un 6% mejor, debido a que está orientado a GPUs NVIDIA, y posee configuraciones que mejoran el desempeño, por otro lado OpenCL no es afectado en gran medida por ser multiplataforma, y es una opción cuando los requerimientos, están orientados hacia la portabilidad. Currently the tendency to obtain a large amount of computing, is through parallel computing, a clear example lies in the fact that the fastest computers in the world are clusters for high performance computing, formed by accelerators and multiprocessors. HPC clusters offer an important computational capacity to solve high computational cost requirements, in areas such as: weather prediction, machine learning. However, to achieve optimal performance is necessary to analyze their requirements, such as: communications, parallelization platforms. The objective of this study is to analyze the scalability of the climate prediction model WRF in HPC clusters based on inter-node communication and MPI processes; and the performance of the Horizontal Diffusion algorithm on XeonPhi and TeslaKepler accelerators, using OpenCL and CUDA. The results show a dependence of the scalability of the WRF with communications, since; a maximum acceleration was obtained for InfiniBand FDR of 25.9, QDR 21.42 and Ethernet 6.4 times more than sequential execution. The accelerator Tesla K40m shows a performance 6 times greater than XeonPhi, since the algorithm does not efficiently use vectorization Intel property, in addition Intel OpenCL drivers for its architecture manycore, they are deprecated. OpenCL has a higher learning curve than CUDA due to its multiplatform properties, in terms of performance CUDA shows a 6% improvement since it is oriented to NVIDIA GPUs, and has configurations that improve the performance, on the other hand OpenCL is not very affected by its multiplatform property, and is an option to consider if the requirements are oriented towards portability. Ingeniero en Sistemas Cuenca 2017-11-23T13:07:43Z 2017-11-23T13:07:43Z 2017 bachelorThesis http://dspace.ucuenca.edu.ec/handle/123456789/28554 spa TS;248 application/pdf application/pdf
spellingShingle Hpc
Cuda
Opencl
Escalabilidad
Cluster
Informatica
Guamán Rivera, Brayme Lino
Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_full Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_fullStr Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_full_unstemmed Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_short Análisis de rendimiento de un clúster HPC y, arquitecturas manycore y multicorer
title_sort análisis de rendimiento de un clúster hpc y, arquitecturas manycore y multicorer
topic Hpc
Cuda
Opencl
Escalabilidad
Cluster
Informatica
url http://dspace.ucuenca.edu.ec/handle/123456789/28554
work_keys_str_mv AT guamanriverabraymelino analisisderendimientodeunclusterhpcyarquitecturasmanycoreymulticorer