Computación en Clúster y en Grid
La computación en clúster agrupa máquinas en red en un único sistema de alto rendimiento, mientras que la computación en grid federa recursos entre organizaciones en una infraestructura virtual compartida.
Definition
Un clúster es una colección de computadoras interconectadas gestionadas como un único recurso para la computación paralela o de alto rendimiento; una grid extiende esto a una federación de recursos distribuidos y administrados de forma autónoma, compartidos entre una organización virtual a través de protocolos comunes.
Scope
Este tema abarca la arquitectura y la gestión de clústeres de computación —interconexiones, planificadores de lotes y gestores de recursos— y el paradigma de la computación en grid que federa recursos heterogéneos y geográficamente distribuidos a través de dominios administrativos en organizaciones virtuales. Cubre la planificación de trabajos, el descubrimiento y la asignación de recursos, y la computación de alto rendimiento para cargas de trabajo de barrido de parámetros y paralelismo vergonzoso.
Core questions
- ¿Cómo se programan los trabajos y se asignan los recursos en un clúster compartido?
- ¿Cómo se pueden federar y compartir de forma segura los recursos propiedad de diferentes organizaciones?
- ¿Qué cargas de trabajo se benefician más de la computación de alto rendimiento en lugar de la computación paralela fuertemente acoplada?
Key theories
- Organizaciones virtuales y arquitectura de grid
- El concepto de grid define protocolos para compartir recursos de computación, almacenamiento y datos a través de los límites organizativos para formar organizaciones virtuales, con servicios en capas para seguridad, gestión de recursos y descubrimiento.
- Planificación de lotes y gestión de recursos
- Los gestores de recursos de clústeres encolan y colocan trabajos en nodos de acuerdo con políticas que equilibran la utilización, la equidad y la prioridad, una función central tanto para clústeres como para grids.
- Computación de alto rendimiento
- Para cargas de trabajo compuestas por muchas tareas independientes, los sistemas aprovechan la capacidad ociosa y distribuida para maximizar los trabajos completados durante largos períodos en lugar de minimizar la latencia de una única computación.
Clinical relevance
Los clústeres y las grids sustentan la computación científica —desde la física y la bioinformática hasta grandes colaboraciones que comparten datos y computación— y sus ideas de planificación y gestión de recursos se trasladan directamente a las plataformas actuales de orquestación de la nube y de contenedores.
History
Los clústeres de estaciones de trabajo comerciales surgieron en la década de 1990 como una alternativa rentable a los superordenadores; la visión de grid de Foster y Kesselman (finales de la década de 1990, formalizada en 2001) extendió el intercambio entre instituciones, y sistemas como Condor demostraron una computación de alto rendimiento a gran escala que prefiguró la nube.
Key figures
- Ian Foster
- Carl Kesselman
- Miron Livny
Related topics
Seminal works
- foster2001
- foster2004
- thain2005
Frequently asked questions
- ¿En qué se diferencia una grid de un solo clúster?
- Un clúster suele ser homogéneo y estar bajo una única autoridad administrativa, mientras que una grid federa recursos heterogéneos propiedad de diferentes organizaciones. Por lo tanto, las grids deben resolver problemas más difíciles de seguridad entre dominios, confianza y descubrimiento de recursos que un solo clúster evita.