Computación en la Nube y en Clúster
La computación en la nube y en clúster organiza un gran número de máquinas comerciales en plataformas escalables y bajo demanda que ofrecen computación y almacenamiento como un servicio.
Definition
La computación en clúster interconecta muchas computadoras independientes para que funcionen como un sistema único; la computación en la nube entrega dichos recursos de computación y almacenamiento agrupados y virtualizados a los usuarios bajo demanda a través de la red, con escalado elástico y precios basados en el uso.
Scope
Esta área abarca la evolución desde los clústeres y las redes (grids) hasta los centros de datos a escala de almacén y la nube; la virtualización y la contenerización que permiten el intercambio elástico de recursos multiusuario; los marcos de procesamiento de datos a gran escala (MapReduce y sus sucesores); y los sistemas de almacenamiento y archivos distribuidos escalables. Es donde la teoría de la computación distribuida y paralela se materializa a escala de internet.
Sub-topics
Core questions
- ¿Cómo se organizan miles de máquinas comerciales para que se comporten como una computadora elástica?
- ¿Cómo permite la virtualización el intercambio elástico de recursos multiusuario?
- ¿Cómo se pueden procesar y almacenar de forma fiable conjuntos de datos demasiado grandes para una sola máquina en un clúster?
Key theories
- Computación de utilidad y elástica
- La computación en la nube convierte la computación en un servicio medido, proporcionando la ilusión de recursos infinitos y elásticos disponibles bajo demanda y trasladando el costo de capital al costo operativo, un cambio analizado por Armbrust y colaboradores.
- Computación a escala de almacén
- Tratar un centro de datos completo como una sola computadora —diseñando para las características de costo, energía y fallas de decenas de miles de servidores— replantea el diseño de sistemas en torno al centro de datos como unidad de despliegue.
- Procesamiento en clúster paralelo de datos
- Marcos como MapReduce permiten a los programadores procesar conjuntos de datos masivos en un clúster expresando la computación como funciones de mapeo (map) y reducción (reduce), con el tiempo de ejecución manejando la paralelización, la distribución de datos y la tolerancia a fallos.
Clinical relevance
Las plataformas en la nube y en clúster albergan esencialmente todos los servicios de internet a gran escala, la computación científica y empresarial, y las tuberías de aprendizaje automático; su diseño determina directamente el costo, la escalabilidad y la fiabilidad de la infraestructura informática moderna.
History
La computación en clúster evolucionó de redes de estaciones de trabajo en la década de 1990 a la computación en red (grid computing) para infraestructura científica compartida (Foster y colaboradores, 2001); MapReduce y el sistema de archivos de Google (2003-2008) demostraron el procesamiento de datos a escala de almacén, y el auge de las plataformas de nube pública a finales de la década de 2000, analizado por Armbrust y colaboradores, hizo que la computación de utilidad elástica se generalizara.
Debates
- Grid versus nube como modelo para la computación compartida
- La computación en red (grid computing) enfatizó la federación entre dominios administrativos para la colaboración científica, mientras que la computación en la nube centralizó los recursos bajo un proveedor con precios elásticos y bajo demanda; el modelo de nube prevaleció en gran medida comercialmente, aunque las ideas de la red persisten en la computación científica.
Key figures
- Jeffrey Dean
- Sanjay Ghemawat
- Luiz Andre Barroso
- Ian Foster
- Michael Armbrust
Related topics
Seminal works
- armbrust2010
- dean2008
- barroso2018
Frequently asked questions
- ¿Cuál es la diferencia entre la computación en clúster y la computación en la nube?
- Un clúster es un conjunto de máquinas en red que actúan como un solo sistema, generalmente propiedad y operado por sus usuarios. La computación en la nube entrega recursos agrupados y virtualizados —a menudo construidos sobre clústeres— a muchos inquilinos bajo demanda a través de la red, con escalado elástico y precios de pago por uso.