ScholarGate
Asistente

Modelos generativos profundos

Los modelos generativos profundos aprenden a producir nuevos datos que se asemejan a un conjunto de entrenamiento, capturando la distribución de datos complejos como imágenes, audio y texto.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

Un modelo generativo profundo es una red neuronal que representa una distribución de probabilidad sobre los datos y puede generar nuevas muestras a partir de ella, aprendida ya sea maximizando la verosimilitud, mediante entrenamiento antagónico o aprendiendo a invertir un proceso de corrupción, dependiendo de la familia del modelo.

Scope

Este tema abarca modelos neuronales que modelan o muestrean a partir de distribuciones de datos: autoencoders variacionales que emparejan un codificador y un decodificador con una prioridad latente, redes generativas antagónicas que enfrentan un generador contra un discriminador, modelos autorregresivos que predicen datos un elemento a la vez, y modelos de difusión que aprenden a revertir un proceso de ruido. Aborda cómo se entrenan y evalúan estos modelos.

Core questions

  • ¿Cómo puede una red neuronal aprender a generar nuevos datos realistas?
  • ¿Qué distingue los enfoques basados en la verosimilitud, los antagónicos y los de difusión?
  • ¿Cómo se utilizan las variables latentes para controlar y estructurar la generación?
  • ¿Cómo se evalúa la calidad de las muestras generadas?

Key theories

Generación de variables latentes
Los autoencoders variacionales aprenden un codificador que mapea los datos a una distribución latente y un decodificador que reconstruye los datos, lo que permite el muestreo de nuevos datos extrayendo códigos latentes de una prioridad.
Entrenamiento antagónico
Las redes generativas antagónicas entrenan un generador para engañar a un discriminador que intenta distinguir los datos reales de los generados, un juego cuyo equilibrio produce muestras realistas.
Modelado autorregresivo y de difusión
Los modelos autorregresivos factorizan una distribución en un producto de condicionales predichos en secuencia, mientras que los modelos de difusión aprenden a revertir un proceso gradual de ruido, ambos proporcionando una generación de alta calidad.

Clinical relevance

Los modelos generativos profundos impulsan la síntesis de imágenes y audio, el aumento de datos, el diseño de fármacos y materiales, y los sistemas de inteligencia artificial generativa que producen texto e imágenes; su capacidad para crear contenido sintético convincente también plantea importantes preocupaciones sobre el uso indebido, la autenticidad y la evaluación.

History

El modelado generativo con redes neuronales progresó desde las máquinas de Boltzmann restringidas y las redes de creencias profundas hasta los autoencoders variacionales y, en 2014, las redes generativas antagónicas. Los modelos autorregresivos avanzaron en la generación de texto y audio, y los modelos de difusión lograron posteriormente una calidad líder en la síntesis de imágenes, lo que convirtió al modelado generativo en un tema central de la inteligencia artificial moderna.

Key figures

  • Ian Goodfellow
  • Diederik Kingma
  • Yoshua Bengio

Related topics

Seminal works

  • goodfellow2016
  • lecun2015
  • murphy2012

Frequently asked questions

¿Qué es una red generativa antagónica?
Es un par de redes entrenadas conjuntamente: un generador que crea muestras y un discriminador que intenta distinguir los datos reales de los generados. El generador mejora aprendiendo a engañar al discriminador, y en el equilibrio ideal produce muestras realistas.
¿Cómo generan datos los modelos de difusión?
Los modelos de difusión aprenden a revertir un proceso que añade ruido gradualmente a los datos. Partiendo de ruido puro, el modelo elimina repetidamente un poco de ruido, paso a paso, hasta que emerge una muestra limpia, lo que ha demostrado ser muy eficaz para la generación de imágenes de alta calidad.

Methods for this concept

Related concepts