Diverso

Nvidia AI hace artistas a todos

Nvidia AI hace artistas a todos

Nvidia ha lanzado un nuevo creador de imágenes alucinante. Denominado GauGAN, el software utiliza redes generativas adversarias (GAN) que permiten a los usuarios convertir bocetos aproximados en paisajes detallados, casi fotorrealistas.

VEA TAMBIÉN: ¿LA IA-ARTE SUPLEMENTARÁ A LOS HUMANOS COMO ARTISTAS DEL FUTURO?

Los videos de demostración muestran solo unas pocas líneas y contornos de formas que se convierten instantáneamente en imágenes cinematográficas. GauGAN es solo una demostración de la poderosa plataforma de red neuronal de Nvidia, hay mucho más por venir.

El mundo virtual se vuelve ricamente real

Nvidia dice que esperan construir una herramienta que permita a todos, desde artistas hasta arquitectos y directores de cine, la capacidad de crear mundos virtuales de alta calidad en solo segundos. Los profesionales podrían crear prototipos de ideas y realizar cambios rápidos en su realidad imaginada.

"Es mucho más fácil generar ideas sobre diseños con bocetos simples, y esta tecnología puede convertir bocetos en imágenes muy realistas", dijo Bryan Catanzaro, vicepresidente de investigación de aprendizaje profundo aplicado en NVIDIA. GuaGAN, un juego de palabras con el nombre del famoso pintor impresionista Gauguin, ofrece a sus usuarios tres herramientas; un cubo de pintura, un bolígrafo y un lápiz.

En la parte inferior de la pantalla, hay una colección de posibles objetos relacionados con imágenes de paisajes. Seleccione el objeto de nube, dibuje una línea en la pantalla y el software lo convertirá en una nube.

El sistema garantiza que el 'arte' sea siempre único

Pero esto no es solo un sello, cada línea única producirá una imagen de nube única. El mismo proceso se aplica para otros objetos de paisaje, seleccione el objeto de árbol, dibuje una línea y se formará un árbol, hágalo bulboso en la parte superior para producir hojas.

El sistema garantiza que incluso los mismos bocetos con la misma configuración sean diferentes al tener números aleatorios integrados que garantizan que el software cree resultados diferentes. El modelo de aprendizaje profundo se entrena en millones de imágenes y es hiperflexible, cambia un objeto de estanque a nieve y observa cómo tu imagen cambia de estación al instante.

Las redes se unen para mejorar constantemente

"Es como un dibujo de un libro para colorear que describe dónde está un árbol, dónde está el sol, dónde está el cielo", dijo Catanzaro.

"Y luego la red neuronal es capaz de completar todos los detalles y texturas, y los reflejos, sombras y colores, basándose en lo que ha aprendido sobre imágenes reales".

Las GAN pueden producir resultados tan convincentes porque utilizan pares de redes cooperantes conocidas como generador y discriminador. El discriminador se entrena en imágenes reales y luego da retroalimentación hasta el píxel al generador sobre el éxito de las imágenes creadas.

Nvidia hace que el software sea gratuito

El sistema también permite a sus usuarios agregar filtros para brindar un estilo más personalizado a las imágenes resultantes. “Esta tecnología no es solo unir piezas de otras imágenes o cortar y pegar texturas”, dijo Catanzaro.

“En realidad, es sintetizar nuevas imágenes, muy similar a cómo un artista dibujaría algo”.

La demostración es muy impresionante, creando imágenes bastante realistas en solo segundos. Pero en una inspección cercana, hay espacios entre los objetos y una pequeña línea donde se tocan.

Nvidia dice que están trabajando para mejorar esto. En este momento, no parece que haya planes para lanzar el software comercialmente, pero Nvidia espera que una versión esté disponible de forma gratuita para que todos la utilicen.

La investigación relacionada con la construcción de GuaGAN ha sido aceptada como presentación oral en la conferencia CVPR en junio.


Ver el vídeo: OpenAIs Jukebox AI Writes Amazing New Songs (Mayo 2021).