Last Updated on febrero 28, 2024 11:42 am by Laszlo Szabo / NowadAIs | Published on febrero 9, 2024 by Juhasz “the Mage” Gabor
MGIE de Apple: ¿Es hora de descartar Photoshop? – Notas clave
- MGIE es un proyecto de colaboración entre Apple y la Universidad de California en Santa Bárbara.
- Permite editar imágenes mediante instrucciones de lenguaje natural.
- Permite realizar modificaciones al estilo Photoshop, optimizar la calidad de las fotos y editarlas localmente.
- Está disponible en código abierto en GitHub para que los usuarios puedan explorarlo y contribuir a él.
- Permite la expresión creativa en el ámbito personal, profesional y artístico.
El nacimiento de MGIE
Apple Inc, el gigante tecnológico famoso por sus productos y servicios innovadores, ha vuelto a demostrar su destreza en el campo de la Inteligencia Artificial (IA) con la introducción de un modelo de IA generador de imágenes: MGIE, o Multimodal Guided Image Editing.
MGIE es el resultado de la colaboración entre Apple e investigadores de la Universidad de California en Santa Bárbara. El modelo se presentó en un trabajo de investigación aceptado en la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR) 2024, una plataforma de primer orden para la investigación de la IA.
Fusión de IA y edición de imágenes
MGIE, un modelo de IA de última generación, aporta una nueva perspectiva a la edición de imágenes al permitir ediciones basadas en instrucciones de lenguaje natural. Este modelo de IA de código abierto interpreta las órdenes del usuario y realiza manipulaciones a nivel de píxel.
Trabajar con MGIE es de lo más intuitivo. Los usuarios sólo tienen que escribir los cambios que desean en un lenguaje sencillo.
Por ejemplo, un usuario puede decir: “Haz que los árboles de esta foto sean más altos” o “Cambia el color de este vestido a azul”
Una vez introducidas las instrucciones, el modelo lingüístico avanzado de MGIE descifra los comandos e identifica objetos, atributos y modificaciones concretos.
Simultáneamente, el modelo analiza la imagen, identificando los elementos clave y sus relaciones.
En el último paso, MGIE combina la comprensión lingüística y visual para manipular inteligentemente la imagen de acuerdo con las órdenes del usuario.
Capacidades variadas de MGIE: Modificaciones al estilo Photoshop
Las capacidades de MGIE no se limitan a meros ajustes de color o modificaciones sencillas. El modelo puede manejar una amplia gama de escenarios de edición, desde la modificación al estilo Photoshop hasta la optimización global de fotos y la edición local.
MGIE puede realizar ediciones habituales al estilo de Photoshop, como recortar, redimensionar, girar, voltear y añadir filtros. También puede ejecutar ediciones más avanzadas, como cambiar el fondo, añadir o eliminar objetos y mezclar imágenes.
El modelo es capaz de optimizar la calidad general de una foto. Esto incluye ajustes de brillo, contraste, nitidez y equilibrio de color. Además, puede aplicar efectos artísticos como esbozar, pintar y caricaturizar.
La función de edición local de MGIE permite modificar regiones u objetos específicos de una imagen. Por ejemplo, puede modificar atributos de caras, ojos, pelo, ropa y accesorios como la forma, el tamaño, el color, la textura y el estilo.
MGIE: una experiencia fácil de usar
MGIE está disponible como un proyecto de código abierto en GitHub, esto permite a los usuarios explorar y contribuir al proyecto directamente.
El proyecto proporciona acceso completo a su código fuente, datos de entrenamiento y modelos preentrenados. También hay un cuaderno de demostración disponible en GitHub que guía a los usuarios a través de varias tareas de edición con MGIE.
Además, los usuarios pueden experimentar con MGIE a través de una demostración web alojada en Hugging Face Spaces, una plataforma en línea para compartir y colaborar en proyectos de aprendizaje automático.
Por qué es importante MGIE
MGIE puede ayudar a los usuarios a crear, modificar y optimizar imágenes para fines personales o profesionales como las redes sociales, el comercio electrónico, la educación, el entretenimiento y el arte. Este modelo de IA permite a los usuarios expresar sus ideas y emociones a través de imágenes y les inspira a explorar su creatividad.
Preguntas más frecuentes
- ¿Qué es MGIE y quién lo ha desarrollado?
- MGIE es un modelo de edición de imágenes basado en IA desarrollado por Apple en colaboración con la Universidad de California en Santa Bárbara.
- Cómo entiende MGIE las instrucciones del usuario?
- MGIE interpreta instrucciones en lenguaje natural para la edición de imágenes, utilizando un modelo lingüístico avanzado para descifrar los comandos del usuario y realizar manipulaciones visuales precisas.
- Puede MGIE realizar ediciones de imágenes complejas?
- Sí, MGIE es capaz de realizar ediciones complejas como cambiar fondos, añadir o eliminar objetos y aplicar efectos artísticos, además de modificaciones básicas como recortar y cambiar el tamaño.
- ¿Es MGIE accesible para uso general?
- MGIE es de código abierto y está disponible en GitHub, lo que permite a los usuarios explorar, utilizar y contribuir al proyecto, con una demostración disponible para la experiencia práctica.
- ¿Por qué es importante MGIE para la edición de imágenes?
- MGIE representa grandes resultados en la edición de imágenes al combinar la IA con comandos lingüísticos intuitivos, lo que permite a los usuarios realizar ediciones detalladas y expresar su creatividad a través de las imágenes.