Apple lanza el editor de imágenes AI de código abierto MGIE

En el campo de la edición de imágenes digitales, la reciente presentación por parte de Apple del sistema MGIE (Edición de imágenes guiada por modelos de lenguaje grande multimodal) marca un paso importante. Esta herramienta de inteligencia artificial de vanguardia aprovecha las capacidades de grandes modelos de lenguaje para interpretar y ejecutar ediciones de imágenes complejas basadas en instrucciones, brindando a los usuarios un nivel de control y flexibilidad sin precedentes. El enfoque innovador de MGIE combina el poder de la entrada de texto y visual para facilitar ajustes similares a los de Photoshop, mejoras fotográficas globales y ediciones locales precisas con una eficiencia notable.

manzana mgie

El desarrollo de MGIE representa el compromiso de Apple de ampliar los límites de la tecnología y la creatividad, proporcionando una plataforma que no sólo simplifica las tareas de edición sofisticadas, sino que también fomenta la colaboración y la innovación dentro de la comunidad de código abierto. Al integrar técnicas de aprendizaje multimodal, MGIE mejora significativamente los sistemas de edición de imágenes anteriores, permitiendo interpretaciones más expresivas y precisas de las instrucciones del usuario. Proporciona competencia de código abierto a sistemas como Midjourney de OpenAI y DallE 3.

Editor de imágenes de código abierto

En los últimos años, la intersección de la inteligencia artificial y las herramientas creativas ha dado lugar a avances revolucionarios en la forma en que interactuamos con los medios digitales. La introducción del sistema MGIE por parte de Apple es un testimonio de esta transformación en curso, que establece un nuevo estándar para la creatividad impulsada por la IA.

MGIE (edición de imágenes guiada por MLLM) es un modelo de IA de código abierto desarrollado en colaboración con investigadores de la Universidad de California. Este modelo, que se distingue por su capacidad para realizar manipulaciones de imágenes complejas basadas en instrucciones en lenguaje natural, se basa en modelos multimodales de lenguaje grande (MLLM) para interpretar con precisión las solicitudes de los usuarios. MGIE le permite realizar una amplia gama de ediciones, desde mejoras globales de fotografías, como ajustar el brillo y el contraste, hasta ediciones locales y ediciones similares a Photoshop, como recortar, cambiar el tamaño y agregar filtros.

iOS 18

Su capacidad para comprender y ejecutar comandos como hacer una pizza más saludable o cambiar el enfoque de una foto es un testimonio de su avanzado sentido común y sus habilidades de manipulación a nivel de píxel. El desarrollo de MGIE, presentado en la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR) de 2024 y disponible en GitHub, representa un gran paso adelante en la investigación de IA para Apple, siguiendo de cerca otros proyectos de IA importantes y la anticipación de funciones de IA generativa en iOS 18.

MGIE representa un puente entre las capacidades avanzadas de IA y la edición de imágenes fácil de usar, permitiendo una gran cantidad de ediciones que van desde la mejora general de la fotografía, como ajustes de brillo, contraste y nitidez, hasta ediciones integrales, localizaciones más específicas que pueden cambiar la forma, el tamaño y el color. o textura de elementos específicos de la imagen. Además, destaca en operaciones similares a las de Photoshop, como recortar, cambiar el tamaño, rotar y aplicar varios filtros, lo que brinda a los usuarios un nivel de control sin precedentes sobre sus entornos digitales.

Edición de imágenes multimodal guiada por un modelo de lenguaje extendido

Uno de los aspectos más notables del MGIE es su capacidad de razonar con sentido común, lo que le permite realizar tareas como añadir ingredientes vegetales a una pizza para que parezca más saludable o mejorar el contraste de una foto para simular luz adicional. Este nivel de operación intuitiva allana el camino para una edición de imágenes más creativa y personalizada, ampliando los límites de lo que se puede lograr con la tecnología de IA.

La colaboración con la Universidad de California y la presentación de MGIE en la Conferencia Internacional sobre Representaciones del Aprendizaje (ICLR) de 2024 marca un hito importante en los esfuerzos de investigación de IA de Apple. Disponible en GitHub, MGIE invita a la exploración y el desarrollo continuos, brindando acceso a su código, datos y modelos previamente entrenados a todas las comunidades científicas y creativas.

Investigación sobre generación y manipulación de imágenes con IA

Esta iniciativa es parte del compromiso más amplio de Apple con la investigación de IA, como lo demuestran sus recientes logros en el despliegue de modelos de lenguaje de gran tamaño en iPhones y otros dispositivos con memoria limitada. El desarrollo del rival "Apple GPT" y el marco "Ajax" para grandes modelos de lenguaje subrayan el compromiso de la empresa con el avance de la tecnología de IA. Además, la anticipación de funciones de IA generativa en iOS 18, incluida una versión mejorada de Siri con funcionalidad similar a ChatGPT, señala un cambio significativo en la forma en que la IA se integrará en los dispositivos de todos los días, lo que podría marcar la actualización de software "más grande" en la historia del iPhone. según analistas del sector.

MGIE no es sólo una herramienta, sino también un presagio del futuro de la creatividad digital, ya que cierra la brecha entre la innovación tecnológica y la expresión artística. Su desarrollo y distribución de código abierto subrayan la visión de Apple de un mundo donde la tecnología sirve no sólo para mejorar la productividad, sino también para fomentar la creatividad y la expresión personal a través de herramientas intuitivas, accesibles y potentes. A medida que evolucione, se espera que MGIE redefina el panorama de la edición de imágenes, haciendo que la manipulación avanzada de imágenes impulsada por IA sea accesible a un público más amplio y fomentando una nueva era del arte digital.

Leer más Guía:

Dejar un comentario

Su dirección de correo electrónico no será publicada. Los campos necesarios están marcados con *