Apple presentó a MGIE (MLLM-Guided Image Editing), un nuevo modelo de inteligencia artificial (IA) y código abierto que puede editar imágenes como todo un profesional y que funciona con instrucciones de lenguaje natural.
De acuerdo con Apple, el algoritmo trabaja bajo el principio de ‘edición de imágenes guiadas’, aprovechando los modelos de lenguaje grande multimodal (MLLM) para interpretar las instrucciones del usuario y manipular los contenidos.
Por ejemplo, al dar instrucciones como ‘hacer el cielo más azul’, MGIE puede convertirlas en comandos similares a ‘aumentar la saturación de la región del cielo en un 20%’.

Esto puede hacer MGIE de Apple
Puede realizar desde ajustes de color simples hasta manipulaciones de objetos complejos, así como ediciones globales y locales.
Es posible modificar las imágenes al estilo de Photoshop: recortar, cambiar el tamaño, rotar, voltear, agregar filtros, cambiar un fondo, agregar o eliminar objetos y combinar elementos.
MGIE también puede optimizar la calidad de las imágenes en parámetros como brillo, contraste, nitidez y equilibrio de color, con efectos artísticos adicionales como dibujar, pintar y crear dibujos.
Cómo probar MGIE
Según el sitio web VentureBeat, Apple lanzó el modelo a través de GitHub, pero los interesados también pueden probar una demostración que actualmente está alojada en Hugging Face Spaces.
Apple aún no ha dicho si planea usar lo que aprenda de este proyecto en una herramienta o una función que pueda incorporar en cualquiera de sus productos.
El desarrollo es el resultado de una investigación realizada en colaboración con la Universidad de California en Santa Bárbara.