MGIE o MLLM-Guided Image Editing es una nueva herramienta de Inteligencia Artificial Generativa que permite realizar cambios y editar imágenes con solo describir los cambios que usted desea realizar.
El nuevo modelo, publicado por desarrolladores de Apple y la Universidad de California, Santa Barbara, le permite a los usuarios describir, en un lenguaje simple, qué cambios desean realizar sobre una imagen o foto sin tener que abrir o utilizar ningún software de edición.
Dentro de los cambios incluidos en la herramienta están la posibilidad de adicionar filtros, voltear, recortar y cambiar el tamaño.
El modelo combina dos usos diferentes de los modelos de lenguaje multimodal. En primer lugar, aprende a interpretar las indicaciones del usuario y luego “imagina” cómo se vería la edición. Aquí hay algunos de los ejemplos de resultados obtenidos.
Esta herramienta podría ser fácilmente integrada con Siri, en iOS 18, para permitir a los usuarios hacer estos cambios con solo hablarle, literalmente, al dispositivo.