






Hasta que no hace mucho tiempo, no era fácil convertir una imagen como la izquierda en algo como los derechos. Podrías hacerlo, sí, pero necesitaba un conocimiento extendido de los programas de edición de imágenes como Photoshop y, por supuesto, el tiempo. Esto es cada vez más cierto, y el uso de la IA generativa para la transformación de imágenes ya es un claro ejemplo de que esta tecnología puede hacer lo que fue muy difícil de antemano.
Hola, editor de la imagen Qwen. Este es el nombre del modelo de IA generativo Publicado por Alibaba Y eso es parte de su familia cada vez más reconocida de modelos Qwen. Nos enfrentamos a un modelo especialmente capacitado para editar fotos e imágenes extremadamente fácilmente: es suficiente para pedir una solicitud de entrada.
Envías, la IA sigue la creación. La nueva edición de imagen QWEN está disponible para intentos directos En el sitio web de este modelo. Cuando vayamos a esta página, veremos cómo el modo «Edición de imagen» ya está preinstalado, y será suficiente que también podamos trabajar en esta imagen una tras otra.
Un modelo cada vez más capaz. Este modelo es una especie de «bifurcación» de Qwen Image, el modelo fundador de 20,000 millones de parámetros (20B), que Alibaba publicó a principios de mes. Este modelo se centró en las cosas sobre cómo rendir texto en las imágenes, pero aquí la edición continúa. El modelo está disponible en Chat de qwenpero también en AbrazoPresente ModelscopePresente Github Y a través de la API de Nube de alibaba (Los costos son 0.045 USD por imagen, pero los primeros 100 son gratuitos).
En la nube y en local, en su PC. Aunque es muy conveniente usarlo desde la interfaz de chat Qwen que puede generar hasta 8 imágenes gratuitas (entrada/finalización cada 12 horas gratuito: también puede descargarla y usarla en una casa en una PC o computadora portátil con memoria gráfica suficiente (el modelo pesa 54 GB).
El experto Simon Willinson lo hizo en su memoria MacBook Pro M2 de 64 GB de memoria unificada y la verificó como con 10 pasos de inferencia (por defecto, él 50, pero eso lleva mucho más tiempo). Tomó 25 minutos Al crear un cambio de una imagen. En el chat Qwen, en el que se utilizan muchos más recursos informáticos, solo tiene que esperar unos segundos para cada imagen.
Entender la imagen antes de que se edite. Una de las ventajas de QWen Image Eduitor es que se utiliza el llamado mecanismo de codificación. Este sistema es analizar las imágenes de entrada con el modelo de reconocimiento visual QWEN2.5-VL, «comprender» y saber qué hay en él, y luego usar un autocodificador variable (VAE) para agregar los detalles del bloqueo (salida). Este enfoque logra cambiar la lealtad al mantenimiento original de lo que exige el usuario.
Junyang Lin, uno de los investigadores involucrados en el desarrollo de este modelo, explicado Esto permite cómo «un cabello se puede eliminar de un plato», que es el desafío de la imagen modificada de la ONU y, en sus palabras, «un cambio de imagen muy sensible».
Edición semántica. Otra de las grandes propiedades de este modelo es la capacidad de crear una edición semántica de la imagen. Esto es: lo que cambia es la estructura o el significado de una imagen. Por ejemplo, podemos usar el famoso efecto de imagen con Studio Ghibli u otro que transforma una foto En una escena creada con laicospero recibe la identidad de los objetos o personas de la imagen original.
Cambiar la realidad. Al igual que otros modelos generativos similares, la evolución sigue siendo notable. Ya hemos visto cómo el editor de magia de Google se ha criado durante mucho tiempo, pero Qwen Image Editor va un paso más para poder mantener esta lealtad de la apariencia en la imagen original.
Por ejemplo, agregar graffiti en diomas ingleses o chinos, que maneja perfectamente este modelo, mientras que el resto de la imagen sigue siendo idéntico al original. La calidad y consistencia de los textos es excepcional. Incluso se adaptan a la ropa, incluso si tienen pliegues, de modo que el efecto de realismo con la imagen de la imagen de Mark Zuckerberg es el caso (aunque no se da cuenta tanto).
Un ejemplo de una tendencia asombrosa (e inquietante). Aquí solo hablamos de un modelo que procesa las imágenes y las transforma, que ya habíamos visto en el pasado, pero que continúa con el editor de imágenes de Qwen. La lección es realmente más profunda: todos estos modelos ya no pueden (ver) necesarios para lanzar un futuro para hacer frente a aplicaciones complejas (como Photoshop y similares en este caso).
¿Aprender Linux? ¿I? Además de en ciertos casos, muchas de las cosas que hemos hecho con estas aplicaciones se pueden llevar a cabo sin una idea de procesamiento gráfico: es suficiente «hablar» con una IA para preguntar qué queremos. Y lo que se aplica a Photoshop se aplica tanto a herramientas y sistemas interminables: presione repentinamente el máximo Excel o la consola de Linux, p. Ai ya lo habrá hecho.
En | China pone todo frente a los Estados Unidos. Lo que no esperaba es que Huawei y Alibaba pelearán entre ellos