Liste des logiciels de synthographie et applications d'art généré par intelligence artificielle (IA / AI art)

Logiciels de création d'images par intelligence artificielle

MIDJOURNEY

Logo Midjourney

Site officiel : https://www.midjourney.com/

Sorti en 2022, Midjourney est à la fois le nom d’un laboratoire d’IA et le nom d’une l’intelligence qui génère des images, en passant par un serveur Discord.

Pour l’utiliser, il faut avoir un compte Discord. On peut alors générer quelques dizaines d’images en mode test. Pour aller plus loin, il faut acheter un abonnement.

Pour générer des images avec Midjourney, un débutant peut se contenter de donner des instructions en langage naturel. Mais pour un usage expert il faudra apprendre un vaste vocabulaire de termes techniques, décrit entre autres dans une documentation détaillée fournie par un bénévole sur Github : 

MidJourney-Styles-and-Keywords-Reference

Midjourney fonctionne soit avec des "prompts" en mode text-to-image : on donne une description du thème de l'image et de ses paramètres techniques - style, format, type de rendu, éclairage, couleurs... - et Midjourney génère 4 rendus, qu'on peut ensuite faire varier ou agrandir. On peut aussi relancer le même prompt et obtenir 4 nouvelles propositions, à l'infini.

On peut également lui fournir une image et un prompt texte, ou deux images, et Midjourney s'efforcera d'intégrer certains paramètres de l'image ou de fusionner les deux images.

En termes de puissance visuelle, Midjourney a clairement une longueur d'avance sur la concurrence.

Pour vous aider à le découvrir, voici un tutoriel Midjourney :

Tutoriel Midjourney, le meilleur logiciel de génération d’image par intelligence artificielle (AI)

Quelques créations de Midjourney

DALL-E

Logo OpenAI Dall-E

Site officiel : https://openai.com/blog/dall-e-now-available-without-waitlist/

Sorti en janvier 2021, Dall-E est une intelligence artificielle génératrice d’images, crée par OpenAI. Dall-E est basé sur GPT-3, la version 3 du modèle de langage nommé Generative Pre-trained Transformer (GPT).

C’est ce même modèle de langage, une forme de traitement automatisé du langage naturel, qui est aussi à l’origine de ChatGPT, une intelligence artificielle capable de discuter avec les utilisateurs humains et de fournir des réponses d’une qualité impressionnante, simulant une compréhension profonde.

Pour générer ses images, Dall-E repose sur un réseau neuronal comprenant des centaines de milliards de paramètres, et entraîné sur des centaines de millions de paires d’images et de descriptions.

En plus de la génération d'image, Dall-E propose une fonctionnalité intéressante : on peut ajouter une zone vierge à une image générée, et l'intelligence artificielle vient compléter les parties manquantes.

Par exemple, si on avait une planète verte partiellement coupée sur le bord d'une image, sur fond de galaxies bleues et roses, on peut compléter cette planète en conservant sa forme et sa texture, tout en prolongeant un arrière-plan similaire.

Quelques créations de Dall-E 2

STABLE DIFFUSION

Stable Diffusion Logo

Site officiel : Stable Diffusion version 2.1 ou Stable Diffusion version 1

Stable Diffusion est un générateur d’images par intelligence artificielle. Son code source est public, sans être open-source.

Stable Diffusion génère des images soit sur la base d’une instruction en mode texte, soit sur la base d’une esquisse dessinée à la souris en mode “diffuse the rest”.

Conçu pour fonctionner sur le GPU d’un ordinateur grand-public, Stable Diffusion est pour l’instant plutôt moins performant que Dall-E et surtout que Midjourney.

Quelques créations de Stable Diffusion

GOOGLE IMAGEN

Site officiel : https://imagen.research.google/

Google Imagen est un logiciel de tex-to-image basé sur l'intelligence artificielle.

Google affirme qu'un sondage aurait montré que les utilisateurs préfèrent les créations de Google Imagen à celles de Dall-E 2, considérées jusque-là parmi les plus avancées. Mais comme tout ce que dit le géant de Mountain View, cette affirmation est à prendre avec des pincettes.

Présenté en 2022, Google Imagen n'est pour l'instant pas ouvert au public et il n'est donc pas encore possible de l'utiliser pour générer des images.

Quelques créations de Google Imagen

Google Imagen Editor et Google Imagen Video

En complément, Google travaille aussi sur deux applications connexes :

NVIDIA CANVAS

Site officiel : https://www.nvidia.com/fr-fr/studio/canvas/

Ce logiciel d'intelligence artificielle créé par le célèbre constructeur de cartes graphiques Nvidia est un logiciel de dessin numérique.

Nvidia Canvas permet de choisir une texture, puis de tracer des formes ou de "colorier" une surface avec cette texture ; l'IA extrapole alors pour calculer un rendu réaliste de la forme et de la surface.

Par exemple, on prend une texture "montagne", on dessine la forme d'une montagne (ou de n'importe quoi d'autre) et l'IA crée cette montagne en direct sous nos yeux ébahis.

On peut ensuite prendre une texture "neige", et en la passant à certains endroits de la montagne, on l'enneige.

STARRYAI

Site officiel : https://starryai.com/

StarryAI est une application d'art généra par intelligence artificielle pour smartphones.

Elle permet de générer gratuitement 5 images par jour.

Quelques créations de StarryAI

DREAM by WOMBO

Site officiel : https://dream.ai/

Dream est une application de création d'art par intelligence artificielle, par l'entreprise Wombo.

Comme beaucoup d'autres, Dream fonctionne avec des prompts en mode texte.

Par contre, elle impose de choisir entre une poignée de rendus graphiques de style "illustration".

Quelques créations de Wombo Dream

ADOBE PHOTOSHOP

Le célèbre logiciel de création graphique Photoshop intègre d'ores et déjà des fonctionnalités d'intelligence artificielle, notamment pour extrapoler la résolution d'une image lors d'un agrandissement.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Ce site cherche des amis. Auteurs / autrices, testeurs / testeuses, critiques, philosophes...

Synthographie.fr

a deux passions :

la génération d'images
par intelligence artificielle

avec des logiciels
comme Midjourney,
Dall-E, Stable Diffusion...

la génération de texte
par les modèles de langage (LLM)

avec des logiciels
comme ChatGPT,
Mistral, LLaMa...

Retour en haut