Mis à jour le Sept. 20, 2022, 6:42 p.m.
Dans ce tuto nous allons voir comment créer une application qui transforme le texte en image.
Nous n'allons pas entrainé le modèle de 0, mais plutot nous en servir pour l'intégrer à une application. J'ai réalisé ce tutos sous ubuntu, mais je vous invite à tenter sous windows10. Si vous le faites sur votre machine vous devez avoir un environnement d'installé (pipenv, virtualenv ou autre) et avoir un environnement de deep learning pr la computer déjà prêt (PIL, torch etc).
Je vous invite à le faire dans google colab si vous n'avez pas de GPU, ou un GPU trop peu puissant.
Assez de blabla, on est pas là pour poser du parquet:
Tout d'abord, creez un compte sur Hugging Face: https://huggingface.co/
Il y a deux façon de faire pour pouvoir utilisé leur modele préentrainer. Sois vous vous connectez directement avec l'API, soit vous cloner le github (nécessite d'être inscrit)
git clone https://huggingface.co/CompVis
/stable-diffusion-v1-4
Rentrez votre identifiant et votre mot de passe
Vous devriez avoir tout cela à l'intérieur:
Remettez vous dans le dossier ou vous avez cloné stable-diffusion.
cd ..
Installez git-lfs
sudo apt-get install git-lfs
git lfs install
Se deplacer dans le fichier:
cd stable-diffusion-v1-4/
Lancer la commande suivante et attendre patiemment
git lfs pull
On se voit dans la partie 2 pour la creation de notre script.