Methexis-Inc/img2prompt es una herramienta fácil de usar que crea indicaciones de texto basadas en imágenes para ayudar a generar nuevos visuales.
Esta herramienta innovadora está diseñada específicamente para funcionar bien con stable-diffusion y utiliza un modelo conocido como clip ViT-L/14. Esencialmente, lo que hace es tomar una imagen que proporcionas y generar una indicación de texto descriptiva que está estrechamente alineada con ella. Este proceso es posible gracias al cuaderno CLIP Interrogator de código abierto, que fue desarrollado por @pharmapsychotic. Al aprovechar los modelos CLIP de OpenAI, identifica varios estilos artísticos, medios y técnicas que corresponden a la imagen.
La magia ocurre cuando la herramienta combina sus hallazgos con los subtítulos generados por BLIP. Esta colaboración resulta en una indicación de texto personalizada que se puede usar para crear nuevas imágenes que comparten características similares a la original. Esta función es especialmente útil para artistas y creadores que desean explorar nuevas ideas basadas en sus visuales existentes.
Si estás buscando usar esta herramienta, puedes acceder a ella a través de una API, y también hay un repositorio de GitHub disponible para aquellos curiosos sobre los detalles técnicos y la licencia. Además, no tendrás que esperar mucho para obtener resultados; las predicciones están listas en aproximadamente 24 segundos, gracias al potente hardware de GPU Nvidia T4 en el que opera.
∞