NVIDIA continúa liderando la innovación en inteligencia artificial con una nueva actualización en sus tarjetas gráficas GeForce RTX y en la tecnología de aceleración de IA. Gracias a la colaboración con Stability AI, la gigante tecnológica ha logrado una optimización clave para los modelos de IA más demandados, como Stable Diffusion 3.5 Large, al reducir el consumo de memoria VRAM en hasta un 40% y duplicar su rendimiento en comparación con versiones anteriores.
Stable Diffusion 3.5 Large es uno de los modelos de generación de imágenes más populares y potentes. Sin embargo, la necesidad de grandes cantidades de memoria (VRAM) para ejecutar este modelo ha sido un desafío para muchos usuarios, limitando su accesibilidad a sistemas con tarjetas gráficas de alto rendimiento. Con la integración de la cuantificación FP8 en la serie GeForce RTX 40 y la generación Ada Lovelace de GPUs RTX PRO, NVIDIA ha logrado reducir el uso de VRAM en un 40%. Esta optimización permite a las tarjetas gráficas GeForce RTX manejar modelos más grandes de IA, con la posibilidad de ejecutar varios modelos simultáneamente, sin necesidad de actualizar el hardware.
La reducción de VRAM no solo hace que el modelo sea más accesible, sino que también incrementa la velocidad de generación de imágenes. Con esta optimización, los usuarios de NVIDIA pueden ahora generar imágenes con Stable Diffusion 3.5 en la mitad de tiempo, manteniendo una calidad similar a la de modelos con FP16. Esto permite a los creadores de contenido y desarrolladores acelerar significativamente sus flujos de trabajo creativos sin comprometer la calidad.
Además de la cuantificación a FP8, la nueva optimización de NVIDIA se ha logrado gracias al uso de TensorRT, un backend especializado en IA que maximiza el rendimiento de las GPUs RTX. Este software ha sido rediseñado para la serie RTX, mejorando la ejecución de modelos de IA mediante compilación JIT (Just In Time) y reduciendo el tamaño de los paquetes en un 8x.
TensorRT permite a los desarrolladores crear motores optimizados de IA para sus aplicaciones de manera más sencilla y rápida. En lugar de tener que generar motores para cada tipo de GPU de forma manual, los desarrolladores ahora pueden crear un motor genérico optimizado que se adapta automáticamente al dispositivo, mejorando así la eficiencia del proceso. Esta funcionalidad está disponible para los desarrolladores a través del nuevo SDK de TensorRT, que puede descargarse de la página de desarrolladores de NVIDIA.
NVIDIA también ha anunciado el lanzamiento de la versión preliminar de su kit de desarrollo de software (SDK) para TensorRT para RTX, disponible ahora como una herramienta independiente para desarrolladores. Este SDK se integra fácilmente con Windows ML, el backend de inferencia de IA de Microsoft, lo que permite a los desarrolladores integrar IA generativa y acelerada por TensorRT de manera más eficiente en sus aplicaciones.
Además, la colaboración con Stability AI no se detiene allí. Los modelos optimizados de Stable Diffusion 3.5 Large y Medium ya están disponibles para su descarga en la plataforma Hugging Face y también se lanzará un microservicio NVIDIA NIM en julio para facilitar aún más el acceso de los creadores a estos modelos de IA avanzados.
Con estas nuevas optimizaciones, los creadores de contenido digital podrán experimentar una mayor rapidez y eficiencia en sus procesos de generación de imágenes. Ya sea para trabajos artísticos, visualización de conceptos o desarrollo de productos, la mejora de rendimiento de Stable Diffusion 3.5 en GPUs RTX abre nuevas oportunidades para innovar sin las limitaciones previas de hardware.

Para los desarrolladores, la nueva versión de TensorRT también les ofrece una forma más sencilla de implementar modelos de IA avanzados, lo que les permitirá crear aplicaciones más potentes y optimizadas con una mayor facilidad.
El anuncio de estas innovaciones fue realizado en el marco de la conferencia GTC París, celebrada en el evento VivaTech, donde el CEO de NVIDIA, Jensen Huang, ofreció una presentación sobre los últimos avances en IA y su infraestructura en la nube. La conferencia destacó cómo las tecnologías de NVIDIA están transformando no solo el desarrollo de IA, sino también su implementación en aplicaciones del día a día.
Con el impacto de estas nuevas herramientas, NVIDIA refuerza su posición como líder en la aceleración de IA y la innovación en la creación digital.