AMD presenta ROCm 6.2.3 que mejora el rendimiento de la IA en las GPU Radeon


Iris Coleman
13 de octubre de 2024 02:37

AMD lanza ROCm 6.2.3, que mejora las capacidades de IA para las GPU Radeon con soporte mejorado para Llama 3, Stable Diffusion y Triton framework, mejorando la eficiencia del desarrollo de IA.



AMD presenta ROCm 6.2.3 que mejora el rendimiento de la IA en las GPU Radeon

AMD ha lanzado la última versión de su software de computación abierta, AMD ROCm™ 6.2.3, diseñado específicamente para mejorar el rendimiento de las GPU Radeon en sistemas nativos Ubuntu® Linux®. Esta actualización tiene como objetivo proporcionar un rendimiento de inferencia superior para los modelos de IA, incluido el Llama 3 70BQ4, y permite a los desarrolladores integrar las capacidades de conversión de texto a imagen de Stable Diffusion (SD) 2.1 en sus proyectos de IA, según AMD.com.

Características principales de ROCm 6.2.3

La nueva versión ROCm 6.2.3 trae varias características avanzadas destinadas a acelerar el desarrollo de la IA:

  • Soporte de Llama 3 a través de vLLM: Esta característica ofrece un rendimiento de inferencia excepcional en las GPU Radeon con el modelo Llama 3 70BQ4.
  • Integración de Flash Atención 2: Diseñada para optimizar el uso de la memoria y mejorar la velocidad de inferencia, esta función admite la activación directa.
  • Soporte de transmisión estable 2.1: Los desarrolladores ahora pueden integrar modelos de conversión de texto a imagen SD en sus aplicaciones de IA.
  • Soporte beta para el marco Triton: Esto permite a los desarrolladores escribir código de IA de alto rendimiento con una experiencia mínima y utilizando hardware AMD de manera eficiente.

Avances en el desarrollo de la IA

Erik Hultgren, gerente de productos de software de AMD, destacó que ROCm 6.2.3 apunta a características específicas para acelerar el desarrollo de la IA generativa. El lanzamiento incluye mejoras de rendimiento de nivel empresarial para la inferencia del modelo de lenguaje grande (LLM) a través de vLLM y Flash Attention 2. También presenta soporte beta para el marco Triton, ampliando el alcance del desarrollo de IA en hardware AMD.

Evolución del soporte ROCm

El soporte ROCm de AMD para las GPU Radeon ha evolucionado significativamente durante el año pasado, comenzando con la versión 5.7. La versión 6.0 amplió las capacidades al incorporar el tiempo de ejecución ONNX y calificar formalmente más GPU Radeon, incluida la Radeon PRO W7800. La actualización 6.1 marcó otro hito con soporte para configuración de múltiples GPU e integración con el marco TensorFlow.

Con la versión actual, ROCm 6.2.3 continúa enfocándose en los sistemas Linux®, con planes de introducir pronto soporte para el subsistema Windows® para Linux® (WSL 2). Este enfoque estratégico tiene como objetivo mejorar aún más la pila de soluciones ROCm para GPU Radeon, posicionándola como una opción sólida para el desarrollo de inteligencia artificial y aprendizaje automático.

Para obtener más información y recursos, visite el sitio web oficial de AMD. pagina de la comunidad.

Fuente de la imagen: Shutterstock