El despliegue del servicio de telemetría provocó una interrupción de 3 horas

Abierto AI dijo que el lanzamiento de un nuevo servicio de telemetría provocó una interrupción de tres horas de todos sus servicios el miércoles (11 de diciembre).

La empresa ChatGPT, API Y sora Los servicios estuvieron degradados o no estuvieron disponibles desde las 3:16 p.m. hasta las 7:38 p.m., hora del Pacífico, dijo OpenAI en un comunicado. informe de incidente.

El incidente se debió a que el nuevo servicio de telemetría sobrecargó el plano de control de Kubernetes y provocó interrupciones en cascada en los sistemas críticos de la empresa.según el informe.

“Este evento fue el resultado de un cambio interno para implementar nueva telemetría en toda nuestra flota y no fue causado por un incidente de seguridad o lanzamiento reciente”, dijo la compañía en el informe.

Según el informe, OpenAI implementó el nuevo servicio de telemetría para mejorar la confiabilidad, ya que el servicio recopilaría métricas detalladas del plano de control de Kubernetes y mejoraría la visibilidad de la empresa sobre el estado de sus sistemas.

Cuatro minutos después el servicio de telemetría ha sido implementadoLa interrupción se produjo porque provocó la ejecución de operaciones API de Kubernetes que consumían muchos recursos y que abrumaron los servidores API de Kubernetes y destruyeron el plano de control de Kubernetes en la mayoría de los grandes clústeres de OpenAI, según el informe.

OpenAI detectó e identificó el problema en cuestión de minutos y comenzó a solucionarlo, según el informe.

La compañía está implementando y priorizando varias medidas para prevenir incidentes similares, incluidas implementaciones graduales mejoradas con un mejor monitoreo de los cambios de infraestructura.según el informe.

“Pedimos disculpas por el impacto que este incidente ha causado en todos nuestros clientes, desde usuarios de ChatGPT hasta desarrolladores y empresas que dependen de productos OpenAI”, dice el informe. “No cumplimos con nuestras propias expectativas”.

OpenAI experimentó tres horas descomponer de todos los servicios relacionados con ChatGPT en junio y un breve pero “importante” descomponer de ChatGPT dos días después del anuncio de alto perfil de una nueva tienda en noviembre de 2023.

La compañía anunció el 4 de diciembre que ChatGPT ahora tiene 300 millones. usuarios activos semanalesque se envían mil millones de mensajes de usuarios en el chatbot de inteligencia artificial cada día y que 1,3 millones de desarrolladores han desarrollado OpenAI en Estados Unidos.

ha sido reportado El 30 de noviembre, OpenAI aspira a alcanzar los mil millones usuarios durante el próximo año.

Para toda la cobertura de PYMNTS AI, suscríbase diariamente Boletín de IA.

Exit mobile version