octubre 23, 2025
Tecnología

Oracle presenta OCI Zettascale10, el clúster de infraestructura en la nube de próxima generación para IA – Reporte Tico

  • octubre 23, 2025
  • 0

San José, 23 de octubre (elmundo.cr) – Oráculo anunciado Infraestructura de nube de Oracle (OCI) Zettascale10, la supercomputadora de IA más grande en la nube. OCI Zettascale10 conecta

Oracle presenta OCI Zettascale10, el clúster de infraestructura en la nube de próxima generación para IA

 – Reporte Tico

San José, 23 de octubre (elmundo.cr) – Oráculo anunciado Infraestructura de nube de Oracle (OCI) Zettascale10, la supercomputadora de IA más grande en la nube. OCI Zettascale10 conecta cientos de miles de GPU NVIDIA en múltiples centros de datos en clústeres de varios gigavatios que ofrecen hasta 16 ZettaFLOPS de máximo rendimiento. OCI Zettascale10 es la base de soporte para el supercúmulo emblemático construido en colaboración con OpenAI en Abilene, Texas, como parte de Stargate. OCI Zettascale10 se basa en la arquitectura de red Oracle Acceleron RoCE de próxima generación y funciona con la infraestructura de IA de NVIDIA que ofrece una escalabilidad innovadora, latencia ultrabaja entre las GPU dentro del clúster, precio/rendimiento líder en la industria, mayor utilización del clúster y la confiabilidad necesaria para cargas de trabajo de IA a gran escala.

OCI Zettascale10 es una poderosa evolución del primer clúster de computación en la nube Zettascale, lanzado en septiembre de 2024. Los clústeres OCI Zettascale10 están alojados en grandes campus de centros de datos de gigavatios que están hiperoptimizados para la densidad dentro de un radio de dos kilómetros para ofrecer la mejor latencia de GPU en cargas de trabajo de entrenamiento de IA a gran escala. Esta arquitectura se implementará utilizando OpenAI en el sitio de Stargate en Abilene.

«Con OCI Zettascale10, estamos fusionando la innovadora arquitectura de red Oracle Acceleron RoCE de OCI con la infraestructura de IA de próxima generación de NVIDIA para ofrecer una capacidad de IA de varios gigavatios a una escala sin precedentes», afirmó Mahesh Thiagarajan, vicepresidente ejecutivo de Oracle Cloud Infrastructure. «Los clientes pueden construir, entrenar y poner en producción sus modelos de IA más grandes con menos energía por unidad de potencia y alta confiabilidad. Además, los clientes tienen la libertad de trabajar en la nube distribuida de Oracle con estrictos controles de soberanía sobre los datos y la IA».

«La red y los tejidos del clúster OCI Zettascale10 se desarrollaron e implementaron originalmente en el sitio insignia de Stargate en Abilene, Texas, nuestro supercúmulo compartido con Oracle», dijo Peter Hoeschele, vicepresidente de infraestructura y computación industrial de OpenAI. «El diseño personalizado y altamente escalable de RoCE maximiza el rendimiento total de la estructura en el rango de gigavatios y centra la mayor parte de la energía en la computación. Esperamos continuar ampliando Abilene y el programa global Stargate juntos».

OCI planea ofrecer implementaciones de varios gigavatios de OCI Zettascale10 a sus clientes. Inicialmente, los clústeres OCI Zettascale10 apuntan a la implementación de hasta 800.000 GPU NVIDIA, proporcionando un rendimiento predecible y una alta rentabilidad con un alto ancho de banda de GPU a GPU habilitado por la red RoCEv2 de latencia ultrabaja de Oracle Acceleron.

«Oracle y NVIDIA combinan la nube distribuida de OCI y nuestra infraestructura de IA de pila completa para ofrecer IA a una escala extraordinaria», afirmó Ian Buck, vicepresidente de hiperescala de NVIDIA. «Con la infraestructura de IA de pila completa de NVIDIA, OCI Zettascale10 proporciona el tejido informático necesario para avanzar en la investigación de IA de vanguardia y ayudar a las empresas a pasar de la experimentación a la IA industrializada».

La red Oracle Acceleron RoCE proporciona escalabilidad, confiabilidad y eficiencia para la IA en OCI Zettascale10

La arquitectura de red Oracle Acceleron RoCE es una innovación crítica para que los clientes creen, entrenen e infieran cargas de trabajo de IA en la nube mientras aprovechan al máximo el poder y las capacidades de OCI Zettascale10. Aprovecha la funcionalidad de conmutación integrada en las GPU NIC (tarjetas de interfaz de red) modernas, lo que permite la conexión simultánea a múltiples conmutadores, cada uno en una capa de red separada y aislada. Este enfoque aumenta significativamente la escala general y la confiabilidad de la red al desviar el tráfico a otras capas de la red cuando ocurren problemas, evitando así costosas fallas y reinicios. Las características clave de la red Oracle Acceleron RoCE que ayudan a los clientes con sus cargas de trabajo críticas de IA incluyen:

  • Tejido ancho, plano y elástico: Permite a los clientes implementar clústeres de IA más grandes rápidamente y a un costo general más bajo utilizando la NIC de GPU como un miniconmutador y conectándose a múltiples capas aisladas física y lógicamente. Esto aumenta la escala al tiempo que reduce la capa de red, el costo y el consumo de energía.
  • Mayor confiabilidad: Ayuda a los clientes a mantener la estabilidad laboral de la IA al eliminar el intercambio de datos entre aeronaves. Esto desvía el tráfico lejos de aeronaves inestables o sobrecargadas, mantiene el entrenamiento en marcha y evita reinicios costosos en los puntos de control.
  • Rendimiento constante: Proporciona a los clientes una latencia de GPU a GPU más consistente, eliminando una capa en comparación con los diseños tradicionales de tres niveles y mejorando la previsibilidad para el entrenamiento e inferencia de IA a gran escala.
  • Óptica energéticamente eficiente: Respalde las cargas de los clientes con ópticas lineales conectables (LPO) y ópticas de receptor lineal (LRO) para reducir los costos de red y enfriamiento sin afectar el rendimiento de 400G/800G. Esto permite a los clientes gastar una mayor parte de su presupuesto energético en el procesamiento de datos.
  • Flexibilidad operativa: Permite a los clientes reducir el tiempo de inactividad y acelerar la entrega de nuevas funciones mediante mantenimiento a nivel de plano y actualizaciones independientes del sistema operativo de red.
  • OCI ya está aceptando pedidos para OCI Zettascale10, que estará disponible en la segunda mitad del próximo año calendario con hasta 800.000 plataformas GPU NVIDIA AI Infrastructure.