Microsoft ha anunciado que ha conectado enormes centros de datos en Wisconsin y Atlanta a través de una red de fibra óptica de alta velocidad, creando lo que describe como la primera “superfábrica de IA a escala planetaria”. Este sistema une los dos sitios —separados por casi 700 millas y cinco estados— para funcionar como un único complejo de computación diseñado especialmente para inteligencia artificial.
A diferencia de los centros de datos tradicionales que alojan millones de aplicaciones diferentes, Microsoft explicó que estas nuevas instalaciones están creadas para manejar un solo trabajo de IA a gran escala que puede estar distribuido en varios lugares. Cada centro contiene cientos de miles de GPU Nvidia conectadas por una arquitectura de red de alta velocidad llamada AI Wide Area Network (AI-WAN), lo que permite compartir tareas de procesamiento en tiempo real.
La compañía también está introduciendo un diseño de centro de datos de dos pisos que permite colocar más GPU en menos espacio y reducir la latencia, junto con un sistema de refrigeración líquida en circuito cerrado para controlar el calor y el uso de energía.
Al conectar centros de datos en regiones distintas, Microsoft afirma que puede equilibrar dinámicamente las cargas de trabajo, unir capacidades de computación y distribuir la enorme demanda de energía a través de la red eléctrica, reduciendo la dependencia de una sola ubicación.
El sistema combinado se utilizará para entrenar y ejecutar la próxima generación de modelos de IA para socios como OpenAI, la empresa francesa Mistral AI y la xAI de Elon Musk, además de los modelos propios de Microsoft. La iniciativa muestra el rápido crecimiento de la inversión en infraestructura de IA entre las grandes compañías tecnológicas. Microsoft gastó más de 34.000 millones de dólares en inversiones el último trimestre, gran parte para centros de datos y GPU, como parte de su estrategia a largo plazo para responder a la creciente demanda de inteligencia artificial.
Mensaje del CEO de Microsoft, Satya Nadella
“Hoy anunciamos nuestro nuevo centro de datos Fairwater en Atlanta, conectado con nuestro primer sitio Fairwater en Wisconsin y con nuestra red más amplia de Azure, para crear la primera superfábrica de IA del mundo.
Fairwater representa nuestra visión de una flota flexible: infraestructura que puede servir cualquier tipo de trabajo, en cualquier lugar, usando aceleradores y redes diseñados especialmente para ofrecer máximo rendimiento y eficiencia.
Los trabajos de IA ya no se limitan al preentrenamiento a gran escala. Ahora incluyen ajuste fino, aprendizaje por refuerzo (RL), generación de datos sintéticos, evaluaciones y más. Fairwater está construido para apoyar todo este ciclo de vida:
Máxima densidad: el diseño de dos pisos y el sistema de refrigeración líquida permiten colocar los racks en tres dimensiones y llenarlos con GPU de forma muy densa, reduciendo los cables y mejorando la latencia y el ancho de banda útil.
Flota: cada centro Fairwater puede integrar cientos de miles de las GPU Nvidia más recientes en un único clúster coherente. Esto ofrece una infraestructura flexible que soporta todo tipo de cargas de trabajo y evita que las GPU queden inactivas sin necesidad.
Y esto se suma a los más de 100.000 GB300 que entran en funcionamiento este trimestre solo para tareas de inferencia en el resto de nuestra flota. Para nosotros, se trata de convertir cada gigavatio en el máximo número de tokens útiles. ¡No todos los gigavatios son iguales!
Escala planetaria: cada centro Fairwater se conectará a través de nuestra red AI-WAN, que cubre el continente, con generaciones anteriores de supercomputadoras de IA, formando un conjunto realmente flexible de capacidad de cómputo. Esto permite a los desarrolladores escalar más allá de un solo sitio y asignar cargas de trabajo dinámicamente a la infraestructura correcta.
Estas innovaciones nos permiten unir diferentes generaciones de hardware y sistemas de IA en centros de datos y regiones en un solo sistema elástico que escala sin interrupciones tanto para entrenamiento como para inferencia.
Y esta capacidad elástica de IA está disponible junto con todos los demás servicios de la nube (computación, almacenamiento, bases de datos, servicios de aplicaciones) que los agentes de IA y las cargas de trabajo necesitan.
Esto es lo que queremos decir cuando hablamos de construir una flota flexible: una plataforma unificada que maximiza el rendimiento por vatio y por dólar.”
Amazon construye “Project Rainier”
Los competidores están tratando de mantenerse al ritmo. Amazon está desarrollando “Project Rainier”, un complejo de 1.200 acres con siete centros de datos en Indiana, mientras que Google, Meta, OpenAI y Anthropic están haciendo inversiones similares de miles de millones de dólares en infraestructura centrada en IA.
Algunos analistas advierten que esta escala de inversión podría parecerse a una burbuja tecnológica si las empresas no logran obtener valor real de la IA a corto plazo. Pero Microsoft y otras compañías aseguran que la demanda es sostenible, señalando contratos a largo plazo y una rápida adopción empresarial como prueba de que el auge de la IA está lejos de ser algo especulativo.
El fin del Artículo