AI-trainingsrack-schaaloplossingen

Technologie
GPGPU-HPC
Partner
One Stop Systems

GPultima CI & OSS Ampere8 is een rack-scale AI-trainingsoplossing voor organisaties die hoogwaardige infrastructuur nodig hebben voor geavanceerde modelontwikkeling. De oplossing combineert robuuste servernodes met GPU-uitbreidingschassis om grootschalige deep-learningtraining in datacenteromgevingen te ondersteunen. De composable architectuur maakt het mogelijk om GPU’s, opslag en netwerkresources dynamisch over workloads te verdelen voor een betere benutting en meer flexibiliteit.

Daardoor is het systeem zeer geschikt voor autonome systemen, defensie- en bewakingsanalyse, wetenschappelijk onderzoek en andere rekenintensieve toepassingen. Door AI-training te centraliseren vormt het platform een waardevolle aanvulling op robuuste edge- en mobiele implementaties waarop getrainde modellen later worden uitgerold. Het resultaat is een gestroomlijnde workflow van gegevensverzameling en modelontwikkeling tot validatie en inzet in het veld.

AI-trainingsrack-schaaloplossingen

Organisaties die geavanceerde AI-modellen willen trainen, hebben baat bij GPultima CI & OSS Ampere8: een gecombineerde rack-scale oplossing die specifiek is ontwikkeld voor intensieve AI-trainingsworkloads. Het platform integreert schaalbare serverinfrastructuur met krachtige GPU-uitbreiding en maakt zo gecentraliseerde deep-learningtraining op enorme datasets mogelijk.

Dankzij het composable ontwerp kunnen GPU’s, NVMe-opslag en netwerkresources dynamisch over applicaties worden verdeeld, zodat teams de infrastructuur eenvoudig kunnen aanpassen aan veranderende projecteisen. Daarmee is deze oplossing geschikt voor AI-ontwikkelpijplijnen die lopen van training in het datacenter tot uitrol op robuuste edge- of mobiele systemen.

Bereikfuncties

Een algemeen overzicht van wat dit bereik te bieden heeft

  • GPU-acceleratie met hoge dichtheid: Ondersteunt tot 48 NVIDIA GPU-accelerators per rack, met 8 GPU’s per OSS Ampere8-chassis voor grootschalige parallelle training.
  • Composable architectuur: Deelt GPU’s, NVMe-opslag en NIC-resources dynamisch tussen servers om de benutting en flexibiliteit van workloads te verbeteren.
  • PCIe Gen4-uitbreidingsfabric: Gebruikt een PCIe Gen4-interconnect met hoge bandbreedte en lage latentie, met een totale bandbreedte tot 512 Gbps voor snelle dataverplaatsing.
  • Geïntegreerde rack-scale oplossing: Combineert servers, GPU-uitbreidingschassis, netwerken en opslag in een vooraf geconfigureerd implementatiemodel.
  • Edge-to-core AI-workflow: Functioneert als centrale trainingshub voor modellen die later worden uitgerold op robuuste edge- en mobiele platforms.
  • Voorbereid op vermogen en koeling: Ontworpen voor dichte compute-omgevingen, met ondersteuning voor een hoog rackvermogen en continue werking.

Downloads

voor AI-trainingsrack-schaaloplossingen

pdf
GPultima CI Rack-Scale System – Datasheet
Downloaden

Wat zit er in dit assortiment?

Alle varianten in het assortiment en een vergelijking van wat ze bieden

SpecificationGPultima CI (Rack-Scale Cluster)OSS Ampere8 (GPU Expansion Chassis)

Form Factor

19-inch rack (42U), single or multi-rack configuration

4U chassis, rack-mountable

Compute Nodes (CPU)

Up to 32 × dual Intel Xeon Scalable nodes per rack

Uses external host server via dual x16 PCIe links, no CPU on board

GPU Capacity

Up to 48 NVIDIA data center GPUs per rack, scalable to 128+ with multi-rack

Up to 8 NVIDIA GPUs in one chassis

Storage

Up to 96 NVMe SSD drives per rack

No internal drives; storage provided by host server or external system

Networking

Up to 32 × 100 Gb InfiniBand/Ethernet NICs per rack

Supports up to 2 high-bandwidth NIC cards for optional data I/O

Interconnect Fabric

48-port PCIe Gen4 switch fabric for composable resource sharing

Dual PCIe 4.0 x16 host interfaces with 512 Gbps total bandwidth

GPU-to-GPU Links

NVLink/NVSwitch supported depending on GPU integration

NVIDIA NVLink 3rd Gen between GPUs with up to 600 GB/s communication

Power Supply

Rack power distribution supports up to ~52 kW

4000 W redundant power supply built in

Management Software

Composable infrastructure management with API and GUI control

Managed as part of the GPultima cluster or via the host system

Veelgestelde vragen

voor AI-trainingsrack-schaaloplossingen

Een rack-scale AI-trainingssysteem is een high-performance computingplatform dat servers, GPU’s, opslag en netwerkvoorzieningen binnen een volledig rack samenbrengt tot één uniform trainingscluster. Het wordt ingezet wanneer AI-workloads meer rekenkracht, geheugen en doorvoercapaciteit vereisen dan één enkele server kan leveren. Deze architectuur helpt de trainingstijd te verkorten, ondersteunt grotere datasets en vergroot de experimenteerruimte voor veeleisende deep-learningprojecten.

GPultima CI maakt gebruik van een composable architectuur waarbij GPU’s, NVMe-opslag en netwerkresources worden gepoold in plaats van permanent aan één server te zijn gekoppeld. Via een snelle PCIe-fabric en beheersoftware kunnen resources dynamisch worden toegewezen aan de servers die ze voor een bepaalde workload nodig hebben. Dat verbetert de benutting, vereenvoudigt herconfiguratie en maakt het mogelijk de hardware af te stemmen op veranderende trainingseisen zonder fysieke herbekabeling.

Het platform is ontworpen voor high-performance datacentercomponenten. GPultima CI ondersteunt tot 48 NVIDIA GPU’s in één rack en servernodes op basis van dual Intel Xeon Scalable-processors. OSS Ampere8 is ontworpen voor PCIe-GPU’s van de NVIDIA Ampere-generatie, zoals de A100, en wordt aangesloten op compatibele hostservers met PCIe Gen4-ondersteuning.

OSS Ampere8 wordt via dubbele x16 PCIe Gen4-links met een hostserver verbonden met behulp van de juiste hostinterface-adapter. Zodra de verbinding tot stand is gebracht, heeft de hostserver toegang tot de GPU’s in het chassis alsof ze lokaal zijn geïnstalleerd. Dit zorgt voor een zeer hoge totale bandbreedte en helpt I/O-knelpunten tijdens GPU-intensieve AI-workloads te voorkomen.

Het systeem biedt een gecentraliseerde trainingsomgeving voor AI-modellen die later draaien op robuuste edge- of mobiele platforms. Gegevens die in het veld worden verzameld, kunnen worden gebruikt om modellen in het datacenter te trainen of te verfijnen, waar veel meer rekenkracht beschikbaar is. Bijgewerkte modellen kunnen daarna weer naar de edge worden uitgerold, wat een praktische workflow oplevert voor continue verbetering van AI.

Ja. De architectuur is modulair en ontworpen om mee te groeien. Organisaties kunnen beginnen met een kleinere configuratie en later extra GPU-uitbreidingschassis, meer servernodes, aanvullende opslag of zelfs meerdere onderling verbonden racks toevoegen. Ook upgrades van GPU’s en opslag zijn mogelijk, mits wordt voldaan aan de eisen voor vermogen, koeling en compatibiliteit.

Deze systemen gebruiken doorgaans software voor clusterbeheer en composable infrastructuur om hardwarebronnen toe te wijzen en de omgeving te bewaken. Aan de AI-zijde ondersteunen ze standaard besturingssystemen en veelgebruikte frameworks zoals PyTorch en TensorFlow, samen met NVIDIA CUDA en driverstacks. Ook gedistribueerde trainingstools en job schedulers kunnen worden ingezet om workloads over meerdere servers en GPU’s te orkestreren.

Een volledig geconfigureerd GPultima CI-rack vraagt om substantiële facilitaire ondersteuning voor zowel stroomvoorziening als koeling. Afhankelijk van de configuratie kan het rackvermogen zeer hoog zijn, waardoor geschikte PDU’s, elektrische voedingen en een goede planning van de luchtstroom essentieel zijn. Deze systemen worden doorgaans ingezet in datacenteromgevingen of gespecialiseerde high-density computerruimtes die continue werking onder zware belasting ondersteunen.