H3C UniServer G6 ir HPE Gen11 serijos: pagrindinis H3C grupės AI serverių leidimas

Sparčiai augant AI programoms, kurioms vadovauja tokie modeliai kaip „ChatGPT“, skaičiavimo galios paklausa išaugo. Siekdama patenkinti didėjančius dirbtinio intelekto eros skaičiavimo poreikius, H3C grupė, priklausanti Tsinghua Unigroup skėčiui, neseniai 2023 m. NAVIGATE lyderių susitikime pristatė 11 naujų H3C UniServer G6 ir HPE Gen11 produktų. Šie nauji serverio produktai sukuria išsamią DI matricą įvairiuose scenarijuose, suteikdami galingą pagrindinę platformą, skirtą masiniams duomenims ir modelių algoritmams tvarkyti, ir užtikrinti pakankamai AI skaičiavimo išteklių.

Įvairi produktų matrica, skirta įvairiems AI skaičiavimo poreikiams patenkinti

Būdama išmaniųjų kompiuterių lyderė, „H3C Group“ daugelį metų aktyviai dirba dirbtinio intelekto srityje. 2022 m. H3C pasiekė didžiausią augimo tempą Kinijos pagreitinto skaičiavimo rinkoje ir iš viso surinko 132 pirmuosius pasaulyje reitingus tarptautiniu mastu pripažintame AI etalone MLPerf, pademonstruodama savo stiprią techninę patirtį ir galimybes.

Išnaudodama pažangią skaičiavimo architektūrą ir pažangias skaičiavimo galios valdymo galimybes, pagrįstas intelektualaus skaičiavimo pagrindu, H3C sukūrė pažangiojo skaičiavimo flagmaną H3C UniServer R5500 G6, specialiai sukurtą didelio masto modelių mokymui. Jie taip pat pristatė „H3C UniServer R5300 G6“ – hibridinį skaičiavimo variklį, tinkantį didelio masto išvadų/mokymo scenarijams. Šie produktai taip pat atitinka įvairius skaičiavimo reikalavimus pagal skirtingus AI scenarijus ir suteikia visapusišką AI skaičiavimo aprėptį.

Išmaniojo skaičiavimo flagmanas, skirtas didelio masto modelių mokymui

H3C UniServer R5500 G6 suderina stiprumą, mažas energijos sąnaudas ir intelektą. Palyginti su ankstesne karta, jis siūlo tris kartus didesnę skaičiavimo galią, sumažindamas treniruočių laiką 70% GPT-4 didelio masto modelio mokymo scenarijuose. Jis taikomas įvairiems AI verslo scenarijams, pvz., didelio masto mokymams, kalbos atpažinimui, vaizdų klasifikavimui ir mašininiam vertimui.

Stiprumas: R5500 G6 palaiko iki 96 procesoriaus branduolių, todėl branduolio našumas padidėja 150%. Jame yra naujas NVIDIA HGX H800 8 GPU modulis, suteikiantis 32 PFLOPS skaičiavimo galios, todėl 9 kartus pagerėjo didelio masto modelio AI mokymo greitis ir 30 kartų pagerėjo didelio masto modelio AI išvadų našumas. Be to, naudodamiesi PCIe 5.0 ir 400G tinklų palaikymu, vartotojai gali diegti didesnio našumo AI skaičiavimo grupes, paspartindamos AI priėmimą ir pritaikymą įmonėse.

Intelektas: R5500 G6 palaiko dvi topologijos konfigūracijas, sumaniai prisitaikydamas prie įvairių AI programų scenarijų ir paspartindamas gilaus mokymosi bei mokslinio skaičiavimo programas, žymiai pagerindamas GPU išteklių panaudojimą. Dėl H800 modulio kelių egzempliorių GPU funkcijos, vieną H800 galima padalyti į 7 GPU egzempliorius su galimybe iki 56 GPU egzempliorių, kurių kiekvienas turi nepriklausomus skaičiavimo ir atminties išteklius. Tai žymiai padidina AI išteklių lankstumą.

Mažas anglies dioksido kiekis: R5500 G6 visiškai palaiko aušinimą skysčiu, įskaitant ir procesoriaus, ir GPU aušinimą skysčiu. Kai PUE (Power Usage Effectiveness) yra mažesnis nei 1,1, jis įgalina „šaunų skaičiavimą“ esant skaičiavimo bangoms.

Verta paminėti, kad R5500 G6 buvo pripažintas vienu iš 10 geriausių 2023 m. puikių didelio našumo serverių 2023 m. skaičiavimo našumo reitinge.

Hibridinis skaičiavimo variklis, skirtas lanksčiam mokymo ir išvadų poreikių atitikimui

H3C UniServer R5300 G6, kaip naujos kartos AI serveris, siūlo reikšmingus procesoriaus ir GPU specifikacijų patobulinimus, palyginti su jo pirmtaku. Jis pasižymi išskirtiniu našumu, išmaniąja topologija ir integruotomis skaičiavimo bei saugojimo galimybėmis, todėl tinka gilaus mokymosi modelio mokymui, gilaus mokymosi išvadoms ir kitiems AI programų scenarijams, lanksčiai derinant mokymo ir išvadų skaičiavimo poreikius.

Išskirtinis našumas: R5300 G6 yra suderinamas su naujausios kartos NVIDIA įmonės lygio GPU, todėl našumas yra 4,85 karto geresnis, palyginti su ankstesne karta. Jis palaiko įvairių tipų dirbtinio intelekto spartinimo korteles, pvz., GPU, DPU ir NPU, kad atitiktų nevienalyčius AI skaičiavimo galios reikalavimus įvairiuose scenarijuose ir suteiktų intelekto erą.

Išmanioji topologija: R5300 G6 siūlo penkis GPU topologijos nustatymus, įskaitant HPC, lygiagrečią AI, nuoseklųjį AI, 4 kortelių tiesioginę prieigą ir 8 kortelių tiesioginę prieigą. Šis precedento neturintis lankstumas labai padidina prisitaikymą prie skirtingų vartotojų programų scenarijų, sumaniai paskirsto išteklius ir skatina efektyvų skaičiavimo galią.

Integruotas skaičiavimas ir saugykla: R5300 G6 lanksčiai talpina dirbtinio intelekto pagreičio korteles ir išmaniuosius NIC, derindamas mokymo ir išvadų galimybes. Jis palaiko iki 10 dvigubo pločio GPU ir 24 LFF (Large Form Factor) standžiojo disko lizdus, ​​leidžiančius vienu metu treniruotis ir daryti išvadas viename serveryje ir suteikia ekonomiškai efektyvų skaičiavimo variklį, skirtą kūrimo ir testavimo aplinkoms. Iki 400 TB saugojimo talpa visiškai atitinka AI duomenų saugojimo vietos reikalavimus.

Vykstant AI bumui, skaičiavimo galia nuolat keičiama ir susiduriama su iššūkiais. Naujos kartos dirbtinio intelekto serverių išleidimas žymi dar vieną etapą H3C Group įsipareigojime naudoti „įgimtą intelekto“ technologiją ir nuolatinį intelektualaus skaičiavimo evoliuciją.

Žvelgdama į ateitį, vadovaudamasi „Cloud-Native Intelligence“ strategija, „H3C Group“ laikosi „kruopštaus pragmatizmo, suteikiančio erai intelekto“ koncepcijos. Jie ir toliau dirbs derlingą išmaniojo skaičiavimo dirvą, tyrinės gilaus lygio AI taikymo scenarijus ir paspartins išmaniojo pasaulio su ateičiai paruošta, pritaikoma skaičiavimo galia atsiradimą.


Paskelbimo laikas: 2023-04-04