Datum zveřejnění: 
30. 5. 2019

Další z českých univerzit se může pochlubit superpočítačem. Cluster, který vznikl v rámci Výzkumného centra informatiky (RCI) pražského ČVUT, bude sloužit zejména pro výzkum a projekty související s umělou inteligencí.

REPORTÁŽ VÝZKUM UMĚLÉ INTELIGENCE

Nový superpočítač představilo RCI v polovině dubna. Samotné RCI pak vzniklo jako výsledek spolupráce Fakulty elektrotechnické a Fakulty informačních technologií ČVUT. "RCI je projekt fungující napříč fakultami a má za úkol propojit všechny možné vědce z různých výzkumných skupin. Jsou to například grafici, experti na počítačové vidění, robotici nebo teoretičtí informatici. Pořídit superpočítač bylo jedním ze způsobů, jak jejich spolupráci prohloubit," vysvětluje Daniel Večerka, který působí na Katedře kybernetiky FEL ČVUT jako IT administrátor. Superpočítač Výzkumného centra informatiky pomohl navrhnout a nyní ho spravuje.

Sjednocení kapacity

ČVUT tak vyřešilo jeden z palčivých problémů dnešních vysokých škol, a to vlastní nedostatečnou výpočetní kapacitu.

"Dnes pokud připravujeme na nějakou konferenci odborný článek, je potřeba to mít podložené konkrétním výpočtem. Dřív to bylo samozřejmě nákladné. Kapacity jsme si různě pronajímali, nebo jednotlivé skupiny měly svá menší řešení," upozorňuje Martin Samek, který vede na ČVUT FEL Středisko výpočetní techniky a informatiky a pracuje na Katedře řídící techniky.

V rámci RCI pak dohlížel a koordinoval instalaci superpočítače a s ním spojených technologií.

Akademici se tak rozhodli investovat téměř 42 milionů korun a zakoupit za ně výpočetní cluster, který je v současnosti nejvýkonnějším superpočítačem určeným pro výzkum umělé inteligence v ČR. Vznikat na něm budou projekty související například s plánováním dopravy, bioinformatikou, problematikou velkých dat, kyberbezpečností nebo počítačovou grafikou.

Cluster je složen z 20 CPU výpočetních uzlů Gigabyte s procesory Intel Xeon Gold (celkem 480 procesorových jader), 12 Nvidia GPU výpočetních uzlů Supermicro, jednoho uzlu Lenovo ThinkSystem SR950 s velkým počtem CPU jader a sdílenou pamětí (192 procesorových jader, 1,5 TB operační paměti), vysokorychlostní propojovací sítí Infiniband EDR (100Gb/s), rychlých NVMe SSD disků Western Digital a sdíleného škálovatelného diskového pole DELL EMC Isilon.

"Nejzásadnější pro využití zařízení pro umělou inteligenci ale bylo zapojení grafických karet. Každý GPU uzel je osazený čtyřmi akcelerátory Nvidia V100 Tensor Core GPU čili celkem těmito 48 kartami. Tato grafika v současnosti představuje nejvýkonnější akcelerátor pro takzvaný high performance computing a umělou inteligenci. Celkový instalovaný výkon přes šest PetaFLOPS dělá z instalace na ČVUT aktuálně nejvýkonnější superpočítač pro AI aplikace v České republice," podotýká Večerka. S tímto výkonem mohou vědci z RCI v plné šíři provádět základní výzkum metod hlubokého učení.

Nejvíc grafik v ČR

Právě počtem grafických karet překonává pražský superpočítač i ostravský cluster. "Výkonem se s ním srovnávat nemůžeme. Ostravský počítač je určený mimo jiné třeba chemikům a biologům pracujícím s obrovským počtem dat, který potřebují zpracovat hrubou silou. Na druhou stranu, to je v dnešní době možné i prostřednictvím algoritmizace za pomoci grafických karet," uvádí Večerka.

Nový cluster nevznikal někde na zeleném poli, jak by se možná pro podobný projekt nabízelo. Superpočítač se nachází v podzemí historické budovy Fakulty elektrotechnické ČVUT na Karlově náměstí. "Prostory pro něj vznikly úpravou staré serverovny. Museli jsme zajistit dostatečné chlazení, které funguje prostřednictvím speciálních jednotek vyvedených na dvůr budovy, a také dostatečný příkon. Ale mít superpočítač v centru staré Prahy je prostě krásné," vysvětluje Samek. Energetická náročnost projektu bude podle něj znát i na celkové spotřebě budovy. "V některých okamžicích běží cluster na plný výkon a dosahujeme spotřeby kolem 20 kW, zhruba 8 kW pak sebere i chlazení," doplňuje.

Výpadek až 100 minut

Napájení tak probíhá prostřednictvím vysokokapacitních UPS. "Tim, jak se o projektu hovořilo už několik let nazpátek, mohli jsme se na něj postupně připravovat. Paralelně jsme zapojili nový přívodní kabel z rozvodny, vznikla také nová akumulátorovna," vypočítává Samek.

V případě neplánovaného výpadku proudu akumulátory a UPS poskytnou zhruba 100 minut času, kdy počítač bez problémů poběží. "V areálu není dieselagregát, ale pokud by šlo o výpadek plánovaný, není problém jej přistavit. Jinak holt budeme muset zařízení vypnout. Ale nejde o nic tragického, nejsme banka. Prostě by se chvíli nepočítalo," říká Večerka.

Instalace samotného clusteru podle Samka proběhla v poměrně šibeničním termínu. "Od podepsání smlouvy na to měla dodavatelská firma M Computers asi šest týdnů. Například klimatizační jednotky byly vyráběny speciálně v Itálii, nebylo to tak nic snadného. Naštěstí se vše včas stihlo," popisuje.

Přístup pro všechny

Přístup k výpočetní kapacitě je řešený přes webové rozhraní, využívat superpočítač je tak možné odkudkoli. "Přístup je povolován přes registrační formulář, každou žádost posuzujeme individuálně. Našim zájmem ale je, aby počítač používalo co nejvíce vědců a studentů. Bude to de facto fungovat jako cloud," vysvětluje Večerka. S případným komerčním využitím se však nepočítá.

Začátkem května měl superpočítač registrovaných zhruba 120 uživatelů, z nichž byla aktivní asi dvacítka. "Lidé si cluster v současnosti spíš zatím jen oťukávají. Běží na něm třeba různé benchmarky a podobně. Ale grafické karty už několikrát běžely na plný výkon," uvádí Večerka.

RCI do budoucna počítá s dalším rozšiřováním clusteru. "Budou se dokupovat nové uzly, a jak morálně zastarají ty staré, tak se vymění. Jejich morální životnost je pět let. Zhruba v roce 2022 nás čeká velký upgrade, při kterém počítáme s přibližně polovičními náklady oproti tomu, kolik stálo samotné zřízení superpočítače. Vyjde nás asi na dvaadvacet milionů korun," dodává Samek.        

Našim zájmem je, aby počítač používalo co nejvíce vědců a studentů. Bude de facto fungovat jako cloud Nejzásadnější pro využití zařízení pro umělou inteligenci bylo zapojení grafických karet        

Autor: 
Jan Spěšný
Zdroj: 
Computer