Minutowy rekord prędkości nauki modelu AI

Minutowy rekord prędkości nauki modelu AI
Mniej niż cztery minuty zajęło szkolenie modelu sztucznej inteligencji superkomputerowi NVIDIA Eos, napędzanemu przez aż 10752 procesory graficzne NVIDIA H100 Tensor Core i sieć NVIDIA Quantum-2 InfiniBand. To rekord w testach porównawczych określanych jako MLPerf bazujących na GPT-3. Dokładny czas szkolenia AI to 3,9 minuty.

Ten rekordowy wynik został osiągnięty przy użyciu największej liczby akceleratorów kiedykolwiek użytych w testach MLPerf. W tej rundzie NVIDIA ustanowiła w sumie kilka nowych rekordów. Oprócz dokonania znaczących postępów w dziedzinie generatywnej sztucznej inteligencji, układy GPU H100 były 1,6 razy szybsze niż w poprzedniej rundzie trenowania modeli rekomendacyjnych.

Ta znacząca poprawa w stosunku do poprzedniego rekordu pokazuje potencjał skrócenia czasu szkolenia, co może obniżyć koszty, zaoszczędzić energię i przyspieszyć rozwój systemów. Benchmarki MLPerf otrzymały szerokie wsparcie zarówno ze strony branży, jak i środowiska akademickiego. Wśród wspierających są m.in. Amazon, ARM, Baidu, Google, Harvard, HPE, Intel, Lenovo, Meta, Microsoft, NVIDIA, uniwersytety Stanforda i Toronto.

Źródło: geeky-gadgets.com, Fot. NVIDIA

Mirosław Usidus