Petaflop w plecaku – lokalne modele 120B na nowym superchipie NVIDII

Petaflop w plecaku – lokalne modele 120B na nowym superchipie NVIDII
NVIDIA zaprezentowała superchip RTX Spark, który pozwala na lokalne uruchamianie największych modeli AI na laptopach, oferując wydajność 1 petaflopa i 128 GB zunifikowanej pamięci.

Podczas konferencji NVIDIA GTC w Tajpej, 31 maja 2026 roku, Jensen Huang zaprezentował superchip RTX Spark, będący owocem współpracy z inżynierami Microsoftu i MediaTek. W demonstracyjnej obudowie laptopa o grubości zaledwie 14 mm uruchomiono model językowy o skali 120 miliardów parametrów, wykonujący złożone zadania analityczne w czasie rzeczywistym bez dostępu do sieci. Pokaz ten wyznaczył moment przejścia zaawansowanych agentów sztucznej inteligencji z potężnych, odległych serwerowni do urządzeń osobistych.

Fundamentem nowej architektury jest integracja 20-rdzeniowego procesora NVIDIA Grace, opartego na architekturze Arm, z układem graficznym Blackwell RTX. Ten ostatni wyposażono w 6144 rdzenie CUDA oraz rdzenie Tensor piątej generacji, pracujące w precyzji FP4. Klucz do przełamania barier wydajnościowych stanowi 128 GB zunifikowanej pamięci LPDDR5X, która eliminuje tradycyjne wąskie gardło w postaci transferu danych między systemową pamięcią RAM a pamięcią wideo (VRAM). Rozwiązanie to pozwala na osiągnięcie mocy obliczeniowej na poziomie 1 petaflopa, co wystarcza do obsługi okna kontekstowego o wielkości miliona tokenów. Inżynierowie, w tym Georgi Gerganov odpowiedzialny za optymalizację bibliotek llama.cpp, dostosowali narzędzia programistyczne tak, aby w pełni wykorzystywały stos technologiczny CUDA i TensorRT. W efekcie laptopy o wadze około 1,36 kg umożliwiają lokalne generowanie wideo 4K oraz renderowanie scen 3D o objętości przekraczającej 90 GB w profesjonalnych programach Adobe czy Octane, oferując przy tym całodniowy czas pracy na zasilaniu akumulatorowym.

Przeniesienie możliwości klasy centrum danych do urządzeń przenośnych rozwiązuje kluczowe problemy opóźnień przesyłu danych oraz wysokich kosztów subskrypcji chmurowych. Użytkownicy zyskują pełną kontrolę nad prywatnością, ponieważ agenci AI, tacy jak OpenClaw czy Hermes Agent, przetwarzają wrażliwe pliki i wykonują operacje wewnątrz systemu Windows bez wysyłania informacji na zewnętrzne serwery. Stanowi to istotne rozwinięcie koncepcji komputerów wyposażonych w jednostki NPU, oferując przepustowość niezbędną dla największych modeli frontierowych, dotychczas zarezerwowanych dla klastrów obliczeniowych.

Pierwsze komercyjne modele laptopów i kompaktowych desktopów od partnerów sprzętowych, takich jak ASUS, Dell, HP, Lenovo oraz MSI, trafią do sprzedaży jesienią 2026 roku. Kolejnym etapem będzie pełna adaptacja standardów Microsoft i NVIDIA OpenShell przez dostawców oprogramowania, co ostatecznie przekształci komputery osobiste w autonomiczne stacje robocze oparte na natywnych, lokalnych agentach AI.

Źródła: https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-pcs-agents-rtx-spark, https://www.nvidia.com/en-us/geforce/news/computex-2026-nvidia-geforce-rtx-announcements/, https://blogs.windows.com/windowsexperience/2026/05/31/introducing-a-powerful-new-chapter-for-windows-pcs-accelerated-by-nvidia-rtx-spark/, https://www.nvidia.com/en-us/products/rtx-spark/, https://www.mediatek.com/products/personal-computing/nvidia-rtx-spark