Fotonowa sieć neuronowa. AI na bazie komputerów optycznych?

Fotonowa sieć neuronowa. AI na bazie komputerów optycznych?
We współczesnej teleinformatyce można mówić o dwóch elementarnych „czynnikach roboczych”, fotonach i elektronach. Do tych pierwszych zwykle należy przenoszenie danych po całym świecie. Elektrony zaś w układach elektronicznych je przetwarzają. Kiedyś oba te zadania należały do elektronów. Wkrótce być może zadanie przetwarzania na dużą skalę przejmą fotony.

Fotonika ma wiele zalet w porównaniu z tradycyjną elektroniką. Na przykład wykorzystanie fotonów w przetwarzaniu zmniejsza zużycie energii, gdyż w odróżnieniu od typowych dla znanych od dawna układów elektronicznych przepływów elektrycznych, generujących opór i straty cieplne, przepływy fotoniczne są pozbawione oporu.

Aby jednak komputer optyczny mógł na dobre zastąpić wszechobecne architektury cyfrowego przetwarzania elektronicznego, trzeba zbudować równoważne pod względem parametrów wydajnościowych komponenty optyczne.

Macierze AI

Być może wcale nie trzeba trzymać się architektury cyfrowej. Niektórzy naukowcy pracują nad nowatorskimi architekturami optycznymi, wykorzystującymi przetwarzanie analogowe zamiast cyfrowego, czyli systemy, w których koduje się dane jako sygnał ciągły, a nie jako zera i jedynki binarne. W tej chwili architektura taka najlepiej nadaje się do rozwiązywania klasy problemów z dziedziny matematyki zwanej algebrą liniową. Jeśli zdamy sobie sprawę, że algebra liniowa ma ogromne znaczenie w budowie sztucznych sieci neuronowych, a zatem dla uczenia maszynowego i dla rozwoju sztucznej inteligencji, to te poszukiwania już nie wydają się takie marginalne i niszowe.

Algebra liniowa posługuje się macierzami liczbowymi. Za pomocą macierzy opisać można równania rządzące zachowaniem promieniowania elektromagnetycznego (czyli światła), opracowane w XIX wieku przez Jamesa Clerka Maxwella. Maxwellowski opis światła prowadzi do konkluzji, że przy użyciu odpowiednich urządzeń modulujących łatwo jest zakodować dane macierzowe w wiązkach światła, a następnie manipulować tymi danymi.

Sztuczne sieci neuronowe są programami reprezentującymi warstwy węzłów. Połączenia między węzłami reprezentowane są przez liczby w macierzach. Ich wartości zmieniają się w odpowiedzi na przychodzące sygnały, co powoduje mnożenie macierzy. Wyniki są przekazywane do kolejnej warstwy, gdzie następuje kolejna runda przetwarzania, i tak dalej, aż dotrą do ostatniej warstwy wyjściowej, która syntetyzuje je w odpowiedź. Efektem jest umożliwienie sieci rozpoznawania i uczenia się wzorców w danych wejściowych. Wygląda na to, że przetwarzanie optyczne jest w pewnym sensie stworzone do sztucznych sieci neuronowych (1).

1. Wizualizacja AI sztucznej sieci neuronowej opartej na przetwarzaniu optycznym
Zdjecie: stock.adobe.com

Pomysł przekształcenia sieci neuronowych w optyczne nie jest taki nowy. Sięga lat 90. ubiegłego wieku. W ostatnich dekadach i latach pojawiały się nowe sztuczne sieci neuronowe oparte na przetwarzaniu optycznym, takie jak rozwiązanie Demetri Psaltisa z Kalifornijskiego Instytutu Technologicznego (Caltech) do rozpoznawania twarzy. Jednak dopiero teraz pojawiły się rozwiązania techniczne umożliwiające budowę komercyjnych systemów tego typu. Tak się przynajmniej wydaje.

Czy wystarczą same fotony?

Prawdę mówiąc, większość projektów budowy optycznych sieci neuronowych nie zrezygnowała całkowicie z elektronów. Pragmatycznie zachowują one elektronikę tam, gdzie jest to konieczne. Na przykład Lightmatter i Lightelligence, dwie firmy z Bostonu, konstruują hybrydowe „modulatory”, które mnożą macierze przez manipulowanie zakodowanym optycznie sygnałem zgodnie z liczbami przekazywanymi elektronicznie. Modulatory wykonane są z krzemu. Choć nie jest to najlepszy z możliwych materiał do modulacji światła, to jest on zdecydowanie najlepiej znany w elektronice. Zastosowanie krzemu pozwala na produkcję hybrydowych układów scalonych przy użyciu sprzętu przeznaczonego dla konwencjonalnych układów scalonych.

Inni badacze, np. Ugur Tegin z Caltech, skłaniają się do pełnego wyeliminowania tradycyjnej elektroniki. W jego ocenie prawdziwą zaletą obliczeń optycznych jest ich zdolność do obsługi dużych zbiorów danych. Obecnie na przykład systemy rozpoznawania obrazów są szkolone na zdjęciach o niskiej rozdzielczości, ponieważ wersje o wysokiej rozdzielczości są zbyt duże, aby mogły być skutecznie obsługiwane. Tak długo, jak w procesie występuje element elektroniczny, tak długo istnieje ograniczona przepustowość. Odpowiedzią Tegina jest całkowite zrezygnowanie z elektroniki i zastosowanie maszyny całkowicie optycznej.

Okazało się to jednak trudne, ponieważ sieci neuronowe, by być uniwersalne, powinny mieć zdolność, oprócz przetwarzania liniowego, także do obsługi funkcji nieliniowej. Zastosowanie wyłącznie funkcji liniowych oznaczałoby, że można by się uczyć tylko liniowych wzorów. Na szczęście, choć światło zachowuje się w większości przypadków w sposób liniowy, istnieje pewien wyjątek. To bardzo krótkie i intensywne impulsy, które dość trudno tu szczegółowo opisać, ale w efekcie, jak wynika z badań, prowadzą do tego, że światło zachowuje się nieliniowo. W pracy opublikowanej w „Nature Computational Science” Tegin pisze, że jego system jest w stanie utrzymać wszystkie informacje w formie optycznej aż do ich dotarcia do ostatniej warstwy, tej, w której pojawia się odpowiedź. Dopiero wtedy jest ona przekształcana w formę elektroniczną, do przetworzenia przez prostszą i mniejszą sieć elektroniczną.

Wcześniej, na Uniwersytecie Kalifornijskim w Los Angeles, Aydogan Ozcan zastosował do osiągnięcia całkowitego przetwarzania optycznego w sieci neuronowej cienkie tafle specjalnie wyprodukowanego szkła, ułożone w stosy analogiczne do warstw sztucznej sieci neuronowej. Razem te arkusze rozpraszają przychodzące światło w sposób, w jaki taka sieć neuronowa przetwarzałaby obraz cyfrowy. System nie przechwytuje obrazów ani nie wysyła surowych danych, a jedynie wywnioskowane wyniki. Ponieważ jednak arkuszy szklanych nie można przekonfigurować, muszą one zostać wymienione w przypadku zmiany algorytmu wnioskującego.

Zbudowanie więc optycznych czy, inaczej mówiąc fotonicznych sieci neuronowych nie jest prostym zadaniem. Uczeni jednak uważają, że warto się przyłożyć do opracowania takiego systemu, bo korzyści mogą być ogromne. 

Mirosław Usidus