System narysuje to, co mu powiesz
"Jeśli poprzez wyszukiwarkę internetową szukasz podobizny ptaka, otrzymasz zdjęcie ptaka. W naszej technice nie szukamy gotowych obrazów, lecz je tworzymy”, pisze w swoim artykule Xiaodong He, główny pracownik naukowy i kierownik ds. badań w Centrum Techniki Doskonalenia Uczenia się laboratorium badawczego Microsoftu w Redmond. „Ptaki takie mogą nawet nie istnieć w realnym świecie – to tylko kwestia wyobraźni naszego komputera."
Sercem "robota rysującego" Microsoftu jest technologia znana jako Generative Adversarial Network (GAN). Sieć składa się z dwóch modeli uczenia się maszynowego – jednego generującego obrazy z opisów tekstowych i drugiego, nazywanego rozróżniającym, który wykorzystuje opisy tekstowe do oceny autentyczności generowanych obrazów. Oba mechanizmy pracują wspólnie, jeden jako twórca, a drugi jako cenzor kontrolujący twórcę.