System narysuje to, co mu powiesz

System narysuje to, co mu powiesz
Opracowana w laboratoriach badawczych Microsoftu technologia sztucznej inteligencji jest zaprogramowana tak, aby dokładnie generować obrazy z opisów słownych. W nowej, dokładniejszej wersji uzyskano prawie trzykrotną poprawę jakości obrazu w porównaniu z poprzednią. AI (artificial intelligence) rozumiejąca i rysująca dokładnie to, co chcemy, opisana została w artykule badawczym opublikowanym na stronie arXiv.org.

"Jeśli poprzez wyszukiwarkę internetową szukasz podobizny ptaka, otrzymasz zdjęcie ptaka. W naszej technice nie szukamy gotowych obrazów, lecz je tworzymy”, pisze w swoim artykule Xiaodong He, główny pracownik naukowy i kierownik ds. badań w Centrum Techniki Doskonalenia Uczenia się laboratorium badawczego Microsoftu w Redmond. „Ptaki takie mogą nawet nie istnieć w realnym świecie – to tylko kwestia wyobraźni naszego komputera."

Sercem "robota rysującego" Microsoftu jest technologia znana jako Generative Adversarial Network (GAN). Sieć składa się z dwóch modeli uczenia się maszynowego – jednego generującego obrazy z opisów tekstowych i drugiego, nazywanego rozróżniającym, który wykorzystuje opisy tekstowe do oceny autentyczności generowanych obrazów. Oba mechanizmy pracują wspólnie, jeden jako twórca, a drugi jako cenzor kontrolujący twórcę.