Komputer Watson, z naturalnym interfejsem - zawstydzi Google’a?

Komputer Watson, z naturalnym interfejsem - zawstydzi Google’a?
Watson (1) to stworzony przez IBM system umożliwiający rozpoznawanie i przetwarzanie języka naturalnego. Wkrótce z tą być może najbardziej zaawansowaną na świecie formą sztucznej inteligencji będzie można skontaktować się za pomocą smartfonowych aplikacji.
1. Awatar Watsona

Tak naprawdę, w sensie fizycznym, nie chodzi o Watsona jako całość, w postaci ogromnego superkomputera (2), z jakiej znają go świadkowie jego słynnego zwycięstwa z ludźmi w amerykańskim teleturnieju „Jeopardy!” (3) (polska wersja: „Va Banque”).

Mamy tu bowiem na myśli wyprodukowane przez IBM mini-Watsony, czyli pudła wielkości komputerów stacjonarnych, które można instalować w serwerowniach i centrach obliczeniowych. Stamtąd będą pracować jako „mądrość w chmurze” dla użytkowników przenośnych urządzeń.

Ponieważ to nie jest zwykły komputer, nie ma mowy, aby podłączały się do niego pierwsze lepsze aplikacje. 28 kwietnia br. firma IBM wyłoniła 25 najlepszych propozycji do konkursu ogłoszonego dwa miesiące wcześniej, na Światowym Kongresie Mobilnym w Barcelonie. Następnie wybrała te projekty, którymi jest zainteresowana.

IBM zainwestowała np. w firmę Fluid z San Francisco, która przygotowuje poradniczą aplikację dla klientów producenta odzieży turystycznej, sportowej i wyczynowej. Kupujący specjalne ubiory i sprzęt mają za jej pomocą uzyskiwać kompetentne porady na podstawie warunków, opinii użytkowników i danych z wyspecjalizowanych serwisów internetowych.

2. Superkomputer Watson

Wszystkiego na temat produktów i ich stosowania ma dowiedzieć się właśnie Watson, który swoją zdolnością pozyskiwania wiedzy przewyższa wszystkie dotychczas stworzone superkomputery. Wykorzystuje wiadomości z różnych źródeł, baz danych, encyklopedii, serwisów informacyjnych, recenzji, słowników, opracowań naukowych, podręczników i oczywiście wyszukiwarek internetowych.

Robi to o niebo szybciej niż człowiek i o trzy nieba lepiej zapamiętuje, co wyszukał. Google był przełomem, ale Watson może go zawstydzić. Weźmy np. sytuację młodej pary, której urodziło się dziecko. Głód wiedzy na temat zdrowia, odżywiania, opieki itd. jest u młodych rodziców ogromny.

I oto jedna z aplikacji, które IBM wybrał, ma ambicje wykorzystać Watsona jako doświadczoną teściową, z tą tylko różnicą, że oprócz praktycznych porad, za pomocą superkomputera w chmurze zaproponuje też wiedzę z najnowszych publikacji specjalistycznych w naukowych periodykach medycznych, pediatrycznych itp.

3. Watson w teleturnieju Jeopardy

120 sposobów na zrozumienie pytania

Watson radzi sobie z danymi zgromadzonymi w postaci „nieustrukturyzowanej”, czyli do swojej analizy wcale nie musi mieć uporządkowanej bazy danych. Pytanie może być zadane w tzw. języku naturalnym (angielskim, choć planuje się dodanie innych języków).

„Lingwistyczny” procesor analizuje je na 120 różnych sposobów. Algorytmy sztucznej inteligencji znajdują możliwe odpowiedzi na zadane pytanie, przy czym trafność wyników z próby na próbę rośnie, co oznacza, że maszyna się uczy.  Zanim zagrała „Va Banque” zapoznała się z dwustoma milionami stron dokumentów i danych.

Główna różnica pomiędzy technologią „odpowiadania na pytania” (ang.: question answering QA) a tradycyjnym wyszukiwaniem dokumentów polega na tym, że rezultat nie polega na podaniu listy uporządkowanej według trafności lub rankingu strony (jak np. jest w Google), lecz wniknięciu głęboko w sens pytania (stąd ta mnogość sposobów lingwistycznej analizy) i podaniu jednej, zdaniem Watsona, najtrafniejszej odpowiedzi.

W sensie informatycznym najważniejszym oprogramowaniem jest DeepQA, która to nazwa obejmuje również oryginalną architekturę przetwarzania informacji w procesorach (4). To ten model i kompleks algorytmów odpowiada za inteligencję Watsona.

Oprócz tego wykorzystuje się w nim technologie bardziej swojskie (oczywiście dla ludzi obeznanych z informatyką), takie jak architekturę Apache UIMA, języki programowania Java, C++ i Prolog. Używany jest system operacyjny SUSE Linux Enterprise Server 11 na platformie Apache Hadoop.

Sprzętowym sercem systemu są tu procesory paralelne POWER7 zbudowane przez firmę IBM na podstawie własnej architektury DeepQA. Oczywiście maszyna przeznaczona do serwerowni obsługujących mobilne chmury i pytania użytkowników smartfonów jest inna niż główny superkomputer.

Gwiazda teleturnieju miała aż 2880 rdzeni procesorowych POWER7 i 16 terabajtów pamięci RAM. Oferowane obecnie pudełka dysponują „zaledwie” 32 rdzeniami i 256 gigabajtami RAM-u. Co nie oznacza, że gorzej sobie radzą.

Zdaniem przedstawicieli IBM, dzięki paralelnej technice przetwarzania informacji, mini-Watsony są tak naprawdę wydajniejsze niż ich sławny przodek. Jeśli ktoś zdecyduje się na zainstalowanie tej maszyny w swoim systemie, to pierwszą rzeczą, jaką powinien zrobić, jest zalanie go oceanem danych z dziedziny, w której jego Watson ma być ekspertem. Bez obawy. Nie zatonie!

On się tego wszystkiego po prostu nauczy. Jeśli np. dostarczymy mu wszelkie dostępne dane na temat jakiegoś miasta, informacje gospodarcze, statystyczne, demograficzne, komunalne, turystyczne, historyczne i inne, to nie powinien mieć problemu z odpowiedzią np. na pytanie: „Jaki jest średni dochód na mieszkańca w tym a tym bloku mieszkalnym, skorelowany z wartością gruntów i inwestycjami mieszkaniowymi w ostatniej dekadzie?”

4. Architektura i model działania technologii DeepQA – w superkomputerze Watson

Einstein, onkolog i znawca motoryzacji

Firma Azoft z rosyjskiego Nowosybirska zamierza dać Watsonowi twarz – awatara – np. Einsteina albo Freuda. Sztuczna inteligencja nauczy się w zamian wszystkiego, co oni napisali (nie tylko w książkach, ale również w listach), powiedzieli w przemówieniach, wywiadach itd. W planach jest nawet syntezator mowy.

Być może jeszcze ambitniejsze zamierzenie polega na zaprzęgnięciu Watsona do pracy w roli eksperta- -autorytetu rekomendującego i doradzającego przy kupnie nowego samochodu. IBM zamierza go przygotować do tej roli, wykorzystując wszelkie dostępne dane, od oficjalnych informacji producentów, przez recenzje w mediach i serwisach motoryzacyjnych, po opinie klientów i dyskusje na forach.

Jedną z najnowszych funkcji zaimplementowanych przez IBM w superkomputerze jest zdolność debatowania. Oznacza to, że Watson potrafi wyszukać wszystkie argumenty za i przeciw na dowolny temat (dostępne w sieci oraz jego bazach danych) i na ich podstawie zaprezentować mowę końcową.

Wyobraźmy sobie, że Watsonowi zostaje zadany problem. Po przeskanowaniu milionów artykułów, wybiera on najbardziej trafne teksty, zdania, w których autorzy podali argumenty za i przeciw. W efekcie bezbłędnie wygłasza je w swojej mowie końcowej.

Watson mógłby nawet odegrać rolę osobistego doradcy w kwestiach społeczno-politycznych, na bieżąco weryfikującego to, na co natrafia odbiorca mediów i słuchacz polityków. Taką właśnie aplikację zamierza przygotować firma Rumble z Izraela.

Inny projekt zakłada z kolei zatrudnienie sztucznej inteligencji w roli doradcy finansowego. „Stary” Watson już teraz uczy się rzeczy bardzo poważnych. IBM uruchomił wersję beta Watson Analytics. To usługa, która na podstawie zestawu danych biznesowych ma odpowiadać na pytania dotyczące kwestii i trendów ekonomicznych związanych z analizowanymi informacjami.

Konkurować będzie z tradycyjnymi narzędziami analitycznymi, bardzo skomplikowanymi w użyciu. Trudno bowiem zebrać odpowiednie dane i je przeanalizować, jeśli nie jest się specjalistą. I trudno tych narzędzi używać. Watson współpracuje także z jednym z centrów onkologicznych w Nowym Jorku.

To na razie program pilotażowy, ale obejmuje prawdziwych pacjentów ze schorzeniami onkologicznymi.  System przeszedł test kompetencji, któremu normalnie poddawani są lekarze. 

Docelowo ma pracować jako pełnoprawny konsultant, pomagający lekarzom określać najwłaściwsze rodzaje terapii na podstawie analizy przypadków i fachowych pism medycznych. Na razie to lekarze wciąż uczą Watsona, korygując błędy w diagnozach, które zdarza mu się popełniać. Wkrótce to być może on będzie uczył lekarzy…

Mirosław Usidus