Rewolucja technologiczna spod znaku OpenAI

W ostatnich dnia nazwy OpenAI i ChatGPT nie schodziły z ust nie tylko przedstawicieli świata nowych technologii, ale i wszelkiej maści mediów – od tych lokalnych po wielkie telewizje informacyjne i biznesowe. Nic dziwnego, bo ChatGPT jest najszybciej zyskującą użytkowników aplikacją w historii. W ciągu dwóch miesięcy korzysta z niego już ponad 100 mln osób. Microsoft się cieszy, a Google drży.

Świat już nigdy nie będzie taki, jak dawniej. Można zaryzykować stwierdzenie, że jesteśmy świadkami kolejnej rewolucji cyfrowej, tym razem spod ręki OpenAI – organizacji badawczej zajmującej się sztuczną inteligencją stworzonej przez najtęższe umysły świata nowej technologii. Jednym z założycieli organizacji był Elon Musk, który jednak zrezygnował z zasiadania w jej władzach i poświęcił swój czas Tesli.

Drugim jest Sam Altman, który przygodę z nowymi technologiami rozpoczął w wieku 19 lat tworząc Loopt, mobilną aplikację do przekazywania swojej lokalizacji wybranym znajomym, którą po kilku latach sprzedał za ponad 43 mln dol. Od razu trafił do Y Combinator – amerykańskiego akceleratora startupów technologicznych. Stał na jego czele w latach 2011-2019. Y Combinator uruchomił i rozwinął ponad 4000 firm, w tym Airbnb, Coinbase, Cruise, DoorDash, Dropbox, Instacart, Quora, PagerDuty, Reddit, Stripe i Twitch. Całkowita wycena firm w portfelu funduszu przekroczyła już 600 mld dol. Obecnie Altman stoi na czele OpenAI jako jej CEO.

Warto wspomnieć, że OpenAI jest hojnie wspierana przez Microsoft, który wpompował w ten projekt miliardy dolarów. Zaoferował m.in. 10 mld dol. za 75% zysków, a po odzyskaniu wkładu pozostanie z 49% udziałem w OpenAI. W zamian gigant z Redmond ma szybszy dostęp do produktów OpenAI.

W ostatnich tygodniach internet rozpaliły do czerwoności dwie aplikacje, które wyszły spod ręki tamtejszych twórców. Jedną z nich jest DALL·E 2 – generator obrazów oparty na sztucznej inteligencji. Jak to działa? Wpisujemy w okno kontekstowe nasz przykładowy tekst, aby otrzymać odpowiadający im obraz. Na stronie projektu mamy przykład słów: astronauta na koniu.

Efekty prac sztucznego artysty można modyfikować poprzez zmianę stylu czy techniki tworzenia obrazu.

Ale to nie wszystko – DALL·E 2 może dokonywać realistycznych edycji istniejących obrazów lub stworzyć różne jego wariacje inspirowane oryginałem. Może dodawać i usuwać elementy, biorąc pod uwagę cienie, odbicia i tekstury. Naprawdę może wiele. I choć na razie służy głównie do radosnego tworzenia często futurystycznych i abstrakcyjnych obrazów, to coś mi mówi, że niedługo znajdzie bardziej praktyczne zastosowania. Na pewno może budzić obawy u fotografów. Popyt na ich usługi może wkrótce gwałtownie się zmniejszyć. Choć reporterzy pewnie nadal mogą spać spokojnie.

Drugim projektem OpanAI, który wstrząsnął światem nowych technologii i spowodował drżenie kolan u Google jest ChatGPT. W ciągu zaledwie 5 dni zdobył 1 mln użytkowników. Dla porównania – drugiej najszybciej skupiającej użytkowników aplikacji – Instagramowi zajęło to ok. 2,5 miesiąca, Facebookowi 10 miesięcy, a Netfliksowi aż 41 miesięcy. Niewiarygodne? Niewiarygodne jest to, że dwa miesiące od jej uruchomienia korzysta z niej już ponad 100 mln osób. Czym zatem jest ChatGPT?

GPT (ang.: Generative Pre-trained Transformer) umożliwia automatyczne generowanie tekstu na podstawie danych wejściowych. Model ten został wytrenowany na ogromnym zbiorze danych (ponad 8 mln artykułów dostępnych w Wikipedii do roku 2021), dzięki czemu posiada zaawansowaną zdolność do przewidywania słów i zdań na podstawie tekstu poprzedzającego. Jak napisali na swojej stronie twórcy aplikacji: „Przeszkoliliśmy ten model za pomocą Reinforcement Learning from Human Feedback (RLHF), używając tych samych metod co InstructGPT, ale z niewielkimi różnicami w konfiguracji zbierania danych. Wyszkoliliśmy początkowy model, korzystając z nadzorowanego dostrajania: trenerzy sztucznej inteligencji prowadzili rozmowy, w których grali obie strony — użytkownika i asystenta sztucznej inteligencji. Daliśmy trenerom dostęp do pisemnych sugestii modelowych, aby pomóc im w komponowaniu odpowiedzi. Połączyliśmy ten nowy zestaw danych dialogowych z zestawem danych InstructGPT, który przekształciliśmy w format dialogu”.

Nazywa się to uczeniem przez wzmocnienie – czyli szukaniem najlepszego rozwiązania metodą prób i błędów. Najwyraźniej zdaje to egzamin, bo aplikacja uczy się w niewiarygodnym tempie w czym mocno wspiera ją armia pracowników OpenAI. W efekcie jest zdolna odpowiedzieć na niemal dowolne pytanie użytkownika używając języka jakim się posługujemy na co dzień, dbając przy tym o składnię i jasność przekazu. Co jeszcze lepsze – potrafi także trafie wnioskować i argumentować.

Możliwości tego narzędzia wydają się praktycznie nieograniczone. W skrócie może zostać wykorzystane do redagowania oraz tworzenia tekstów – maili, CV, ofert handlowych, automatycznego odpowiadania na pytania klientów, tłumaczenia tekstów. Z pewnością chętnie skorzystają z niego agencje reklamowe, bo niewielkim nakładem środków pomoże stworzyć kampanię reklamową z ustaleniem grupy docelowej. Nic dziwnego, że wielkie nadzieje wiąże z nim Microsoft.

Bill Gates nazwał nawet aplikację „wynalazkiem na miarę nowego internetu”. I już implementuje ją w swojej przeglądarce Bing Microsoft. Teraz zwykła wyszukiwarka internetowa staje się osobistym asystentem użytkownika. Na dodatek zastosowany w niej ChatGPT 4.0 ma czerpać „wiedzę” nie tylko z historycznych tekstów, ale również z tych nieustanie wyszukiwanych, bieżących informacji. A to daje naprawdę duże możliwości. Z pewnością odbije się to na przychodach z reklam.

Alians OpenAI z Microsoft najmocniej uderza w Google (obecnie Alphabet), które do tej pory nie miało konkurencji na polu wyszukiwarek internetowych. W firmie musiało się zagotować, bo po udostępnieniu chatbota w Google ogłoszono kod czerwony, a szefowie firmy zwrócili się o pomoc w znalezieniu rozwiązania samych założycieli firmy Larry’ego Page’a i Sergeya Brina. Skąd ta nerwowość? Wynika ona ze sposobu prezentacji wyników zadanych wyszukiwarce zapytań. O ile tradycyjna wyszukiwarka Google poda nam listę stron, na których znajduje się interesujące nas zagadnienie, to Bing poda nam na talerzu gotową odpowiedź wraz ze wskazaniem źródeł.

W odpowiedzi na plany Microsoft Google zapowiedział wprowadzenie własnego rozwiązania o nazwie Bard. Prezentacja nie wypadła chyba jednak najlepiej, bo inwestorzy giełdowi postanowili pozbyć się udziałów w firmie, w wyniku czego jej kapitalizacja spadła o ponad 100 mld dol.

Jak zwykle w takich sytuacjach pozostaje pytanie o wykorzystanie narzędzia w praktyce. A jak wiadomo, może być ono stosowane zarówno w szczytnych celach, jak i tych mniej etycznych. Mowa chociażby o tworzeniu fake newsów. Teraz stanie się to niezwykle proste. Chętnie skorzystają z niego zapewne także wszelkiej maści cyberprzestępcy. Już teraz plagą jest podszywanie się pod pracowników różnorodnych instytucji, jak chociażby banków. Również niektóre zawody mogą poczuć się zagrożone. Jednym z nich jest dziennikarz, czy ogólnie osoby tworzące treści. Kwestią osobną pozostaną prawa autorskie, ale to zupełnie inne zagadnienie.

I choć ChatGPT wciąż jeszcze popełnia błędy lub nie do końca prawidłowo interpretuje kontekst, to na pewno stanowi milowy krok w rozwoju nowej rzeczywistości.