Autor: Mikołaj Birek

Mgr Mikołaj Birek

Asystent, sekretarz w Katedrze Projektowania Graficznego i Zakładzie Grafiki Komputerowej WSIiZ. Magister sztuki, doktorant na Wydziale Sztuki Uniwersytetu Pedagogicznego, gdzie bada warsztat współczesnego artysty multimedialnego. Prowadzi zajęcia z malarstwa cyfrowego i multimediów. Miłośnik Gwiezdnych wojen, przyrody, sztuk walki i kotów.

Sztuczna inteligencja w sztukach wizualnych. Rewolucja czy zabawka?

W filmie Ja, robot (A. Proyas, 2004) jest scena, w której grany przez Willa Smitha bohater pyta humanoidalnego robota, czy ten potrafi napisać symfonię lub namalować arcydzieło. Po sekundzie bardzo ludzkiego namysłu, maszyna odpowiada pytaniem: „A ty?”. Scena ta jest charakterystyczna dla pewnej koncepcji, jaką od lat proponują teksty kultury z nurtu science-fiction: jeśli ludzkość zbuduje inteligentne maszyny, to będą one doskonałe w wykonywaniu powtarzalnych, technicznych czynności, ale za to brak im będzie uczuć i ludzkiej kreatywności.

Inaczej inteligentne roboty przedstawia Ridley Scott w filmach Prometeusz (2012) i Obcy: Przymierze (2017). Jedna z najważniejszych postaci tej serii to David, android grany przez Michaela Fassbendera. David jest przebiegły, ma własne, ukryte motywacje, marzenia i kompleksy. Co znaczące w kontekście niniejszego tekstu, umie też doskonale rysować, komponować i grać na instrumentach. Dzięki najnowszym przełomom w generatywnej sztucznej inteligencji widzimy, że rzeczywistości bliższa jest raczej wizja Ridley’a Scotta. Ale po kolei.

Od Lascaux do Midjourney

Technologia zawsze szła ze sztuką ramię w ramię. Jednym z najwcześniejszych tego przykładów jest wykorzystanie przez prehistorycznych ludzi Afryki, Europy, Australii i Ameryk barwnika z ochry do konserwacji ubrań i narzędzi, a także do tworzenia malowideł naskalnych – pierwszych (zarejestrowanych) przejawów działalności artystycznej naszego gatunku. Kolejne rewolucje przyniosły nowe narzędzia, zwiększające swobodę twórczą i możliwości artystów. Barwniki, pędzle, sztalugi to wynalazki czysto mechaniczne. Dzięki matematyce poznaliśmy koncepcje perspektywy i proporcji. Kolejne narzędzia opierały się na procesach chemicznych (fotografia), potem – elektronicznych (komputery). Każdy z tych wynalazków przyniósł zmiany w sposobie podejścia do twórczości, jej dostępności, wartości, a także statusu i roli artysty. Z tej perspektywy możemy w zasadzie uznać, że algorytmy generatywne, takie jak Midjourney, Dalle czy Stable Diffusion, są po prostu kolejnym krokiem w tej długiej ewolucji. Czy aby na pewno?

W lipcu 2023 firma Midjourney udostępniła szerszemu gronu użytkowników swój algorytm o tej samej nazwie. Dostępny po opłaceniu subskrypcji model pozwala wygenerować dowolny, do tej pory nieistniejący obraz, tylko i wyłącznie na podstawie pisanej potocznym językiem komendy tekstowej – tzw. „prompt” – bez żadnej dodatkowej ingerencji manualnej czy manipulacji komputerowej. Oznacza to, że każdy, kto wykupi subskrypcję na Midjourney, może za pomocą mniej lub bardziej skomplikowanych opisów sterować kreacją dwuwymiarowych obrazów cyfrowych. Systemy tego typu istnieją co prawda od wielu lat (Generative Adversarial Network, czyli tzw. GAN, został po raz pierwszy zaprezentowany w 2014 roku), oparte były jednak na innej technologii, tzn. były przeznaczone głównie dla informatyków i technicznie zaawansowanych grafików cyfrowych, a efekty generacji pozostawiały wiele do życzenia. Wszystko to zmieniło się z wejściem na rynek Midjourney.

Trenowany na gigantycznej bazie danych model spowodował istne trzęsienie ziemi. Środowisko artystów (i ich klientów) podzieliło się. Jedni sceptycznie zwrócili uwagę na liczne, charakterystyczne dla sztucznej inteligencji „artefakty” w ich obrazach (np. zdeformowane twarze, palce, proporcje postaci, mieszanie się tekstur, materiałów i obiektów) oraz ich ogólnie średni, z punktu widzenia profesjonalistów, poziom. Inni entuzjastycznie obwieścili nową erę ludzkiej kreatywności i zabrali się za generowanie tysięcy grafik, wypatrując kolejnych, ulepszonych i dokładniejszych wersji algorytmu. Zachwyt nad nowymi możliwościami pomieszał się z lękiem o przyszłość.

Kto ma rację? W momencie pisania tych słów od premiery Midjourney minął niemal rok. Z perspektywy czasu możemy uznać, że rację mieli poniekąd wszyscy.

AI kontra człowiek

Technologia generatywnej sztucznej inteligencji przynosi zmiany idące o wiele dalej, niż tylko usprawnienie mechanicznych, odtwórczych procesów. Automatyzacja postępuje od lat wraz z rozwojem technologii mechanicznych i komputerowych, ale po pierwsze, do tej pory do obsługi tych systemów potrzebny był wyspecjalizowany operator, a po drugie, proces ten dotyczył do tej pory czynności powtarzalnych, manualnych, męczących.

Modele pokroju Midjourney pracują w sposób „kreatywny” – najprostsza komenda tekstowa zaproponuje rozwiązania, o których „promptujący” mógł nawet nie pomyśleć, ubierając je w atrakcyjną szatę graficzną, bogatą kolorystykę, detal – wszystkie elementy, które do tej pory musiał wykonać artysta-grafik. Jakość tych generacji nadal pozostawia sporo do życzenia, ale mniej doświadczony odbiorca prawdopodobnie i tak nie zwróci na to uwagi. Midjourney udostępniło już pięć wersji swojego algorytmu, a każda z nich była w jakiś sposób udoskonalona w stosunku do poprzedniej, i nie zapowiada się, żeby proces ten miał się w najbliższym czasie zatrzymać.

Należy zdać sobie także sprawę z tego, że „targetem” algorytmów generatywnych nie są artyści. Mogą oni oczywiście kreatywnie z nich korzystać, sięgając z większą łatwością po efekty bardziej rozbudowane, interesujące i niestandardowe niż ludzie, którzy sztukami się nie zajmują. Natomiast po roku widzimy już, że najchętniej sięgają po nie potencjalni klienci, którzy po prostu nie będą już potrzebowali ludzkiego artysty – wygenerowany przez algorytm obraz będzie dla nich wystarczająco dobry i, przede wszystkim, nieskończenie tańszy. Co w takim razie dalej? Czy to koniec zawodu artysty?

Nie sądzę. To oczywiście tylko moje prognozy, a rozwój tych technologii zaskoczył nas już niejednokrotnie, ale na podstawie własnych doświadczeń ze sztuką, technologią, studentami, klientami i artystami przypuszczam, że podniesiona zostanie poprzeczka tego, co uznaje się za „dobrą jakość”. Atrakcyjny obraz czy zdjęcie będą na wyciągnięcie ręki dla każdego – dla artystów także. Może się jednak okazać, że artystów i grafików mniej wyróżniających się i zdeterminowanych rynek (na którym utrzymanie się było już wystarczająco trudne nawet bez sztucznej inteligencji) zweryfikuje i wymusi przekwalifikowanie. Zostaną więc tylko najwytrwalsi, nawiedzeni, szaleni, dla których liczy się akt tworzenia, rozwiązywanie problemów formy i treści, samorealizacja, ekspresja – niezależnie od medium i narzędzi, którym przyjdzie im się posługiwać. Sztuczna inteligencja tego nie zmieni.

Problemy prawne, moralne i inne

Wspomnieć trzeba o problemach natury pragmatycznej, wynikających w dużej mierze z gospodarczego modelu naszej cywilizacji. W jaki sposób początkujący artysta zdobędzie doświadczenie, niezbędne w rozwoju osobistym i zawodowym, skoro niewielkie zlecenia znikną na rzecz sztucznej inteligencji? Sztuki wizualne wymagają praktyki i powtarzalności. Może wreszcie zaczniemy doceniać czas spędzony w szkole i na uczelni, i korzystać z możliwości eksperymentowania i nauki, jakie oferują? Artysta świadomy, bogaty w doświadczenie, posiadający zdolności techniczne i manualne, znający teorię i praktykę z pewnością będzie bardziej wartościowy w działaniach kreatywnych, niż dyletant posiadający subskrypcję na Midjourney.

Nie możemy też przejść obojętnie obok kwestii natury moralnej i prawnej. Sądy na całym świecie odmawiają rejestracji praw autorskich dla obrazów w całości wygenerowanych przez sztuczną inteligencję. W Stanach Zjednoczonych toczy się proces o masowe naruszenie praw autorskich milionów twórców przez Midjourney i Stability AI, których bazy danych zawierają miliardy objętych prawem autorskim obrazów z internetu (w tym autorstwa piszącego te słowa). Bez tych baz danych nie jest możliwe wygenerowanie czegokolwiek, a nawet pomijając ten aspekt, efekty tych generacji to po prostu rodzaj pikselowej „piany”, bezmyślnie ubitej przez zaawansowany kalkulator.

Mnóstwo jest przypadków, kiedy internauci celowo „uczyli” generatory, aby specjalizowały się w podrabianiu stylu konkretnych, żyjących artystów – niekiedy nawet złośliwie ich o tym informując, jak to miało miejsce w przypadku Sama Yanga. I nawet jeśli zabroni się tworzenia baz danych do trenowania tych modeli na materiałach objętych prawem autorskim, pojawią się legalne alternatywy, jak choćby Firefly, rozwijany przez Adobe model generatywny, trenowany na obrazach z biblioteki należącej do firmy.

To dopiero początek

Trzeba mieć świadomość, że generacja obrazu to dopiero początek. We wczesnych fazach rozwoju są modele, generujące film, grafikę trójwymiarową, dźwięk, głos, muzykę (chociaż z muzykami autorzy algorytmów obchodzą się dużo ostrożniej, niż z artystami wizualnymi, bojąc się pozwów z wytwórni muzycznych, co dobitnie pokazuje ich hipokryzję). Duże modele językowe, jak np. ChatGPT już wpływają na dziennikarstwo, pisarstwo, marketing, programowanie i wiele innych dziedzin życia. Zmiany dotkną wszystkich, nie tylko artystów – przypadkiem po prostu to artystom „oberwało się” pierwszym. Niezbędna jest reakcja rządów i społeczeństwa na te zmiany, nie w formie luddystycznej histerii czy bezrefleksyjnego, lekkomyślnego hiper-entuzjazmu, ale w formie rozsądnej i wyważonej dyskusji popartej badaniami naukowymi, z dobrem społeczeństwa stawianym wyżej niż zyski korporacji i technologicznych start-upów. Innymi słowy, wolno marzyć.

Czy w takim razie sztuczna inteligencja w sztuce to rewolucja, czy kolejna zabawka? Ponownie myślę, że jedno i drugie. Jako artysta wykształcony klasycznie, ale już w erze cyfrowej, spoglądam z obawą na kolejne pokolenia – jak będziemy ich uczyć? Co oni będą oglądać, czego słuchać? Czy prowadzona ołówkiem linia, zamykająca kształt głowy, wydobywająca rysy twarzy, będzie w dobie potężnych, generujących multimedialne spektakle algorytmów wydawała się jeszcze interesująca? Patrząc na fakt, że sztuka manualna towarzyszy nam od zarania dziejów, i nigdzie po drodze się nie zgubiła, jestem pewien, że tak. Przebodźcowani, może właśnie tym bardziej docenimy jej prostotę i piękno?