Mgr inż. Arkadiusz Gaweł

Asystent i Sekretarz w Katedrze Kognitywistyki i Modelowania Matematycznego. Magister Informatyki Stosowanej o specjalności Systemy Informatyczne w Zarządzaniu (Wyższa Szkoła Informatyki i Zarządzania w Rzeszowie), inżynier Informatyki Stosowanej o specjalności Technologie Internetowe oraz technik dyscypliny Informatyka o specjalności Bazy Danych. Członek zespołu ds. Analiz i Badań Edukacyjnych WSIiZ. Zainteresowania naukowe koncentrują się wokół: analityki, analityki internetowej, statystyki, Big Data oraz przetwarzaniu języka naturalnego (NLP).

Predykcja – czy technologia zna nas lepiej niż własna rodzina?

Technologia predykcji stała się na tyle powszechna w dzisiejszych czasach, że niemal każdy może spotkać się z nią nawet w nieświadomy sposób. Może wpływać na Ciebie kiedy prowadzisz samochód, komunikujesz się ze znajomymi, wykonujesz transakcje bankowe bądź idziesz do lekarza.

Słownik PWN mówi: predykcja to proces wnioskowania o przyszłych wielkościach zmiennych losowych w określonym przyszłym momencie (okresie), gdy nie jest znana wielkość wyjściowa. No właśnie, czym jest ta wielkość wyjściowa oraz czym są elementy na nią wpływające?

„Informacja jest nową ropą naftową” – Meglena Kuneva, komisarz Unii Europejskiej ds. ochrony konsumenta.

Większość z nas nie interesuje się danymi. Prawdą jest, że większość zdarzeń, które podejmujemy, są w jakiś sposób odnotowywane, dane o nich gromadzone, a w konsekwencji później analizowane. Załóżmy, że dokonujemy wpisu w mediach społecznościowych, kupujemy jakiś przedmiot w serwisie aukcyjnym, bądź składamy wniosek kredytowy. Każda z tych czynności jest związana z gromadzeniem naszych danych. W taki sposób ilość danych rośnie w zastraszającym tempie.

Czy gromadzone dane mogą pomóc w przewidywaniu zachowań ludzi?

Serwis statista.com pokazuje, że ilość danych/informacji utworzonych, przechwyconych, skopiowanych i wykorzystanych na całym świecie w latach 2010-2025 w 2025 osiągnie 181 zettabajtów (1 ZB – 1021 = 1 000 000 000 000 000 000 000 bajtów). Tylko komputery mogą przetworzyć taką ilość danych i – jeśli wykorzysta się maszyny w odpowiedni sposób – mogą wycisnąć z ogromnych baz potrzebne informacje. Jak mówi autor Eric Siegel w książce Prognozuj – kto kliknie, skłamie lub umrze, proces uczenia maszyn (machine learning) uwalnia potencjał zasobu jakim są dane.

Stąd wiemy na przykład, że: fani Rihanny to w większości demokraci, oraz że przestępczość wzrasta po wydarzeniach sportowych. Wykorzystanie danych do predykcji widzimy w bardzo różnych obszarach jak: bankowość (m.in. badanie historii kredytowej podczas pożyczki – model przewiduje czy jesteś w stanie spłacić wartość kredytu), polityka (m.in. prognozowanie zachowań głosujących (prezydent Barack Obama w 2012 został ponownie wybrany m. in. dzięki pomocy prognozowania zachowań głosujących i dobór odpowiednich komunikatów dla grup wyborców)), biznes (m.in. Firma Hewlett Packard HP przypisuje swoim pracownikom ryzyko odejścia z firmy – inaczej mówiąc prawdopodobieństwo zmiany pracy przez tego pracownika – dzięki czemu przełożeni mogą zareagować z wyprzedzeniem i zatrzymać pracownika). Firmy ubezpieczeniowe przewidują kto może spowodować kolizję lub wypadek i na podstawie charakterystyk danego klienta oraz pojazdu dobierać wysokość ubezpieczenia. W USA w stanie Maryland tworzone są prognozy, kto z pośród osób, które są pod nadzorem, mogą potencjalnie dokonywać przestępstw lub wskazywać osoby które mogą zostać zaatakowane. W marketingu internetowym można m. in. prognozować kliknięcia w reklamy internetowe i wskazywać odpowiednie miejsca umieszczenia elementów stron www. Serwisy randkowe czy programy telewizyjne są w stanie na podstawie przeszłych wzorców osób o podobnych charakterystykach dobrać nam partnera na całe życie (tutaj wyniki akurat prezentują się z różnym skutkiem 😊 ).

Archiwizowane dane – cenny zasób czy pierwszy krok do zagłady?

Zastosowań budowania modeli predykcyjnych jest ogrom, lecz podstawą zawsze są dane, na których po odpowiednim ich przetworzeniu można odczytać pewne wzorce zachowań, nawyków, trendów. To one stają się coraz większym i coraz bardziej cennym zasobem, który może na wyjściu generować wartość; czy to kupno rekomendowanego przez model predykcyjny produktu, czy identyfikacja przez system wspomagania decyzji potencjalnej choroby na podstawie objawów, czy prawdopodobieństwo odniesienia sukcesów na podstawie scenariusza przez studia filmowe.

Trzeba pamiętać, że większość modeli ma wbudowane mechanizmy analizujące nasze zachowania i stara się nam pomóc oraz ułatwić większość zadań w codziennym życiu. Aczkolwiek mogą istnieć też takie modele, które wykorzystane przez nieodpowiednie osoby mogą stać się narzędziem do całkiem innych celów. Najważniejsze, aby z rozwagą posługiwać się swoimi danymi i skrupulatnie weryfikować systemy je gromadzące.