BuwLOG

Czy jesteś dataholikiem? Czyli jak Cię widzi algorytm.

Masz za zadanie porównać listę tytułów czasopism z poszczególnych prenumerowanych baz danych i wykazać duplikaty. Dorzućmy do tego jeszcze pomiar ich wykorzystania. Porównanie kilku lat. Może okazać się, że przekroczyłeś limit 1 048 576 wierszy na 16 384 kolumn arkusza kalkulacyjnego programu Excel. Decydujesz się w takim przypadku podzielić dane na kilka arkuszy, no może kilkanaście. Parę poleceń, wybranych funkcji matematycznych, spowolnienie komputera i jakoś udało się przesiać i porównać dane. Kupić czy nie kupić kolejną kolekcję JSTOR? Oto jest pytanie, do którego jeszcze wrócimy.

Czarna okładka publikacja Yuval Noah Harari Homo deus. W tle sterty książek czekających na opracowanie.

Yuval Noah Harari / Homo deus : krótka historia jutra

To tylko przykład, który sygnalizuje, do czego zmierzamy. Do fali big data. To już wyższy poziom, gdzie danych jest ogrom, są zmienne i pochodzą z różnych zbiorów. Przetworzyć je, a co dopiero analizować, jest bardzo trudno. Zapomnij o Excelu. Tu przyda się jakiś szybki komputer z dużą mocą obliczeniową i program z odpowiednimi algorytmami, który ten proces zautomatyzuje. A z dnia na dzień, z godziny na godzinę… danych cyfrowych przybywa. Ten wpis jest kolejnym zestawem danych, który wyszukiwarka Google przeindeksuje już w parę sekund po jego publikacji.

Dość długi wstęp był tylko pretekstem do opisania nowego zjawiska nazwanego dataizmem (data-izm), które zyskuje popularność w różnych środowiskach naukowych, a w przystępny sposób przybliża je m.in. profesor Yuval Noah Harari w książce „Homo deus: krótka historia jutra”. Niektórzy twierdzą, że zjawisko to stanie się kluczowym, i że już zaczyna oddziaływać na kształt ówczesnego świata i będzie mieć wpływ na naszą przyszłość. Inni porównują je nawet do religii, która ma swoich wyznawców, a nawet męczennika – ale o tym na sam koniec.

Poniżej link do prelekcji (fragment):

Yuval Noah Harari  „Listen to Google” From Theism to Humanism to Data-ism (dodany na kanale UCTV 2019 roku)

Dla zainteresowanych cała prezentacja zarejestrowana 27 lutego 2017 r. na kanale University of California Television (UCTV) zamieszczam –> link.

Autor „Homo deus” obrał sobie za misję szerzenie wiedzy naukowej w przystępny i otwarty sposób, tak, aby każdy miał dostęp do wiedzy i możliwość zrozumienia nadchodzących zmian. Kluczowe staje się założenie, że dana/informacja staje się “bogiem” oraz tylko na jej podstawie jesteśmy w stanie podejmować decyzje. Nie każdy jest w stanie (ma do nich dostęp albo chęć) czytać artykuły w czasopismach Science czy Nature i pomęczyć umysł, żeby zrozumieć, co autor miał na myśli tym przykładem posługuje się Harari. Ale każdy martwi się, czy będzie miał pracę, jeśli sztuczna inteligencja, opisywana w artykułach z wyżej wymienionych czasopism, przejmie jego zadania a maszyny będą rządzić światem.

Harari w swoich książkach porusza wiele ważnych kwestii, m.in. wspomniany dataizm. Spróbuję omówić tutaj najważniejsze jego założenia. Wiele źródeł za twórcę tego terminu uznaje Davida Brooksa. Najważniejszą cechą dataizmu jest przepływ informacji. Po drugie wszystko można rozpatrywać w kategoriach algorytmów i systemów przetwarzania danych, np. utwór muzyczny, ciało człowieka, podaż i popyt, wyrok sądu, zmianę pogody, wirus, Google, Facebook, Library Integrated System czy SAP. Po trzecie dostęp do danych jest nieograniczony, bo dane „chcą być wolne”. Po raz drugi pojawia się tutaj termin 'algorytm’. Jedna z definicji mówi, że: 

Algorytm[y] (rzecz.) to krokowa procedura rozwiązania problemu lub osiągnięcia określonego celu, szczególnie przez komputer. (…) Korzystając z równań, arytmetyki, algebry, analizy, logiki i rachunku prawdopodobieństwa, przetwarzają ciąg operacji matematycznych na kod komputerowy. Karmimy je danymi ze świata rzeczywistego, określamy zadania i każemy je wykonać.[1]

Cytując Harariego: 

Dataizm głosi, że wszechświat składa się z przepływu danych, a wartość każdego zjawiska czy bytu określa jego wkład w przetwarzanie danych. (…) Za system przetwarzania danych uważa się dzisiaj nie tylko poszczególne organizmy, lecz również całe zbiorowości, na przykład ule, kolonie bakterii, lasy i miasta. Również ekonomiści w coraz większym stopniu interpretują gospodarkę jako system przetwarzania danych. (…)

Dotychczas dane uważano jedynie za pierwszy krok w długim łańcuchu intelektualnej aktywności. (…) [D]ataiści uważają, że ludzie nie potrafią już sobie radzić z olbrzymimi przepływami danych, dlatego nie potrafią destylować z danych informacji, nie mówiąc już o [destylacji] wiedzy, czy [z wiedzy] mądrości. Zadanie przetwarzania danych należy zatem powierzyć elektronicznym algorytmom, których wydajność przekracza zdolności ludzkiego mózgu. W praktyce oznacza to, że dataiści są sceptycznie nastawieni do ludzkiej wiedzy i mądrości, a wolą ufać big data i algorytmom komputerowym.[2]

Ile danych umieściłeś w Internecie? Ile przesłałeś relacji, przelewów, artykułów, danych, lajków, kliknięć? Myślisz, że nie jesteś dataholikiem? Mam nadzieje, że ten temat was zainteresował i sięgnięcie po książkę Harariego. Innych źródeł na ten temat w polskich bibliotekach jest niewiele. W katalogu NUKAT można znaleźć jedną książkę poświęconą w pełni tej tematyce, w języku angielskim: Data-ism: inside the big data revolution / Steve Lohr, London : Oneworld, 2016. W kolekcjach elektronicznych, do których BUW ma dostęp, polecam przede wszystkim platformę Academic Research Source eBooks (wcześniej eBook Academic Collection). Wybrałam kilka tytułów, tak na dobry początek: (1) Compromised Data : From Social Media to Big Data” / Langlois, Ganaele; Redden, Joanna; Elmer, Greg. New York : Bloomsbury Academic. 2015. eBook; (2) Quantified : Biosensing Technologies in Everyday Life” / Nafus, Dawn. Cambridge, Massachusetts : The MIT Press. 2016. eBook; (3) Becoming Digital : Toward a Post-Internet Society” / Mosco, Vincent. Series: SocietyNow. Edition: 1st ed. Bingley : Emerald Publishing Limited. 2017. eBook; (4) Metric Culture : Ontologies of Self-Tracking Practices” / Ajana, Btihaj. United Kingdom : Emerald Publishing Limited. 2018. eBook.

Jeśli chodzi o zasoby sieci WWW, to oprócz wypowiedzi profesora Harariego, w różnych wywiadach i prelekcjach (na oficjalnym kanale jest tego sporo), warto też śledzić dorobek Kevina Kelly’ego. Jego opowieści na temat technologii są bardzo ciekawe i pouczające. Tu kilka wybranych przykładów przemówień: How AI can bring on a second Industrial Revolution, The Power of Being Lost, God, Robots, & You.

Ciekawy wykład m.in. na temat dataizmu przygotowali Dawid Kamiński i Cezary Rochnowski. Jak prawo wielkich liczb, ewolucji i genetyka wspierają ideologię dataizmu? Obejrzyjcie tu: Infoanarchizm i dataizm. Swoboda informacji przyszłości  i zobaczcie, w jaki sposób próbują to wytłumaczyć.

Nauka jest droga. Bardzo droga i wymaga dużych nakładów pieniężnych. Nauka nowożytna mogła się rozwijać dzięki dotacjom rządów, inwestorów, darczyńców. Pomińmy podawanie celu takiego finansowania, bo to temat na innych wpis lub książkę. W naszej branży ściśle powiązanej z nauką i dydaktyką, od ponad dekady prowadzone są dyskusje na temat dostępu do danych czy ściślej publikacji naukowych. Ruch otwartej nauki, w tym tzw. wolny dostęp, nabiera rozpędu i przybiera nowe kształty. Z tegorocznych wpisów na BuwLOG-u można przytoczyć: Relacje z seminarium „Jak wspierać naukę i dydaktykę” czy Plan zarządzania danymi na podstawie wytycznych NCN. Dataiści powołują się na Manifest z 2008 r., Guerilla Open Access Manifesto, Aarona Swartza (1986-2013), przez jednych uważanego za zwykłego hakera, a przez innych za pierwszego męczennika nowej ideologii. Swartz przyczynił się do udostępnienia danych m.in. przez bazę JSTOR, część danych faktycznie jest dostępna bezpłatnie, ale nie wszystkie. Wszystko zależy od umów i licencji z wydawcami i właścicielami praw autorskich. 

I tu wracam do postawionego w pierwszym akapicie pytania o zakup prenumeraty. Czy powinniśmy płacić za dostęp do czegoś, co powstało z pieniędzy publicznych i ma dalej przyczyniać się do budowania dobrobytu i raju na Ziemi? Swartz uważał, że nie i zhakował serwery MIT, z których pobrał artykuły naukowe, za co został pozwany do sądu. Skąd miał wiedzieć, że w 2020 na pewien okres JSTOR udostępni swoje dane? Przyznam, że irytuje mnie zależność nauki od ekonomii, polityki, czy religii i rozumiem jego bunt przeciw realiom naszych czasów. Natomiast nie wierzę, aby dataizm był lekiem na całe zło. Niektóre rewolucje postępują bardzo powoli, dostęp do wiedzy może je przyspieszyć. Tylko czy wszyscy jesteśmy na to gotowi i, co ważniejsze, co jesteśmy w stanie poświęcić w imię postępu? Swoje życie, wolność? Wolałabym mieć prawo podejmowania decyzji, jak będzie wyglądała moja przyszłość, jednak obecna fala danych (często fake news) jest przytłaczająca.

Przetworzyła dane w algorytmie biochemicznym:

Karolina Minch, Oddział Wydawnictw Ciągłych

[1] Hello world : jak być człowiekiem w epoce maszyn / Hannah Fry, Kraków : Wydawnictwo Literackie, 2019, s. 18-19. (BUW WD: T14.5 .F79165 2019)

[2]  Homo deus : krótka historia jutra / Yuval Noah Harari, Kraków : Wydawnictwo Literackie, 2018, 467-469. (BUW WD: CB428 .H38165 2018b)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.