9 marca 2016 r. w Bibliotece Uniwersyteckiej w Warszawie odbyło się Seminarium naukowe Big Data i Cloud computing jako nowe narzędzia w informatyce i w nauce.
„Wprowadzenie do chmury obliczeniowej” zaprezentował Karol Żak (Microsoft Technical Evangelist). Informacje były przekazane w sposób zwięzły przystosowany do poziomu słuchaczy. W istotny sposób rozszerzające dotychczasowe postrzeganie danych w chmurze, w tym przypadku w chmurze proponowanej przez Microsoft Azure. Przywołana chmura stanowi w rzeczywistości szereg rozproszonych po całym świecie serwerów – są to wielkie serwerownie wielkości kilkunastu pełnowymiarowych boisk do piłki nożnej (120 według danych podanych przez prelegenta). Przyczyną takiego rozproszenia jest, między innymi, chęć zabezpieczenia powierzonych danych przed dostępem podmiotów nieuprawnionych, nie tylko rozumianych jako podmioty przestępcze, ale również podmioty państwowe, w tym reprezentujące rząd USA. Ciekawie zaprezentowana została flagowa aplikacja chmurowa Azure – tworząca własny serwer w chmurze w kilka minut w wybranym rejonie świata o wybranych parametrach: jak system (nie tylko firmy Microsoft), specyfikacja sprzętowa na życzenie klienta, itp. Zostały też omówione wady i zalety różnych rozwiązań środowisk pracy w firmach: „on-premise” (sprzęt, oprogramowanie, informatycy na miejscu w firmie), hybrydowe oraz bazujących na chmurze – w tym trzy usługi z zakresu „cloud computing” polegające na dostarczaniu, w zależności od potrzeb odbiorcy, odpowiedniego oprogramowania, platformy i infrastruktury przez Internet (IaaS – ang. Infrastructure as a Service, PaaS – ang. Platform as a Service, SaaS – ang. Software as a Service). Istotnym elementem tej sesji była dyskusja. W jej ramach poruszono temat bezpieczeństwa danych w chmurze, opłat towarzyszących usłudze, możliwości przeniesienia danych na inne platformy oraz norm prawnych obowiązujących w USA i Europie.
„Nowoczesne metody analizy danych w chmurze obliczeniowej Microsoft” oraz „Big Data i Cloud computing – rewolucja w analizie danych” przedstawił Radosław Łebkowski (Microsoft Technology Solution Professional). We wspomnianej chmurze odbywają się kompletne analizy danych, np. Zimowe Igrzyska Olimpijskie 2014 w Soczi były całkowicie obsługiwane przez chmurę Microsoft. W sposób czytelny zostały wskazane podstawowe narzędzia (również darmowe) pozwalające na pełniejsze korzystanie z chmury obliczeniowej Microsoft m.in. Azure DocumentDB, Data Factory, Power BI oraz firm zewnętrznych jak np. Google Analytics. Do analizy można połączyć dane z różnych źródeł nawet znajdujących się bezpośrednio w Internecie bądź zadawać pytania w języku naturalnym. W ramach prezentacji wskazano praktyczne możliwości wykorzystania chmury, chociażby przez pocztę USA do sortowania listów (narzędzie OCR), omówione były też takie narzędzia jak algorytm uczenia maszynowego (Azure Machine Learning) oraz wspomniane różne ciekawe przykłady analiz danych jak programy do wykrywania logo, analiz tekstu, obrazu, analiza wieku postaci ze zdjęcia. Pokazane były możliwości popularnego programu Microsoft Excel od wersji 2013, który w obecnej chwili potrafi dużo więcej niż tylko typowe funkcje arkusza kalkulacyjnego. Można z poziomu programu pobrać dane z najróżniejszych zewnętrznych źródeł, baz danych i przygotować prezentacje w postaci zaawansowanych filmów przedstawiających pobrane źródła. Również i ta część została zakończona dyskusją, której tematem przewodnim stała się analiza sieci społecznościowych, co wzbudziło sporo emocji.
Sesja III objęła tematykę: „Zbiory Big Data w bibliotekach i w informacji”, „Humanistyka bez bibliotek jest martwa (Projekt DARIAH.PL)”, „Polska Biblioteka Literacka jako narzędzie badawcze – założenia teoretyczne”, „CLARIN-PL – narzędzia badawcze wspierające analizę tekstowych Big Data”. Niestety, mimo szczególnego zainteresowania, ograniczenia czasowe nie pozwoliły na racjonalne przedstawienie poruszanej tematyki. Wyraźnie dało się zauważyć, że prowadzący skupiają się wyłącznie na danych statystycznych, przedstawieniu firmy oraz wymienianiu szeregu projektów i nazwisk. Tam gdzie poza statystyką pojawiały się informacje merytoryczne, było one podawane w sposób mało czytelny, przypominający bieg na 100 m. Byle szybciej.
Podsumowując, należy zauważyć, że seminarium mimo swoich mankamentów w sposób czytelny przedstawiło poruszoną problematykę, pozwalając na uświadomienie sobie nowych wyzwań związanych z omawianą technologią. Szczególne wrażenie na mnie wywarli Panowie z giganta z Richmond. Mimo dużego sceptycyzmu z jakim podchodziłam do swoistych treści reklamowych, mogę stwierdzić, że zaimponowali mi poziomem przygotowania oraz swobodą w posługiwaniu się słowem. Zwłaszcza w porównaniu z innymi prowadzącymi, u których widać było podejście iście „akademickie”. Siedzenie za biurkiem czy stanie przed ekranem i odczytywanie treści prezentacji wręcz raziło w porównaniu z osobami, które z pamięci przytaczały informacje i w sposób bezpośredni, swobodny zwracały się do słuchaczy. Cóż, pan Karol Żak mógłby rzeczywiście zostać „ewangelistą”!
Moja rada na przyszłość dla organizatorów konferencji: lepiej umieścić o jeden punkt/temat mniej i dać poszczególnym prelegentom więcej swobody/czasu niż powodować u nich odruch ciągłego patrzenia na zegarek i analizowania czy zdążą podać wszystkie nazwiska, programy, fundusze przed upływem przydzielonego im czasu.
Anna Sołdecka, Centrum NUKAT
Celem seminarium naukowego „Big data i cloud computing w informacji i w nauce” zorganizowanego w dniu 9 marca 2016 r. przez EDC CEUW było zasygnalizowanie nowych zagadnień technologicznych mających związek z działalnością bibliotek. Seminarium było jednodniowe i bezpłatne ponieważ tyle mogli zaofiarować sponsorzy (BUW nie partycypował w sponsoringu). Prelegenci spoza Warszawy przyjechali na własny koszt, a udział w seminarium nie był dla Pracowników BUW obowiązkowy.
Obszerne sprawozdanie z seminarium zostało złożone do druku w „Przeglądzie Bibliotecznym” toteż Osoby, które nie zdołały przyswoić sobie prezentowanych tematów – będą mogły zapoznać się szerzej z treścią referatów. Tekst sprawozdania został dostarczony do Redakcji „Przeglądu Bibliotecznego” w maju 2016 r. toteż zapewne wkrótce się ukaże.
Z poważaniem,
Marta Grabowska, CEUW