Technologie strumieniowe w bibliotekach cyfrowych. Uniwersytet Pedagogiczny w Krakowie, 13 marca 2017 r.
W dziedzinie tak szybko rozwijającej się jak bibliotekarstwo cyfrowe każda okazja do skonfrontowania swoich doświadczeń z doświadczeniami kolegów z innych bibliotek jest cenna. Szczególnie wtedy, gdy mówimy o różnych sposobach udostępniania zbiorów i zwiększania ich wartości informacyjnej. Dlatego też rankiem 13 marca wsiadałem do pociągu w kierunku Krakowa ze sporymi nadziejami na poszerzenie mojej wiedzy w dziedzinie strumieniowego przesyłania plików graficznych nie tyle w aspekcie teoretycznym (ostatecznie opisy technologii i oprogramowania można bez trudu znaleźć na licznych stronach organizacji standaryzujących stosowane systemy bibliotek cyfrowych), ale od strony praktycznych wdrożeń funkcjonujących już na naszym rodzimym gruncie. Od razu też trzeba powiedzieć, że seminarium organizowane przez pracowników Biblioteki Głównej Uniwersytetu Pedagogicznego w Krakowie we współpracy z tamtejszym Instytutem Nauk o Informacji w znacznym stopniu te nadzieje spełniło.
Choć ze względu na ograniczoną liczbę miejsc nie udało mi się uczestniczyć w pierwszym punkcie programu tego spotkania, jakim była wizyta w pracowni fotograficznej Biblioteki Książąt Czartoryskich, to bez problemu – również dzięki świetnemu oznaczeniu w samym budynku głównym Uniwersytetu Pedagogicznego – dotarłem na miejsce dalszych obrad. Po równie bezproblemowej rejestracji rozpoczęliśmy obrady. Jako pierwszy występował Marcin Szala z Biblioteki Uniwersyteckiej we Wrocławiu. Jego referat International Image Interoperability Framework – nowoczesne udostępnianie zbiorów zdigitalizowanych w bibliotekach cyfrowych po pierwsze wprowadził zebranych w ogólne ramy teoretyczne tego rozwiązania, następnie zaś umożliwił zapoznanie się z zastosowaniem tej technologii w ramach Biblioteki Cyfrowej Uniwersytetu Wrocławskiego. Tak więc IIIF (czyli właśnie International Image Interoperability Framework, którego skrót wedle samych jego twórców dobrze jest wymawiać jako Triple I F) to framework umożliwiający wdrożenie strumieniowego przekazywania plików graficznych miedzy biblioteką cyfrową a użytkownikiem. Na czym jednak to strumieniowanie polega? Mówiąc najogólniej chodzi o zmianę podejścia do uzyskiwania dostępu do plików graficznych przez sieć: zamiast zmuszać użytkownika do pobierania całego pliku graficznego w wysokiej rozdzielczości, który niekiedy miewa dość duże rozmiary i wywołuje spore obciążenie sieci oraz komputera docelowego, udostępnia się najpierw plik w niższej rozdzielczości obejmującej całość obiektu, potem zaś na żądanie klienta dosyła się obszary przybliżone w wyższej rozdzielczości. W zdecydowanie mniejszym stopniu obciąża to zarówno zasoby sieciowe biblioteki cyfrowej i osób z niej korzystających, umożliwia uzyskania dostępu do szczegółów obiektu w wysokiej jakości w zdecydowanie krótszym czasie oraz zmniejsza zużycie zasobów sprzętowych na komputerze docelowym. Efekt taki osiąga się zasadniczo w IIIF za sprawą instalacji po stronie biblioteki cyfrowej oprogramowania serwera strumieniującego (udostępnianego przez organizację tworzącą ten standard na licencji open-source’owej) oraz podczepienie do tego systemu specjalnie przygotowanych plików graficznych, bądź to w formie tzw. piramidalnych plików TIFF, bądź plików JPEG2000. Otrzymują one swoje identyfikatory, dzięki którym tzw. plik manifestu stanowiący tekstowy plik w formacie JSON jest w stanie połączyć je z rozmaitymi informacjami zawartymi w nim samym (takimi jak: metadane deskryptywne obiektu, szkielet publikacyjny – tj. kolejność poszczególnych stron w publikacjach wielostronicowych, struktura obiektu – spis treści, obszary artykułów w czasopiśmie, warstwa OCR, czy inne adnotacje poczynione na samym obrazie). Pozostaje jeszcze oczywiście kwestia obsługi tego systemu po stronie użytkownika. Najczęściej uzyskuje się to poprzez napisaną w którymś z języków skryptowych (najczęściej JavaScript) i wykorzystującą możliwości standardu HTML5 przeglądarkę (tzw. viewer). Część z nich dostępna jest na wolnych licencjach z otwartymi źródłami, co umożliwia ich modyfikację w zależności od potrzeb udostępniającej biblioteki; same zresztą zawierają mechanizmy przydatne w różnych zastosowaniach i odpowiednie do róznych typów prezentowanych obiektów (inne opcje przydatne są przy pokazywaniu w bibliotece cyfrowej map lub materiału ikonograficznego, inne natomiast przy prezentacji druków zwartych czy czasopism).
Drugim referentem była Aleksandra Nowak z Poznańskiego Centrum Superkomputerowo-Sieciowego. Temat jej wystąpienia brzmiał: Zastosowanie IIIF w chmurze – Europeana Cloud. Dość skrótowo i pobieżnie omówiła projekty PCSS związane z zastosowanie technologii strumieniowych w kontekście współpracy jej instytucji z Europeaną. Nieco więcej czasu poświęciła możliwościom szóstej wersji oprogramowania dLibra w zakresie integracji serwera IIIF w ramach biblioteki cyfrowej jako jednej z opcji wprowadzanej właśnie wieloformatowości. Informacja o istniejących już wdrożeniach najnowszej wersji systemu wywołała niemałe zainteresowanie zgromadzonych oraz liczne pytania. Niestety referentka nie była w stanie określić jakiejkolwiek daty publicznej premiery, odsyłając zainteresowanych do innych pracowników poznańskiego centrum. Równie interesującym elementem wystąpienia było omówienie planów Europeany w zakresie wykorzystania w jej serwisie strumieniowania plików publikowanych na serwerach instytucji, które zgłosiły do niej akces. Choć zagadnienie to nie wywołało wielu pytań, to wydaje się jednak, że ma ono dość duże znaczenie dla rozwoju projektów digitalizacyjnych, które chcą dostarczać treść dostępną z poziomu europejskiej biblioteki cyfrowej.
Trzecie wystąpienie (Technologie strumieniowe w muzykologii cyfrowej – przegląd projektów) przygotowane zostało przez pracownika Biblioteki Narodowej, Sonię Wronkowską. Tytułem wstępu została przedstawiona specyfika materiałów muzycznych (w tym kwestia zróżnicowania samej notacji muzycznej oraz dawnych technik druku muzycznego) oraz istniejące technologie mające na celu komputerowe rozpoznawanie znaków. Referentka przedstawiła technologię OMR (Optical music recognition nazywany także muzycznym OCR-em), w efekcie której uzyskujemy cyfrową transkrypcję notacji muzycznej w postaci pliku XML (oczywiście odpowiednio wystandaryzowanego) lub MEI. Trochę na uboczu wspomniana została technologia AMT (Automatic Music Transcription) umożliwiająca wytworzenie zapisu nutowego z nagrania. Uzyskanie zapisu nutowego w postaci przydatnej do dalszej obróbki przez narzędzia statystyczne czy chociażby wyszukiwanie fraz w tekście muzycznej otwiera nowe możliwości w zakresie badań nad stylometrią (ustalanie za pomocą narzędzi do analizy danych masowych charakterystycznych cech twórców czy też szkół) oraz w znacznym stopniu przyspiesza kwerendę źródłową. Omówione wyżej techniki bardzo dobrze wpisują się w sam model strumieniowania danych graficznych IIIF dzięki możliwościom jego elementu jakim jest Shared Canvas Data Model. Opisuje on, w jaki sposób mają być opisywane współrzędne obszarów na publikowanych plikach graficznych oraz jak dodawać do nich odpowiednie adnotacje. Ostatni elementem wystąpienia pani Wronkowskiej było przedstawienie przykładowych projektów i powstałych w ich wyniku serwisów, korzystających z rozmaitych źródeł muzycznych udostępnianych przez posiadające je biblioteki za pomocą serwerów IIIF. Jednym z najbardziej charakterystycznych tego typu stron jest Cantus Ultimus (https://cantus.simssa.ca/), który stara się zebrać wszystkie zachowane rękopisy muzyczne chorału gregoriańskiego i uczynić je przeszukiwalnymi zarówno jeśli chodzi o tekst, jak i muzykę.
Ostatnim prelegentem był Tomasz Kalota z Biblioteki Uniwersyteckiej we Wrocławiu. Jego prezentacja Wykorzystanie technologii strumieniowych w procesach wydawniczych dotyczyła możliwości, które stwarza dla publikacji tradycyjnych i elektronicznych zastosowaniu w bibliotekach cyfrowych technologii IIIF. Podstawą dla jego rozważań była książka Gmina Świerzawa. Atlas materiałów i źródeł historycznych (dostępna w Bibliotece Cyfrowej Uniwersytetu Wrocławskiego: http://www.bibliotekacyfrowa.pl/dlibra/docmetadata?id=78294&from=publication). Zawarte w tej książce fragmenty reprodukcji nowożytnych map pochodzą w części ze zbiorów Biblioteki Cyfrowej Uniwersytetu Wrocławskiego, a dzięki aktywnym linkom można przyjrzeć się kontekstowi prezentowanego fragmentu oraz całej mapie.
Konferencję zakończyła dyskusja, która mimo początkowych oporów rozwinęła się bardzo silnie. Wśród pytań i wątpliwości dotyczących przedstawianej technologii dominowały obawy o obciążenie serwerów (trzeba bowiem przyznać, że o ile w obecnie dominującym w Polsce modelu biblioteki cyfrowej większość pracy obliczeniowej przerzucona jest na czytelnika, który musi na własnym sprzęcie wyrenderować plik DjVu, to w technologii IIIF to serwer instytucji udostępniającej przejmuje na siebie większość obliczeń związanych ze skalowaniem i dostarczaniem gotowego obrazu, użytkownik końcowy natomiast otrzymuje po prostu strumień graficzny do bezpośredniego wyświetlenia na swoim urządzeniu). Znaczącym problemem, przynajmniej dla krajowych implementacji schematu IIIF jest również udostępnianie warstwy OCR – choć to technicznie możliwe (doskonałe przykłady znajdowały się w wystąpieniu Sonii Wronkowskiej) – to jednak nie jest praktykowane. Bez popadania jednak w hurraoptymistyczne zachwyty nad tą nienową już technologią warto jednak zastanowić się nad zastosowaniem strumieniowania przynajmniej dla niektórych kategorii zbiorów, w szczególności ikonografii, kartografii czy cennych iluminowanych rękopisów. Refleksje nad szansami prezentacji tych właśnie elementów bibliotecznego zasobu towarzyszyły mi gdy późnym wieczorem wracałem do Warszawy. Być może już niedługo i w e-BUWie pojawi się obok plików DjVu oraz PDF jakiś czytnik (viewer), który będzie łączył się z naszym serwerem IIIF?
Wojciech Oczkowski, Oddział Rozwoju Zasobów Elektronicznych