BuwLOG

e-bUW, 10 lat i co dalej?…

Dziesięciolecie funkcjonowania to dla osób związanych z e-bUW-em czas wspomnień i podsumowań, ale to też dobry moment na głębsze zastanowienie się nad przyszłością biblioteki cyfrowej.

Łatwo zauważyć, że biblioteka cyfrowa, mimo swojego digitalnego charakteru raczej podlega gwałtownym zamianom. Raczej ewoluuje, dostosowując się do zmian technologicznych i/lub strukturalnych. Rewolucje w środowisku bibliotecznym, to nie są zbyt częste przypadki 😉 No chyba, że trafi się projekt, który „wymusza” zrewidowanie stosowanych założeń.

POPC

Takim bodźcem jest dla nas projekt „Nowa jakość udostępniania dóbr kultury na Uniwersytecie Warszawskim – stworzenie centrum digitalizacji zbiorów bibliotecznych i muzealnych” realizowany w ramach Programu Operacyjnego Polska Cyfrowa, poddziałanie 2.3.2 Cyfrowe udostępnienie zasobów kultury. Projekt zaczął się ponad rok temu. W ciągu tego roku ORZE wzbogaciło się o nowy sprzęt do digtializacji (tu można o nim przeczytać), zostały wyremontowane pomieszczenia oddziału, który przy okazji „skupił” się w jednym ciągu pomieszczeń.

Wykonaliśmy również dużo pracy teoretycznej, tworząc założenia nowej biblioteki cyfrowej. I to jest pierwsza z rewolucji, które nas (i was drodzy czytelnicy korzystający również z e-bUW-u) czeka. Jednym z podstawowych założeń projektu jest wytworzenie całkiem nowego oprogramowania służącego do prezentacji zdigitalizowanych obiektów w internecie ‒ na bazie doświadczeń z dLibrą (obecnie wykorzystywanym oprogramowaniem biblioteki cyfrowej), tego, co jest w niej dobre i tego, co powinno działać lepiej. Staramy się stworzyć oprogramowanie odpowiadające oczekiwaniom użytkowników, współczesnym standardom oraz designowi stron www oraz zapewniające również wsparcie dla bibliotekarzy cyfrowych. Nowy system musi być elastyczny, gdyż będą w nim prezentowane różne rodzaje zbiorów, nie tylko biblioteczne, ale również różnego rodzaju obiekty muzealne. Wymusza to na nas elastyczne podejście do struktury metadanych oraz różnorodne formy prezentacji zbiorów (od skanów 2D, przez zdjęcia, aż po fotogrametryczne odwzorowania obiektów 3D).

Nowy sposób prezentacji treści wpłynie również na cały proces digitalizacji. Zmianom ulegnie etap archiwizacji, co wpłynie również na pozostałe elementy drogi od obiektu oryginalnego do jego cyfrowej kopii. Dokumenty drukowane będą przetwarzane w inny sposób niż dzieje się to teraz. I nie chodzi tu tylko o wieloformatowość (czyli dostępność dokumentu do odczytu w wielu formatach plików), ale przede wszystkim o strukturyzację rozpoznania treści, która będzie podzielona na mniejsze, odpowiednio otagowane fragmenty, dzięki czemu będzie możliwe ich rozpoznanie, a docelowo np. wyekstrahowanie wyłącznie reklam czy ilustracji.

I to jest ta bliższa przyszłość, projekt kończy się w 2019 roku.

James Marvin Phelps: Information Overload. Flickr CC BY-NC 2.0

I co dalej?

Właśnie strukturyzacja treści, obok dobrej jakości metadanych, wydaje się obecnie kierunkiem, który należy obrać dla dalszego rozwoju bibliotek cyfrowych. W zakresie OCR, kuszą również rozwiązania pozwalające na automatycznej lub ręcznej transkrypcji tekstów pisanych odręcznie. Kolejnym krokiem, już w odleglejszej przyszłości, wydaje się kodowanie semantyczne, co dla zbioru kilku milionów skanów będzie musiało opierać się na rozwiązaniach automatyzujących taki proces.

Jednak podstawą do dalszej pracy będzie cały czas digitalizacja ‒ skany 2D, 3D, na różne sposoby przetwarzane i prezentowane w różnej formie. Ale upłynie jeszcze dużo wody w Wiśle nim będzie widać koniec cyfryzacji zbiorów BUW i innych jednostek Uniwersytetu. W szerszej perspektywie wydaje się, że właśnie włączenie w prace nad digitalizacją wielu różnych jednostek UW będzie dobrą drogą dla wzrostu liczby dostępnych online obiektów, a także dla znaczącego zwiększenia ich różnorodności, zarówno ze względu na formę, jak i ich treść, co pozwoli lepiej odpowiadać na oczekiwania użytkowników.

Na pewno będziemy wybrane obiekty już zdigitalizowane, ponownie cyfryzować z użyciem dokładniejszych i dających lepsze rezultaty urządzeń oraz programów pozwalających na jeszcze lepszą ich prezentację czytelnikom. Przy procesie digitalizacji rozciągniętym już praktycznie na dziesięciolecia, nie da się uniknąć recyfryzacji najważniejszych obiektów z kolekcji BUW-u i Uniwersytetu.

W realnej perspektywie czasowej nastąpią zapewne zmiany w archiwizacji wytworzonych podczas digitalizacji plików. Będą to zmiany w procedurach oraz przyjętej polityce archiwizacji, ale również, na co liczymy, w technologiach, które pozwolą na jeszcze bezpieczniejsze, długotrwałe, a może nawet wieczyste, przechowywanie rezultatów naszej pracy.

Embed from Getty Images

Na pewno w długiej perspektywie pojawi się jeszcze wiele wyzwań oraz możliwości (czasem to to samo ;)), których w tym momencie nie jesteśmy w stanie przewidzieć. Biblioteka cyfrowa funkcjonuje w żywym organizmie Biblioteki, Uniwersytetu, a w końcu również w konkretnych ramach prawnych. Każdy z tych czynników może wpływać na to co i jak możemy i musimy robić, jakie zadania są konieczne do realizacji. Wszystko to powoduje, że jedno jest pewne ‒ przyszłość rysuje się ciekawie!

Grzegorz Kłębek, Oddział Rozwoju Zasobów Elektronicznych

W cyklu na 10-lecie e-bUWu pisaliśmy już o:

Historii e-bUWu.

Dziwnych rzeczach jakie można zobaczyć na skanach.

Prawie autorskim w pracy bibliotekarza cyfrowego.

Drodze książki w procesie digitalizacji

Przepisie na publikację w e-bUWie

O sprzęcie fotograficznym w digitalizacji

O tym, co zmieniało się w naszej pracy przez te 10 lat, w części pierwszej i drugiej.

Pokazaliśmy infografikę dotyczącą e-bUWu.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *