BuwLOG

“Making Cultural Heritage Data Accessible and Reusable: Finding Best Practices”

19 kwietnia w Bibliotece Uniwersyteckiej w Warszawie odbyła się konferencja „Making Cultural Heritage Data Accessible and Reusable: Finding Best Practices”. Organizatorem tego wydarzenia była DARIAH-PL, DARIAH-DE, DARIAH-EU oraz Muzeum Historii Polski. Wszystko odbyło się pod patronatem Ministerstwa Nauki i Szkolnictwa Wyższego.  W dniu następnym odbywały się również warsztaty, podzielone na dwie ścieżki: prawną i techniczną. Aplikowałem na ścieżkę techniczną, niestety, liczba miejsc była ograniczona i nie dostałem się na nie.

Podstawowym celem zorganizowanej w ramach DARIAH Theme konferencji miało być ułatwienie współpracy pomiędzy instytucjami kultury i dziedzictwa oraz badaczami z obszaru nauk humanistycznych. Konferencja miała stworzyć okazję do udzielenia odpowiedzi na pytania dotyczące:

– sposobów wykorzystania w badaniach humanistów zasobów cyfrowych dziedzictwa.

– strategii tworzenia, rozwijania i udostępniania cyfrowych kolekcji przy uwzględnieniu potrzeb badaczy.

– integracji sposobów udostępniania z narzędziami akademickimi.

– kompetencji które powinni posiadać badacze korzystający z zasobów cyfrowych.

– sposobów zachęcenia badaczy do korzystania z zasobów cyfrowych.

– zachowania norm prawnych przy udostępnianiu i wykorzystywania zasobów cyfrowych.

– wyzwań, wspólnych standardów i protokołów wymiany danych dotyczących zasobów cyfrowych dziedzictwa.

Powitali wszystkich: dr hab. Maciej Duszczyk – Prorektor UW ds. naukowych, Anna Piekarska – Zastępca Dyrektora MHP ds. Merytorycznych oraz prof. Aleksander Bursche – Przewodniczący Rady Konsorcjum DARIAH-PL. W pierwszym bloku tematycznym zabrały głos Klaudia Grabowska i Agata Lipczik z MHP. Ich prelekcja „Cyfrowe dziedzictwo w służbie nauce. Instytucje bliżej naukowców” poświęcona była polityce otwartości, jaką kieruje się MHP jeśli chodzi o swoje cyfrowe zbiory. W 2015 r. MHP przystąpiło do Koalicji Otwartej Edukacji (KOED), której zadaniem jest wspieranie tworzenia otwartych zasobów edukacyjnych i promowanie związanych z nimi dobrych praktyk i narzędzi. Panie wspomniały również o programach grantowych MHP, których sztandarowy przykładem jest „Patriotyzm jutra”. Ogólnopolski program służący odkrywaniu i upowszechnianiu wiedzy z zakresu historii Polski, wspierający inicjatywy lokalnych społeczności poświęcone pielęgnowaniu i promowaniu lokalnego dziedzictwa i kultury. Jako narzędzie wspierające badania naukowe i edukację została przedstawiona baza bibliograficzna polskich naukowych czasopism humanistycznych i społecznych BazHum. Na zakończenie obie Panie wspomniały o projekcie gry internetowej „Dwudziestolecie bez filtra”. Gra miała by za zadanie zarówno, edukację młodego pokolenia na temat 20-lecia międzywojennego w Polsce, jak również zaprezentowanie autentycznych zdjęć z tego okresu.

Prelekcja Alicji de Rosset z Narodowego Instytutu Muzealnictwa i Ochrony Zbiorów dotyczyła „Możliwości wykorzystania cyfrowych zasobów polskich muzeów”. Myślą przewodnią tego wystąpienia było wypracowanie standardów digitalizacji dla muzeów polskich. NIMOZ, pełni rolę Centrum Kompetencji ds. digitalizacji muzealiów. Gromadzi i archiwizuje zasoby cyfrowe wytworzone w procesie digitalizacji obiektów o charakterze muzealnym w programie Kultura Cyfrowa. Prelegentka mówiła o wyzwaniach związanych z dostępem do danych z muzealnych projektów digitalizacyjnych, takich jak: brak miejsca do udostępniania, brak oprogramowania do zarządzania zbiorami, brak przyjętego schematu udostępniania oraz brak standardu metadanych. Obecnie duża część muzeów korzysta ze standardu metadanych Dublin Core. Nie jest on jednak wystarczającym rozwiązaniem dla obiektów muzealnych. Coraz częściej przyjmowanym i używanym przez muzea  standardem dla metadanych jest SPECTRUM 4.0.

Jako ostatni w pierwszym bloku prelekcji wystąpił Grzegorz Zajączkowski z Ministerstwa Cyfryzacji. Tematem jego prezentacji był „Projekt KRONIK@”. Na początku swojej wypowiedzi wspomniał o różnych projektach podejmowanych przez Ministerstwo Cyfryzacji: domenypubliczne.gov.pl, widok.gov.pl oraz KRONIKA@. Dwa pierwsze nie są związane z digitalizacją, tylko z przechowywaniem danych, dlatego prelekcja dotyczyła tylko ostatniego projektu. KRONIK@ w swoim założeniu to swoisty „sandbox” stanowiący głównie „back-up dla projektu OMNIS” i umożliwiający pracę z danymi które się w nim znajdują. Inaczej mówiąc ideą tego projektu jest stworzenie w ramach istniejącej infrastruktury państwa miejsca do długotrwałej archiwizacji zdigitalizowanych zasobów kultury i nauki, utworzenie repozytorium cyfrowego tych zasobów oraz wyszukiwarki umożliwiającej przeszukiwanie tych zasobów. W tej chwili projekt KRONIK@ ma zgromadzonych na swoich serwerach 15 petabajtów (jeden petabajt [PB] to milion megabajtów [MB]) danych. Niestety niewiele więcej można było się dowiedzieć o projekcie, ponieważ uwagę słuchaczy przyciągały bardziej tablice z pokazywanym czasem jaki został do końca prelekcji niż ona sama.

Drugi blok tematyczny rozpoczęła  Karolina Tabak z Muzeum Narodowego. Jej wykład „Otwarte Muzeum. Strategia cyfrowa Muzeum Narodowego w Warszawie” dotyczył serwisu Muzeum Narodowego – Cyfrowe Muzeum Narodowe. Jako standard metadanych został w nim przyjęty Dublin Core. W tej chwili zostało zgromadzonych 36 000 zdigitalizowanych zabytków. Ciekawą ideą jest współpraca MN z Wikimedią dzięki czemu wzrasta oglądalność jeśli chodzi o stronę Cyfrowego Muzeum Narodowego. Polityka otwartości to teraz jedna z głównych idei jakimi kieruje się Muzeum. Jest to spowodowane otrzymaniem dofinansowania ze środków Unii Europejskiej na digitalizację i udostępnianie cyfrowych zasobów w ramach projektu „Otwarte Narodowe. Digitalizacja i udostępnianie zbiorów Muzeum Narodowego w Warszawie”. Celem projektu jest powiększenie cyfrowej dokumentacji kolekcji MNW oraz udostępnienie jej w nowym serwisie internetowym. Dzielenie się zbiorami to dużo więcej niż tylko możliwość ich oglądania w Sieci, Muzeum Narodowe pozwala również zarabiać na swoich zbiorach. Jako przykład można tutaj przytoczyć możliwość drukowania na koszulkach wzorów zdigitalizowanych obiektów z Cyfrowego Muzeum Narodowego, a następnie ich sprzedaży.

Następnie głos zabrali Grzegorz Urbański i Karol Czajkowski z Narodowego Instytutu Dziedzictwa. Ich prezentacja „Portal Zabytek.pl – przykład zintegrowanych działań na rzecz upowszechniania dziedzictwa narodowego” odnosiła się do powstającej bazy zabytków. Zabytek.pl  udostępnia informacje o polskich zabytkach wraz z ich opisami, zdjęciami, atrakcyjnymi zasobami cyfrowymi (np. modelami 3D obiektów, chmurami punktów) oraz lokalizacją.

Joanna Kaliszewska z Filmoteki Narodowej – Instytutu Audiowizualnego przedstawiła nowopowstałą instytucję kultury FINA. Filmoteka Narodowa – Instytut Audiowizualny FINA powstał w czerwcu 2017 r. z połączenia Filmoteki Narodowej i Narodowego Instytutu Audiowizualnego. Nowo utworzona instytucja będzie kontynuowała dotychczasową działalność podmiotów z których powstała. Co oznacza że, będzie gromadziła, katalogowała i restaurowała dziedzictwo audiowizualne.

Po przerwie trzeci blok tematyczny rozpoczęła Justyna Soliwoda z Narodowego Archiwum Cyfrowego. Zaprezentowała dwa serwisy ZoSIA i szukajwarchiwach.pl. Zintegrowany System Informacji Archiwalnej (ZoSIA) powstał w 2008 r. i jest aplikacją przeznaczona do opracowania zbiorów archiwalnych. Może być wykorzystywana w archiwach państwowych oraz innych jednostkach posiadających archiwa. Został zaimplementowany między innymi w Archiwum Akt Dawnych i Archiwum Akt Nowych. Szukajwarchiwach.pl działa od 2009 r. Jest to serwis, którego celem jest udostępnienie w internecie opisów materiałów archiwalnych z archiwów państwowych i innych instytucji. Większość prezentowana jest wraz ze skanami. Dostęp jest całkowicie otwarty – nie wymaga logowania i jest bezpłatny. Prezentowane są w nim archiwalne zbiory z: Zintegrowanego Systemu Informacji Archiwalnej (ZoSIA) oraz bazy „Program Rejestracji Akt Metrykalnych i Stanu Cywilnego” (PRADZIAD). Zawiera ponad 28 milionów skanów materiałów archiwalnych.

portret ślubny dwojga ludzi, stroje z lat 20-30 XX wieku

Dawny portret ślubny,   www.pixabay.com CC0

Następnie zabrali głos Aleksandra Tokarska-Trzaskowska i Marcin Wilkowski z Laboratorium Cyfrowego Humanistyki UW. Ich prezentacja „Cyfrowe dziedzictwo kulturowe w badaniach humanistycznych: doświadczenia LaCH UW” dotyczyła działań samego Laboratorium na polu upowszechniania cyfrowego dziedzictwa w badaniach humanistycznych. Głównie była mowa o wykładach popularyzatorskich jako przykład podano projekt szekspirowski – repozytorium polskich tłumaczeń Szekspira.

Kolejny prelegent, Jarosław Lipszyc, wystąpił z prezentacją „Wolne lektury – technologia future proof”. Opowiedział o początkach serwisu oraz o formacie WL XML podstawie funkcjonowania serwisu Wolne Lektury. Praca nad treściami publikowanymi w serwisie, polega nie tylko na digitalizacji, ale również kompleksowym opracowywaniu, jest to tak naprawdę przygotowanie de facto nowej cyfrowej edycji. Fundacja pracuje również nad wykupem praw autorskich do kolejnych pozycji, które mają się w nim znaleźć.

Aleksandra Janus z Centrum Cyfrowego w swojej prezentacji „Swoboda użycia: obiegi cyfrowych zasobów dziedzictwa” opowiedziała o serwisie Otwarte Zabytki. Jest to narzędzie online, dzięki któremu internauci sprawdzają i uzupełniają podstawowe informacje o zabytkach: nazwę, adres, datę powstania i współrzędne GPS. Centrum Cyfrowe razem z Creative Commons Polska ma za zadanie pomoc instytucjom kultury we wdrażaniu nowych, otwartych modeli dzielenia się cyfrowym dziedzictwem kultury. Łączy ludzi nauki i kultury z zasobami cyfrowymi – wspiera instytucje kultury we wdrażaniu procesów otwartej digitalizacji i udostępniania zasobów. Jako przykłady takiej współpracy zostały podane współpraca z Muzeum Narodowym i ośrodkiem KARTA. W pierwszym przypadku będzie to aplikacja mobilna MUSELFIE, w drugim narzędzie internetowe Szlaki tułaczy.

Prezentacja „Kompetencje Cyfrowe Humanistów”, przygotowana przez Klaudię Grabowską z Centrum Humanistyki Cyfrowej i dr Martę Kołodziejską z Instytutu Badań Literackich PAN dotyczyła obszarów współpracy międzysektorowej. Został przedstawiony projekt DiMPO (DARIAH Digital Methods and Practices Observatory) prowadzony przez DARIAH.EU. Ma on na celu opracowanie i dostarczanie opisu pojawiających się praktyk, potrzeb i postaw informacyjnych związanych ze środowiskiem cyfrowym z których powinni skorzystać humaniści.

Michał Kozak z Poznańskiego Centrum Superkomuterowo-Sieciowego w swojej prezentacji „MANUS – Internetowy system opracowywania i udostępniania dokumentów źródłowych w standardzie TEI XML” opowiedział o nowym systemie obsługi historycznych dokumentów źródłowych, dedykowanym do budowania zaawansowanych baz i narzędzi dla projektów badawczych. Jako przykłady gdzie MANUS został zastosowany podał Karaimskie Centrum Cyfrowe JAZYSZŁAR oraz Elektroniczne Repozytorium Rot Wielkopolskich e-ROTHA. Spodziewałem się że, dowiem się czegoś więcej o TEI XML, niestety, formuła konferencji starająca się utrzymać prelegentów w czasowych ryzach nie pozwalała na rozwinięcie im swoich prezentacji. O TEI dowiedziałem się tylko tyle że w systemie MANUS stosowana jest wersja TEI P5.

ekran laptopa z kodem komputerowym

Edycja kodu, www.pixabay.com. CC0

Ostatnia prelekcja w tym bloku tematycznym nosiła tytuł „Dokumenty osobiste kobiet w bazie Archiwum kobiet: piszące”. Monika Rudaś-Grodzka oraz Katarzyna Nadana-Sokołowska z Instytutu Badań Literackich PAN przedstawiły projekt bazy internetowej z wpisami dotyczącymi niewydanych rękopisów kobiet mieszkających na obszarze historycznej Polski od XVI w. do współczesności. Będą to przede wszystkim ich dokumentów osobiste takie jak: dzienniki, pamiętniki, autobiografie, listy, ale także dzieła literackie. Obecnie zgromadzone zostały dokumenty z XIX i początku XX w.

Prelekcja Tomasza Gruszkowskiego z Biblioteki Narodowej rozpoczęła ostatni blok tematyczny tej konferencji. „Miliony obiektów, miliony pikseli, miliony opisów” było prezentacją…? A raczej podróżą sentymentalną w przeszłość. Zostały pokazane slajdy na których mogliśmy zobaczyć jak wyglądały skany w Bibliotece Narodowej kiedyś i jak wyglądają teraz.

Następnie dr hab. Maciej Eder oraz Magdalena Król i Joanna Byszuk z Instytutu Języka Polskiego PAN przedstawili w swojej prezentacji „Cyfryzacja historii? Oto jest wyzwanie!” wyniki badań przeprowadzonych nad językiem.  Dotyczyły one zmian w języku na przestrzeni historii. Dla osób zajmujących się digitalizacją był to feedback ze strony środowiska naukowego, jak bardzo ważna jest jakość OCRu w kopiach cyfrowych dokumentów.

COURAGE: rejestr kolekcji dotyczących opozycji kulturowej w krajach postsocjalistycznych” to tytuł prelekcji Barbary Tołłoczko z Instytutu Filozofii i Socjologii Polskiej Akademii Nauk. Opowiedziała o projekcie bazy internetowej istniejących, ale rozproszonych kolekcji dokumentujących różne formy działalności opozycji kulturowej w krajach postsocjalistycznych. Jako opozycję kulturową podała tu przykład Pomarańczowej Alternatywy czy ruchów punkowych.

Przedostatni wykład był tym, na który najbardziej czekałem. Z tytułu prelekcji „Déjà vu jako inspiracja nie tylko dla formatu zapisu danych” wysnułem wniosek, że będzie on najbardziej dotyczył pracy którą wykonuje (przetwarzanie plików TIF do formatu DjVu i HC PDF). Grzegorz Myrda z Instytutu Historii PAN mówił o „synergii” międzyprojektowej powtórnym wykorzystaniu istniejących zasobów, ale ani razu nie wspomniał o formacie DjVu. Przyznam, że byłem troszkę zawiedziony.

Jako ostatnia zabrała głos Agnieszka Fulda-Krokos z Instytutu Nauk o Informacji, Uniwersytetu Pedagogicznego w Krakowie. Jej prezentacja „Cyfrowe biblioteki i muzea jako źródło wiedzy o ekslibrisach – rzeczywistość a potrzeby” dotyczyła cyfrowych postaci exlibrisów i znaków proweniencyjnych. Krótko przedstawiła wytyczne co decyduje o tym że coś jest exlibrisem, następnie przedstawiła statystyki dotyczące występowania exlibrisów w polskich bibliotekach i muzeach cyfrowych. Jako przykład można tu podać bibliotekę Ossolińskich gdzie znajduje się 60 tys. oraz Bibliotekę UJ gdzie znajduje się ich 20 tys.

Po konferencji nasunęło mi się kilka wniosków. Po pierwsze: środowisko muzealników i bibliotekarzy cyfrowych jest bardzo podzielone, nie ma jednolitych standardów jeśli chodzi o digitalizację, metadane i opracowanie zbiorów cyfrowych. Po drugie: mała jest świadomość potrzeby rozwoju na polu informatycznym w środowiskach bibliotekarskich i muzealnych – ani jeden z wykładów nie poruszał np. kwesti IIIF. Po trzecie: jak bardzo istotny dla środowiska naukowego jest OCR oraz inwestowanie przez biblioteki, muzea oraz wszelkiego rodzaju fundacje w jego jakość oraz wszystkie jego pochodne takie jak np. HTR (Handwritting Text Recognition). Po czwarte: cała konferencja była tak naprawdę prezentacją portali internetowych, zabrakło wgłębienia się w temat i dzielenia się szczegółami technicznymi dotyczącymi digitalizacji i cyfryzacji – to oczywiście tylko moje subiektywne odczucie.

Pojawiły się już nagrania wideo z konferencji „Making Cultural Heritage Data Accessible and Reusable: Finding Best Practices”. Można je znaleźć pod tym adresem: http://lach.edu.pl/blog/2018/06/26/nagrania-konferencji-dariah-theme/ .

Adam Owczarczyk, Oddział Rozwoju Zasobów Elektronicznych

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *