BuwLOG

METS – standard kodowania i transmisji metadanych

Pliki METS powstają podczas procesu przetwarzania zeskanowanych materiałów do formatu prezentacyjnego. 

METS – Metadata Encoding and Transmission Standard (Standard kodowania i transmisji metadanych) – co to takiego jest i dlaczego jest ważny dla bibliotekarzy? METS to pewien schemat kodowania informacji – metadanych opisowych, administracyjnych i strukturalnych dotyczących obiektów cyfrowych, które w przypadku BUW najczęściej trafiają do Crispy. Jest on wyrażony przy użyciu kodu w pliku XML. Ten rodzaj pliku to dosyć popularny standard stosowany do kodowania metadanych, ale trzeba zauważyć, że nie każdy plik XML stosuje ten sam schemat wewnętrzny. W przypadku METSa nad standardami schematu pliku XML czuwa organizacja World Wide Web Consortium. Nad utrzymaniem standardu METS czuwa Zarząd METS we współpracy z Biurem Rozwoju Sieci i Biurem Standardów MARC Biblioteki Kongresu. Powstał on z inicjatywy Digital Library Federation – DLF.

Metadane dotyczące poszczególnych obiektów są bardzo ważną rzeczą dla funkcjonowania biblioteki cyfrowej. Mam na myśli informacje lub, inaczej mówiąc, dane dotyczące pliku lub większego obiektu składającego się ze zbioru plików. Metadane dotyczące obiektów cyfrowych, pozwalające nimi zarządzać i korzystać z nich, są obszerniejsze i różnią się od metadanych używanych do pracy z obiektami fizycznymi. Oprócz opisu (zawierającego dane bibliograficzne) samej publikacji takie metadane muszą zawierać jeszcze metadane techniczne i strukturalne obiektu. Metadane techniczne dotyczą samego procesu digitalizacji np.: rozdzielczości w której został zeskanowany obiekt czy urządzenia, na którym on został poddany cyfryzacji. W przypadku metadanych strukturalnych są to dane dotyczące powiązań pomiędzy plikami w danej publikacji. Obiekt fizyczny stanowi całość i o ile ktoś nie dokona jego uszkodzenia np. wyrwie i zniszczy jakieś strony, to stanowi on jeden obiekt. W przypadku publikacji cyfrowej są to przeważnie pojedyncze pliki, zgromadzone w jednym lub kilku katalogach. Bez metadanych pokazujących jak mają być połączone (powiązane) publikacja cyfrowa stanowiłaby tylko zbiór luźnych plików. Metadane strukturalne i techniczne spajają publikację cyfrową w jeden obiekt, są istotne dla okresowego odświeżania, uzupełniania i migracji danych oraz zapewniają trwałość zasobów cyfrowych. Bez metadanych technicznych dotyczących procesu digitalizacji naukowiec zajmujący się danym obiektem nie mógłby być pewien, jakie dokładnie odzwierciedlenie oryginału zapewnia mu wersja cyfrowa tego obiektu.

Plik METS jest „kontenerem”, w którym wszystkie te metadane dotyczące danej publikacji są gromadzone. Zawiera metadane dotyczące fizycznego obiektu (opis obiektu w katalogu), danych technicznych i strukturalnych dotyczących plików, które stanowią wersję cyfrową tego obiektu.

Kolorowa grafika przedstawiająca schemat pliku METS
Ogólny schemat pliku METS (autor grafiki Adam Owczarczyk)

W sekcji nagłówka umieszczane są dane opisujące sam plik METS, w tym takie informacje, jak twórca, edytor itp.

kod pliku mets.xml - nagłówek
Sekcja HEADER pliku METS.xml – przykład

W sekcji metadanych deskryptywnych znajdują się: dane opisowe zewnętrzne w stosunku do dokumentu METS (np. rekord MARC) lub wewnętrznie osadzone, lub jedne i drugie. W przypadku plików znajdujących się w Crispie umieszczamy tu opis MARC danego obiektu skopiowany z naszego katalogu (OPAC). Dane z rekordu katalogowego są przetwarzane do postaci schematu MODS używanego do opisu elementów bibliograficznych. 

kod pliku METS.xml - dane opisowe pliku
Część kodu pliku METS.xml przedstawiająca dane opisowe – przykład

Sekcja metadanych administracyjnych zawiera informacje dotyczące sposobu tworzenia i przechowywania plików, praw własności intelektualnej, danych dotyczących oryginalnego obiektu źródłowego, z którego został utworzony obiekt biblioteki cyfrowej. Ważną częścią tej sekcji są informacje dotyczące pochodzenia plików składających się na obiekt biblioteki cyfrowej – chodzi o relacje pomiędzy plikami nadrzędnymi i pochodnymi oraz informacje o ich migracji lub transformacji. Podobnie jak w przypadku metadanych opisowych, metadane administracyjne mogą być zewnętrzne w stosunku do dokumentu METS lub zakodowane wewnętrznie.

kod pliku METS.xml - dane administracyjne
Część kodu pliku METS.xml przedstawiająca dane administracyjne – przykład

Sekcja opisująca zestawienie plików zawiera jeden lub więcej elementów używanych do grupowania powiązanych ze sobą plików. W tej części pliku METS znajduje się lista wszystkich plików, które składają się na pojedynczą elektroniczną wersję obiektu biblioteki cyfrowej (tzw. publikację lub wersję prezentacyjną obiektu).

Mogą istnieć oddzielne sekcje dla: miniatur, głównych obrazów archiwalnych, wersji pdf, plików jpg, plików ALTO itd. Nie bez powodu wspominam tutaj pliki ALTO ponieważ w Crispie zawarty jest w nich OCR (Optical Character Recognition). Wszystkie elementy znajdujące się w tej sekcji  mają unikatowy atrybut ID. Jest to wewnętrzna nazwa danego pliku, do której mogą się odwoływać inne części dokumentu.

kod pliku METS.xml  - sekcja opisująca zestawienie plików publikacji
Część kodu pliku METS.xml przedstawiająca zestawienie plików tworzących publikację – przykład

Z poprzednią sekcją pliku METS łączy się następna, opisująca zależności strukturalne plików tworzących obiekt cyfrowy. Pozwala to na prezentowanie obiektu użytkownikom w takiej formie i kolejności plików, jak jest opisana w tej sekcji. Jest to pewien rodzaj mapy, po której porusza się maszyna (komputer, oprogramowanie itp.) prezentująca użytkownikowi obiekt cyfrowy.

kod pliku METS.xml - dane strukturalne
Część kodu pliku METS.xml przedstawiająca dane strukturalne – przykład

Ostatnie dwie sekcje, bardzo rzadko wykorzystywane, zawierają dwa rodzaje danych: linki strukturalne i zachowania wykonywalne publikacji . Sekcja łączy strukturalnych w METS ma na celu umożliwienie rejestrowania istnienia hiperłączy między elementami w obrębie mapy strukturalnej danego obiektu. Jest to przydatna funkcja, jeśli chcielibyśmy używać standardu METS do archiwizowania witryn internetowych do przechowywania zapisu struktury hipertekstowej (linków) witryn oddzielnie od plików HTML samej witryny. Jeśli chodzi o sekcję zawierającą zachowania wykonywalne publikacji tzw. „Behavior” służy do kojarzenia tych zachowań z zawartością pliku METS. Zachowania obiektów cyfrowych można umieścić w pliku METS jako powiązania z rozproszonymi usługami sieciowymi.

Adam Owczarczyk (ORZE)


Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.