BuwLOG

Droga obiektu w procesie digitalizacji

Digitalizacja ma na celu udostępnienie w Internecie obiektów, które są 1) cenne, 2) zniszczone, 3) bardzo często wykorzystywane przez czytelników. Nawet jedna z tych cech jest przesłanką do zdigitalizowania książki czy czasopisma, często występują wszystkie trzy naraz. Dla bibliotek z jednej strony digitalizacja jest metodą ochrony zbiorów (zamiast oryginałów udostępniamy tylko cyfrowe kopie), z drugiej strony ‒ pozwala na znacznie szersze ich udostępnianie (niekoniecznie trzeba przyjeżdżać osobiście do biblioteki, wystarczy urządzenie z dostępem do Internetu).

Profesjonalne podejście do procesu digitalizacji jest bardziej skomplikowane, niż mogłoby się wydawać. W tym wpisie chcielibyśmy pokazać jak wygląda droga obiektu w procesie digitalizacji, od wersji analogowej do cyfrowej.
Składa się on z następujących etapów:

Typowanie

Pierwszym etapem jest typowanie. Kryteria jakimi w BUW-ie kierujemy się decydując, co i jak zdigitalizować można znaleźć na stronie e-bUW-u. Są to:

– przydatność w prowadzonych pracach naukowych oraz procesie dydaktycznym,

– znaczenie dla ochrony dziedzictwa narodowego – w odniesieniu do kolekcji historycznych zgromadzonych w BUW i w bibliotekach wydziałowych,

– zły stan zachowania obiektów oryginalnych,

– znaczenie dla propagowania wiedzy o dziedzictwie kulturowym Warszawy i Mazowsza.

Obiekt do biblioteki cyfrowej może zaproponować też każdy czytelnik. Dla każdej pozycji wytypowanej do digitalizacji sprawdza się jej status prawnoautorski (żeby można było ją udostępnić jak najszerzej w internecie musi znajdować się w tzw. domenie publicznej) oraz czy nie została już opublikowana przez inną bibliotekę cyfrową (żeby nie dublować pracy innych instytucji).

Opracowanie

Od początku istnienia biblioteki cyfrowej przyjęliśmy zasadę, że każdy obiekt w niej publikowany powinien być opracowany w katalogu NUKAT lub, jeśli to niemożliwe, w katalogu bibliotek UW. Trzymamy się tej zasady, gdyż opracowania dokonują katalogerzy –  specjaliści, znający zbiory i ich specyfikę, dzięki czemu metadane (opis obiektu w bibliotece cyfrowej, prezentowany w formacie Dublin Core) powstające na bazie opisu bibliograficznego są najwyższej możliwej jakości.

Przygotowanie

Każdy obiekt przed digitalizacją jest sprawdzany pod kątem kompletności oraz stanu zachowania. Jeśli ma jakieś braki (np. stron), próbujemy je uzupełnić we współpracy z innymi bibliotekami, sprowadzając i digitalizując ich obiekty albo zamawiając skany wykonane w innych instytucjach. Jeśli osoba przygotowująca obiekt do skanowania uzna, że digitalizacja mogłaby pogorszyć jego stan ‒ jest on kierowany w pierwszej kolejności do konserwacji.

Skanowanie

Przygotowany obiekt trafia do pracowni skanerów, gdzie jest digitalizowany. Obecnie większość obiektów jest skanowana w rozdzielczości 300 dpi, w kolorze ‒ takie wartości są wystarczające dla zachowania odpowiedniej jakości obrazu, jak również do późniejszego przetwarzania oraz archiwizacji. Wyjątek stanowią tu zbiory specjalne, digitalizowane w indywidualnie dobieranych wartościach, w oparciu o wielkość samego obiektu, jego specyfikę oraz szczegółowość najmniejszych fragmentów jego treści. Do zapisu powstałych w ten sposób plików został przyjęty format TIFF. Po zeskanowaniu następuje obróbka graficzna (najczęściej sprowadzająca się do kadrowania) i kontrola plików (sprawdzana kompletności i jakości plików cyfrowych).
Niektórych obiektów nie można zeskanować, wtedy używany jest aparat fotograficzny. Gotowe pliki danej publikacji są przesyłane do dalszych prac.

Przetwarzanie

W kolejnym etapie skany przetwarzane są do formatu prezentacyjnego, czyli takiego jaki możemy oglądać w e-bUW-ie. Pliki są poddawane procesowi konwersji formatu prezentacyjnego i łączone w jedną publikację. Efektem końcowym jest obecnie plik w formacie HC PDF (High Compressed PDF). To w tym etapie wykonywane jest rozpoznanie treści (OCR) w publikacjach drukowanych, dodawane są również hiperłącza do spisów treści (tzw. mapowanie).

Publikowanie

Pliki prezentacyjne trafiają do redaktorów cyfrowych, których zadaniem jest połączyć je z odpowiednimi metadanymi. Proces publikowania odbywa się w oprogramowaniu dLibra. Można go podzielić na kilka etapów. Pierwszy, to zaimportowanie danych obiektu oryginalnego (patrz etap „Opracowanie”) i ich dostosowanie do formatu Dublin Core, używanego do prezentacji metadanych w bibliotece cyfrowej. Następnie są importowane pliki prezentacyjne publikacji. Na koniec link do publikacji w e-bUW-ie jest dodawany do opisu obiektu w katalogu NUKAT lub katalogu bibliotek UW, w zależności od tego, gdzie obiekt oryginalny został opracowany.

Archiwizacja

Końcem procesu digitalizacji, jest archiwizacja, polegająca na bezpiecznym przechowywaniu zarówno skanów, jak i plików prezentacyjnych.

Aby można było sobie lepiej wyobrazić całą ścieżkę digitalizacji przygotowaliśmy krótki film na którym możecie się przekonać jak to wygląda.

Adam Owczarczyk, Oddział Rozwoju Zasobów Elektronicznych

Pisaliśmy już o:

Historii e-bUWu.

Dziwnych rzeczach jakie można zobaczyć na skanach.

Prawie autorskim w pracy bibliotekarza cyfrowego.

W kolejnych wpisach:

Przekażemy trochę statystyk dotyczących e-bUW-u.

Przedstawimy receptę na e-bUW

Przyjrzymy się, co zmieniało się w naszej pracy przez te 10 lat.

Postaramy się wyjaśnić kwestię ponownego wykorzystanie zbiorów e-bUW.

Opowiemy o pewnym rękopisie, trudnym w każdym calu.

A na koniec zastanowimy się nad przyszłością e-bUW-u.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *