BuwLOG

Plan zarządzania danymi na podstawie wytycznych NCN

badanie mikroskopem prace badawcze laboratorium mikroskop

Chokniti Khongchum z Pixabay źródło: https://cdn.pixabay.com/photo/2019/08/13/08/15/analysis-4402809_960_720.jpg

Plan zarządzania danymi na podstawie wytycznych NCN to cykl szkoleń organizowanych w 2020 r. przez Narodowe Centrum Nauki przy współpracy z Centrum Kompetencji Otwartej Nauki przy Bibliotece Politechniki Gdańskiej. Szkolenia przygotowano z myślą o bibliotekarzach i pracownikach administracji uczelni, by przygotować ich do wspierania pracowników naukowych w tworzeniu planów zarządzania danymi badawczymi (PZD). Szkolenia cieszyły się ogromnym zainteresowaniem bibliotekarzy z całej Polski. Dwie osoby z OUIS w lutym miały okazję wzięcia w nich udziału: Anna Książczak-Gronowska (szkolenie w Krakowie) i Maja Bogajczyk (szkolenie w Gdańsku).

Podczas krakowskiego szkolenia, które odbyło się w siedzibie NCN, wysłuchaliśmy najpierw wystąpienia dr Laury Bandury-Morgan pt. „Transparentność badań naukowych w Polsce – spojrzenie z perspektywy Narodowego Centrum Nauki”. Następne dwa wystąpienia przedstawicielek Biblioteki Politechniki Gdańskiej: dr Anny Wałek (Dyrektor BPG, koordynatorki merytorycznej programu MOST DANYCH) i Magdaleny Szuflity-Żurawskiej (Liderki Centrum Kompetencji Otwartej Nauki Politechniki Gdańskiej – projekt MOST DANYCH) dotyczyły otwartych danych badawczych, prezentacji projektu MOST DANYCH, planów zarządzania danymi badawczymi i wreszcie roli bibliotek w procesie zarządzania danymi badawczymi. Gdańskie szkolenie zostało ograniczone do tych dwóch ostatnich punktów.

Narodowe Centrum Nauki przystąpiło do cOAlisionS[1] w 2018 r. Kolejnym krokiem NCN ku otwartej nauce w Polsce było wprowadzenie w 2019 roku wymogu sporządzenia Planu Zarządzania Danymi Badawczymi (ang. Data Managment Plan, DMP) przy składaniu wniosków grantowych do niektórych programów. Przystępując do „Planu S” NCN zadeklarowało, że nie tylko publikacje, ale wszystkie efekty badań prowadzonych w ramach grantów mają być udostępniane w otwartym dostępie. Oznacza to, że każdy wniosek grantowy składany od 2020 r. musi zawierać Plan zarzadzania danymi. Natomiast od 1 stycznia 2021 r. nastąpić ma w NCN pełna realizacja założeń Planu S, zrealizowana poprzez:

  • zapewnienie natychmiastowego dostępu (bez embargo) do publikacji (artykułów, książek i rozdziałów) i danych badawczych;
  • zachowanie przez autorów pełnych autorskich praw majątkowych (preferowane są licencje CC-BY 4.0);
  • nieobciążania autorów opłatami publikacyjnymi APC (article processing charges) za publikacje w czasopismach; mają one być finansowane przez uczelnie lub grantodawców (wpisywane do kosztów kwalifikowanych);
  • ustalenie przez agencje finansujące naukę kryteriów jakości, które muszą spełniać czasopisma, platformy i repozytoria OA: zalecana jest rejestracja w DOAJ, DOAB i OpenDOAR;
  • zaprzestanie finansowania publikacji w czasopismach hybrydowych przez NCN (model akceptowany tylko w okresie przejściowym).

Przypomnijmy, że 23 października 2018 r. Dyrektor NCN podpisał również Deklarację DORA[2], która dotyczący sposobu oceniania jakości badań naukowych. Jej sygnatariusze zgadzają się, że przy ocenie wyników badań naukowych należy stosować kryteria merytoryczne, a nie wskaźniki bibliometryczne (np. Impact Factor czasopisma lub indeks Hirscha). Stąd we wnioskach grantowych NCN brak jest pytań o te wskaźniki. Wszystkie te działania NCN mają na celu podniesienie standardów prowadzenia badań naukowych w Polsce.

Szkolenia, w których uczestniczyłyśmy były skupione wokół tematu planu zarządzania danymi nadawczymi (Data Management Plan, DMP). Określa on, w jaki sposób dane badawcze mają być gromadzone, przetwarzane, analizowane, wizualizowane, opisywane, przechowywane, zabezpieczone, opublikowane i ewentualnie ponownie wykorzystane podczas projektu badawczego, jak i po jego zakończeniu. Jest to tzw. cykl życia danych badawczych. Uporządkowanie danych i ich publiczne udostępnienie ma kapitalne znaczenie dla weryfikacji wyników badań i stanowi niepodważalny dowód ich przeprowadzenia. W planie określa się również, kto będzie odpowiedzialny za zarządzanie danymi i ich udostępnianie (np. kierownik projektu). Wprowadzenie obowiązku uzupełnienia wniosku grantowego o plan zarządzania danymi badawczymi nie powinien być traktowany przez naukowców jako kolejny biurokratyczny obowiązek.  Przemyślany plan pomaga bowiem zaplanować badania i poprawnie wypełnić wniosek o grant badawczy.

Plan zarządzania danymi powinien być przygotowany wraz z wnioskiem grantowym, następnie uzupełniony na etapie składania raportu końcowego. Oceniany będzie przez ekspertów po zakończeniu realizacji projektu. Należy go traktować jako tzw. żywy dokument, który może być uzupełniany w trakcie trwania projektu. Natomiast niekompletny lub niezrealizowany plan może być podstawą do rozwiązania umowy o finansowanie badań przez NCN. Plan zarządzania danymi wypełnia się w języku angielskim. Jednak taki plany powinny powstawać nie tylko na potrzeby wniosków grantowych. Powinny być uznane jako kolejna dobra praktyka prowadzenia badań naukowych, przekazywana młodym naukowcom najpóźniej na studiach doktoranckich. Naukowiec powinien jak najszybciej nauczyć się sprawnie zarządzać swoimi danymi, aby podnieść jakość swoich badań.

Dane badawcze to zarejestrowane materiały o charakterze faktograficznym (w postaci liczbowej, tekstowej, graficznej czy dźwiękowej). Mogą ni mi być: dane liczbowe, dokumenty tekstowe, notatki, kwestionariusze, nagrania audio i wideo, fotografie, oprogramowanie, wyniki symulacji komputerowych, protokoły laboratoryjne, opisy metodologiczne, dane odczytane z urządzeń pomiarowych itp. Dane badawcze to zarówno surowe dane – uzyskane bezpośrednio w wyniku zastosowania narzędzia badawczego oraz takie dane, które poddane zostały obróbce. Dane badawcze powinny być traktowane równie poważnie, jak publikacje podsumowujące wyniki przeprowadzonych badań. Jednak dziś większość danych badawczych, na których oparto publikacje jest niedostępnych. Czasami pełne udostępnienie danych nie jest możliwe z powodów prawnych (np. przepisy o ochronie danych osobowych) lub etycznych (np. dane o pacjentach), dlatego powszechne jest już przekonanie, że dane powinny być tak otwarte, jak to możliwe i na tyle zamknięte, na ile jest to konieczne.

Podczas obu szkoleń (w Krakowie i w Gdańsku) omówione zostały typy danych badawczych oraz zasada FAIR[3], opisująca wytyczne wg których powinny być przygotowywane dane udostępniane zarówno ludziom, jak i maszynom. Przedstawione zostało pokrótce zagadnienie metadanych danych badawczych. Wszystkie dane badawcze muszą być udostępnione wraz z opisującymi je metadanymi, tak aby można było je w przyszłości znaleźć. Istnieje kilka standardów metadanych, dostosowanych do poszczególnych dyscyplin. Wszystkie standardy są dostępne na stronie http://www.dcc.ac.uk/resources/metadata-standards.

Prowadząca szkolenie Magdalena Szuflita-Żurawska skupiła się nie tylko na przybliżeniu uczestnikom samego problemu danych badawczych i planu ich zarządzania, omówieniu formatki Planu Zarządzania Danymi w konkursach NCN, przykładów repozytoriów danych, ale również na tym, na co warto zwrócić uwagę prowadząc szkolenia dla naukowców. Jak się okazuje, wielu naukowców nie jest obeznanych z podstawową terminologią dotyczącą open access, np. z licencjami Creative Commons. Równie wielu uważa, że nie gromadzi żadnych danych badawczych, więc „problem” planu zarządzania nimi wcale ich nie dotyczy. Prowadząca doradziła też, by w związku z dużymi różnicami między poszczególnymi dyscyplinami naukowymi, przygotowywać szkolenia raczej dla naukowców z poszczególnych obszarów badawczych, niż szkolenia ogólne dla wszystkich dyscyplin.

Niestety problemem w Polsce jest brak dobrej praktyki udostępniania gotowych, wysoko ocenionych planów badawczych. Na szkoleniu nie dostaliśmy do ręki żadnych przykładów planów sprządzonych przez pracowników Politechniki Gdańskiej, ponieważ nikt z nich nie wyraził na to zgody. Samo NCN również nigdzie ich nie publikuje. Miejmy nadzieję, że zasady otwartej nauki będą konsekwentnie wdrażane także w tym aspekcie.

W wytycznych dla wnioskodawców do uzupełnienia PZD w projekcie badawczym NCN odsyła naukowców po pomoc w wypełnianiu formularza do pracowników biblioteki / odpowiedniego repozytorium / działu IT instytucji. Stąd wynika rosnąca rola bibliotek w doradzaniu naukowcom w procesie zarządzania danymi badawczymi. Szkolenie, pełne praktycznych porad dla bibliotekarzy uzmysłowiło nam przed jak wielkimi wyzwaniami przychodzi nam stanąć, zwłaszcza, że gromadzenie danych badawczych ma wiele aspektów: prawnych, etycznych, technicznych i organizacyjnych. Obawa przed pisaniem planów zarządzania danymi badawczymi pojawia się zapewne stąd, że wraz z zagłębianiem się w temat, rośnie świadomość skomplikowania tej materii. Bibliotekarz prawdopodobnie nigdy nie stanie się specjalistą od sporządzania planu dla każdej dyscypliny naukowej, stąd już od paru lat spotykamy się z pojęciem data stewardów, naukowców specjalizujących się w temacie danych badawczych gromadzonych w danej dyscyplinie. To oni powinni pomagać kolegom z instytucji zarządzać wytwarzanymi danymi badawczymi. Natomiast rolą bibliotekarzy naukowych powinno być wsparcie, szkolenia, wskazywanie źródeł informacji na temat zarządzania danymi, ale na pewno nie przygotowanie planów ZDB za aplikujących o granty naukowców. Przygotowanie przemyślanego planu zarządzania danymi badawczymi musi być bowiem częścią całego projektu badawczego.

[1] Plan S (cOAlition S ) – europejskie porozumienie instytucji finansujących badania naukowe, którego sygnatariusze postulują  udostępnianie w sposób otwarty wszystkich publikacji z badań finansowanych przez koalicjantów; zasada ta ma obowiązywać już od 2020 roku.

[2] https://www.ncn.gov.pl/aktualnosci/2018-10-23-ncn-sygnatariuszem-dora

[3] FAIR Data to dane badawcze, które zostały opisane, przechowywane i publikowane zgodnie z międzynarodowym standardem. FAIR jest akronimem od: findable – możliwe do odnalezienia; accessible – dostępne dla wszystkich; interoperable – interoperacyjne, tak aby można było je połączyć z innymi danymi;  reusable – wielokrotnego użytku.

Anna Książczak-Gronowska, Maja Bogajczyk  

Oddział Usług Informacyjnych i Szkoleń

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.