Plan Zarządzania Danymi
Co to jest plan zarządzania danymi?
Plan Zarządzania Danymi (ang. Data Management Plan) jest kluczowym narzędziem służącym do efektywnego zarządzania danymi badawczymi. Dokument ten zawiera szczegółowe informacje dotyczące rodzajów danych badawczych, zasad korzystania z tych danych, a także procedur związanych z ich udostępnianiem i archiwizacją w trakcie i po zakończeniu badań naukowych lub procesu badawczego. Warto zaznaczyć, że Plan Zarządzania Danymi powinien być opracowany już na wstępnym etapie projektów naukowych.
Obecnie coraz więcej instytucji i agencji, które przyznają środki finansowe na badania naukowe, wymaga dostarczenia Planu Zarządzania Danymi (np. konkursy Narodowego Centrum Nauki, granty w programach Horyzont 2020 i Horyzont Europa finansowanych przez Komisję Europejską).
Podstawowe elementy Planu Zarządzania Danymi
- Opis pozyskanych lub wytworzonych danych: Precyzyjny opis rodzajów danych, które zostaną pozyskane lub wytworzone w trakcie projektu badawczego.
- Kwestie prawne: Określenie aspektów prawnych związanych z danymi, w tym prawa autorskie, licencje, zasady zachowania poufności itp.
- Rodzaje i formaty plików używanych w projekcie: Sporządzenie wykazu formatów plików, które będą używane w trakcie badania.
- Przechowywanie danych: Informacje dotyczące sposobu przechowywania danych w czasie trwania projektu, procedur tworzenia kopii zapasowych oraz kontroli jakości danych.
- Zasady dostępu: Określenie, które dane badawcze zostaną udostępnione, w jakim zakresie oraz na jakich zasadach.
- Prawne i etyczne aspekty przechowywania i udostępniania danych: Wyjaśnienie zasad długoterminowego przechowywania danych, wybór danych do archiwizacji oraz ustalenie okresu przechowywania danych.
- Koszty: Szacowanie kosztów związanych z przygotowaniem danych, ich udostępnianiem i przechowywaniem.
Plan Zarządzania Danymi stanowi kluczowy element projektów badawczych, który pozwala na odpowiednie i odpowiedzialne zarządzanie danymi, a także umożliwia zgodność z wymaganiami instytucji i agencji finansujących badania naukowe. Dzięki temu badacze mogą skuteczniej wykorzystać zebrane dane, a ich prace stają się bardziej dostępne i wartościowe dla całej społeczności naukowej.
Zasady FAIR
Zasady FAIR Data (Inicjatywa FAIR Data) stanowią wytyczne, których celem jest umożliwienie ponownego wykorzystania danych naukowych w sposób klarowny zarówno dla ludzi, jak i maszyn. Wprowadzają one standardy dla dostępu i zarządzania danymi, dzięki którym dane stają się bardziej dostępne, interoperacyjne i ponownie wykorzystywalne, przyczyniając się do postępu w badaniach naukowych oraz w innych dziedzinach.
Warto podkreślić, że zasady FAIR Data nie wykluczają danych, które ze względu na ochronę prywatności nie mogą być publikowane w całości. W rzeczywistości, zasady te pozwalają na zachowanie odpowiednich środków ochrony prywatności i ograniczeń dostępu do danych, jednocześnie spełniając wytyczne umożliwiające wykorzystanie tych danych w kontekście zgodności z FAIR. W ten sposób, dane z ochroną prywatności nadal mogą spełniać wszystkie zasady FAIR, co pozwala na skuteczne zarządzanie danymi badawczymi przy jednoczesnym respektowaniu odpowiednich regulacji i wymogów związanych z poufnością informacji.
Dzięki wprowadzeniu i przestrzeganiu zasad FAIR Data, dane naukowe stają się bardziej dostępne, wiarygodne i łatwiejsze do analizy, co przyczynia się do rozwoju nauki, współpracy badawczej oraz rozwiązywania współczesnych wyzwań naukowych i społecznych.
Zasady FAIR
FINDABLE – możliwy do znalezienia.
• Zbiór danych posiada metadane, które pozwalają zarówno ludziom, jak i programom komputerowym na odnalezienie tego zbioru
• Każdy zbiór jest przypisany unikalnemu identyfikatorowi (np. DOI), który jednocześnie stanowi element metadanych, opisujących ten zbiór
• Metadane są indeksowane w publicznie dostępnych i otwartych bazach danych, umożliwiających ich przeszukiwanie
ACCESSIBLE – dostępny dla wszystkich.
• „Dostępność” w FAIR nie oznacza otwartego dostępu bez ograniczeń; oznacza to, że dane są dostępne i możliwe do ponownego wykorzystania poprzez metadane, które określają dokładne warunki udostępniania.
• Dostęp do zbioru danych, a przynajmniej do metadanych, jest możliwy bezpośrednio poprzez unikalny identyfikator i nie wymaga dodatkowych narzędzi ani oprogramowania
• Metadane są zawsze dostępne, nawet jeśli sam zbiór danych został już usunięty lub przeniesiony
INTEROPERABLE – interoperacyjny – zdolny do współpracy z innymi systemami.
• Dane oraz metadane są dostarczane w formacie zapewniającym łatwy odczyt i przetwarzanie zarówno przez ludzi, jak i komputery; zbiory danych i metadane zawierają odnośniki do innych powiązanych z nimi zbiorów.
REUSABLE – możliwy do ponownego użycia – nadający się do wielokrotnego wykorzystania;
• Metadane zawierają liczne atrybuty dokładnie opisujące zbiór danych i ułatwiające użytkownikom określenie ich przydatności dla własnych badań;
• Zbiór danych zawiera licencję, która jednoznacznie określa warunki ponownego wykorzystania i przetwarzania danych;
• Metadane jasno wskazują autora oraz miejsce powstania danych;
• Metadane są skonstruowane zgodnie z powszechnie akceptowanymi standardami specyficznymi dla danej dziedziny oraz rodzaju danych.
Zgodnie z wytycznymi programu Horyzont 2020: TAK OTWARTE, JAK TO MOŻLIWE, TAK ZAMKNIĘTE, JAK TO KONIECZNE – konieczne jest uwzględnienie ograniczeń prawnych i etycznych oraz spójności z głównym celem prowadzonych badań. Nie wszystkie zbiory danych muszą mieć otwarty charakter, zwłaszcza w przypadku danych osobowych, komercjalizacji wyników badań oraz bezpieczeństwa narodowego.