Co to jest plan zarządzania danymi ?
Plan Zarządzania Danymi (ang. Data Management Plan) jest kluczowym narzędziem służącym do efektywnego zarządzania danymi badawczymi. Dokument ten zawiera szczegółowe informacje dotyczące rodzajów danych badawczych, zasad korzystania z tych danych, a także procedur związanych z ich udostępnianiem i archiwizacją w trakcie i po zakończeniu badań naukowych lub procesu badawczego. Warto zaznaczyć, że Plan Zarządzania Danymi powinien być opracowany już na wstępnym etapie projektów naukowych.
Obecnie coraz więcej instytucji i agencji, które przyznają środki finansowe na badania naukowe, wymaga dostarczenia Planu Zarządzania Danymi (np. konkursy Narodowego Centrum Nauki, granty w programach Horyzont 2020 i Horyzont Europa finansowanych przez Komisję Europejską).
Podstawowe elementy Planu Zarządzania Danymi
- Opis pozyskanych lub wytworzonych danych: Precyzyjny opis rodzajów danych, które zostaną pozyskane lub wytworzone w trakcie projektu badawczego.
- Kwestie prawne: Określenie aspektów prawnych związanych z danymi, w tym prawa autorskie, licencje, zasady zachowania poufności itp.
- Rodzaje i formaty plików używanych w projekcie: Sporządzenie wykazu formatów plików, które będą używane w trakcie badania.
- Przechowywanie danych: Informacje dotyczące sposobu przechowywania danych w czasie trwania projektu, procedur tworzenia kopii zapasowych oraz kontroli jakości danych.
- Zasady dostępu: Określenie, które dane badawcze zostaną udostępnione, w jakim zakresie oraz na jakich zasadach.
- Prawne i etyczne aspekty przechowywania i udostępniania danych: Wyjaśnienie zasad długoterminowego przechowywania danych, wybór danych do archiwizacji oraz ustalenie okresu przechowywania danych.
- Koszty: Szacowanie kosztów związanych z przygotowaniem danych, ich udostępnianiem i przechowywaniem.
Plan Zarządzania Danymi stanowi kluczowy element projektów badawczych, który pozwala na odpowiednie i odpowiedzialne zarządzanie danymi, a także umożliwia zgodność z wymaganiami instytucji i agencji finansujących badania naukowe. Dzięki temu badacze mogą skuteczniej wykorzystać zebrane dane, a ich prace stają się bardziej dostępne i wartościowe dla całej społeczności naukowej.
Zasady FAIR
Zasady FAIR Data (Inicjatywa FAIR Data) stanowią wytyczne, których celem jest umożliwienie ponownego wykorzystania danych naukowych w sposób klarowny zarówno dla ludzi, jak i maszyn. Wprowadzają one standardy dla dostępu i zarządzania danymi, dzięki którym dane stają się bardziej dostępne, interoperacyjne i ponownie wykorzystywalne, przyczyniając się do postępu w badaniach naukowych oraz w innych dziedzinach.
Warto podkreślić, że zasady FAIR Data nie wykluczają danych, które ze względu na ochronę prywatności nie mogą być publikowane w całości. W rzeczywistości, zasady te pozwalają na zachowanie odpowiednich środków ochrony prywatności i ograniczeń dostępu do danych, jednocześnie spełniając wytyczne umożliwiające wykorzystanie tych danych w kontekście zgodności z FAIR. W ten sposób, dane z ochroną prywatności nadal mogą spełniać wszystkie zasady FAIR, co pozwala na skuteczne zarządzanie danymi badawczymi przy jednoczesnym respektowaniu odpowiednich regulacji i wymogów związanych z poufnością informacji.
Dzięki wprowadzeniu i przestrzeganiu zasad FAIR Data, dane naukowe stają się bardziej dostępne, wiarygodne i łatwiejsze do analizy, co przyczynia się do rozwoju nauki, współpracy badawczej oraz rozwiązywania współczesnych wyzwań naukowych i społecznych.
FINDABLE – możliwy do znalezienia.
• Zbiór danych posiada metadane, które pozwalają zarówno ludziom, jak i programom komputerowym na odnalezienie tego zbioru
• Każdy zbiór jest przypisany unikalnemu identyfikatorowi (np. DOI), który jednocześnie stanowi element metadanych, opisujących ten zbiór
• Metadane są indeksowane w publicznie dostępnych i otwartych bazach danych, umożliwiających ich przeszukiwanie
ACCESSIBLE – dostępny dla wszystkich.
• „Dostępność” w FAIR nie oznacza otwartego dostępu bez ograniczeń; oznacza to, że dane są dostępne i możliwe do ponownego wykorzystania poprzez metadane, które określają dokładne warunki udostępniania.
• Dostęp do zbioru danych, a przynajmniej do metadanych, jest możliwy bezpośrednio poprzez unikalny identyfikator i nie wymaga dodatkowych narzędzi ani oprogramowania
• Metadane są zawsze dostępne, nawet jeśli sam zbiór danych został już usunięty lub przeniesiony
INTEROPERABLE – interoperacyjny – zdolny do współpracy z innymi systemami.
• Dane oraz metadane są dostarczane w formacie zapewniającym łatwy odczyt i przetwarzanie zarówno przez ludzi, jak i komputery; zbiory danych i metadane zawierają odnośniki do innych powiązanych z nimi zbiorów.
REUSABLE – możliwy do ponownego użycia – nadający się do wielokrotnego wykorzystania;
• Metadane zawierają liczne atrybuty dokładnie opisujące zbiór danych i ułatwiające użytkownikom określenie ich przydatności dla własnych badań;
• Zbiór danych zawiera licencję, która jednoznacznie określa warunki ponownego wykorzystania i przetwarzania danych;
• Metadane jasno wskazują autora oraz miejsce powstania danych;
• Metadane są skonstruowane zgodnie z powszechnie akceptowanymi standardami specyficznymi dla danej dziedziny oraz rodzaju danych.
Zgodnie z wytycznymi programu Horyzont 2020: TAK OTWARTE, JAK TO MOŻLIWE, TAK ZAMKNIĘTE, JAK TO KONIECZNE – konieczne jest uwzględnienie ograniczeń prawnych i etycznych oraz spójności z głównym celem prowadzonych badań. Nie wszystkie zbiory danych muszą mieć otwarty charakter, zwłaszcza w przypadku danych osobowych, komercjalizacji wyników badań oraz bezpieczeństwa narodowego.