Przejdź do treści

Uniwersytet Śląski w Katowicach

search

Plan Zarządzania Danymi

Co to jest plan zarządzania danymi?

Plan Zarządzania Danymi (ang. Data Management Plan) jest kluczowym narzędziem służącym do efektywnego zarządzania danymi badawczymi. Dokument ten zawiera szczegółowe informacje dotyczące rodzajów danych badawczych, zasad korzystania z tych danych, a także procedur związanych z ich udostępnianiem i archiwizacją w trakcie i po zakończeniu badań naukowych lub procesu badawczego. Warto zaznaczyć, że Plan Zarządzania Danymi powinien być opracowany już na wstępnym etapie projektów naukowych.

Obecnie coraz więcej instytucji i agencji, które przyznają środki finansowe na badania naukowe, wymaga dostarczenia Planu Zarządzania Danymi (np. konkursy Narodowego Centrum Nauki, granty w programach Horyzont 2020 i Horyzont Europa finansowanych przez Komisję Europejską).

 

Podstawowe elementy Planu Zarządzania Danymi

  1. Opis pozyskanych lub wytworzonych danych: Precyzyjny opis rodzajów danych, które zostaną pozyskane lub wytworzone w trakcie projektu badawczego.
  2. Kwestie prawne: Określenie aspektów prawnych związanych z danymi, w tym prawa autorskie, licencje, zasady zachowania poufności itp.
  3. Rodzaje i formaty plików używanych w projekcie: Sporządzenie wykazu formatów plików, które będą używane w trakcie badania.
  4. Przechowywanie danych: Informacje dotyczące sposobu przechowywania danych w czasie trwania projektu, procedur tworzenia kopii zapasowych oraz kontroli jakości danych.
  5. Zasady dostępu: Określenie, które dane badawcze zostaną udostępnione, w jakim zakresie oraz na jakich zasadach.
  6. Prawne i etyczne aspekty przechowywania i udostępniania danych: Wyjaśnienie zasad długoterminowego przechowywania danych, wybór danych do archiwizacji oraz ustalenie okresu przechowywania danych.
  7. Koszty: Szacowanie kosztów związanych z przygotowaniem danych, ich udostępnianiem i przechowywaniem.

Plan Zarządzania Danymi stanowi kluczowy element projektów badawczych, który pozwala na odpowiednie i odpowiedzialne zarządzanie danymi, a także umożliwia zgodność z wymaganiami instytucji i agencji finansujących badania naukowe. Dzięki temu badacze mogą skuteczniej wykorzystać zebrane dane, a ich prace stają się bardziej dostępne i wartościowe dla całej społeczności naukowej.

Sprawdź się!

 

Samoocena wiedzy w zakresie zarządzania danymi badawczymi (DMP – NCN)

Kwestionariusz pozwala na ocenienie własnej wiedzy i gotowości do tworzenia oraz wdrażania planów zarządzania danymi badawczymi zgodnych z wymaganiami NCN

 

Opis danych, gromadzenie lub ponowne wykorzystanie danych

☐ Rozumiem, czym są dane badawcze i potrafię określić ich typ.

☐ Znam różnicę między danymi pierwotnymi a wtórnymi.

☐ Potrafię opisać dane w sposób umożliwiający ich ponowne wykorzystanie.

☐ Znam zalety stosowania otwartych formatów danych.

☐ Potrafię znaleźć istniejące dane do ponownego użycia.

Dokumentacja i jakość danych

☐ Znam znaczenie i zastosowanie metadanych.

☐ Potrafię opracować słownik danych i opisać zmienne.

☐ Rozumiem potrzebę dokumentowania jednostek miary i danych brakujących.

☐ Znam zasady wersjonowania danych i kontroli ich jakości.

☐ Znam standardy dokumentacyjne dla mojej dyscypliny.

Przechowywanie i kopie zapasowe danych

☐ Znam zasady bezpiecznego przechowywania danych.

☐ Znam zasadę 3-2-1 backupu.

☐ Potrafię dobrać odpowiednie miejsce przechowywania danych.

☐ Potrafię zaplanować regularne tworzenie backupów i ich testowanie.

☐ Znam ryzyka przechowywania danych tylko lokalnie lub w chmurze komercyjnej.

Wymogi prawne i etyczne, kodeksy postępowania

☐ Rozumiem przepisy RODO w kontekście danych badawczych.

☐ Wiem, kiedy należy uzyskać zgodę uczestników na przetwarzanie danych.

☐ Potrafię rozpoznać dane wrażliwe i je zabezpieczyć.

☐ Znam instytucjonalne procedury zatwierdzania badań przez komisję etyczną.

☐ Rozumiem obowiązki związane z anonimizacją i pseudonimizacją danych.

Udostępnianie i długoterminowa ochrona danych

☐ Rozumiem koncepcję otwartych danych badawczych.

☐ Potrafię dobrać repozytorium do udostępnienia danych.

☐ Znam funkcję DOI i innych trwałych identyfikatorów.

☐ Potrafię określić, które dane mogą być publiczne.

☐ Znam zasady archiwizacji danych.

Obowiązki i zasoby w zarządzaniu danymi

☐ Potrafię wskazać osoby odpowiedzialne za dane w zespole.

☐ Rozumiem znaczenie przypisania ról i obowiązków.

☐ Wiem, jak zaplanować budżet na działania RDM.

☐ Potrafię aktualizować DMP w trakcie projektu.

☐ Znam źródła wsparcia instytucjonalnego (np. data steward, IT, biblioteka).

 

Zasady FAIR Data (Inicjatywa FAIR Data) stanowią wytyczne, których celem jest umożliwienie ponownego wykorzystania danych naukowych w sposób klarowny zarówno dla ludzi, jak i maszyn. Wprowadzają one standardy dla dostępu i zarządzania danymi, dzięki którym dane stają się bardziej dostępne, interoperacyjne i ponownie wykorzystywalne, przyczyniając się do postępu w badaniach naukowych oraz w innych dziedzinach.

Warto podkreślić, że zasady FAIR Data nie wykluczają danych, które ze względu na ochronę prywatności nie mogą być publikowane w całości. W rzeczywistości, zasady te pozwalają na zachowanie odpowiednich środków ochrony prywatności i ograniczeń dostępu do danych, jednocześnie spełniając wytyczne umożliwiające wykorzystanie tych danych w kontekście zgodności z FAIR. W ten sposób, dane z ochroną prywatności nadal mogą spełniać wszystkie zasady FAIR, co pozwala na skuteczne zarządzanie danymi badawczymi przy jednoczesnym respektowaniu odpowiednich regulacji i wymogów związanych z poufnością informacji.

Dzięki wprowadzeniu i przestrzeganiu zasad FAIR Data, dane naukowe stają się bardziej dostępne, wiarygodne i łatwiejsze do analizy, co przyczynia się do rozwoju nauki, współpracy badawczej oraz rozwiązywania współczesnych wyzwań naukowych i społecznych.

Zasady FAIR

 

FINDABLE – możliwy do znalezienia.
• Zbiór danych posiada metadane, które pozwalają zarówno ludziom, jak i programom komputerowym na odnalezienie tego zbioru
• Każdy zbiór jest przypisany unikalnemu identyfikatorowi (np. DOI), który jednocześnie stanowi element metadanych, opisujących ten zbiór
• Metadane są indeksowane w publicznie dostępnych i otwartych bazach danych, umożliwiających ich przeszukiwanie

ACCESSIBLE – dostępny dla wszystkich.
• „Dostępność” w FAIR nie oznacza otwartego dostępu bez ograniczeń; oznacza to, że dane są dostępne i możliwe do ponownego wykorzystania poprzez metadane, które określają dokładne warunki udostępniania.
• Dostęp do zbioru danych, a przynajmniej do metadanych, jest możliwy bezpośrednio poprzez unikalny identyfikator i nie wymaga dodatkowych narzędzi ani oprogramowania
• Metadane są zawsze dostępne, nawet jeśli sam zbiór danych został już usunięty lub przeniesiony

INTEROPERABLE – interoperacyjny – zdolny do współpracy z innymi systemami.
• Dane oraz metadane są dostarczane w formacie zapewniającym łatwy odczyt i przetwarzanie zarówno przez ludzi, jak i komputery; zbiory danych i metadane zawierają odnośniki do innych powiązanych z nimi zbiorów.

REUSABLE  – możliwy do ponownego użycia – nadający się do wielokrotnego wykorzystania;
• Metadane zawierają liczne atrybuty dokładnie opisujące zbiór danych i ułatwiające użytkownikom określenie ich przydatności dla własnych badań;
• Zbiór danych zawiera licencję, która jednoznacznie określa warunki ponownego wykorzystania i przetwarzania danych;
• Metadane jasno wskazują autora oraz miejsce powstania danych;
• Metadane są skonstruowane zgodnie z powszechnie akceptowanymi standardami specyficznymi dla danej dziedziny oraz rodzaju danych.

 

Zgodnie z wytycznymi programu Horyzont 2020: TAK OTWARTE, JAK TO MOŻLIWE, TAK ZAMKNIĘTE, JAK TO KONIECZNE – konieczne jest uwzględnienie ograniczeń prawnych i etycznych oraz spójności z głównym celem prowadzonych badań. Nie wszystkie zbiory danych muszą mieć otwarty charakter, zwłaszcza w przypadku danych osobowych, komercjalizacji wyników badań oraz bezpieczeństwa narodowego.

Checklista do sporządzenia Planu Zarządzania Danymi (DMP):

 

Opis danych:

☐ Jakie dane będą zbierane, generowane lub wykorzystywane ponownie?

☐ Jaki będzie format danych (np. CSV, TIFF, TXT)?

☐ Czy dane będą miały strukturę (np. bazy danych) czy będą niestrukturalne (np. nagrania audio)?

Dokumentacja i jakość danych:

☐ Jakie metadane będą zbierane (np. standardy metadanych dla danej dziedziny)?

☐ Czy istniejące standardy jakości danych będą stosowane?

☐ Jak będą weryfikowane poprawność i spójność danych?

Przechowywanie i backup:

☐ Gdzie dane będą przechowywane podczas realizacji projektu (np. serwery instytucji, chmura)?

☐ Jakie metody backupu zostaną zastosowane (np. zasada 3-2-1)?

☐ Kto będzie odpowiedzialny za zarządzanie backupami?

Aspekty prawne i etyczne:

☐ Czy dane będą zawierały informacje wrażliwe lub dane osobowe?

☐ Jakie środki ochrony danych zostaną wdrożone (np. anonimizacja, pseudonimizacja)?

☐ Czy konieczna jest zgoda komisji etycznej lub uczestników badań

Udostępnianie i archiwizacja danych:

☐ Czy i kiedy dane zostaną udostępnione publicznie?

☐ W jakich repozytoriach naukowych dane zostaną zarchiwizowane?

☐ Jakie licencje zostaną przypisane do danych (np. CC0)?

☐ Czy są jakieś ograniczenia dla udostępnienia danych (np. potrzeba embarga)?

Odpowiedzialność i zasoby:

☐ Kto będzie odpowiedzialny za zarządzanie danymi w trakcie projektu (oraz po jego zakończeniu)?

☐ Czy potrzebne są dodatkowe zasoby, szkolenia lub wsparcie IT?

Checklista dla osób rozpoczynających realizację projektu badawczego:

 

Zapoznanie się z Planem Zarządzania Danymi:

☐ Czy wszyscy członkowie zespołu znają/rozumieją zapisy DMP?

☐ Czy podział ról związanych z zarządzaniem danymi jest jasno określony?

Ustanowienie infrastruktury:

☐ Czy istnieje odpowiednia przestrzeń do przechowywania danych?

☐ Czy backupy zostały skonfigurowane (np. automatyczne kopie)?

☐ Czy repozytoria danych i narzędzia do współpracy są gotowe do użycia?

Procedury związane z bezpieczeństwem:

☐ Czy dane wrażliwe są odpowiednio zabezpieczone?

☐ Czy dostęp do danych jest ograniczony tylko do uprawnionych osób?

☐ Czy stosowane są procedury szyfrowania i bezpiecznego przesyłania danych?

Bieżąca dokumentacja:

☐ Czy zmiany w danych są odpowiednio dokumentowane?

☐ Czy tworzona jest bieżąca dokumentacja metod, narzędzi i standardów wykorzystywanych w analizach?

Monitorowanie realizacji DMP:

☐ Czy dane są regularnie archiwizowane zgodnie z DMP?

☐ Czy procesy zarządzania danymi są okresowo weryfikowane i aktualizowane?

☐ Czy zmiany w zarządzaniu danymi są monitorowane i odnotowywane (na poczet raportu końcowego)?

Przygotowanie do raportu końcowego:

☐ Czy dokumentacja danych jest kompletna i zgodna z DMP?

☐ Czy dane zostały zdeponowane w odpowiednich repozytoriach?

☐ Czy planowana jest archiwizacja danych (długoterminowe przechowanie innych danych wytworzonych w projekcie niż danych podstawowych umieszczonych w repozytoriach)?

☐ Czy końcowy raport zarządzania danymi został przygotowany do rozliczenia grantu?

return to top