Kdy a jaká data sdílet

Ať už je otevřené sdílení dat podmínkou ve vašem projektu, nebo třeba při odevzdání publikace u specifického vydavatele, vždy je potřeba zvážit, jaká data je nutné/možné zveřejnit, kdy data zveřejnit a kde a jakým způsobem to udělat. Otázka sdílení dat může nastat kdykoli během vašeho výzkumu a informace o tom, kdy a jaká data budete sdílet, by měly být zachyceny ve vašem data management plánu.

I přesto, že každý vydavatel nebo poskytovatel může mít své podmínky pro zveřejnění dat, obecně platí, že v době publikace vědeckého výstupu, je nutné zveřejnit všechna data nezbytná pro replikaci výsledků studie bez omezení. Pokud existují právní nebo etické překážky takovému sdílení dat, autoři tak musí uvést v Prohlášení o dostupnosti dat a zmínit, kde bude možné k datům získat přístup.

Kdy během výzkumu/publikování sdílet výzkumná data

Pro sdílení výzkumných dat existuje několik časových rámců:

1. Sdílejte data v reálném čase podle toho, jak váš výzkum postupuje.

Sdílení dat v průběhu jejich sběru není ve vědecké praxi příliš časté. Důvodem jsou obavy z poskytování výhody a možnosti vytěžovat vaše výzkumná data jinými institucemi a výzkumníky. Výjimkou jsou případy nenadálých událostí nebo globálních problémů, jako jsou například pandemie, kdy sdílená data mohou výrazně pomoci veřejnosti.

2. Sdílejte data, ihned když předkládáte rukopis, s nímž jsou spojena, k recenzi v odborném časopise.

To, že jsou data k dispozici recenzentům, jim umožní hlouběji prozkoumat vaši práci a prokáže bohatost vašeho výzkumu. Sdílení dat v této fázi může být specifickou podmínkou vydavatele, proto doporučujeme vždy sledovat jednotlivé politiky pro sdílení dat u akademických vydavatelství.

3. Sdílejte data ve stejnou dobu, kdy je publikována kniha nebo článek, který je jejich základem.

To je pravděpodobně nejčastěji používaným způsobem. Opět se může jednat o požadavek vydavatele, u kterého publikujete. Může se také jednat o jednu z podmínek ve vašem projektu. Případně můžete chtít čtenářům jednoduše poskytnout podkladové materiály k vaší práci.

4. Sdílejte data po uplynutí doby časového embarga

Časové embargo může být na data uvaleno z různých důvodů. Do DMP vašeho výzkumu je vždy nutné časové embargo zapsat (i když je pouze předpokládané), tak abyste mohli splnit podmínku otevřeného sdílení dat a zároveň data z různých důvodů po omezenou dobu chránit. Stejně tak časové embargo musí být uvedeno v Prohlášení o dostupnosti dat.

Důvody pro omezení přístupu k datům

Ne všechna data je možné sdílet otevřeně, a to nejčastěji z důvodů právních nebo etických překážek. Proto existují přijatelné situace nastavení omezení přístupu k datům. Pokud cokoli brání zveřejnění dat nebo musí dojít k jejich zveřejnění v omezeném režimu (např. časové embargo), musí autoři tato omezení jasně uvést v prohlášení o dostupnosti dat v době předložení publikace/výsledků výzkumu. Přijatelná omezení veřejného sdílení dat zahrnují:

  • Data třetích stran

U studií zahrnujících data třetích stran se doporučuje sdílet veškerá data specifická pro analýzy provedené ve výzkumu, pokud je jejich šíření legálně možné. Pokud byla použita data třetích stran, na jejichž sdílení nemají výzkumníci právo, musí autoři poskytnout veškeré informace potřebné k tomu, aby zainteresovaní výzkumní pracovníci mohli požádat o přístup k datům.

  • Údaje o účastnících výzkumu s lidskými subjekty a další citlivé údaje

U studií zahrnujících údaje o účastnících výzkumu s lidskými subjekty nebo jiné citlivé údaje doporučujeme autorům, aby sdíleli pouze anonymizované údaje. Pokud však údaje nelze veřejně sdílet, nebo plně anonymizovat, tato překážka otevřenému přístupu k datům musí být uvedena v DMP a také Prohlášení o dostupnosti dat.

  • Obchodní tajemství, konkurenční výhoda a patenty

V případě, kdy se během výzkumu spolupracuje se soukromým sektorem a výzkumná data použitá pro vznik publikace/vědeckého výstupu, by mohla poškodit obchodní záměry partnera, pak je relevantním důvodem výzkumná data zveřejnit s omezením, např. časovým embargem, kdy toto embargo bude odstraněno po vypršení možného ohrožení. Stejně tak je tomu v případě, kdy by otevřené sdílení výzkumných dat mohlo ohrozit například podání patentové přihlášky. I v tomto případě nemohou být výzkumná data zveřejněna otevřeně. Tyto překážky musí být uvedeny v DMP a také Prohlášení o dostupnosti dat.

Jaká data je nutné sdílet

Ve většině případů, ať už se jedná o publikování nebo zveřejnění dat po dokončení projektu, se při otevřeném sdílení dat přistupuje ke sdílení tzv. minimálního datasetu. Minimální dataset se skládá z dat potřebných pro replikaci všech výsledků vašeho výzkumu či publikace, a zahrnuje také související metadata a metody. Dobrou praxí je také dodržovat specifické oborové standardy pro přípravu, dokumentaci a ukládání dat.

Příkladem dat, které by měly být zahrnuty do minimálního data setu jsou:
  • hodnoty průměrů, směrodatných odchylek a dalších uváděných měr;
  • hodnoty použité k sestavení grafů;
  • body extrahované z obrázků pro analýzu

Nezpracovaná nebo zpracovaná data?

Co se týče charakteru otevřeně sdílených dat, záleží na ustálené oborové praxi a také podmínkách vydavatele. Autoři nemusí předkládat celý dataset, pokud byla v uváděné studii použita pouze část dat. Autoři také nemusí předkládat nezpracované údaje shromážděné během šetření, pokud je v dané vědecké disciplíně standardem sdílet údaje, které byly zpracovány.

V jiných případech vydavatelé žádají sdílení nezpracovaných dat (raw data), z nichž vychází daná vědecká publikace. Je tomu proto, že raw data zahrnují jednotlivé datové body nebo nejmenší jednotky informací, na kterých je výzkum založen. Již zpracovaná data, jako jsou průměry a procenta, je možné znovu analyzovat pouze omezenými metodami. Ze zpracovaných dat navíc nelze vyčíst ani odlehlé hodnoty a chybějící údaje, takže může dojít pouze k částečnému ověření vědeckých výsledků.

Prohlášení o dostupnosti výzkumných dat

Doporučujeme autorům, aby do všech článků, které uvádějí výsledky získané z výzkumných dat, zahrnuli Prohlášení o dostupnosti dat (Data Availability Statement, DAS). Prohlášení by mělo obsahovat informace o tom, kde lze nalézt údaje podporující výsledky uvedené v článku, případně včetně hypertextových odkazů na veřejně dostupné soubory dat nahrané do datového repozitáře, včetně perzistentních identifikátorů. Pokud výzkumná data nejsou veřejně dostupná, musí to být uvedeno spolu s případnými důvody pro omezení přístupu a podmínkami přístupu k datům.

Pokud odevzdáváte rukopis do odborného časopisu, který má podmínky pro sdílení výzkumných dat, budete pravděpodobně vyzváni, abyste prohlášení o dostupnosti dat zahrnuli přímo do svého rukopisu. Cílem těchto prohlášení je umožnit lepší nalezení a zpřístupnění dat.

Příklady textu pro Prohlášení o dostupnosti dat:

  • Soubory dat vytvořené během této studie a/nebo analyzované během této studie jsou k dispozici v datovém repozitáři [NÁZEV], [PERSISTENTNÍ IDENTIFIKÁTOR DATASETU A ODKAZ NA DATASET].
  • Datové soubory vytvořené během a/nebo analyzované během této studie nejsou veřejně dostupné z důvodu [DŮVOD, PROČ DATA NEJSOU VEŘEJNÁ], ale jsou k dispozici u odpovídajícího autora na základě přiměřené žádosti.
  • Datové soubory vytvořené během a/nebo analyzované během této studie jsou na základě přiměřené žádosti k dispozici u zodpovědného autora.
  • Sdílení dat se na tento článek nevztahuje, protože během této studie nebyly vytvořeny ani analyzovány žádné datové soubory.

Pro umístění sekce Prohlášení o dostupnosti dat v samotném manuskriptu, doporučujeme sledovat podmínky jednotlivých vydavatelů. Ve většině případů se Prohlášení o dostupnosti dat (DAS) uvádí v souboru rukopisu pod nadpisem "Prohlášení o dostupnosti dat" jako součást závěrečné části článku, například před oddílem "Reference".

Kde data sdílet

Uložení do datového repozitáře (důrazně doporučeno)

Veškerá data a související metadata, na nichž jsou založeny vaše výsledky výzkumu, by měla být uložena v příslušném datovém repozitáři. Repozitáře mohou být buď oborově specifické, nebo mezioborové obecné. Více o datových repozitářích najdete zde:

Data Note – článek o datech

Pokud jste uložili vaše výzkumná data do datového repozitáře, vaše námaha může být zhodnocena nejen větší transparentností a kredibilitou vašeho výzkumu, či případnými citacemi. Dodatečně se můžete se rozhodnout pro napsání tzv. Data Note.

Co je to Data Note?

Data Note odkazuje na krátký recenzovaný článek, který stručně popisuje výzkumná data uložená v datovém repozitáři. Zvyšují viditelnost a transparentnost vašeho výzkumu, pomáhá plnit požadavky poskytovatelů financování na otevřené sdílení dat a zajišťuje, aby vaše data byla FAIR (nalezitelná, přístupná, interoperabilní a opakovaně použitelná).

Data Note typicky neobsahují žádnou analýzu ani závěry, ale mohou být propojeny s výzkumným článkem zahrnujícím analýzu zveřejněného souboru dat, jakož i dalšími výstupy výzkumu. Mohou také upozorňovat na samostatné datové soubory uložené v datovém repozitáři, například pokud datová sada nevedla k vytvoření publikace.

Jaké jsou výhody vydání Data Note?

✔ maximalizace potenciálu výzkumných dat díky zlepšení jejich dohledatelnosti, použitelnosti a reprodukovatelnosti

✔ získání odpovídajícího uznání za svá výzkumná data prostřednictvím citovatelné publikace

✔ oslovení nového publika pro váš výzkum

✔ podpora nové spolupráce napříč obory díky zpřístupněním vašich dat a jejich popisu

Jak mám napsat Data Note?

Data Notes musí popisovat výzkumná data, která autoři vytvořili a vlastní je, a měly by obsahovat:

  • zdůvodnění datové sady, protokol a podrobnosti o validaci
  • informace o případných omezeních datové sady
  • informace o tom, kde a jak je možné získat přístup k datové sadě, jako součást prohlášení o dostupnosti dat
  • odkaz na datovou sadu pomocí formální citace, perzistentního identifikátoru, odkazu
  • případně uveďte citace a shrnutí všech předchozích publikací, které využívají zveřejněná data
Šablony Data Notes

Zde najdete několik příkladů, kde si můžete stáhnout šablony pro vytvoření Data Notes:

Sdílení výzkumného kódu

Pokud jste během vašeho výzkumu vytvořili nový kód; možná jako přímý výstup své práce nebo jako nástroj, který vám pomůže analyzovat shromážděná data, můžete ho také otevřeně sdílet v datovém repozitáři. Otevřené sdílení kódu byste měli zahrnout do svého plánu správy dat, zejména pokud je kód, který jste vytvořili, potřebný pro ostatní k ověření vašich výsledků.

Proč veřejně sdílet kód?

Je stále běžnější, že výzkumní pracovníci a vývojáři sdílejí kód, který vytvořili během výzkumu nebo ve svém projektu. Stejně jako u sdílení jiných forem dat má zpřístupnění vašeho kódu mnoho výhod, mezi které patří např:

  • Získání uznání a citací za typ výzkumného výstupu, který často zůstává v pozadí.
  • Lepší zjistitelnost vašich výzkumných projektů.
  • Budování důvěry ve váš výzkum tím, že napomáháte jeho transparentnosti a reprodukovatelnosti.
  • Umožnění dalším výzkumným pracovníkům opakovaně používat váš kód a stavět na něm.
Povinnost sdílet výzkumný kód je stále častější

Například vydavatel Springer Nature má jednotnou politiku pro sdílení výzkumného kódu, tak aby bylo podpořeno otevřené sdílení vědy. Nedílnou součástí této politiky je podpora autorů ve veřejném sdílení kódu použitého v primárním výzkumu, zahrnutém v knihách/kapitolách a také nově vyvinutého kódu v původních výzkumných článcích. Sekce Dostupnost kódu přímo v publikaci bude uvedena u všech původních výzkumů, u nichž autoři deklarovali vývoj nového kódu, který je nezbytný pro interpretaci a replikaci závěrů. Některé časopisy budou také vyžadovat sdílení kódu během recenzního řízení.

Nejčastější dotazy o sdílení výzkumných dat

Musím sdílet všechna svá výzkumná data?

Mohu omezit přístup ke svým výzkumným datům po jejich zveřejnění?

Jak mám informovat poskytovatele financování o možných problémech se sdílením dat?

Co je to prohlášení o dostupnosti dat?

Máte nějaké šablony textu pro informování o dostupnosti výzkumných dat, které bych mohl vložit do publikace?

Jak mám vydavateli předložit prohlášení o dostupnosti výzkumných dat?

Jak mohu propojit svá data se zveřejněnou publikací?

Co když někdo moje data použije neoprávněně?

Jak mohu zjistit, zda musím data sdílet?

Budou moje data automaticky propojena s mojí publikací?

V jakém okamžiku odevzdání publikace je třeba data zveřejnit?

Musím sdílet všechna data? Raw i upravená?

Politiky sdílení výzkumných dat vybraných akademických vydavatelství

Doporučené:

Zdroje