Datové repozitáře

Datový repozitář je online platforma pro ukládání, zveřejňování a uchování finálních dat po skončení výzkumu, která shromažďuje, spravuje a zpřístupňuje data a související metadata a dokumentaci. Použití repozitáře usnadňuje vyhledávání a uchovávání datových souborů, a celkově přispívá ke zvýšení kredibility vědeckých poznatků. Zveřejněním datové sady v repozitáři se zajistí, že data budou přístupná dalším výzkumníkům a že se budou dostupná i v budoucnu.

Pokud potřebujete uložit Vaše výzkumná data do datového repozitáře, máte několik možností:

  • Obecné datové repozitáře
  • Oborové datové repozitáře
  • Institucionální datové repozitáře

Když je soubor dat zveřejněn, je obvykle k dispozici ve veřejném datovém repozitáři. Pro některé výzkumné pracovníky není možné datovou sadu sdílet veřejně ihned, například z důvodu ochrany duševního vlastnictví (např. patentové ochrany). Proto některé datové repozitáře poskytují možnost publikovat data s časovým embargem.

Časové embargo je období, během kterého zůstává zveřejněná datová sada veřejnosti nedostupná. Během embarga zůstávají samotná data neveřejná a lze k nim přistupovat pouze na základě autorizace ze strany původce dat.

Důvěryhodné datové repozitáře

Důvěryhodné datové repozitáře splňují následující charakteristiky:

  • Poskytují otevřený přístup k obsahu repozitáře
  • Přiřazují obsahu trvalé identifikátory pro odkazování a citování
  • Používají standardizovaná, strojově zpracovatelná metadata
  • Zveřejněným datovým sadám umožňují přidělovat licence
  • Zajišťují uchování obsahu repozitáře, a to i v dlouhodobém horizontu
  • Získaly certifikaci (např. Core Trust Seal nebo ISO16363)
  • Jedná se o repozitáře specifické pro danou vědní oblast, jsou mezinárodně uznávané, běžně používané a schválené vědeckou komunitou
dmp

Obecné datové repozitáře

Je možné v nich zveřejňovat a vyhledávat výzkumná data z jakéhokoliv vědního oboru.

Zenodo

Zenodo je obecný repozitář, který byl vytvořen platformou OpenAIRE a společností CERN. Do Zenodo lze ukládat kromě výzkumných dat také články, kód, plakáty a prezentace.

dmp
  • soubory do 50 GB (větších souborů je nutná domluva)
  • přiděluje identifikátor DOI
  • možnost volby licence Creative Commons a dalších
  • metadatový popis se řídí podle standardu DataCite's Metadata Schema.

Repozitář nemá certifikát Core Trust Seal, protože dle současných pravidel tento certifikát nelze přidělit obecným repozitářům. Přesto je repozitář Zenodo považován poskytovateli financí jako důvěryhodný.

Národní datový repozitář

Národní repozitář pro výzkumná data je provozován sdružením CESNET a je zatím v pilotním provozu. V budoucnu bude v rámci Národní repozitářové platformy jedním z hlavních uložišť výzkumných dat v ČR. Kontrolu ukládaných záznamů spravuje Národní technická knihovna.

dmp
  • velikost datasetu: 500 GB
  • přiděluje identifikátor DOI
  • možnost volby licence Creative Commons

Harvard Dataverse

Harvard Dataverse je datový repozitář, může jej využít výzkumný pracovník jakéhokoli oboru, nejvíce záznamů je z oboru Social Sciences.

dmp
  • soubory do velikosti 1 TB
  • přiděluje identifikátor DOI
  • možnost volby licence Creative Commons
  • metadata splňují standardy Dublin Core, DataCite, OpenAIRE aj.

Figshare

Je datový repozitář od společností Digital Science, která je součástí portfolia Springer Nature.

dmp
  • soubory do velikosti 20 GB
  • přiděluje identifikátor DOI
  • možnost volby licence Creative Commons
  • metadata jsou podle standardu DataCite

Figshare je považován za důvěryhodný repozitář, má certifikaci ISO27001.

Dryad

Repozitář obsahuje výzkumná data zejména z přírodních a medicínských věd.

dmp
  • soubory do velikosti 300 GB (do 50 GB zdarma)
  • přiděluje identifikátor DOI
  • možnost volby licence Creative Commons

Oborové datové repozitáře

Obecně se doporučuje ukládat výzkumná data přednostně do oborových repozitářů. Oborový datový repozitář můžete vyhledat na rozcestnících datových repozitářů:

Pozor, vždy si pozorně přečtěte podmínky daného repozitáře, zda můžete do repozitáře přispívat!

Český sociálněvědní datový archiv

Dlouhodobě uchovává a zpřístupňuje data ze sociálněvědních výzkumů. Uložení dat se odehrává na základě smlouvy mezi producentem dat a Sociologickým ústavem AV ČR (jehož je ČSDA součástí).

dmp
  • certifikace Core Trust Seal
  • přiděluje identifikátor DOI

LINDAT/CLARIAH-CZ

Oborový repozitář pro lingvistická data a nástroje, budovaný Ústavem formální a aplikované lingvistiky MFF UK.

dmp
  • umožňuje vybrat datům identifikátor Handle
  • uděluje identifikátor Handle

Datové repozitáře, které doporučují některé časopisy a vydavatelé