共有
データ共有とは?
データ共有とは、自分のデータを他の人に知ってもらうことです。
データを共有したい場合、共同研究プロジェクトの中で共同研究者と行うこともできれば、データを公開して世界中の研究者や社会全体と共有することもできます。
データ共有はオープンデータや公開されたデータを意味するものではないことを知っておくことが重要です。研究者は、制限付きアクセスまたはクローズドアクセスでデータを共有することを選択できます。さらに、データの共有または公開は、ジャーナルにおける論文や記事の公開とは異なります。ここでは、論文や記事ではなく、データ(生の観測結果や測定値、解析ワークフロー、コードなど)に焦点を当てています。
データ共有は、研究データのライフサイクルの中でいつでも行うことができますが、遅くとも論文公開時にはデータを利用できるようにする必要があります。データは、論文の科学的な結論を出すために使用されます。
国立情報学研究所オープンサイエンス基盤研究センター. “Research Data Management Kit-jp“. 2022.
詳細については「共有|RDMkit-jp」をご覧ください。
共有フェーズで想定される研究者のタスク(外部リンク)
共有フェーズにおける参考情報
データを公開持続可能なファイル形式で保存し、バックアップを取り、他の研究者や機関からの求めがあった場合に応じられるようにする必要があります。
データを公開するためのリポジトリには分野別リポジトリ・汎用リポジトリ・機関リポジトリ等があります。
分野別リポジトリ
特定の分野のデータを対象に収録するリポジトリです。例として以下のようなものがあります。
- OLAC (Open Language Archives Community):言語関連リソースの協調型分散アーカイブ。メタデータスキーマとしてはダブリンコアの拡張版を適用し、OAI-PMHと互換性のある独自のメタデータ・ハーベスティング・プロトコルを使用しています。
- ComparaLex: the Canada Institute of Linguisticsが開発を手掛けたオンライン語彙データベース。音声サンプルなどの単語リストデータが保存され、言語分析に使用できます。
機関リポジトリ
東京外国語大学附属図書館が運用するリポジトリです。
機関リポジトリでの公開については「機関リポジトリでの学術データ公開について」をご覧ください。