論文の概要: Towards High-Value Datasets determination for data-driven development: a
systematic literature review
- arxiv url: http://arxiv.org/abs/2305.10234v1
- Date: Wed, 17 May 2023 14:22:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 15:40:58.787350
- Title: Towards High-Value Datasets determination for data-driven development: a
systematic literature review
- Title(参考訳): データ駆動開発のための高価値データセット決定に向けて:体系的文献レビュー
- Authors: Anastasija Nikiforova, Nina Rizun, Magdalena Ciesielska, Charalampos
Alexopoulos, Andrea Mileti\v{c}
- Abstract要約: 2022年、オープンデータディレクティブ領域における重要なトレンドとして認識された「高価値データセット(HVD)」。
最高データ責任者を支援するための標準化されたアプローチは存在しない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The OGD is seen as a political and socio-economic phenomenon that promises to
promote civic engagement and stimulate public sector innovations in various
areas of public life. To bring the expected benefits, data must be reused and
transformed into value-added products or services. This, in turn, sets another
precondition for data that are expected to not only be available and comply
with open data principles, but also be of value, i.e., of interest for reuse by
the end-user. This refers to the notion of 'high-value dataset' (HVD),
recognized by the European Data Portal as a key trend in the OGD area in 2022.
While there is a progress in this direction, e.g., the Open Data Directive,
incl. identifying 6 key categories, a list of HVDs and arrangements for their
publication and re-use, they can be seen as 'core' / 'base' datasets aimed at
increasing interoperability of public sector data with a high priority,
contributing to the development of a more mature OGD initiative. Depending on
the specifics of a region and country - geographical location, social,
environmental, economic issues, cultural characteristics, (under)developed
sectors and market specificities, more datasets can be recognized as of high
value for a particular country. However, there is no standardized approach to
assist chief data officers in this. In this paper, we present a systematic
review of existing literature on the HVD determination, which is expected to
form an initial knowledge base for this process, incl. used approaches and
indicators to determine them, data, stakeholders.
- Abstract(参考訳): OGDは、市民の関与を促進し、公共生活の様々な分野における公共セクターの革新を促進することを約束する政治的・社会経済的現象と見なされている。
期待される利益をもたらすためには、データを再利用し、付加価値製品やサービスに変換する必要があります。
これにより、オープンデータ原則に準拠するだけでなく、エンドユーザによる再利用への関心も高まると期待されるデータに対する別の前提条件が設定される。
これは2022年に欧州データポータルがOGD地域の重要なトレンドとして認識した「高価値データセット(HVD)」の概念を指す。
この方向は、例えばopen data directive、inclのように進歩している。
6つの主要なカテゴリ、hvdのリスト、出版と再使用のためのアレンジを識別することは、より成熟したogdイニシアチブの開発に寄与し、公共セクターデータの相互運用性を高い優先度で高めることを目的とした'core'/'base'データセットと見なすことができる。
地域や国の特質 - 地理的位置、社会、環境、経済問題、文化的特徴、(下)開発分野と市場特異性 - によって、特定の国にとって、より多くのデータセットが高い価値として認識される。
しかし、これには最高データ責任者を支援するための標準化されたアプローチは存在しない。
本稿では,このプロセスの初期知識基盤となることが期待されるHVD決定に関する既存の文献を体系的にレビューする。
それら、データ、利害関係者を決定するために 手法と指標を使いました
関連論文リスト
- Unlocking the Potential of Open Government Data: Exploring the Strategic, Technical, and Application Perspectives of High-Value Datasets Opening in Taiwan [0.0]
本研究の目的は,世界有数の情報通信技術(ICT)製品の生産者である台湾において,高価値データセット公開のライフサイクルを理解し,評価することである。
論文 参考訳(メタデータ) (2024-03-14T09:31:20Z) - When is Off-Policy Evaluation Useful? A Data-Centric Perspective [60.76880827781716]
ログ化されたデータセットだけで仮説的ターゲットポリシーの価値を評価することは重要だが、難しい。
データ中心のフレームワークであるDataCOPEを提案する。
論文 参考訳(メタデータ) (2023-11-23T17:13:37Z) - Data Acquisition: A New Frontier in Data-centric AI [65.90972015426274]
まず、現在のデータマーケットプレースを調査し、データセットに関する詳細な情報を提供するプラットフォームが不足していることを明らかにする。
次に、データプロバイダと取得者間のインタラクションをモデル化するベンチマークであるDAMチャレンジを紹介します。
提案手法の評価は,機械学習における効果的なデータ取得戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-11-22T22:15:17Z) - A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z) - Mapping and Comparing Data Governance Frameworks: A benchmarking
exercise to inform global data governance deliberations [0.0]
この記事は、データの急速な成長と責任あるデータ利用と保護の必要性による、グローバルデータガバナンスの重要性の高まりについて説明する。
報告書は、データのグローバルフローを責任を持って、そして公共の関心のために管理するための、より包括的な、協調的なデータガバナンスアプローチの必要性を強調している。
論文 参考訳(メタデータ) (2023-02-27T12:56:25Z) - DMOps: Data Management Operation and Recipes [2.28438857884398]
データ中心のAIは、機械学習(ML)パイプライン内のデータの重要性に光を当てている。
我々は,NLP製品のデータセット構築を最適化する上で,業界を導く「データ管理運用とレシピ」を提案する。
論文 参考訳(メタデータ) (2023-01-02T09:46:53Z) - Data Innovation in Demography, Migration and Human Mobility [0.0]
データ革新は、市民、統計事務所、政策立案者、民間部門の新たな課題(倫理、プライバシー、データガバナンスモデル、データ品質)につながっている。
この研究は300以上の論文や科学的報告、および多くのツールをレビューし、非伝統的なデータソースを用いて重要な人口発生を計測した。
論文 参考訳(メタデータ) (2022-09-05T07:55:07Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - Domain Generalization: A Survey [146.68420112164577]
ドメイン一般化(DG)は、モデル学習にソースドメインデータを使用するだけでOOD一般化を実現することを目的としています。
初めて、DGの10年の開発をまとめるために包括的な文献レビューが提供されます。
論文 参考訳(メタデータ) (2021-03-03T16:12:22Z) - Leveraging Public Data for Practical Private Query Release [24.615338449313676]
既存のベースラインとは異なり、PMWPubは、関連するディストリビューションから引き出された公開データを事前情報として利用します。
米国コミュニティサーベイ(ACS)およびADULTデータセットに関する理論的分析と実証的評価を提供します。
PMWPubは、多くの既存のメソッドを実行する高次元データドメインによくスケールする。
論文 参考訳(メタデータ) (2021-02-17T06:19:34Z) - Towards Inheritable Models for Open-Set Domain Adaptation [56.930641754944915]
本稿では、将来、ソースデータセットが存在しない場合の適応を容易にするために、ソース学習モデルを用いた実用的なドメイン適応パラダイムを提案する。
本稿では,ソースデータがない場合でも,対象領域に対して最適なソースモデルの選択を可能にするために,継承可能性の定量化を目的とする手法を提案する。
論文 参考訳(メタデータ) (2020-04-09T07:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。