論文の概要: Towards High-Value Datasets determination for data-driven development: a
systematic literature review
- arxiv url: http://arxiv.org/abs/2305.10234v1
- Date: Wed, 17 May 2023 14:22:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 15:40:58.787350
- Title: Towards High-Value Datasets determination for data-driven development: a
systematic literature review
- Title(参考訳): データ駆動開発のための高価値データセット決定に向けて:体系的文献レビュー
- Authors: Anastasija Nikiforova, Nina Rizun, Magdalena Ciesielska, Charalampos
Alexopoulos, Andrea Mileti\v{c}
- Abstract要約: 2022年、オープンデータディレクティブ領域における重要なトレンドとして認識された「高価値データセット(HVD)」。
最高データ責任者を支援するための標準化されたアプローチは存在しない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The OGD is seen as a political and socio-economic phenomenon that promises to
promote civic engagement and stimulate public sector innovations in various
areas of public life. To bring the expected benefits, data must be reused and
transformed into value-added products or services. This, in turn, sets another
precondition for data that are expected to not only be available and comply
with open data principles, but also be of value, i.e., of interest for reuse by
the end-user. This refers to the notion of 'high-value dataset' (HVD),
recognized by the European Data Portal as a key trend in the OGD area in 2022.
While there is a progress in this direction, e.g., the Open Data Directive,
incl. identifying 6 key categories, a list of HVDs and arrangements for their
publication and re-use, they can be seen as 'core' / 'base' datasets aimed at
increasing interoperability of public sector data with a high priority,
contributing to the development of a more mature OGD initiative. Depending on
the specifics of a region and country - geographical location, social,
environmental, economic issues, cultural characteristics, (under)developed
sectors and market specificities, more datasets can be recognized as of high
value for a particular country. However, there is no standardized approach to
assist chief data officers in this. In this paper, we present a systematic
review of existing literature on the HVD determination, which is expected to
form an initial knowledge base for this process, incl. used approaches and
indicators to determine them, data, stakeholders.
- Abstract(参考訳): OGDは、市民の関与を促進し、公共生活の様々な分野における公共セクターの革新を促進することを約束する政治的・社会経済的現象と見なされている。
期待される利益をもたらすためには、データを再利用し、付加価値製品やサービスに変換する必要があります。
これにより、オープンデータ原則に準拠するだけでなく、エンドユーザによる再利用への関心も高まると期待されるデータに対する別の前提条件が設定される。
これは2022年に欧州データポータルがOGD地域の重要なトレンドとして認識した「高価値データセット(HVD)」の概念を指す。
この方向は、例えばopen data directive、inclのように進歩している。
6つの主要なカテゴリ、hvdのリスト、出版と再使用のためのアレンジを識別することは、より成熟したogdイニシアチブの開発に寄与し、公共セクターデータの相互運用性を高い優先度で高めることを目的とした'core'/'base'データセットと見なすことができる。
地域や国の特質 - 地理的位置、社会、環境、経済問題、文化的特徴、(下)開発分野と市場特異性 - によって、特定の国にとって、より多くのデータセットが高い価値として認識される。
しかし、これには最高データ責任者を支援するための標準化されたアプローチは存在しない。
本稿では,このプロセスの初期知識基盤となることが期待されるHVD決定に関する既存の文献を体系的にレビューする。
それら、データ、利害関係者を決定するために 手法と指標を使いました
関連論文リスト
- Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Automating the Identification of High-Value Datasets in Open Government Data Portals [0.0]
高価値データセット(HVD)は、より広いOpen Government Data(OGD)ムーブメントにおいて重要な役割を果たす。
OGDポータル上でのHVDの識別は、データ値の微妙な性質のため、リソース集約的で複雑な課題である。
本提案では,ユーザ関心の詳細な分析に基づく定量的アプローチを用いて,OGDポータル上でのHVDの識別を自動化することを目的とする。
論文 参考訳(メタデータ) (2024-06-15T07:54:37Z) - From an Integrated Usability Framework to Lessons on Usability and Performance of Open Government Data Portals: A Comparative Study of European Union and Gulf Cooperation Council Countries [0.0]
本研究では,Open Government Data (OGD)ポータル評価のための統合ユーザビリティフレームワークを提案する。
この枠組みは欧州連合(EU)と湾岸協力理事会(GCC)の33のOGDポータルに開発され、適用されている。
論文 参考訳(メタデータ) (2024-06-13T03:05:36Z) - Exploring Estonia's Open Government Data Development as a Journey towards Excellence: Unveiling the Progress of Local Governments in Open Data Provision [0.0]
エストニアは、デジタル国家または電子国家という世界的名声を持っている。
デジタルガバナンスの成功にもかかわらず、この国はオープン・ガバメント・データ(OGD)の領域で課題に直面している。
本稿では,エストニアのOGD開発の発展と位置づけを,国内および地域レベルを包括的に検討することを目的とする。
論文 参考訳(メタデータ) (2024-03-18T16:50:05Z) - Unlocking the Potential of Open Government Data: Exploring the Strategic, Technical, and Application Perspectives of High-Value Datasets Opening in Taiwan [0.0]
本研究の目的は,世界有数の情報通信技術(ICT)製品の生産者である台湾において,高価値データセット公開のライフサイクルを理解し,評価することである。
論文 参考訳(メタデータ) (2024-03-14T09:31:20Z) - When is Off-Policy Evaluation (Reward Modeling) Useful in Contextual Bandits? A Data-Centric Perspective [64.73162159837956]
ログ化されたデータセットだけで仮説的ターゲットポリシーの価値を評価することは重要だが、難しい。
データ中心のフレームワークであるDataCOPEを提案する。
医療データセットを用いたログ化された文脈的帯域設定におけるDataCOPEの実証分析により、機械学習と人間の専門家ポリシーの両方を評価する能力が確認された。
論文 参考訳(メタデータ) (2023-11-23T17:13:37Z) - A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z) - Data Innovation in Demography, Migration and Human Mobility [0.0]
データ革新は、市民、統計事務所、政策立案者、民間部門の新たな課題(倫理、プライバシー、データガバナンスモデル、データ品質)につながっている。
この研究は300以上の論文や科学的報告、および多くのツールをレビューし、非伝統的なデータソースを用いて重要な人口発生を計測した。
論文 参考訳(メタデータ) (2022-09-05T07:55:07Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - Domain Generalization: A Survey [146.68420112164577]
ドメイン一般化(DG)は、モデル学習にソースドメインデータを使用するだけでOOD一般化を実現することを目的としています。
初めて、DGの10年の開発をまとめるために包括的な文献レビューが提供されます。
論文 参考訳(メタデータ) (2021-03-03T16:12:22Z) - Towards Inheritable Models for Open-Set Domain Adaptation [56.930641754944915]
本稿では、将来、ソースデータセットが存在しない場合の適応を容易にするために、ソース学習モデルを用いた実用的なドメイン適応パラダイムを提案する。
本稿では,ソースデータがない場合でも,対象領域に対して最適なソースモデルの選択を可能にするために,継承可能性の定量化を目的とする手法を提案する。
論文 参考訳(メタデータ) (2020-04-09T07:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。