論文の概要: Automating the Identification of High-Value Datasets in Open Government Data Portals
- arxiv url: http://arxiv.org/abs/2406.10541v1
- Date: Sat, 15 Jun 2024 07:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-18 23:53:14.336082
- Title: Automating the Identification of High-Value Datasets in Open Government Data Portals
- Title(参考訳): オープン・ガバメント・データポータルにおける高価値データセットの自動識別
- Authors: Alfonso Quarati, Anastasija Nikiforova,
- Abstract要約: 高価値データセット(HVD)は、より広いOpen Government Data(OGD)ムーブメントにおいて重要な役割を果たす。
OGDポータル上でのHVDの識別は、データ値の微妙な性質のため、リソース集約的で複雑な課題である。
本提案では,ユーザ関心の詳細な分析に基づく定量的アプローチを用いて,OGDポータル上でのHVDの識別を自動化することを目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognized for fostering innovation and transparency, driving economic growth, enhancing public services, supporting research, empowering citizens, and promoting environmental sustainability, High-Value Datasets (HVD) play a crucial role in the broader Open Government Data (OGD) movement. However, identifying HVD presents a resource-intensive and complex challenge due to the nuanced nature of data value. Our proposal aims to automate the identification of HVDs on OGD portals using a quantitative approach based on a detailed analysis of user interest derived from data usage statistics, thereby minimizing the need for human intervention. The proposed method involves extracting download data, analyzing metrics to identify high-value categories, and comparing HVD datasets across different portals. This automated process provides valuable insights into trends in dataset usage, reflecting citizens' needs and preferences. The effectiveness of our approach is demonstrated through its application to a sample of US OGD city portals. The practical implications of this study include contributing to the understanding of HVD at both local and national levels. By providing a systematic and efficient means of identifying HVD, our approach aims to inform open governance initiatives and practices, aiding OGD portal managers and public authorities in their efforts to optimize data dissemination and utilization.
- Abstract(参考訳): イノベーションと透明性の育成、経済成長の推進、公共サービスの向上、研究の支援、市民の強化、環境の持続可能性の向上など、ハイバリューデータセット(HVD)はオープン・ガバメント・データ(OGD)運動において重要な役割を担っている。
しかし、HVDの同定は、データ値の微妙な性質のため、リソース集約的で複雑な課題である。
本提案は,データ利用統計から得られたユーザ関心の詳細な分析に基づく定量的アプローチを用いて,OGDポータル上でのHVDの識別を自動化することを目的としている。
提案手法は、ダウンロードデータを抽出し、メトリクスを分析して高価値カテゴリを特定し、異なるポータル間でHVDデータセットを比較する。
この自動化プロセスは、市民のニーズと嗜好を反映して、データセット使用のトレンドに関する貴重な洞察を提供する。
提案手法の有効性を米国OGD市ポータルのサンプルに応用して実証した。
本研究の実際的意味は、地域レベルと国家レベルでのHVDの理解に寄与することである。
我々は,HVDを体系的かつ効率的な識別手段を提供することにより,オープンガバナンスのイニシアチブや実践を通知し,OGDポータル管理者や公共機関がデータの普及と活用を最適化する取り組みを支援することを目的とする。
関連論文リスト
- Collection, usage and privacy of mobility data in the enterprise and public administrations [55.2480439325792]
個人のプライバシーを守るためには、匿名化などのセキュリティ対策が必要である。
本研究では,現場における実践の洞察を得るために,専門家によるインタビューを行った。
我々は、一般的には最先端の差分プライバシー基準に準拠しない、使用中のプライバシー強化手法を調査した。
論文 参考訳(メタデータ) (2024-07-04T08:29:27Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - From an Integrated Usability Framework to Lessons on Usability and Performance of Open Government Data Portals: A Comparative Study of European Union and Gulf Cooperation Council Countries [0.0]
本研究では,Open Government Data (OGD)ポータル評価のための統合ユーザビリティフレームワークを提案する。
この枠組みは欧州連合(EU)と湾岸協力理事会(GCC)の33のOGDポータルに開発され、適用されている。
論文 参考訳(メタデータ) (2024-06-13T03:05:36Z) - Unlocking the Potential of Open Government Data: Exploring the Strategic, Technical, and Application Perspectives of High-Value Datasets Opening in Taiwan [0.0]
本研究の目的は,世界有数の情報通信技術(ICT)製品の生産者である台湾において,高価値データセット公開のライフサイクルを理解し,評価することである。
論文 参考訳(メタデータ) (2024-03-14T09:31:20Z) - An Integrated Usability Framework for Evaluating Open Government Data
Portals: Comparative Analysis of EU and GCC Countries [0.0]
本研究は、多様な利害関係者間の透明性と協力を促進するために、オープン政府データ(OGD)ポータルが果たす重要な役割について考察する。
本稿では,ユーザビリティ,多様な集団とのコミュニケーション,戦略的価値創造の課題を認識し,OGDポータルの有効性を評価するための統合的な枠組みを開発する。
論文 参考訳(メタデータ) (2024-03-13T12:06:42Z) - Transcending Traditional Boundaries: Leveraging Inter-Annotator
Agreement (IAA) for Enhancing Data Management Operations (DMOps) [4.413246337852144]
我々は、個々のアノテータのラベル付け品質を予測するのにIAAを使うことを提唱し、データ生産におけるコストと時間効率をもたらす。
この研究は、データ駆動型研究最適化におけるIAAの幅広い応用可能性を強調している。
論文 参考訳(メタデータ) (2023-06-26T01:33:58Z) - Your Room is not Private: Gradient Inversion Attack on Reinforcement
Learning [47.96266341738642]
プライバシーは、ロボットが実質的な個人情報にアクセスすることによって、具体化されたAIの領域における重要な関心事として浮上する。
本稿では, 状態, 行動, 監視信号の再構成に勾配インバージョンを利用する, 値ベースアルゴリズムと勾配ベースアルゴリズムに対する攻撃を提案する。
論文 参考訳(メタデータ) (2023-06-15T16:53:26Z) - Towards High-Value Datasets determination for data-driven development: a
systematic literature review [0.0]
2022年、オープンデータディレクティブ領域における重要なトレンドとして認識された「高価値データセット(HVD)」。
最高データ責任者を支援するための標準化されたアプローチは存在しない。
論文 参考訳(メタデータ) (2023-05-17T14:22:02Z) - Gradient Imitation Reinforcement Learning for General Low-Resource
Information Extraction [80.64518530825801]
本研究では,ラベル付きデータに対する勾配降下方向を模倣するために擬似ラベル付きデータを奨励するグラディエント強化学習法(GIRL)を開発した。
GIRLを利用して、低リソース設定ですべてのIEサブタスク(エンティティ認識、関係抽出、イベント抽出)を解決します。
論文 参考訳(メタデータ) (2022-11-11T05:37:19Z) - Explainable Patterns: Going from Findings to Insights to Support Data
Analytics Democratization [60.18814584837969]
我々は,データストーリテリングの探索と作成において,レイユーザをサポートする新しいフレームワークであるExplainable Patterns (ExPatt)を提示する。
ExPattは、外部(テキスト)の情報ソースを使用して、観察または選択された発見の実用的な説明を自動的に生成します。
論文 参考訳(メタデータ) (2021-01-19T16:13:44Z) - Towards Inheritable Models for Open-Set Domain Adaptation [56.930641754944915]
本稿では、将来、ソースデータセットが存在しない場合の適応を容易にするために、ソース学習モデルを用いた実用的なドメイン適応パラダイムを提案する。
本稿では,ソースデータがない場合でも,対象領域に対して最適なソースモデルの選択を可能にするために,継承可能性の定量化を目的とする手法を提案する。
論文 参考訳(メタデータ) (2020-04-09T07:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。