論文の概要: Challenges of Linking Organizational Information in Open Government Data
to Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2008.06232v1
- Date: Fri, 14 Aug 2020 08:07:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:37:29.189149
- Title: Challenges of Linking Organizational Information in Open Government Data
to Knowledge Graphs
- Title(参考訳): オープン政府データとナレッジグラフにおける組織情報リンクの課題
- Authors: Jan Portisch, Omaima Fallatah, Sebastian Neumaier, Mohamad Yaser
Jaradeh, Axel Polleres
- Abstract要約: Open Government Data (OGD)は、世界中の公共機関によって公開されている。
我々は,(1)組織とポータルメタデータの時間的変化,(2)公共知識グラフの組織構造と変化を記述する基盤の欠如,(3)メタデータとKGデータ品質,(4)多言語性,(5)あいまいな公共セクター組織に関する5つの課題を強調した。
- 参考スコア(独自算出の注目度): 0.15749416770494706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open Government Data (OGD) is being published by various public
administration organizations around the globe. Within the metadata of OGD data
catalogs, the publishing organizations (1) are not uniquely and unambiguously
identifiable and, even worse, (2) change over time, by public administration
units being merged or restructured. In order to enable fine-grained analyses or
searches on Open Government Data on the level of publishing organizations,
linking those from OGD portals to publicly available knowledge graphs (KGs)
such as Wikidata and DBpedia seems like an obvious solution. Still, as we show
in this position paper, organization linking faces significant challenges, both
in terms of available (portal) metadata and KGs in terms of data quality and
completeness. We herein specifically highlight five main challenges, namely
regarding (1) temporal changes in organizations and in the portal metadata, (2)
lack of a base ontology for describing organizational structures and changes in
public knowledge graphs, (3) metadata and KG data quality, (4) multilinguality,
and (5) disambiguating public sector organizations. Based on available OGD
portal metadata from the Open Data Portal Watch, we provide an in-depth
analysis of these issues, make suggestions for concrete starting points on how
to tackle them along with a call to the community to jointly work on these open
challenges.
- Abstract(参考訳): Open Government Data (OGD)は、世界中の公共機関によって公開されている。
OGDデータカタログのメタデータ内において、出版機関(1)は、独自かつ明白に識別可能ではなく、さらに悪いことに、行政単位の合併や再編成によって、経時的に変化している。
OGDポータルからWikidataやDBpediaなどの公開知識グラフ(KGs)にリンクすることで、オープン政府データのパブリッシングレベルの詳細な分析や検索を可能にすることは、明らかな解決策のように思える。
それでも、このポジションの論文で示すように、利用可能なメタデータ(ポートレート)とデータ品質と完全性の観点からのkgsの両方において、組織リンクは重大な課題に直面している。
本稿では,(1)組織とポータルメタデータの時間的変化,(2)組織構造と公共知識グラフの変化を記述するための基盤オントロジーの欠如,(3)メタデータとkgデータ品質,(4)多言語性,(5)公共部門組織を曖昧にする,という5つの課題を強調する。
Open Data Portal Watchの利用可能なOGDポータルメタデータに基づいて、これらの問題を詳細に分析し、それに取り組むための具体的な出発点と、これらのオープンな課題に共同で取り組むコミュニティへの呼びかけを提案します。
関連論文リスト
- A Systematic Review of NeurIPS Dataset Management Practices [7.974245534539289]
我々はNeurIPSトラックで公開されたデータセットの体系的なレビューを行い、証明、配布、倫理的開示、ライセンスの4つの重要な側面に焦点を当てる。
この結果から, データセットの出現は不明瞭なフィルタリングやキュレーションのプロセスのため, しばしば不明瞭であることが明らかとなった。
これらの矛盾は、データセットの公開と管理のための標準化されたデータインフラストラクチャーの緊急の必要性を浮き彫りにする。
論文 参考訳(メタデータ) (2024-10-31T23:55:41Z) - TAGIFY: LLM-powered Tagging Interface for Improved Data Findability on OGD portals [0.0]
本稿では,GPT-3.5-turbo や GPT-4 のような大規模言語モデル (LLM) を用いて,データセットのタグ付けを自動化するタグ付けインタフェースのプロトタイプを提案する。
開発したソリューションはユーザによって評価され,今後のプロトタイプ改善のアジェンダを定義するためにフィードバックが収集された。
論文 参考訳(メタデータ) (2024-07-26T14:22:30Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Cross Modal Data Discovery over Structured and Unstructured Data Lakes [5.270224494298927]
組織はデータ駆動意思決定のために、ますます大量のデータを集めています。
これらのデータは、数千の構造化データセットと非構造化データセットからなる集中型リポジトリにダンプされることが多い。
逆に、そのようなデータセットの混合は、ユーザのクエリや分析タスクに関連する要素を発見することを非常に困難にしている。
論文 参考訳(メタデータ) (2023-06-01T17:34:42Z) - Mapping and Comparing Data Governance Frameworks: A benchmarking
exercise to inform global data governance deliberations [0.0]
この記事は、データの急速な成長と責任あるデータ利用と保護の必要性による、グローバルデータガバナンスの重要性の高まりについて説明する。
報告書は、データのグローバルフローを責任を持って、そして公共の関心のために管理するための、より包括的な、協調的なデータガバナンスアプローチの必要性を強調している。
論文 参考訳(メタデータ) (2023-02-27T12:56:25Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - CateCom: a practical data-centric approach to categorization of
computational models [77.34726150561087]
本稿では,物理モデルとデータ駆動型計算モデルのランドスケープを整理する取り組みについて述べる。
オブジェクト指向設計の概念を適用し、オープンソース協調フレームワークの基礎を概説する。
論文 参考訳(メタデータ) (2021-09-28T02:59:40Z) - QD-GCN: Query-Driven Graph Convolutional Networks for Attributed
Community Search [54.42038098426504]
QD-GCNは、ACS問題を解決するために、コミュニティ構造とノード属性を統一するエンドツーエンドフレームワークである。
本稿では、QD-GCNが既存の属性付きコミュニティ検索アルゴリズムを効率性と有効性の両方で上回ることを示す。
論文 参考訳(メタデータ) (2021-04-08T07:52:48Z) - Explainable Patterns: Going from Findings to Insights to Support Data
Analytics Democratization [60.18814584837969]
我々は,データストーリテリングの探索と作成において,レイユーザをサポートする新しいフレームワークであるExplainable Patterns (ExPatt)を提示する。
ExPattは、外部(テキスト)の情報ソースを使用して、観察または選択された発見の実用的な説明を自動的に生成します。
論文 参考訳(メタデータ) (2021-01-19T16:13:44Z) - Second layer data governance for permissioned blockchains: the privacy
management challenge [58.720142291102135]
新型コロナウイルス(COVID-19)やエボラウイルス(エボラ出血熱)のようなパンデミックの状況では、医療データを共有することに関連する行動は、大規模な感染を避け、死亡者を減らすために重要である。
この意味において、許可されたブロックチェーン技術は、スマートコントラクトが管理する不変で統一された分散データベースを通じて、データのオーナシップ、透明性、セキュリティを提供する権利をユーザに与えるために登場します。
論文 参考訳(メタデータ) (2020-10-22T13:19:38Z) - Graph integration of structured, semistructured and unstructured data
for data journalism [0.0]
異種データソースの動的集合を統合するための完全なアプローチについて述べる。
提案手法はConnectionLensシステム内に実装されており,一連の実験を通じて検証する。
論文 参考訳(メタデータ) (2020-07-23T08:55:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。