論文の概要: Typing Errors in Factual Knowledge Graphs: Severity and Possible Ways
Out
- arxiv url: http://arxiv.org/abs/2102.02307v1
- Date: Wed, 3 Feb 2021 21:47:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-05 20:15:36.046266
- Title: Typing Errors in Factual Knowledge Graphs: Severity and Possible Ways
Out
- Title(参考訳): Factual Knowledge Graphsにおけるタイピングエラー:深刻さと可能性
- Authors: Peiran Yao and Denilson Barbosa
- Abstract要約: 金と雑音の両方のラベルの利用を最大化する能動的型付き誤り検出アルゴリズムを提案する。
本研究の結果は、研究者がノイズの多い事実KGを使用するためのガイドラインを提供する。
- 参考スコア(独自算出の注目度): 11.534085606272242
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Factual knowledge graphs (KGs) such as DBpedia and Wikidata have served as
part of various downstream tasks and are also widely adopted by artificial
intelligence research communities as benchmark datasets. However, we found
these KGs to be surprisingly noisy. In this study, we question the quality of
these KGs, where the typing error rate is estimated to be 27% for
coarse-grained types on average, and even 73% for certain fine-grained types.
In pursuit of solutions, we propose an active typing error detection algorithm
that maximizes the utilization of both gold and noisy labels. We also
comprehensively discuss and compare unsupervised, semi-supervised, and
supervised paradigms to deal with typing errors in factual KGs. The outcomes of
this study provide guidelines for researchers to use noisy factual KGs. To help
practitioners deploy the techniques and conduct further research, we published
our code and data.
- Abstract(参考訳): DBpediaやWikidataなどのFactual knowledge graph(KG)は、さまざまな下流タスクの一部として機能し、ベンチマークデータセットとして人工知能研究コミュニティにも広く採用されている。
しかし、これらのKGは驚くほどうるさいことがわかった。
本研究では,これらのKGの品質に疑問を呈し,入力誤り率の平均値は粗粒型が27%,特定の細粒型が73%と推定された。
そこで本研究では,ゴールドラベルとノイズラベルの両方の利用を最大化するアクティブタイピング誤り検出アルゴリズムを提案する。
また、非監視、半監督、および監督されたパラダイムを包括的に議論し、実際のKGにおけるタイプミスに対処するために比較します。
この研究の結果は、研究者が騒々しい事実KGを使用するためのガイドラインを提供します。
実践者が技術を展開し、さらなる研究を行うのを助けるために、私たちはコードとデータを公開しました。
関連論文リスト
- Learning Rules from KGs Guided by Language Models [48.858741745144044]
ルール学習手法は、潜在的に欠落する事実を予測するために適用することができる。
規則のランク付けは、高度に不完全あるいは偏りのあるKGよりも特に難しい。
近年のLanguage Models (LM) の台頭により、いくつかの研究が、LMがKG補完の代替手段として利用できると主張している。
論文 参考訳(メタデータ) (2024-09-12T09:27:36Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - A Survey of Knowledge Graph Reasoning on Graph Types: Static, Dynamic,
and Multimodal [57.8455911689554]
知識グラフ推論(KGR)は、知識グラフに基づくマイニング論理則に基づいて、既存の事実から新しい事実を推論することを目的としている。
質問応答やレコメンデーションシステムなど、多くのAIアプリケーションでKGを使うことに大きなメリットがあることが証明されている。
論文 参考訳(メタデータ) (2022-12-12T08:40:04Z) - Contrastive Knowledge Graph Error Detection [11.637359888052014]
提案する新しいフレームワーク - ContrAstive Knowledge Graph Error Detection (CAGED) を提案する。
CAGEDは、KG学習に対照的な学習を導入し、KGモデリングの新しい方法を提供する。
KGエラー検出における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-18T05:01:19Z) - KGxBoard: Explainable and Interactive Leaderboard for Evaluation of
Knowledge Graph Completion Models [76.01814380927507]
KGxBoardは、データの意味のあるサブセットを詳細に評価するためのインタラクティブなフレームワークである。
実験では,KGxBoardを用いることで,標準平均シングルスコアメトリクスでは検出が不可能であったことを強調した。
論文 参考訳(メタデータ) (2022-08-23T15:11:45Z) - Trustworthy Knowledge Graph Completion Based on Multi-sourced Noisy Data [35.938323660176145]
我々は,KGにおけるマルチソースノイズデータと既存事実に基づく知識グラフの事実を利用する,信頼に値する新しい手法を提案する。
具体的には,総合的なスコアリング機能を備えたグラフニューラルネットワークを導入し,さまざまな値型で事実の妥当性を判定する。
本稿では、データソースの品質を事実スコアリング機能に組み込んだ真理推論モデルを提案し、異質な値から真理を推測する半教師付き学習方法を設計する。
論文 参考訳(メタデータ) (2022-01-21T07:59:16Z) - DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文 参考訳(メタデータ) (2022-01-14T00:16:57Z) - Handling Missing Data with Graph Representation Learning [62.59831675688714]
特徴量計算とラベル予測のためのグラフベースのフレームワークであるGRAPEを提案する。
GRAPEでは,特徴計算をエッジレベル予測タスク,ラベル予測をノードレベル予測タスクとして定式化する。
9つのベンチマークデータセットによる実験結果から、GRAPEは計算タスクの平均絶対誤差を20%低く、ラベル予測タスクを10%低くすることがわかった。
論文 参考訳(メタデータ) (2020-10-30T17:59:13Z) - Efficient Knowledge Graph Validation via Cross-Graph Representation
Learning [40.570585195713704]
ノイズの多い事実は、自動抽出によって引き起こされる可能性のある知識グラフに必然的に導入されます。
対象KGの事実を効率的に検証するために外部KGを活用するクロスグラフ表現学習フレームワークであるCrossValを提案する。
論文 参考訳(メタデータ) (2020-08-16T20:51:17Z) - Entity Type Prediction in Knowledge Graphs using Embeddings [2.7528170226206443]
オープンナレッジグラフ(DBpedia、Wikidata、YAGOなど)は、データマイニングと情報検索の分野における多様なアプリケーションのバックボーンとして認識されている。
これらのKGのほとんどは、スナップショットからの自動情報抽出またはユーザーが提供する情報蓄積によって作成されるか、ウィキペディアを用いて作成される。
これらのKGの型情報は、しばしばうるさい、不完全、不正確である。
KG埋め込みを用いたエンティティタイピングのためのマルチラベル分類手法を提案する。
論文 参考訳(メタデータ) (2020-04-28T17:57:08Z) - Guiding Graph Embeddings using Path-Ranking Methods for Error Detection
innoisy Knowledge Graphs [0.0]
この研究は、様々な主要なアプローチを示し、タスクのためのハイブリッドでモジュラーな方法論を提案する。
2つのベンチマークと1つの実世界のバイオメディカル・パブリッシング・データセットで異なる手法を比較し、アプローチの可能性を示している。
論文 参考訳(メタデータ) (2020-02-19T11:04:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。