論文の概要: Disjointness Violations in Wikidata
- arxiv url: http://arxiv.org/abs/2410.13707v2
- Date: Wed, 23 Oct 2024 19:12:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:49:07.115672
- Title: Disjointness Violations in Wikidata
- Title(参考訳): ウィキデータにおける不一致違反
- Authors: Ege Atacan Doğan, Peter F. Patel-Schneider,
- Abstract要約: ウィキデータにおける解離の現在のモデル化について分析する。
我々は、SPARQLクエリを使用して、不一致違反の原因となる各犯人を特定し、矛盾する情報を特定し、修正するための公式をレイアウトする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Disjointness checks are among the most important constraint checks in a knowledge base and can be used to help detect and correct incorrect statements and internal contradictions. Wikidata is a very large, community-managed knowledge base. Because of both its size and construction, Wikidata contains many incorrect statements and internal contradictions. We analyze the current modeling of disjointness on Wikidata, identify patterns that cause these disjointness violations and categorize them. We use SPARQL queries to identify each ``culprit'' causing a disjointness violation and lay out formulas to identify and fix conflicting information. We finally discuss how disjointness information could be better modeled and expanded in Wikidata in the future.
- Abstract(参考訳): 整合性チェックは知識ベースにおける最も重要な制約チェックのひとつであり、誤った文や内部の矛盾を検出し、修正するのに役立つ。
Wikidataは非常に大きく、コミュニティが管理する知識ベースです。
Wikidataはそのサイズと構成の両方のため、多くの誤った文や内部の矛盾を含んでいる。
Wikidataにおける不整合の現在のモデリングを解析し、これらの不整合性違反の原因となるパターンを特定し、それらを分類する。
我々は、SPARQLクエリを使用して、不一致違反の原因となる各 ``culprit'' を識別し、矛盾する情報を特定し、修正するための公式をレイアウトする。
ウィキデータでは, 情報の整合性がより良くモデル化され, 拡張される可能性について論じる。
関連論文リスト
- Understanding and Mitigating Spurious Correlations in Text
Classification with Neighborhood Analysis [69.07674653828565]
機械学習モデルは、トレーニングセットに存在するが一般的な状況では当てはまらない急激な相関を利用する傾向にある。
本稿では, 周辺分析と呼ばれる新しい視点から, 突発的相関がもたらす意味について考察する。
本稿では,テキスト分類における素早い相関を緩和する正規化手法であるNFL(doN't Forget your Language)を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:55:50Z) - Handling Wikidata Qualifiers in Reasoning [0.0]
Wikidata文を用いた推論規則における修飾子処理方法を示す。
Wikidataモデルの形式化には,多種多様な論理言語を使用します。
MSLと仕様を使って修飾子を推論する方法を示す。
論文 参考訳(メタデータ) (2023-04-06T21:05:52Z) - Does Wikidata Support Analogical Reasoning? [17.68704739786042]
Wikidataの知識が類推的推論をサポートするかどうかを検討する。
Wikidataは類似分類のためのデータ作成に利用できることを示す。
我々は、Wikidataからアナログを抽出する自動手法を導くためのメトリクスセットを考案した。
論文 参考訳(メタデータ) (2022-10-02T20:46:52Z) - Enriching Wikidata with Linked Open Data [4.311189028205597]
現在のリンクされたオープンデータ(LOD)ツールは、Wikidataのような大きなグラフの強化には適していない。
本稿では、ギャップ検出、ソース選択、スキーマアライメント、セマンティックバリデーションを含む新しいワークフローを提案する。
実験の結果,我々のワークフローは,高品質な外部LODソースからの数百万の新規ステートメントでWikidataを豊かにすることができることがわかった。
論文 参考訳(メタデータ) (2022-07-01T01:50:24Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - A Benchmark for Generalizable and Interpretable Temporal Question
Answering over Knowledge Bases [67.33560134350427]
TempQA-WDは時間的推論のためのベンチマークデータセットである。
Wikidataは、最も頻繁にキュレーションされ、公開されている知識ベースである。
論文 参考訳(メタデータ) (2022-01-15T08:49:09Z) - Survey on English Entity Linking on Wikidata [3.8289963781051415]
Wikidataはコミュニティ主導の多言語知識グラフである。
現在のWikidata固有のEntity Linkingデータセットは、DBpediaのような他の知識グラフのためのスキームとアノテーションスキームの違いはない。
ほとんど全てのアプローチはラベルや時々記述のような特定の特性を用いるが、ハイパーリレーショナル構造のような特性は無視する。
論文 参考訳(メタデータ) (2021-12-03T16:02:42Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Wikidata on MARS [0.20305676256390934]
一般化されたプロパティグラフの形式的データモデルとして,マルチ分散リレーショナル構造 (MARS) が提案されている。
MARPLはプロパティグラフ上の推論ルールを記述するための有用なルールベースのロジックである。
Wikidataは、Wikidataのデータ型を追加する拡張MARSでモデル化することができる。
論文 参考訳(メタデータ) (2020-08-14T22:58:04Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。