論文の概要: Understanding Wikidata Qualifiers: An Analysis and Taxonomy
- arxiv url: http://arxiv.org/abs/2603.11767v1
- Date: Thu, 12 Mar 2026 10:15:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.01348
- Title: Understanding Wikidata Qualifiers: An Analysis and Taxonomy
- Title(参考訳): Wikidata Qualifiersを理解する:分析と分類
- Authors: Gilles Falquet, Sahar Aljalbout,
- Abstract要約: 本研究は、周波数と多様性に基づいて、修飾子の重要性を評価する。
Wikidataのダンプを分析することで、上位300の資格者が選択され、洗練された分類に分類された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents an in-depth analysis of Wikidata qualifiers, focusing on their semantics and actual usage, with the aim of developing a taxonomy that addresses the challenges of selecting appropriate qualifiers, querying the graph, and making logical inferences. The study evaluates qualifier importance based on frequency and diversity, using a modified Shannon entropy index to account for the "long tail" phenomenon. By analyzing a Wikidata dump, the top 300 qualifiers were selected and categorized into a refined taxonomy that includes contextual, epistemic/uncertainty, structural, and additional qualifiers. The taxonomy aims to guide contributors in creating and querying statements, improve qualifier recommendation systems, and enhance knowledge graph design methodologies. The results show that the taxonomy effectively covers the most important qualifiers and provides a structured approach to understanding and utilizing qualifiers in Wikidata.
- Abstract(参考訳): 本稿では,Wikidata qualifiers の詳細な分析を行い,その意味論と実際の使用法に着目し,適切な qualifiers を選択すること,グラフを問うこと,論理的推論を行うことの課題に対処する分類学を開発することを目的とする。
この研究は、「ロングテール」現象を考慮に入れた改良型シャノンエントロピー指数を用いて、周波数と多様性に基づいて、修飾因子の重要性を評価する。
Wikidataダンプを解析することにより、上位300の資格者が選択され、文脈、疫学/不確実性、構造、追加の資格を含む洗練された分類に分類された。
分類学は、コントリビュータがステートメントの作成とクエリを指導し、資格者推薦システムを改善し、知識グラフ設計方法論を強化することを目的としている。
以上の結果から,分類学は最も重要な分類学を効果的にカバーし,Wikidataにおける分類学の理解と活用のための構造化されたアプローチを提供することが明らかとなった。
関連論文リスト
- Enriching Taxonomies Using Large Language Models [1.546945230112218]
本稿では,Large Language Models(LLMs)を活用して与えられた分類を強化する新しい分類体系であるTaxoriaを紹介する。
内部LLMを抽出するアプローチとは異なり、Taxoriaは既存の分類学をシードとして使用し、LLMに富化のための候補ノードを提案するよう促す。
最終的なアウトプットには、分析のための最終統合分類の追跡と視覚化を含む、豊富な分類が含まれます。
論文 参考訳(メタデータ) (2025-11-21T10:25:59Z) - Diagnosing and Mitigating Semantic Inconsistencies in Wikidata's Classification Hierarchy [1.4705700441788643]
Wikidataはウェブ上で最大のオープンナレッジグラフであり、1億2000万以上のエンティティを含んでいる。
本研究では,分類誤りと過一般化サブクラスリンクの存在を確認するために,新しい検証手法を提案し,適用した。
ユーザが任意のウィキデータエンティティの分類関係を検査できるシステムを開発した。
論文 参考訳(メタデータ) (2025-11-07T02:09:00Z) - Refining Wikidata Taxonomy using Large Language Models [2.392329079182226]
我々は,Large Language Models (LLM) とグラフマイニング技術を組み合わせたWikidata分類の新バージョンであるWiKCを提案する。
リンクを切断したり、クラスをマージしたりといった分類の操作は、オープンソースのLCM上でゼロショットプロンプトの助けを借りて行われる。
論文 参考訳(メタデータ) (2024-09-06T06:53:45Z) - Handling Wikidata Qualifiers in Reasoning [0.0]
Wikidata文を用いた推論規則における修飾子処理方法を示す。
Wikidataモデルの形式化には,多種多様な論理言語を使用します。
MSLと仕様を使って修飾子を推論する方法を示す。
論文 参考訳(メタデータ) (2023-04-06T21:05:52Z) - Multilingual Extraction and Categorization of Lexical Collocations with
Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。
以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文 参考訳(メタデータ) (2022-05-23T16:47:37Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。