論文の概要: Linking Named Entities in Diderot's \textit{Encyclopédie} to Wikidata
- arxiv url: http://arxiv.org/abs/2406.03221v1
- Date: Wed, 5 Jun 2024 13:00:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 18:20:44.085830
- Title: Linking Named Entities in Diderot's \textit{Encyclopédie} to Wikidata
- Title(参考訳): Diderot's \textit{Encyclopédie} における名前付きエンティティのウィキデータへのリンク
- Authors: Pierre Nugues,
- Abstract要約: ディドロトの『Encyclop'edie』はヨーロッパにおける第8世紀からの参考文献で、その時代の知識を収集することを目的としている。
2つの百科事典間のデジタル接続の欠如は、それらの比較と知識がどのように進化したかの研究を妨げる可能性がある。
我々は,textitEncyclop'edieエントリの10,300以上のアノテーションをWikidata識別子で記述し,これらのエントリをグラフに接続する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Diderot's \textit{Encyclop\'edie} is a reference work from XVIIIth century in Europe that aimed at collecting the knowledge of its era. \textit{Wikipedia} has the same ambition with a much greater scope. However, the lack of digital connection between the two encyclopedias may hinder their comparison and the study of how knowledge has evolved. A key element of \textit{Wikipedia} is Wikidata that backs the articles with a graph of structured data. In this paper, we describe the annotation of more than 10,300 of the \textit{Encyclop\'edie} entries with Wikidata identifiers enabling us to connect these entries to the graph. We considered geographic and human entities. The \textit{Encyclop\'edie} does not contain biographic entries as they mostly appear as subentries of locations. We extracted all the geographic entries and we completely annotated all the entries containing a description of human entities. This represents more than 2,600 links referring to locations or human entities. In addition, we annotated more than 9,500 entries having a geographic content only. We describe the annotation process as well as application examples. This resource is available at https://github.com/pnugues/encyclopedie_1751
- Abstract(参考訳): ディデロットの『書物{Encyclop\'edie}』は、その時代の知識を収集することを目的としたヨーロッパにおける第8世紀からの参考文献である。
\textit{Wikipedia} は、はるかに広い範囲で同じ野心を持っている。
しかし、2つの百科事典間のデジタル接続の欠如は、それらの比較と知識の進化の研究を妨げる可能性がある。
textit{Wikipedia} の重要な要素は Wikidata で、構造化されたデータのグラフで記事をバックアップする。
本稿では,これらのエントリをグラフに接続できるWikidata識別子を用いて,textit{Encyclop\'edie}エントリの10,300以上のアノテーションを記述する。
我々は地理的・人的実体を検討した。
textit{Encyclop\'edie} には、主に位置のサブエントリとして現れるため、伝記エントリは含まれない。
我々は、すべての地理的項目を抽出し、人間の実体の記述を含む全ての項目を完全に注釈付けした。
これは、位置または人間実体を参照する2,600以上のリンクを表す。
さらに、地理的コンテンツのみを持つ9,500以上のエントリを注釈付けしました。
アノテーションのプロセスとアプリケーションの例を説明します。
このリソースはhttps://github.com/pnugues/encyclopedie_1751で入手できる。
関連論文リスト
- Towards a Brazilian History Knowledge Graph [50.26735825937335]
ブラジル歴史辞典(DHBB)とウィキペディア/ウィキデータに基づくブラジルの歴史に関する知識グラフを構築した。
DHBBに記述されている多くの用語/エンティティがWikidataに対応する概念(またはQ項目)を持っていないことを示す。
論文 参考訳(メタデータ) (2024-03-28T22:05:32Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Connecting a French Dictionary from the Beginning of the 20th Century to
Wikidata [0.0]
textitPetit Larousse illustr'eは1905年に出版されたフランスの辞書である。
我々は、歴史と地理の全ての辞書エントリを現在のデータソースに接続する、新しい語彙資源について記述する。
wikidataのリンクを使えば、歴史的に分類された表現の識別、比較、検証をより容易に自動化できる。
論文 参考訳(メタデータ) (2022-06-22T12:45:21Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Survey on English Entity Linking on Wikidata [3.8289963781051415]
Wikidataはコミュニティ主導の多言語知識グラフである。
現在のWikidata固有のEntity Linkingデータセットは、DBpediaのような他の知識グラフのためのスキームとアノテーションスキームの違いはない。
ほとんど全てのアプローチはラベルや時々記述のような特定の特性を用いるが、ハイパーリレーショナル構造のような特性は無視する。
論文 参考訳(メタデータ) (2021-12-03T16:02:42Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Commonsense Knowledge in Wikidata [3.8359194344969807]
本稿では,既存のコモンセンスソースを補完するコモンセンス知識をウィキデータが保持しているかどうかを検討する。
我々はWikidataとConceptNetの関係をマッピングし、Wikidata-CSを既存の統合コモンセンスグラフに統合する。
論文 参考訳(メタデータ) (2020-08-18T18:23:06Z) - Entity Extraction from Wikipedia List Pages [2.3605348648054463]
私たちは、DBpediaをバックボーンとして、カテゴリとリストページから大規模な分類を構築します。
遠隔監視により、リストページ内の新しいエンティティの識別のためのトレーニングデータを抽出する。
我々はDBpediaを7.5万の新しい型ステートメントと380万の高精度な新しい事実で拡張する。
論文 参考訳(メタデータ) (2020-03-11T07:48:46Z) - From Topic Networks to Distributed Cognitive Maps: Zipfian Topic
Universes in the Area of Volunteered Geographic Information [59.0235296929395]
本研究では,テキストの話題レベルに関する地理情報のエンコードとネットワーク化について検討する。
本研究は,オンラインコミュニケーションにおいて地理的な場所が位置するテーマ宇宙のZipfian組織を示す。
互いに近いかどうかに関わらず、場所はトピックの宇宙における類似の作業にまたがる隣の場所にある。
論文 参考訳(メタデータ) (2020-02-04T18:31:25Z) - Classifying Wikipedia in a fine-grained hierarchy: what graphs can
contribute [0.5530212768657543]
我々は、ウィキペディアを細かな名前付きエンティティオントロジー(NE)に分類するために、グラフ(構造)情報を統合するタスクに対処する。
日本語ウィキペディアから抽出した22,000ページのサブセットを手作業でラベル付けして,大規模な実践実験を行う。
この結果から,グラフ情報の統合は,入力特徴空間の空白度を低減することに成功し,従来の作業と同等かそれ以上の分類結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-01-21T14:19:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。