論文の概要: Connecting a French Dictionary from the Beginning of the 20th Century to
Wikidata
- arxiv url: http://arxiv.org/abs/2206.11022v1
- Date: Wed, 22 Jun 2022 12:45:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 15:31:32.576266
- Title: Connecting a French Dictionary from the Beginning of the 20th Century to
Wikidata
- Title(参考訳): 20世紀初頭からウィキデータとフランス語辞書をつなぐ
- Authors: Pierre Nugues
- Abstract要約: textitPetit Larousse illustr'eは1905年に出版されたフランスの辞書である。
我々は、歴史と地理の全ての辞書エントリを現在のデータソースに接続する、新しい語彙資源について記述する。
wikidataのリンクを使えば、歴史的に分類された表現の識別、比較、検証をより容易に自動化できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The \textit{Petit Larousse illustr\'e} is a French dictionary first published
in 1905. Its division in two main parts on language and on history and
geography corresponds to a major milestone in French lexicography as well as a
repository of general knowledge from this period. Although the value of many
entries from 1905 remains intact, some descriptions now have a dimension that
is more historical than contemporary. They are nonetheless significant to
analyze and understand cultural representations from this time. A comparison
with more recent information or a verification of these entries would require a
tedious manual work. In this paper, we describe a new lexical resource, where
we connected all the dictionary entries of the history and geography part to
current data sources. For this, we linked each of these entries to a wikidata
identifier. Using the wikidata links, we can automate more easily the
identification, comparison, and verification of historically-situated
representations. We give a few examples on how to process wikidata identifiers
and we carried out a small analysis of the entities described in the dictionary
to outline possible applications. The resource, i.e. the annotation of 20,245
dictionary entries with wikidata links, is available from GitHub
(\url{https://github.com/pnugues/petit_larousse_1905/})
- Abstract(参考訳): The \textit{Petit Larousse illustr\'e} は1905年に出版されたフランスの辞書である。
言語と歴史と地理に関する2つの主要な部分の区分は、フランス語の辞書学における大きなマイルストーンであり、またこの時代の一般的な知識の保管庫でもある。
1905年からの多くの項目の価値は残っていないが、現代よりも歴史的な次元を持つ記述もある。
それにもかかわらず、それらはこの時代の文化表現の分析と理解に重要である。
最近の情報との比較やこれらのエントリの検証には面倒な手作業が必要になる。
本稿では,歴史と地理の全ての辞書エントリを現在のデータソースに接続する,新しい語彙資源について述べる。
そのため、これらのエントリをwikidata識別子にリンクしました。
wikidataのリンクを使えば、歴史的に分類された表現の識別、比較、検証をより容易に自動化できる。
我々はwikidata識別子の処理方法についていくつかの例を示し、辞書に記述されたエンティティの小さな分析を行い、考えられるアプリケーションを概説した。
ウィキデータリンクを含む20,245の辞書エントリのアノテーションはgithubから入手できる(\url{https://github.com/pnugues/petit_larousse_1905/})。
関連論文リスト
- Linking Named Entities in Diderot's \textit{Encyclopédie} to Wikidata [0.0]
ディドロトの『Encyclop'edie』はヨーロッパにおける第8世紀からの参考文献で、その時代の知識を収集することを目的としている。
2つの百科事典間のデジタル接続の欠如は、それらの比較と知識がどのように進化したかの研究を妨げる可能性がある。
我々は,textitEncyclop'edieエントリの10,300以上のアノテーションをWikidata識別子で記述し,これらのエントリをグラフに接続する。
論文 参考訳(メタデータ) (2024-06-05T13:00:04Z) - Towards a Brazilian History Knowledge Graph [50.26735825937335]
ブラジル歴史辞典(DHBB)とウィキペディア/ウィキデータに基づくブラジルの歴史に関する知識グラフを構築した。
DHBBに記述されている多くの用語/エンティティがWikidataに対応する概念(またはQ項目)を持っていないことを示す。
論文 参考訳(メタデータ) (2024-03-28T22:05:32Z) - FRACAS: A FRench Annotated Corpus of Attribution relations in newS [0.0]
引用抽出と情報源帰属のために,フランス語で1676年のニュースワイヤテキストを手作業で注釈付けしたコーパスを提示する。
まず,データ選択時のコーパスの構成と選択について述べる。
次に、手動ラベリングに取り組んでいる8つのアノテータ間のアノテータ間合意について詳述する。
論文 参考訳(メタデータ) (2023-09-19T13:19:54Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - Longtonotes: OntoNotes with Longer Coreference Chains [111.73115731999793]
コア参照アノテートされたドキュメントのコーパスを,現在利用可能なものよりもはるかに長い長さで構築する。
結果として得られたコーパスはLongtoNotesと呼ばれ、様々な長さの英語の複数のジャンルの文書を含んでいる。
この新しいコーパスを用いて,最先端のニューラルコアシステムの評価を行った。
論文 参考訳(メタデータ) (2022-10-07T15:58:41Z) - Does Wikidata Support Analogical Reasoning? [17.68704739786042]
Wikidataの知識が類推的推論をサポートするかどうかを検討する。
Wikidataは類似分類のためのデータ作成に利用できることを示す。
我々は、Wikidataからアナログを抽出する自動手法を導くためのメトリクスセットを考案した。
論文 参考訳(メタデータ) (2022-10-02T20:46:52Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。