論文の概要: Mapping the Past: Geographically Linking an Early 20th Century Swedish Encyclopedia with Wikidata
- arxiv url: http://arxiv.org/abs/2406.17903v1
- Date: Tue, 25 Jun 2024 19:34:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-27 15:27:11.635108
- Title: Mapping the Past: Geographically Linking an Early 20th Century Swedish Encyclopedia with Wikidata
- Title(参考訳): 20世紀前半のスウェーデンの百科事典とウィキデータ
- Authors: Axel Ahlin, Alfred Myrne, Pierre Nugues,
- Abstract要約: 私たちは、38巻と182,000以上の記事からなる『textitUggleupplagan』という第2版に焦点を当てた。
項目の約22%が場所であることがわかった。
この論文は、ファミルイェボクのテクストにおける地理的情報の選択と表現に光を当て、歴史的・社会的視点に関する洞察を与えている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we describe the extraction of all the location entries from a prominent Swedish encyclopedia from the early 20th century, the \textit{Nordisk Familjebok} `Nordic Family Book.' We focused on the second edition called \textit{Uggleupplagan}, which comprises 38 volumes and over 182,000 articles. This makes it one of the most extensive Swedish encyclopedias. Using a classifier, we first determined the category of the entries. We found that approximately 22 percent of them were locations. We applied a named entity recognition to these entries and we linked them to Wikidata. Wikidata enabled us to extract their precise geographic locations resulting in almost 18,000 valid coordinates. We then analyzed the distribution of these locations and the entry selection process. It showed a higher density within Sweden, Germany, and the United Kingdom. The paper sheds light on the selection and representation of geographic information in the \textit{Nordisk Familjebok}, providing insights into historical and societal perspectives. It also paves the way for future investigations into entry selection in different time periods and comparative analyses among various encyclopedias.
- Abstract(参考訳): 本稿では,20世紀初頭のスウェーデンの著名な百科事典である『textit{Nordisk Familjebok} `Nordic Family Book'』から,すべての項目の抽出について述べる。
「第2版「textit{Uggleupplagan"」は38巻18万2000点以上を収録。
これはスウェーデンで最も広い百科事典の1つである。
まず,分類器を用いて項目のカテゴリを決定する。
うち約22%が場所であることがわかった。
これらのエントリに名前付きエンティティ認識を適用し、Wikidataにリンクした。
Wikidataを使えば、正確な地理的位置を抽出でき、その結果、およそ18,000の有効な座標が得られる。
次に、これらの位置の分布とエントリ選択過程を分析した。
スウェーデン、ドイツ、イギリスでは人口密度が高かった。
この論文は、歴史的・社会的視点に関する洞察を提供する『textit{Nordisk Familjebok}』において、地理的情報の選択と表現について光を当てている。
また、異なる期間におけるエントリー選択の今後の調査方法や、様々な百科事典の比較分析の道を開く。
関連論文リスト
- Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。
我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文 参考訳(メタデータ) (2024-10-05T20:40:49Z) - Linking Named Entities in Diderot's \textit{Encyclopédie} to Wikidata [0.0]
ディドロトの『Encyclop'edie』はヨーロッパにおける第8世紀からの参考文献で、その時代の知識を収集することを目的としている。
2つの百科事典間のデジタル接続の欠如は、それらの比較と知識がどのように進化したかの研究を妨げる可能性がある。
我々は,textitEncyclop'edieエントリの10,300以上のアノテーションをWikidata識別子で記述し,これらのエントリをグラフに接続する。
論文 参考訳(メタデータ) (2024-06-05T13:00:04Z) - Towards a Brazilian History Knowledge Graph [50.26735825937335]
ブラジル歴史辞典(DHBB)とウィキペディア/ウィキデータに基づくブラジルの歴史に関する知識グラフを構築した。
DHBBに記述されている多くの用語/エンティティがWikidataに対応する概念(またはQ項目)を持っていないことを示す。
論文 参考訳(メタデータ) (2024-03-28T22:05:32Z) - Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文 参考訳(メタデータ) (2022-10-26T02:25:23Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Enriching Wikidata with Linked Open Data [4.311189028205597]
現在のリンクされたオープンデータ(LOD)ツールは、Wikidataのような大きなグラフの強化には適していない。
本稿では、ギャップ検出、ソース選択、スキーマアライメント、セマンティックバリデーションを含む新しいワークフローを提案する。
実験の結果,我々のワークフローは,高品質な外部LODソースからの数百万の新規ステートメントでWikidataを豊かにすることができることがわかった。
論文 参考訳(メタデータ) (2022-07-01T01:50:24Z) - Connecting a French Dictionary from the Beginning of the 20th Century to
Wikidata [0.0]
textitPetit Larousse illustr'eは1905年に出版されたフランスの辞書である。
我々は、歴史と地理の全ての辞書エントリを現在のデータソースに接続する、新しい語彙資源について記述する。
wikidataのリンクを使えば、歴史的に分類された表現の識別、比較、検証をより容易に自動化できる。
論文 参考訳(メタデータ) (2022-06-22T12:45:21Z) - Razmecheno: Named Entity Recognition from Digital Archive of Diaries
"Prozhito" [1.4823641127537543]
本稿では,ロシア語のプロジェクトProzhitoの日記テキストから収集した新しいデータセット"Razmecheno"を作成することを目的とする。
ラズメチーノは1331の文と14119のトークンで構成されており、ペレストロイカ時代に書かれた日記から採集されている。
論文 参考訳(メタデータ) (2022-01-24T23:06:01Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - From Topic Networks to Distributed Cognitive Maps: Zipfian Topic
Universes in the Area of Volunteered Geographic Information [59.0235296929395]
本研究では,テキストの話題レベルに関する地理情報のエンコードとネットワーク化について検討する。
本研究は,オンラインコミュニケーションにおいて地理的な場所が位置するテーマ宇宙のZipfian組織を示す。
互いに近いかどうかに関わらず、場所はトピックの宇宙における類似の作業にまたがる隣の場所にある。
論文 参考訳(メタデータ) (2020-02-04T18:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。