論文の概要: Temporal Concept Drift and Alignment: An empirical approach to comparing
Knowledge Organization Systems over time
- arxiv url: http://arxiv.org/abs/2208.07835v1
- Date: Tue, 16 Aug 2022 16:37:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:26:25.273500
- Title: Temporal Concept Drift and Alignment: An empirical approach to comparing
Knowledge Organization Systems over time
- Title(参考訳): 時間的概念ドリフトとアライメント:知識組織システムを時間とともに比較する実証的アプローチ
- Authors: Sam Grabus (1), Peter Melville Logan (2), Jane Greenberg (1) ((1)
Drexel University, (2) Temple University)
- Abstract要約: 本研究では,知識組織システム(KOS)における時間的概念の漂流と時間的アライメントについて検討する。
比較分析は、1910年の議会主題見出し図書館、2020年のFASTトピカル、自動索引付けなどを用いて追求されている。
その結果、歴史的語彙は、KOSや歴史資源において、時間にわたって概念的ドリフトを表すアナクロニスティックな主題の見出しを生成するのに有効であることが確認された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This research explores temporal concept drift and temporal alignment in
knowledge organization systems (KOS). A comparative analysis is pursued using
the 1910 Library of Congress Subject Headings, 2020 FAST Topical, and automatic
indexing. The use case involves a sample of 90 nineteenth-century Encyclopedia
Britannica entries. The entries were indexed using two approaches: 1) full-text
indexing; 2) Named Entity Recognition was performed upon the entries with
Stanza, Stanford's NLP toolkit, and entities were automatically indexed with
the Helping Interdisciplinary Vocabulary application (HIVE), using both 1910
LCSH and FAST Topical. The analysis focused on three goals: 1) identifying
results that were exclusive to the 1910 LCSH output; 2) identifying terms in
the exclusive set that have been deprecated from the contemporary LCSH,
demonstrating temporal concept drift; and 3) exploring the historical
significance of these deprecated terms. Results confirm that historical
vocabularies can be used to generate anachronistic subject headings
representing conceptual drift across time in KOS and historical resources. A
methodological contribution is made demonstrating how to study changes in KOS
over time and improve the contextualization of historical humanities resources.
- Abstract(参考訳): 本研究では,知識組織システム(kos)における時間的概念ドリフトと時間的アライメントについて検討する。
1910年の議会図書館の主題見出し、2020年の高速トピック、自動インデックスを用いて比較分析を行った。
ユースケースは、90世紀の百科事典ブリタニカのサンプルを含む。
エントリは2つのアプローチでインデックス付けされた。
1) フルテキストインデックス化
2) 名前付きエンティティ認識はスタンフォードのNLPツールキットであるStanzaのエントリに基づいて行われ、エンティティは1910 LCSHとFAST Topicalを使用してHIVE(Helping Interdisciplinary Vocabulary Application)で自動的にインデックス付けされる。
分析は3つの目標に焦点を当てました
1) 1910年のlcsh生産物に排他的な結果の特定
2) 排他的集合において,当時のlcshから廃止され,時相概念ドリフトを示す用語を識別すること。
3)これらの非推奨用語の歴史的意義を探究する。
その結果、歴史的語彙は、KOSや歴史資源において、時間にわたって概念的ドリフトを表すアナクロニスティックな主題を生成できることを確認した。
KOSの変化を時間とともに研究し、歴史的人文科学資源の文脈化を改善する方法を示す。
関連論文リスト
- Language Models As Semantic Indexers [80.76133595275728]
生成言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMINDEXERを紹介する。
本稿では, 逐次離散表現を生成可能なセマンティックインデクサを導入することで, シーケンシャルなシーケンシャルIDの課題に対処する。
学習したセマンティックインデクサは、レコメンデーションや検索など、さまざまな下流タスクを容易にすることができる。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Clustering Semantic Predicates in the Open Research Knowledge Graph [0.0]
オープンリサーチ知識グラフ(ORKG)のリソースに関する述語を推奨するために、2つのAIベースのクラスタリングアルゴリズムをカスタマイズするアプローチについて述べる。
線形実行時の性能を比較的高い精度で再現する実験は,非常に有望な結果を示した。
この研究は、44の研究分野にまたがる学術知識のセマンティフィケーションのための一般的なセマンティフィケーションパターンとして、自動的に緩やかに蓄積する述語群に対する新たな洞察を提供する。
論文 参考訳(メタデータ) (2022-10-05T05:48:39Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - Placing (Historical) Facts on a Timeline: A Classification cum Coref
Resolution Approach [4.809236881780707]
タイムラインは、ある期間に起こった重要な歴史的事実を視覚化する最も効果的な方法の1つである。
複数の(歴史的)テキスト文書からイベントタイムラインを生成するための2段階システムを提案する。
我々の結果は、歴史学者、歴史研究の進展、そして国の社会・政治の風景を理解する上で非常に役立ちます。
論文 参考訳(メタデータ) (2022-06-28T15:36:44Z) - Overview of the TREC 2020 Fair Ranking Track [64.16623297717642]
本稿は、NIST TREC 2020 Fair Ranking trackの概要を示す。
フェア・ランキング・トラックの中心的な目標は、様々な作家グループに公正な露出を提供することである。
論文 参考訳(メタデータ) (2021-08-11T10:22:05Z) - Leveraging Domain Agnostic and Specific Knowledge for Acronym
Disambiguation [5.766754189548904]
アクロニムの曖昧さは、テキストの中で曖昧なアクロニムの正しい意味を見つけることを目的としている。
本稿では,hdBERTを用いた階層型デュアルパスBERT法を提案する。
62,441文を含むSciADデータセットを用いて,hdBERTの有効性を検討した。
論文 参考訳(メタデータ) (2021-07-01T09:10:00Z) - Search from History and Reason for Future: Two-stage Reasoning on
Temporal Knowledge Graphs [56.33651635705633]
そこで我々は,CluSTeRを提案し,2段階の予測手法であるClue SearchとTemporal Reasoningを提案する。
CluSTeRは、強化学習(RL)を通じてビームサーチポリシーを学び、歴史的事実から複数の手がかりを導き出す。
時間的推論段階では、グラフ畳み込みネットワークに基づくシーケンス法を採用し、手がかりから回答を導出する。
論文 参考訳(メタデータ) (2021-06-01T09:01:22Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Corpus of Chinese Dynastic Histories: Gender Analysis over Two Millennia [3.2851864672627618]
王朝の歴史は紀元前3世紀から紀元前18世紀にかけて、およそ2000年の長い連続した言語空間を形成している。
歴史は古典(文学)中国語で2000万文字以上のコーパスで記録されており、歴史的辞書の計算分析や意味変化に適している。
このプロジェクトでは,Creative Commonsライセンスでカバーされた24のダイナスティックヒストリーの新たなオープンソースコーパスを導入する。
論文 参考訳(メタデータ) (2020-05-18T15:14:33Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z) - Semantic Relatedness for Keyword Disambiguation: Exploiting Different
Embeddings [0.0]
本稿では,学習時に未知の外部インベントリ(オントロジー)によって提供される単語と感覚間の意味的関連性に基づくキーワードの曖昧さに対するアプローチを提案する。
実験の結果,特定のドメインをトレーニングすることなく,単語センスの曖昧さ (WSD) を適用した場合に,この手法が技術状況に匹敵する結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-02-25T16:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。