論文の概要: Temporal Concept Drift and Alignment: An empirical approach to comparing
Knowledge Organization Systems over time
- arxiv url: http://arxiv.org/abs/2208.07835v1
- Date: Tue, 16 Aug 2022 16:37:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:26:25.273500
- Title: Temporal Concept Drift and Alignment: An empirical approach to comparing
Knowledge Organization Systems over time
- Title(参考訳): 時間的概念ドリフトとアライメント:知識組織システムを時間とともに比較する実証的アプローチ
- Authors: Sam Grabus (1), Peter Melville Logan (2), Jane Greenberg (1) ((1)
Drexel University, (2) Temple University)
- Abstract要約: 本研究では,知識組織システム(KOS)における時間的概念の漂流と時間的アライメントについて検討する。
比較分析は、1910年の議会主題見出し図書館、2020年のFASTトピカル、自動索引付けなどを用いて追求されている。
その結果、歴史的語彙は、KOSや歴史資源において、時間にわたって概念的ドリフトを表すアナクロニスティックな主題の見出しを生成するのに有効であることが確認された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This research explores temporal concept drift and temporal alignment in
knowledge organization systems (KOS). A comparative analysis is pursued using
the 1910 Library of Congress Subject Headings, 2020 FAST Topical, and automatic
indexing. The use case involves a sample of 90 nineteenth-century Encyclopedia
Britannica entries. The entries were indexed using two approaches: 1) full-text
indexing; 2) Named Entity Recognition was performed upon the entries with
Stanza, Stanford's NLP toolkit, and entities were automatically indexed with
the Helping Interdisciplinary Vocabulary application (HIVE), using both 1910
LCSH and FAST Topical. The analysis focused on three goals: 1) identifying
results that were exclusive to the 1910 LCSH output; 2) identifying terms in
the exclusive set that have been deprecated from the contemporary LCSH,
demonstrating temporal concept drift; and 3) exploring the historical
significance of these deprecated terms. Results confirm that historical
vocabularies can be used to generate anachronistic subject headings
representing conceptual drift across time in KOS and historical resources. A
methodological contribution is made demonstrating how to study changes in KOS
over time and improve the contextualization of historical humanities resources.
- Abstract(参考訳): 本研究では,知識組織システム(kos)における時間的概念ドリフトと時間的アライメントについて検討する。
1910年の議会図書館の主題見出し、2020年の高速トピック、自動インデックスを用いて比較分析を行った。
ユースケースは、90世紀の百科事典ブリタニカのサンプルを含む。
エントリは2つのアプローチでインデックス付けされた。
1) フルテキストインデックス化
2) 名前付きエンティティ認識はスタンフォードのNLPツールキットであるStanzaのエントリに基づいて行われ、エンティティは1910 LCSHとFAST Topicalを使用してHIVE(Helping Interdisciplinary Vocabulary Application)で自動的にインデックス付けされる。
分析は3つの目標に焦点を当てました
1) 1910年のlcsh生産物に排他的な結果の特定
2) 排他的集合において,当時のlcshから廃止され,時相概念ドリフトを示す用語を識別すること。
3)これらの非推奨用語の歴史的意義を探究する。
その結果、歴史的語彙は、KOSや歴史資源において、時間にわたって概念的ドリフトを表すアナクロニスティックな主題を生成できることを確認した。
KOSの変化を時間とともに研究し、歴史的人文科学資源の文脈化を改善する方法を示す。
関連論文リスト
- Taxonomy-guided Semantic Indexing for Academic Paper Search [51.07749719327668]
TaxoIndexは学術論文検索のためのセマンティックインデックスフレームワークである。
学術分類学によって導かれる意味指標として、論文から重要な概念を整理する。
既存の高密度レトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-10-25T00:00:17Z) - From cart to truck: meaning shift through words in English in the last two centuries [0.0]
この擬似論的研究は、時間とともに異なる単語が同じ概念をどう表現するかを、ダイアクロニックな単語埋め込みを用いて調査する。
我々は、エネルギー、輸送、エンターテイメント、およびコンピューティング領域の変化を特定し、言語と社会的な変化の関連を明らかにする。
論文 参考訳(メタデータ) (2024-08-29T02:05:39Z) - Data Set Terminology of Deep Learning in Medicine: A Historical Review and Recommendation [0.7897552065199818]
医学とディープラーニングに基づく人工知能工学は、数十年にわたる歴史を持つ2つの異なる分野を表している。
このような歴史によって、特定の方法が適用される一連の用語がもたらされる。
このレビューは、これらの用語の歴史的文脈を与え、これらの用語が医療AIの文脈で使用されるときの明確さの重要性を強調することを目的としている。
論文 参考訳(メタデータ) (2024-04-30T07:07:45Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - Placing (Historical) Facts on a Timeline: A Classification cum Coref
Resolution Approach [4.809236881780707]
タイムラインは、ある期間に起こった重要な歴史的事実を視覚化する最も効果的な方法の1つである。
複数の(歴史的)テキスト文書からイベントタイムラインを生成するための2段階システムを提案する。
我々の結果は、歴史学者、歴史研究の進展、そして国の社会・政治の風景を理解する上で非常に役立ちます。
論文 参考訳(メタデータ) (2022-06-28T15:36:44Z) - Supporting Vision-Language Model Inference with Confounder-pruning Knowledge Prompt [71.77504700496004]
視覚言語モデルは、オープンセットの視覚概念を扱うために、画像とテキストのペアを共通の空間に整列させることで事前訓練される。
事前訓練されたモデルの転送可能性を高めるため、最近の研究では、固定または学習可能なプロンプトが採用されている。
しかし、どのようにして、どのプロンプトが推論性能を改善するのかは、まだ不明である。
論文 参考訳(メタデータ) (2022-05-23T07:51:15Z) - Overview of the TREC 2020 Fair Ranking Track [64.16623297717642]
本稿は、NIST TREC 2020 Fair Ranking trackの概要を示す。
フェア・ランキング・トラックの中心的な目標は、様々な作家グループに公正な露出を提供することである。
論文 参考訳(メタデータ) (2021-08-11T10:22:05Z) - Search from History and Reason for Future: Two-stage Reasoning on
Temporal Knowledge Graphs [56.33651635705633]
そこで我々は,CluSTeRを提案し,2段階の予測手法であるClue SearchとTemporal Reasoningを提案する。
CluSTeRは、強化学習(RL)を通じてビームサーチポリシーを学び、歴史的事実から複数の手がかりを導き出す。
時間的推論段階では、グラフ畳み込みネットワークに基づくシーケンス法を採用し、手がかりから回答を導出する。
論文 参考訳(メタデータ) (2021-06-01T09:01:22Z) - Corpus of Chinese Dynastic Histories: Gender Analysis over Two Millennia [3.2851864672627618]
王朝の歴史は紀元前3世紀から紀元前18世紀にかけて、およそ2000年の長い連続した言語空間を形成している。
歴史は古典(文学)中国語で2000万文字以上のコーパスで記録されており、歴史的辞書の計算分析や意味変化に適している。
このプロジェクトでは,Creative Commonsライセンスでカバーされた24のダイナスティックヒストリーの新たなオープンソースコーパスを導入する。
論文 参考訳(メタデータ) (2020-05-18T15:14:33Z) - Semantic Relatedness for Keyword Disambiguation: Exploiting Different
Embeddings [0.0]
本稿では,学習時に未知の外部インベントリ(オントロジー)によって提供される単語と感覚間の意味的関連性に基づくキーワードの曖昧さに対するアプローチを提案する。
実験の結果,特定のドメインをトレーニングすることなく,単語センスの曖昧さ (WSD) を適用した場合に,この手法が技術状況に匹敵する結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-02-25T16:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。