論文の概要: Beyond Pairwise Distance: Cognitive Traversal Distance as a Holistic Measure of Scientific Novelty
- arxiv url: http://arxiv.org/abs/2602.06607v1
- Date: Fri, 06 Feb 2026 11:11:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.367141
- Title: Beyond Pairwise Distance: Cognitive Traversal Distance as a Holistic Measure of Scientific Novelty
- Title(参考訳): ペアワイズ距離を超えて:科学的ノベルティの全体的尺度としての認知的トラバース距離
- Authors: Yi Xiang, Pascal Welke, Chengzhi Zhang, Jian Wang,
- Abstract要約: 我々は,ネットワークに基づく認知的トラバース距離(CTD)を導入した。
CTDは、紙に関連するすべての知識ユニットを繋ぐのに必要な最短経路の長さとして定義される。
我々は,F1000Prime推奨論文とノーベル賞受賞論文から,専門家によるノベルティベンチマークに対するCTDの評価を行った。
- 参考スコア(独自算出の注目度): 11.146850683156705
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Scientific novelty is a critical construct in bibliometrics and is commonly measured by aggregating pairwise distances between the knowledge units underlying a paper. While prior work has refined how such distances are computed, less attention has been paid to how dyadic relations are aggregated to characterize novelty at the paper level. We address this limitation by introducing a network-based indicator, Cognitive Traversal Distance (CTD). Conceptualizing the historical literature as a weighted knowledge network, CTD is defined as the length of the shortest path required to connect all knowledge units associated with a paper. CTD provides a paper-level novelty measure that reflects the minimal structural distance needed to integrate multiple knowledge units, moving beyond mean- or quantile-based aggregation of pairwise distances. Using 27 million biomedical publications indexed by OpenAlex and Medical Subject Headings (MeSH) as standardized knowledge units, we evaluate CTD against expert-based novelty benchmarks from F1000Prime-recommended papers and Nobel Prize-winning publications. CTD consistently outperforms conventional aggregation-based indicators. We further show that MeSH-based CTD is less sensitive to novelty driven by the emergence of entirely new conceptual labels, clarifying its scope relative to recent text-based measures.
- Abstract(参考訳): 科学のノベルティ(英: Scientific novelty)は、文献学において重要な構造であり、一般的に、紙の裏にある知識単位間のペアの距離を集計することによって測定される。
先行研究はそのような距離の計算方法を洗練してきたが、紙のレベルでの新規性を特徴づけるためにダイアド関係の集計方法にはあまり注意が払われていない。
本稿では,ネットワークベースの指標である認知的トラバース距離(CTD)を導入することで,この制限に対処する。
歴史文献を重み付き知識ネットワークとして概念化したCTDは、紙に関連付けられたすべての知識ユニットを繋ぐのに必要な最短経路の長さとして定義される。
CTDは、複数の知識単位を統合するのに必要な最小構造距離を反映した紙レベルのノベルティ尺度を提供する。
標準知識単位としてOpenAlexとMeSHによってインデックス付けされた2700万のバイオメディカル出版物を用いて, F1000Prime推奨論文とノーベル賞受賞論文から, 専門家によるノベルティベンチマークによるCTDの評価を行った。
CTDは、従来の集約ベースの指標よりも一貫して優れています。
さらに,MeSHに基づくCTDは,全く新しい概念ラベルの出現によって生じる新規性に敏感でないことを示し,最近のテキストベース対策と比較してその範囲を明らかにした。
関連論文リスト
- METER: Multi-modal Evidence-based Thinking and Explainable Reasoning -- Algorithm and Benchmark [48.78602579128459]
本稿では,画像,ビデオ,音声,映像コンテンツにまたがる偽造検出のための統合ベンチマークMETERを紹介する。
我々のデータセットは4つのトラックから構成されており、それぞれのトラックは実際のvsフェイク分類だけでなく、エビデンスチェーンに基づく説明も必要である。
論文 参考訳(メタデータ) (2025-07-22T03:42:51Z) - FENICE: Factuality Evaluation of summarization based on Natural language Inference and Claim Extraction [85.26780391682894]
自然言語推論とクレーム抽出(FENICE)に基づく要約のファクチュアリティ評価を提案する。
FENICEは、ソース文書内の情報と、要約から抽出されたクレームと呼ばれる一連の原子的事実との間のNLIベースのアライメントを利用する。
我々の測定基準は、事実性評価のためのデファクトベンチマークであるAGGREFACTに関する新しい技術状況を設定する。
論文 参考訳(メタデータ) (2024-03-04T17:57:18Z) - BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence [18.77248934443666]
コヒーレントテキストは本質的に文間の連続的かつ密着的な相互作用を示す。
BBScore(英: BBScore)は、ブラウン橋理論において、テキストコヒーレンスを評価するための基準のない計量である。
論文 参考訳(メタデータ) (2023-12-28T08:34:17Z) - Ontology Enrichment from Texts: A Biomedical Dataset for Concept
Discovery and Placement [22.074094839360413]
新しい概念のメンションはテキストに定期的に現れ、収穫とそれらを知識ベースに配置するために自動化されたアプローチを必要とする。
既存のデータセットは3つの問題に悩まされており、(i)新しい概念が事前に発見され、KB外の参照発見をサポートできないことを前提にしている。
我々は,最近のLarge Language Modelベースの手法である発見と概念配置について,アウト・オブ・KBを参照するためのデータセットを用いて評価を行う。
論文 参考訳(メタデータ) (2023-06-26T13:54:47Z) - Supervised Knowledge May Hurt Novel Class Discovery Performance [13.31397670697559]
新たなクラス発見(NCD)は、非結合クラスを含むラベル付き集合の事前知識を活用することにより、ラベル付きデータセットで新しいカテゴリを推論することを目的としている。
教師付き知識は、意味的関連性の異なるレベルにおいて常に役に立つか?
論文 参考訳(メタデータ) (2023-06-06T13:04:05Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。