論文の概要: How Does Research Evolve? Tracing Cross-Domain Trajectories in NLP, ML, and CV with Claim-Grounded Typed Citations
- arxiv url: http://arxiv.org/abs/2606.22342v1
- Date: Sun, 21 Jun 2026 05:20:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 18:52:42.901459
- Title: How Does Research Evolve? Tracing Cross-Domain Trajectories in NLP, ML, and CV with Claim-Grounded Typed Citations
- Title(参考訳): NLP, ML, CVにおけるクロスドメイン軌跡をクラムグラウンド型サイテーションで追跡する方法
- Authors: Abdul Muntakim, Md Abdullah Al Hafiz Khan, Sadid Hasan, Yong Pei,
- Abstract要約: 本稿では,各エッジを動機づける特定のクレーム文にリンクする最初のクレームグラウンド型型引用グラフを提案する。
SciTrajにはNLP、ML、Vision (2015-2024)の32,559の論文が含まれており、6つの関係タイプで533,126本のエッジが接続されている。
コーパスには長さ$geq 3$の287Mの型付きトラジェクトリが含まれており、72.8%の論文をカバーし、時間分割型付きリンク予測ベンチマークをサポートしている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How does research evolve, and what substrate would let us forecast where it goes next? Scientific progress is not simply a uniform accumulation of facts: ideas extend prior methods, address known limitations, realize proposed future directions, and sometimes dispute earlier claims. Existing citation graphs usually collapse these roles into a single homogeneous edge type, limiting how we can analyze scientific progress. We address this gap by proposing the SciTraj corpus, the first claim-grounded typed citation graph in which each edge is linked to the specific claim sentence that motivates it. Claim-bearing sentences are extracted from paper sections; four claim-driven relations are verified by NLI entailment against in-paper context, while two similarity-only relations are gated by abstract cosine and year-gap rules. SciTraj contains 32,559 papers from NLP, ML, and Vision (2015--2024), connected by 573,126 directed edges across six relation types, with NLI-verified claim seeds. Using SciTraj, we identify disciplinary siloing in typed citation flow and topic emergence concentrated in Vision and LLM-related work. The corpus also contains 287M typed trajectories of length $\geq 3$, covering 72.8% of papers, and supports a temporally split typed link-prediction benchmark. A year-shuffle falsifiability test separates temporal structure from year-correlated content, and a 3-annotator pilot reports $κ= 0.74$ with 79.9% precision.
- Abstract(参考訳): 研究はどのように進化し、どの基板が次に進むかを予測できますか?
科学的進歩は単に事実の統一的な蓄積ではなく、アイデアは事前の手法を拡張し、既知の制限に対処し、提案された将来の方向性を実現し、時には以前の主張に異議を唱える。
既存の引用グラフは通常、これらの役割を単一の均一なエッジタイプに分解し、科学的進歩を分析する方法を制限する。
このギャップに対処するために、我々はSciTraj corpus を提案し、これは最初のクレームグラウンド付き型付き引用グラフで、各エッジがそれを動機づける特定のクレーム文にリンクされている。
4つのクレーム駆動関係は、NLIによる論文中の文脈に対する含意によって検証され、2つの類似性のみの関係は抽象的コサインと年金規則によって表される。
SciTrajには、NLP、ML、Vision (2015-2024)の32,559の論文が含まれており、6つの関係型にわたる573,126本のエッジとNLI検証されたクレームシードが接続されている。
SciTrajを用いて、型付き引用フローにおけるディシプリナシロイングと、ビジョンとLCM関連作業に集中したトピックの出現を同定する。
コーパスには長さ$\geq 3$の287Mの型付きトラジェクトリが含まれており、72.8%の論文をカバーし、時間分割型付きリンク予測ベンチマークをサポートしている。
年数シャッフルのファルシフィビリティテストでは、時間構造と年数関連コンテンツとを区別し、3つのアノテーションのパイロットは、79.9%の精度でκ=0.74$と報告する。
関連論文リスト
- Reading Between the Citations: A Typed Claim Network for Scientific Literature [6.6267663941512005]
学術的な相互参照文書のコーパスに適用可能な建設パイプラインを提供する。
我々はこれを3Dポイントクラウドセマンティックセマンティックセグメンテーションで127の論文のコーパスでインスタンス化し、8,260の型付きクレームのネットワークを生成する。
標準の検索・拡張生成(RAG)ベースラインに対するヘッド・ツー・ヘッド評価は、フラット検索よりも利得が、間違ったものよりも正しい中間表現から得ていることを示している。
論文 参考訳(メタデータ) (2026-05-29T08:02:45Z) - CRISP: Characterizing Relative Impact of Scholarly Publications [70.25915589244961]
本稿では,大規模言語モデル(LLM)を用いた引用論文の中で,引用論文の全てを共同でランク付けするCRISPを提案する。
LLMの位置バイアスを軽減するために、ランダムな順序で各リストを3回ランク付けし、多数決によって影響ラベルを集約する。
CRISPは従来の最先端の衝撃分類器の精度を+9.5%、F1を+8.3%で上回っている。
論文 参考訳(メタデータ) (2026-03-25T16:42:30Z) - ClaimFlow: Tracing the Evolution of Scientific Claims in NLP [67.23189226608389]
NLP文献のクレーム中心のビューである$texttClaimFlow$を紹介します。
新しいタスク $-$$textitClaim Relation Classification$$-$を定義する。
我々の分析によると、63.5$%の請求は決して再利用されない。
論文 参考訳(メタデータ) (2026-03-17T02:43:36Z) - Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes [16.12060986892916]
クローズド・ブック・セッティングにおいて,配置動機による制約が引用の妥当性にどのように影響するかを検討する。
17,443個の励起が生成され、0.475の励起レベルを超えるモデルはない。
論文 参考訳(メタデータ) (2026-03-07T17:14:05Z) - Density, asymmetry and citation dynamics in scientific literature [0.0]
本稿では,出版物のセマンティック・エリアの局所的幾何学を特徴付けるための2つの相補的指標を提案する。
これら2つの指標とその後の引用率の予測関係を検証した。
引用数に対する$rhoの個々の効果は小さく、可変であるが、密度ベースの予測器を組み込むことで、常にサンプル外予測を改善している。
論文 参考訳(メタデータ) (2025-06-29T18:55:04Z) - HLM-Cite: Hybrid Language Model Workflow for Text-based Scientific Citation Prediction [14.731720495144112]
本稿では,表面的な言及を超越した批判的参照を識別する,コア引用という新しい概念を紹介する。
我々は、引用予測のための$textbfH$ybrid $textbfL$anguage $textbfM$odelワークフローである$textbfHLM-Citeを提案する。
我々はHLM-Citeを19分野にわたって評価し,SOTA法と比較して17.6%の性能向上を示した。
論文 参考訳(メタデータ) (2024-10-10T10:46:06Z) - CausalCite: A Causal Formulation of Paper Citations [80.82622421055734]
CausalCiteは紙の意義を測定するための新しい方法だ。
これは、従来のマッチングフレームワークを高次元のテキスト埋め込みに適応させる、新しい因果推論手法であるTextMatchに基づいている。
科学専門家が報告した紙衝撃と高い相関性など,各種基準におけるCausalCiteの有効性を実証する。
論文 参考訳(メタデータ) (2023-11-05T23:09:39Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。