論文の概要: Semantically Orthogonal Framework for Citation Classification: Disentangling Intent and Content
- arxiv url: http://arxiv.org/abs/2601.05103v1
- Date: Thu, 08 Jan 2026 16:48:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.285312
- Title: Semantically Orthogonal Framework for Citation Classification: Disentangling Intent and Content
- Title(参考訳): 沈み込み分類のための意味的直交的枠組み:含意と内容の遠ざかる
- Authors: Changxu Duan, Zhiyin Tan,
- Abstract要約: SOFTは2次元のSemantically Orthogonal Frameworkであり、引用意図と引用内容のタイプを明確に分離する。
我々は、SOFTを用いてACL-ARCデータセットを再注釈し、ACT2からサンプリングされたクロスディシプリナテストセットをリリースする。
結果は、デジタルライブラリや学術的なコミュニケーション基盤の明確性、一貫性、一般化性を改善した、明確で再利用可能なアノテーション標準としてのSOFTの価値を確認した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Understanding the role of citations is essential for research assessment and citation-aware digital libraries. However, existing citation classification frameworks often conflate citation intent (why a work is cited) with cited content type (what part is cited), limiting their effectiveness in auto classification due to a dilemma between fine-grained type distinctions and practical classification reliability. We introduce SOFT, a Semantically Orthogonal Framework with Two dimensions that explicitly separates citation intent from cited content type, drawing inspiration from semantic role theory. We systematically re-annotate the ACL-ARC dataset using SOFT and release a cross-disciplinary test set sampled from ACT2. Evaluation with both zero-shot and fine-tuned Large Language Models demonstrates that SOFT enables higher agreement between human annotators and LLMs, and supports stronger classification performance and robust cross-domain generalization compared to ACL-ARC and SciCite annotation frameworks. These results confirm SOFT's value as a clear, reusable annotation standard, improving clarity, consistency, and generalizability for digital libraries and scholarly communication infrastructures. All code and data are publicly available on GitHub https://github.com/zhiyintan/SOFT.
- Abstract(参考訳): 引用の役割を理解することは、研究評価と引用対応デジタルライブラリーにとって不可欠である。
しかし、既存の引用分類フレームワークは引用意図(なぜ作品が引用されるのか)を引用内容型(引用される部分)と区別することが多く、微粒な型区別と実用的な分類信頼性のジレンマによる自動分類の有効性を制限している。
2次元のセマンティック直交フレームワークであるSOFTを導入し、引用意図を引用内容のタイプから明確に分離し、セマンティックロール理論からインスピレーションを引き出す。
我々は、ACL-ARCデータセットをSOFTを用いて体系的に再注釈し、ACT2からサンプリングされたクロスディシプリナテストセットをリリースする。
ゼロショットと微調整のLarge Language Modelsによる評価は、SOFTが人間のアノテータとLLMのより高い一致を可能にし、ACL-ARCやSciCiteのアノテーションフレームワークと比較して、より強力な分類性能と堅牢なドメイン間一般化をサポートすることを示している。
これらの結果は、デジタルライブラリや学術的なコミュニケーション基盤の明確性、一貫性、一般化性を改善した、明確で再利用可能なアノテーション標準としてのSOFTの価値を裏付けるものである。
すべてのコードとデータはGitHub https://github.com/zhiyintan/SOFTで公開されている。
関連論文リスト
- SemanticCite: Citation Verification with AI-Powered Full-Text Analysis and Evidence-Based Reasoning [0.0]
本稿では,全文ソース解析による引用精度の検証を行うAIシステムであるSemanticCiteを紹介する。
提案手法は,複数の検索手法と,ニュアンスド・クレーム・ソース関係を抽出する4クラス分類システムを組み合わせたものである。
我々は、詳細なアライメント、機能分類、セマンティックアノテーション、およびバイオロメトリメタデータを備えた1000以上の引用からなる包括的なデータセットをコントリビュートする。
論文 参考訳(メタデータ) (2025-11-20T10:05:21Z) - FeClustRE: Hierarchical Clustering and Semantic Tagging of App Features from User Reviews [0.0]
FeClustREは、ハイブリッド機能抽出、階層クラスタリング、自動チューニング、セマンティックラベリングを統合したフレームワークである。
FeClustREを,クラスタリングの品質,セマンティックコヒーレンス,解釈可能性に関するAIアシスタントアプリレビューのサンプル調査と,その正しさの抽出のための公開ベンチマークで評価した。
論文 参考訳(メタデータ) (2025-10-21T16:54:21Z) - Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models [44.31597857713689]
最初の段階でActive Indexingを導入し、一般化可能なソースアンコールバインディングを作成します。
Qwen-2.5-7B&3Bの実験は、アクティブインデックスがパッシブインデックスのベースラインを一貫して上回っていることを示している。
内部の引用は、モデルを検索ノイズに対してより堅牢にすることで、外部の引用を補完する。
論文 参考訳(メタデータ) (2025-06-21T04:48:05Z) - CiteFusion: An Ensemble Framework for Citation Intent Classification Harnessing Dual-Model Binary Couples and SHAP Analyses [1.6695303704829412]
CiteFusionは、SciCiteとACL-ARCという2つのベンチマークデータセット上のマルチクラスCitation Intent Classificationタスクに対処する。
実験の結果、CiteFusionは最先端のパフォーマンスを達成し、Macro-F1スコアはSciCiteで89.60%、ACL-ARCで76.24%であった。
我々は、SciCiteで開発されたCiteFusionモデルを利用して、引用意図を分類するWebベースのアプリケーションをリリースする。
論文 参考訳(メタデータ) (2024-07-18T09:29:33Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z) - Document-Level Relation Extraction with Sentences Importance Estimation
and Focusing [52.069206266557266]
文書レベルの関係抽出(DocRE)は、複数の文の文書から2つのエンティティ間の関係を決定することを目的としている。
我々はDocREのための文重要度スコアと文集中損失を設計するSIEF(Sentence Estimation and Focusing)フレームワークを提案する。
2つのドメインの実験結果から、SIEFは全体的なパフォーマンスを改善するだけでなく、DocREモデルをより堅牢にします。
論文 参考訳(メタデータ) (2022-04-27T03:20:07Z) - Generalized Funnelling: Ensemble Learning and Heterogeneous Document
Embeddings for Cross-Lingual Text Classification [78.83284164605473]
emphFunnelling (Fun)は、最近提案された言語間テキスト分類手法である。
Emph Generalized Funnelling (gFun) はFunの一般化である。
gFunは、Funや最先端のベースラインよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-09-17T23:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。