論文の概要: RenoBench: A Citation Parsing Benchmark
- arxiv url: http://arxiv.org/abs/2603.25640v1
- Date: Thu, 26 Mar 2026 16:52:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.390003
- Title: RenoBench: A Citation Parsing Benchmark
- Title(参考訳): RenoBench: Citation Parsing Benchmark
- Authors: Parth Sarin, Juan Pablo Alperin, Adam Buttrick, Dione Mentis,
- Abstract要約: RenoBenchは機械可読な引用解析のためのベンチマークである。
SciELO、Redalyc、Public Knowledge Project、Open Research Europeの4つの出版エコシステムでリリースされたPDFから派生している。
複数の言語、パブリッシュタイプ、プラットフォームにまたがる1万の引用のデータセットに対して、自動検証と機能ベースのサンプリングを適用する。
- 参考スコア(独自算出の注目度): 0.764971671709743
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate parsing of citations is necessary for machine-readable scholarly infrastructure. But, despite sustained interest in this problem, existing evaluation techniques are often not generalizable, based on synthetic data, or not publicly available. We introduce RenoBench, a public domain benchmark for citation parsing, sourced from PDFs released on four publishing ecosystems: SciELO, Redalyc, the Public Knowledge Project, and Open Research Europe. Starting from 161,000 annotated citations, we apply automated validation and feature-based sampling to produce a dataset of 10,000 citations spanning multiple languages, publication types, and platforms. We then evaluate a variety of citation parsing systems and report field-level precision and recall. Our results show strong performance from language models, particularly when fine-tuned. RenoBench enables reproducible, standardized evaluation of citation parsing systems, and provides a foundation for advancing automated citation parsing and metascientific research.
- Abstract(参考訳): 機械可読な学術インフラでは、引用の正確な解析が不可欠である。
しかし、この問題への継続的な関心にもかかわらず、既存の評価手法は、合成データに基づいて一般化できない場合や、一般には利用できない場合が多い。
我々は、SciELO、Redalyc、Public Knowledge Project、Open Research Europeの4つの出版エコシステムでリリースされたPDFから得られた引用解析のためのパブリックドメインベンチマークであるRenoBenchを紹介します。
161,000の注釈付き引用から始めて、自動検証と機能ベースのサンプリングを適用して、複数の言語、パブリッシュタイプ、プラットフォームにまたがる10,000の引用のデータセットを生成します。
次に、様々な引用解析システムを評価し、フィールドレベルの精度とリコールを報告する。
この結果から,言語モデル,特に微調整時の性能が向上した。
RenoBenchは、引用解析システムの再現可能で標準化された評価を可能にし、自動引用解析とメタサイエンティフィック研究の進展のための基盤を提供する。
関連論文リスト
- Public Profile Matters: A Scalable Integrated Approach to Recommend Citations in the Wild [5.273138059454523]
Profilerは軽量で学習不能なモジュールで、人間の引用パターンを効率よく、バイアスなくキャプチャする。
DAVINCIは,プロファイラ由来の信頼度を意味情報と統合する新しい階調モデルである。
論文 参考訳(メタデータ) (2026-03-18T04:52:42Z) - CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era [51.63024682584688]
大規模言語モデル (LLM) は新たなリスクを導入している。
本稿では,科学文献における幻覚的引用のための総合的なベンチマークおよび検出フレームワークについて紹介する。
我々のフレームワークは、精度と解釈可能性の両方において、先行手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-26T19:17:39Z) - SemanticCite: Citation Verification with AI-Powered Full-Text Analysis and Evidence-Based Reasoning [0.0]
本稿では,全文ソース解析による引用精度の検証を行うAIシステムであるSemanticCiteを紹介する。
提案手法は,複数の検索手法と,ニュアンスド・クレーム・ソース関係を抽出する4クラス分類システムを組み合わせたものである。
我々は、詳細なアライメント、機能分類、セマンティックアノテーション、およびバイオロメトリメタデータを備えた1000以上の引用からなる包括的なデータセットをコントリビュートする。
論文 参考訳(メタデータ) (2025-11-20T10:05:21Z) - Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models [44.31597857713689]
最初の段階でActive Indexingを導入し、一般化可能なソースアンコールバインディングを作成します。
Qwen-2.5-7B&3Bの実験は、アクティブインデックスがパッシブインデックスのベースラインを一貫して上回っていることを示している。
内部の引用は、モデルを検索ノイズに対してより堅牢にすることで、外部の引用を補完する。
論文 参考訳(メタデータ) (2025-06-21T04:48:05Z) - CiteEval: Principle-Driven Citation Evaluation for Source Attribution [38.24323805177938]
CiteEvalは、きめ細かい引用評価に焦点を当てた、引用評価フレームワークである。
CiteBenchは、引用品質に関する高品質なヒューマンアノテーションを備えたベンチマークである。
CiteEval-Autoは、人間の判断と強い相関を示すモデルベースのメトリクスのスイートである。
論文 参考訳(メタデータ) (2025-06-02T16:15:34Z) - Citation Parsing and Analysis with Language Models [0.0]
文書引用をインデックス化可能な形式でマークアップするオープンウェイト言語モデルの能力について検討する。
ボックスからでも、今日の言語モデルでは、各引用の構成要素を特定する上で高いレベルの精度が得られます。
論文 参考訳(メタデータ) (2025-05-21T19:06:17Z) - ALiiCE: Evaluating Positional Fine-grained Citation Generation [54.19617927314975]
本稿では,微細な引用生成のための最初の自動評価フレームワークであるALiiCEを提案する。
我々のフレームワークはまず、文のクレームを依存性分析によって原子クレームに解析し、次に原子クレームレベルでの引用品質を計算する。
複数大言語モデルの2つの長文QAデータセット上での位置的きめ細かな引用生成性能を評価する。
論文 参考訳(メタデータ) (2024-06-19T09:16:14Z) - ILCiteR: Evidence-grounded Interpretable Local Citation Recommendation [31.259805200946175]
本稿では,特定の論文を推薦するための証拠を対象とする,根拠に基づく局所引用推薦タスクを紹介する。
単にレコメンデーションを出力する過去の定式化とは異なり、ICCiteRはエビデンスのリストとレコメンデーションペーパーのペアを検索する。
本研究では,エビデンスに基づく局所的引用推薦タスクのための新しいデータセットを提供し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-03-13T17:38:05Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。