Fugu-MT 論文翻訳(概要): Are Finer Citations Always Better? Rethinking Granularity for Attributed Generation

論文の概要: Are Finer Citations Always Better? Rethinking Granularity for Attributed Generation

arxiv url: http://arxiv.org/abs/2604.01432v1
Date: Wed, 01 Apr 2026 22:16:23 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-03 14:21:10.078017
Title: Are Finer Citations Always Better? Rethinking Granularity for Attributed Generation
Title（参考訳）: ファイナレーションは常に改善されているか? 分散生成の粒度を再考する
Authors: Hexuan Wang, Jingyu Zhang, Benjamin Van Durme, Daniel Khashabi,
Abstract要約: その結果, 微粒化は, 最も優れた粒度に比べて, 属性品質を16～276%低下させることがわかった。分析の結果,詳細な(文レベルの)引用は,主張に答えるために証拠を帰属させるために必要な意味的依存関係を阻害することがわかった。厳密には、引用-最適粒度は、回答の正しさを保ったり改善したりしながら、帰属品質を大幅に向上させる。
参考スコア（独自算出の注目度）: 75.27453112832093
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Citation granularity - whether to cite individual sentences, paragraphs, or documents - is a critical design choice in attributed generation. While fine-grained citations are often preferred for precise human verification, their impact on model performance remains under-explored. We analyze four model scales (8B-120B) and demonstrate that enforcing fine-grained citations degrades attribution quality by 16-276% compared to the best-performing granularity. We observe a consistent performance pattern where attribution quality peaks at intermediate granularities (paragraph-level). Our analysis suggests that fine-grained (sentence-level) citations disrupt necessary semantic dependencies for attributing evidence to answer claims, while excessively coarse citations (multi-paragraph) introduce distracting noise. Importantly, the magnitude of this performance gap varies non-monotonically with model scale: fine-grained constraints disproportionately penalize larger models, suggesting that atomic citation units disrupt the multi-sentence information synthesis at which these models excel. Strikingly, citation-optimal granularity leads to substantial gains in attribution quality while preserving or even improving answer correctness. Overall, our findings demonstrate that optimizing solely for human verification via fine-grained citation disregards model constraints, compromising both attribution faithfulness and generation reliability. Instead, effective attribution requires aligning citation granularity with the model's natural semantic scope.
Abstract（参考訳）: 引用の粒度 - 個々の文、段落、文書を引用するかどうか - は、属性生成において重要な設計選択である。きめ細かい引用は正確な人間の検証に好まれるが、モデルの性能への影響は未解明のままである。 4つのモデルスケール (8B-120B) を解析し, 微粒な引用を強制すると, 寄与品質が16～276%低下することを示した。属性品質が中間粒度(パラグラフレベル)でピークとなる一貫した性能パターンを観察する。分析の結果,詳細な(文レベルの)引用が主張に答えるために必要な意味的依存関係を阻害する一方で,過度に粗い引用(複数パラグラフ)がノイズを生じさせることが示唆された。この性能ギャップの大きさは、モデルスケールと非単調に異なる: きめ細かい制約は、より大きなモデルを不均等に罰し、原子励起ユニットがこれらのモデルが排他的である多文情報合成を妨害することを示唆する。厳密には、引用-最適粒度は、回答の正しさを保ったり改善したりしながら、帰属品質を大幅に向上させる。全体として,詳細な引用による検証のみに最適化することはモデル制約を無視し,帰属忠実度と生成信頼性の両方を損なうことが示唆された。その代わり、効果的な帰属は、引用の粒度をモデルの自然な意味範囲と整合させることを必要とする。

関連論文リスト

GenProve: Learning to Generate Text with Fine-Grained Provenance [14.66501508318216]
本稿では, モデルが文レベル三重項を同時に生成しながら, フロートな解を生成するタスクである生成時ファイン・グラニュアル・プロヴァンス(Generation-time Fine-fine Provenance)を提案する。 GenProveは,回答忠実度と証明精度の複合報酬を最適化することにより,14個の強力なLDMよりも高い性能を示した。
論文参考訳（メタデータ） (2026-01-08T13:30:30Z)
FineRef: Fine-Grained Error Reflection and Correction for Long-Form Generation with Citations [30.28908306106096]
FineRefはモデルに、2つの重要な引用エラー、ミスマッチと無関係を自己識別し、修正するように教える。 FineRefは、引用性能と回答精度の両方を大幅に改善する。我々の7Bモデルは、Citation F1では最大18%、EMリコールでは4%、GPT-4より優れています。
論文参考訳（メタデータ） (2025-11-18T09:35:12Z)
VeriCite: Towards Reliable Citations in Retrieval-Augmented Generation via Rigorous Verification [107.75781898355562]
証拠を厳格に検証し,回答の帰属性を高めるために設計された,VeriCiteと呼ばれる新しいフレームワークを紹介する。我々は,5つのオープンソースLCMと4つのデータセットを対象とした実験を行い,VeriCiteが回答の正しさを維持しつつ,引用品質を大幅に向上できることを実証した。
論文参考訳（メタデータ） (2025-10-13T13:38:54Z)
Generation-Time vs. Post-hoc Citation: A Holistic Evaluation of LLM Attribution [8.691344810384114]
大規模言語モデル (LLMs) は、医療、法律、アカデミア、金融といった高度な領域において、人間の検証可能な情報源を引用しなければならない。本稿では,一つのパスで応答と引用を生成する生成時間Citation(G-Cite)と,起草後の引用を付加または検証するポストホックCitation(P-Cite)という2つのパラダイムを紹介する。両パラダイムにおける帰属品質の主要因は検索であり,適用範囲と引用精度の相反するトレードオフを示した。
論文参考訳（メタデータ） (2025-09-25T20:39:26Z)
Preference Learning for AI Alignment: a Causal Perspective [55.2480439325792]
私たちはこの問題を因果パラダイムに枠組み化し、永続的な課題を特定するための因果関係の豊富なツールボックスを提供します。因果推論の文献を継承し、信頼性の高い一般化に必要な重要な仮定を特定する。そこで本研究では, 因果関係に基づくアプローチがモデルロバスト性をいかに改善するかを, ナイーブ報酬モデルの障害モードを例示する。
論文参考訳（メタデータ） (2025-06-06T10:45:42Z)
SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models [51.90867482317985]
SelfCiteは、生成されたレスポンスの文に対して、きめ細かい文レベルの引用を生成する、自己教師型アプローチである。 SelfCiteの有効性は、LongBench-Citeベンチマークにおいて、引用F1を5.3ポイントまで増やすことによって示される。
論文参考訳（メタデータ） (2025-02-13T18:55:13Z)
Learning to Generate Answers with Citations via Factual Consistency Models [28.716998866121923]
大型言語モデル(LLM)は、ミッションクリティカルな状況においてその信頼性を阻害する。本稿では,事実整合性モデル(FCM)を利用した弱教師付き微調整法を提案する。集中学習は目的に統合され、ファインチューニングプロセスが現実の単位トークンを強調するように指示される。
論文参考訳（メタデータ） (2024-06-19T00:40:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。