論文の概要: Compositional Multi-hop Factual Error Correction via Decomposition-and-Injection
- arxiv url: http://arxiv.org/abs/2605.02277v1
- Date: Mon, 04 May 2026 07:08:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.166782
- Title: Compositional Multi-hop Factual Error Correction via Decomposition-and-Injection
- Title(参考訳): 分解・注入による組成多重ホップ誤差補正
- Authors: Lei Zhu, Xiaobao Wang, Jianbiao Yang, Chenyang Wang, Dongxiao He, Longbiao Wang, Jianwu Dang,
- Abstract要約: 本稿では,合成誤り訂正のための論理的枠組みであるCECoR(Reasoning-aware Synthesis)を提案する。
CECoRはマルチホップクレームを解釈可能な推論ステップに分解し、制御された摂動を注入して高品質なトレーニングペアを合成する。
教師付き微調整と強化学習を組み合わせた2段階学習戦略は、事実の正確性と堅牢性を向上させる。
- 参考スコア(独自算出の注目度): 60.34509125517578
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Factual Error Correction (FEC) aims to revise inaccurate text into statements that are factually consistent with external evidence. Although recent methods perform well on single-hop correction, they often treat claims as atomic units and struggle with multi-hop cases that require compositional reasoning across multiple evidence sources. This challenge is further amplified by limited paired data and difficulties in locating semantic errors within complex reasoning chains. We present CECoR (Compositional Error Correction via Reasoning-aware Synthesis), a reasoning-aware framework that introduces a Decomposition and Injection paradigm for compositional error correction. CECoR decomposes multi-hop claims into interpretable reasoning steps and injects controlled perturbations to synthesize high-quality training pairs. A two-stage learning strategy combining supervised fine-tuning and reinforcement learning improves factual accuracy and robustness. Comprehensive evaluations show that CECoR achieves strong performance on multi-hop benchmarks, outperforming both distantly supervised methods and few-shot LLM baselines. It also generalizes effectively to single-hop correction and remains stable under noisy evidence, demonstrating its versatility for real-world factual correction.
- Abstract(参考訳): FEC(Factual Error Correction)は、不正確なテキストを実際に外部の証拠と一致した文に書き換えることを目的としている。
近年の手法はシングルホップ補正においてよく機能するが、主張を原子単位として扱い、複数の証拠源をまたいだ構成的推論を必要とするマルチホップ事件に苦慮することが多い。
この課題は、限定的なペアデータと、複雑な推論チェーン内のセマンティックエラーを見つけることの難しさによってさらに増幅される。
本稿では,合成誤り訂正のための分解・注入パラダイムを導入する理工学的枠組みであるCECoRを提案する。
CECoRはマルチホップクレームを解釈可能な推論ステップに分解し、制御された摂動を注入して高品質なトレーニングペアを合成する。
教師付き微調整と強化学習を組み合わせた2段階学習戦略は、事実の正確性と堅牢性を向上させる。
総合評価の結果,CECoR はマルチホップベンチマークにおいて高い性能を示し,遠隔教師付き手法と数ショット LLM ベースラインの両方に優れていた。
また、シングルホップ補正を効果的に一般化し、ノイズのある証拠の下で安定であり、現実の事実補正にその汎用性を証明している。
関連論文リスト
- CRAFT: Calibrated Reasoning with Answer-Faithful Traces via Reinforcement Learning for Multi-Hop Question Answering [19.391824811629125]
Retrieval-augmented Generation (RAG) は、大規模言語モデル(LLM)をマルチホップ質問応答に利用するために広く使われている。
マルチホップQAにおける推論は,マルチホップ構成により本質的に複雑であり,ノイズ検索によりさらに不安定となる。
CRAFTは、応答生成時に忠実な推論を行うためにモデルを訓練する強化学習フレームワークである。
論文 参考訳(メタデータ) (2026-02-01T17:33:39Z) - Scaling Reasoning Hop Exposes Weaknesses: Demystifying and Improving Hop Generalization in Large Language Models [66.36240676392502]
CoT(Chain-of- Thought)推論は、LLM(Large Language Models)が複雑な問題を解決するための標準パラダイムとなっている。
近年の研究では、ホップ一般化シナリオの推論性能が急落している。
推論過程におけるEPヘッドを動的に識別・非活性化する軽量な介入法である推論の試験時間補正を提案する。
論文 参考訳(メタデータ) (2026-01-29T03:24:32Z) - Bridging Internal Probability and Self-Consistency for Effective and Efficient LLM Reasoning [53.25336975467293]
パープレキシティや自己整合性などの手法の第一理論誤差分解解析について述べる。
パープレキシティ法は、適切な整合関数が存在しないため、かなりのモデル誤差に悩まされる。
本稿では、自己整合性とパープレキシティを統合したReasoning-Pruning Perplexity Consistency(RPC)と、低確率推論経路を排除したReasoning Pruningを提案する。
論文 参考訳(メタデータ) (2025-02-01T18:09:49Z) - Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification [52.095460362197336]
大規模言語モデル(LLM)は一貫性と正確な推論に苦しむ。
LLMは、主に正しいソリューションに基づいて訓練され、エラーを検出して学習する能力を減らす。
本稿では,CoT(Chain-of-Thought)とPoT(Program-of-Thought)を組み合わせた新しい協調手法を提案する。
論文 参考訳(メタデータ) (2024-10-05T05:21:48Z) - Cross-modal Active Complementary Learning with Self-refining
Correspondence [54.61307946222386]
既存手法のロバスト性を改善するために,クロスモーダルなロバスト補完学習フレームワーク(CRCL)を提案する。
ACLは、誤った監視を行うリスクを減らすために、アクティブで補完的な学習損失を利用する。
SCCは、モーメント補正を備えた複数の自己精製プロセスを使用して、対応を補正するために受容場を拡大する。
論文 参考訳(メタデータ) (2023-10-26T15:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。