論文の概要: Defend: Automated Rebuttals for Peer Review with Minimal Author Guidance
- arxiv url: http://arxiv.org/abs/2603.27360v1
- Date: Sat, 28 Mar 2026 18:12:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.921125
- Title: Defend: Automated Rebuttals for Peer Review with Minimal Author Guidance
- Title(参考訳): Defend: 最小限の著者ガイドによるピアレビューのための自動リビュー
- Authors: Jyotsana Khatri, Manasi Patwardhan,
- Abstract要約: 大規模言語モデル (LLM) は、しばしば、反響生成に直接使用されるとき、目標とする反響を実行し、正確な事実的根拠を維持するのに苦労する。
本稿では,自動再帰生成の基本的な推論プロセスを明示的に実行するためのLDMベースのツールであるDEFENDを紹介する。
反論をスクラッチから書くのとは対照的に、著者は最小限の介入で推論プロセスのみを実行する必要がある。
- 参考スコア(独自算出の注目度): 4.655159257282135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rebuttal generation is a critical component of the peer review process for scientific papers, enabling authors to clarify misunderstandings, correct factual inaccuracies, and guide reviewers toward a more accurate evaluation. We observe that Large Language Models (LLMs) often struggle to perform targeted refutation and maintain accurate factual grounding when used directly for rebuttal generation, highlighting the need for structured reasoning and author intervention. To address this, in the paper, we introduce DEFEND an LLM based tool designed to explicitly execute the underlying reasoning process of automated rebuttal generation, while keeping the author-in-the-loop. As opposed to writing the rebuttals from scratch, the author needs to only drive the reasoning process with minimal intervention, leading an efficient approach with minimal effort and less cognitive load. We compare DEFEND against three other paradigms: (i) Direct rebuttal generation using LLM (DRG), (ii) Segment-wise rebuttal generation using LLM (SWRG), and (iii) Sequential approach (SA) of segment-wise rebuttal generation without author intervention. To enable finegrained evaluation, we extend the ReviewCritique dataset, creating review segmentation, deficiency, error type annotations, rebuttal-action labels, and mapping to gold rebuttal segments. Experimental results and a user study demonstrate that directly using LLMs perform poorly in factual correctness and targeted refutation. Segment-wise generation and the automated sequential approach with author-in-the-loop, substantially improve factual correctness and strength of refutation.
- Abstract(参考訳): 反論生成は、科学的論文のピアレビュープロセスにおいて重要な要素であり、著者は誤解、事実の正確さの正しさ、そしてより正確な評価に向けてレビュアーを導くことができる。
我々は,Large Language Models (LLMs) が,Rebuttal Generation に直接使用される場合,目的の難読化と正確な事実的根拠の維持に苦慮し,構造化された推論と著者の介入の必要性を強調している。
そこで本論文では,LLM ベースのツールである DEFEND を導入し,著者をループに留めつつ,自動再帰生成の基本的な推論プロセスを明示的に実行する。
スクラッチから反論を書くのとは対照的に、著者は最小限の介入で推論プロセスのみを駆動し、最小限の努力と認知負荷の少ない効率的なアプローチを導く必要がある。
DEFENDと他の3つのパラダイムを比較します。
一 LLM(DRG)を用いた直接反射発生
(II)LDM(SWRG)を用いたセグメントワイズ応答生成と
三 著者の介入を伴わない部分的反感発生の逐次的アプローチ(SA)
詳細な評価を可能にするため、ReviewCritiqueデータセットを拡張し、レビューセグメンテーション、欠陥、エラータイプアノテーション、rebuttal-action label、およびゴールドレビュータルセグメンテーションへのマッピングを作成する。
実験結果とユーザスタディにより, LLM を直接使用すると, 事実の正しさや目的の難読化が著しく低下することが示された。
セグメンションワイズ生成とオーサリング・イン・ザ・ループによる自動シーケンシャルアプローチにより, 消火の事実的正しさと強度が大幅に向上する。
関連論文リスト
- Incorporating Self-Rewriting into Large Language Model Reasoning Reinforcement [54.63337314382886]
自己書き起こしフレームワークを導入し、モデルが独自の推論テキストを書き直し、その後、書き直し推論から学習し、内部思考プロセスの品質を向上させる。
アルゴリズム設計において、モデルの一貫した正当性によって定義される「単純な」サンプルのみを書き換える選択的な書き換え手法を提案する。
モデルサイズが異なる多様なタスクの実験は、自己書き換えの有効性を検証する。
論文 参考訳(メタデータ) (2025-11-20T13:10:52Z) - Automatic Paper Reviewing with Heterogeneous Graph Reasoning over LLM-Simulated Reviewer-Author Debates [27.434014916351348]
複数ラウンドのレビュアー-著者による議論に対して不均一なグラフ推論を行う新しいフレームワークであるReViewGraphを提案する。
これらの構造化された議論グラフの推論にグラフニューラルネットワークを適用することで、ReViewGraphは詳細な議論のダイナミクスをキャプチャし、より詳細なレビュー決定を可能にする。
論文 参考訳(メタデータ) (2025-11-11T14:46:07Z) - Arg-LLaDA: Argument Summarization via Large Language Diffusion Models and Sufficiency-Aware Refinement [27.673022970833163]
本稿では,要約を反復的に改善する新しい大規模言語拡散フレームワークArg-LLaDAを紹介する。
本手法では,フレキシブルマスキングコントローラと十分チェックモジュールを組み合わせることで,サポート対象,冗長,あるいは不完全なスパンを特定し,修正する。
2つのベンチマークデータセットの実証結果は、Arg-LLaDAが10の自動評価指標のうち7の最先端のベースラインを超えたことを示している。
論文 参考訳(メタデータ) (2025-07-25T09:07:52Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Analysing Zero-Shot Readability-Controlled Sentence Simplification [54.09069745799918]
本研究では,異なる種類の文脈情報が,所望の可読性を持つ文を生成するモデルの能力に与える影響について検討する。
結果から,全ての試験されたモデルは,原文の制限や特徴のため,文の簡略化に苦慮していることがわかった。
実験では、RCTSに合わせたより良い自動評価指標の必要性も強調した。
論文 参考訳(メタデータ) (2024-09-30T12:36:25Z) - Sentiment Analysis through LLM Negotiations [58.67939611291001]
感情分析の標準的なパラダイムは、単一のLCMに依存して、その決定を1ラウンドで行うことである。
本稿では,感情分析のためのマルチLLMネゴシエーションフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-03T12:35:29Z) - REFINER: Reasoning Feedback on Intermediate Representations [47.36251998678097]
中間推論を生成するための言語モデルを微調整するフレームワークであるREFINERを紹介する。
REFINERは、推論に対する自動フィードバックを提供する批評家モデルと対話することで機能する。
経験的評価は、同等のスケールのベースラインLMよりも大幅に改善された。
論文 参考訳(メタデータ) (2023-04-04T15:57:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。