論文の概要: R-Debater: Retrieval-Augmented Debate Generation through Argumentative Memory
- arxiv url: http://arxiv.org/abs/2512.24684v1
- Date: Wed, 31 Dec 2025 07:33:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.595015
- Title: R-Debater: Retrieval-Augmented Debate Generation through Argumentative Memory
- Title(参考訳): R-Debater: Argumentative Memoryによる検索拡張議論生成
- Authors: Maoyuan Li, Zhongsheng Wang, Haoyuan Li, Jiamou Liu,
- Abstract要約: 本稿では,議論的メモリ上に構築されたマルチターン討論を生成するエージェントフレームワークであるR-Debaterを提案する。
R-Debaterは、ケースライクな証拠を検索するための議論知識ベースと、前回の議論は、旋回するコヒーレントな発話を構成するロールベースのエージェントと統合する。
- 参考スコア(独自算出の注目度): 18.007379464461312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present R-Debater, an agentic framework for generating multi-turn debates built on argumentative memory. Grounded in rhetoric and memory studies, the system views debate as a process of recalling and adapting prior arguments to maintain stance consistency, respond to opponents, and support claims with evidence. Specifically, R-Debater integrates a debate knowledge base for retrieving case-like evidence and prior debate moves with a role-based agent that composes coherent utterances across turns. We evaluate on standardized ORCHID debates, constructing a 1,000-item retrieval corpus and a held-out set of 32 debates across seven domains. Two tasks are evaluated: next-utterance generation, assessed by InspireScore (subjective, logical, and factual), and adversarial multi-turn simulations, judged by Debatrix (argument, source, language, and overall). Compared with strong LLM baselines, R-Debater achieves higher single-turn and multi-turn scores. Human evaluation with 20 experienced debaters further confirms its consistency and evidence use, showing that combining retrieval grounding with structured planning yields more faithful, stance-aligned, and coherent debates across turns.
- Abstract(参考訳): 本稿では,議論的メモリ上に構築されたマルチターン討論を生成するエージェントフレームワークであるR-Debaterを提案する。
修辞学と記憶学に根ざして、システムは議論を、姿勢の整合性を維持するために事前の議論をリコールし、適応させ、相手に反応し、証拠で主張を支持するプロセスであると見なしている。
具体的には、R-Debaterは、ケースのような証拠を検索するための議論知識ベースと、旋回するコヒーレントな発話を構成するロールベースのエージェントとの事前の議論の動きを統合する。
我々は、標準化されたORCHIDの議論について評価し、1000項目の検索コーパスと7つのドメインにわたる32の議論セットを構築した。
InspireScore(主観的、論理的、事実的)で評価された次の発話生成と、Debatrix(引数、ソース、言語、全体)で判定された逆多重ターンシミュレーションの2つのタスクが評価される。
強いLLMベースラインと比較して、R-Debaterは高いシングルターンとマルチターンのスコアを得る。
経験豊富な20人の議論者による人間による評価は、その一貫性とエビデンスの使用をさらに確認し、構造化された計画と組み合わせることで、ターン間のより忠実で、スタンスに整合し、一貫性のある議論が生まれることを示した。
関連論文リスト
- Debating for Better Reasoning: An Unsupervised Multimodal Approach [56.74157117060815]
議論のパラダイムをマルチモーダルな設定に拡張し、より弱いモデルがより強力なモデルの性能を監督し、強化する可能性を探る。
視覚的質問応答 (VQA) に焦点をあて, 2つの「目に見える」専門家の視覚言語モデルが解答について議論する一方, 「盲目」(テキストのみ)の判断は議論の品質にのみ依存する。
この枠組みでは, 専門家は信念に沿う回答のみを守り, 明示的な役割プレーの必要性を排除し, 専門家の不一致の事例に議論を集中させる。
論文 参考訳(メタデータ) (2025-05-20T17:18:17Z) - DebateBench: A Challenging Long Context Reasoning Benchmark For Large Language Models [1.8197265299982013]
DebateBenchを紹介します。このデータセットは、世界で最も権威ある競争上の議論のいくつかから、広範な写本とメタデータのコレクションで構成された、新しいデータセットです。
このデータセットは、様々なトピックに関する高名な討論会から英国議会で議論され、詳細なスピーチレベルスコアと公式の判断データから得られた家格ランキングが注釈付けされている。
我々は32の討論で256のスピーチをキュレートし、各討論は1時間以上、各入力は平均32,000のトークンである。
論文 参考訳(メタデータ) (2025-02-10T09:23:03Z) - Debatrix: Multi-dimensional Debate Judge with Iterative Chronological Analysis Based on LLM [51.43102092480804]
Debatrixは、Large Language Models (LLMs)に基づく自動ディスカッションジャッジである。
実世界の議論シナリオに合わせるため、私たちはPanelBenchベンチマークを導入し、システムの性能と実際の議論結果を比較した。
以上の結果から,LSMを直接使用して議論評価を行ない,顕著な改善が見られた。
論文 参考訳(メタデータ) (2024-03-12T18:19:47Z) - Argue with Me Tersely: Towards Sentence-Level Counter-Argument
Generation [62.069374456021016]
本稿では,文レベル逆問題生成のためのArgTerselyベンチマークを提案する。
また,Arg-LlaMAによる高品質な逆問題生成手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T06:51:34Z) - Persua: A Visual Interactive System to Enhance the Persuasiveness of
Arguments in Online Discussion [52.49981085431061]
説得力のある議論を書く能力を高めることは、オンラインコミュニケーションの有効性と文明性に寄与する。
オンライン議論における議論の説得力向上を支援するツールの設計目標を4つ導き出した。
Persuaは対話型ビジュアルシステムであり、議論の説得力を高めるための説得戦略の例に基づくガイダンスを提供する。
論文 参考訳(メタデータ) (2022-04-16T08:07:53Z) - High Quality Real-Time Structured Debate Generation [0.0]
ハイレベルな構造と文法を図りながら議論を起こすための議論木と経路を定義した。
各議論に関連付けられたメタデータを持つ木構造論争の大規模なコーパスを活用する。
以上の結果から,人間に近い品質で複雑なトピックをリアルタイムに議論する能力を示す。
論文 参考訳(メタデータ) (2020-12-01T01:39:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。