論文の概要: Towards Robust Argumentative Essay Understanding via TIDE: An Interactive Framework with Trial and Debate
- arxiv url: http://arxiv.org/abs/2605.17247v1
- Date: Sun, 17 May 2026 04:10:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.803079
- Title: Towards Robust Argumentative Essay Understanding via TIDE: An Interactive Framework with Trial and Debate
- Title(参考訳): TIDEによるロバスト弁論的Essay理解に向けて: 試行錯誤による対話型フレームワーク
- Authors: Zheqin Yin, Yupei Ren, Yadong Zhang, Yujiang Lu, Man Lan,
- Abstract要約: 議論関連タスクの基準に基づくプロンプト最適化を改善するための新しいフレームワークであるTIDEを提案する。
本手法は,ノイズ学習データの影響を緩和し,基準に基づくプロンプト最適化の鍵となる限界に対処する。
結果は、我々のフレームワークがタスク間のパフォーマンスを改善していることを示している。
- 参考スコア(独自算出の注目度): 10.157878868051414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Argumentative essays serve as a vital medium for assessing critical thinking and reasoning skills, yet there is limited works on accurately understanding and evaluating such texts via prompt. In this work, we propose TIDE, a novel framework designed to improve criteria-based prompt optimization for argument-related tasks by integrating TrIal and DEbate mechanism. Our method addresses key limitations of criteria-based prompt optimizing by mitigating the influence of noisy training data and enhancing optimization stability. We evaluate TIDE on three core tasks: Automated Essay Scoring, Argument Component Detection, and Argument Relation Identification. Results demonstrate that our framework improves performance across tasks. These findings underscore the potential of combining prompt-based methods for advanced argument understanding.
- Abstract(参考訳): 論証的エッセイは批判的思考と推論のスキルを評価する上で重要な媒体となるが、プロンプトを通じてそのような文章を正確に理解し評価する作業は限られている。
本稿では,TrIal と Debate の機構を統合することで,議論関連タスクの基準に基づくプロンプト最適化を改善するための新しいフレームワークである TIDE を提案する。
本手法は,ノイズ学習データの影響を緩和し,最適化安定性を向上することにより,基準に基づくプロンプト最適化の鍵となる限界に対処する。
我々は,TIDEを3つのコアタスク – 自動評価,引数成分検出,引数関係同定 – で評価する。
結果は、我々のフレームワークがタスク間のパフォーマンスを改善していることを示している。
これらの知見は、先進的な議論理解のためのプロンプトベースの手法を組み合わせる可能性を示している。
関連論文リスト
- Beyond Rating: A Comprehensive Evaluation and Benchmark for AI Reviews [69.66583722746904]
私たちは、AIレビュアーを5次元にわたって評価する総合的な評価フレームワークであるBeyond Ratingを紹介します。
本稿では,専門家の不一致に対応するためのMax-Recall戦略を提案する。
提案したテキスト中心の指標は、特に弱みの議論のリコールであり、評価精度と強く相関している。
論文 参考訳(メタデータ) (2026-04-21T14:21:15Z) - Implicit Reasoning in Large Language Models: A Comprehensive Survey [67.53966514728383]
大規模言語モデル(LLM)は、幅広いタスクにまたがる強力な一般化を実証している。
最近の研究は、暗黙の推論に拍車をかけた、明示的な思考の連鎖から注意を向けている。
本調査では,表現形式から計算戦略へ焦点を移し,実行パラダイムを中心とした分類を紹介した。
論文 参考訳(メタデータ) (2025-09-02T14:16:02Z) - Measurement to Meaning: A Validity-Centered Framework for AI Evaluation [12.55408229639344]
我々は、利用可能な証拠から得られる評価的クレームのタイプを推論するための構造化されたアプローチを提供する。
私たちのフレームワークは、機械学習の現代的なパラダイムに適しています。
論文 参考訳(メタデータ) (2025-05-13T20:36:22Z) - Why Reasoning Matters? A Survey of Advancements in Multimodal Reasoning (v1) [66.51642638034822]
推論は人間の知性の中心であり、多様なタスクにまたがる構造化された問題解決を可能にする。
大規模言語モデル(LLM)の最近の進歩は、算術、常識、記号領域における推論能力を大幅に向上させてきた。
本稿では,テキストおよびマルチモーダルLLMにおける推論手法の簡潔かつ洞察に富んだ概要について述べる。
論文 参考訳(メタデータ) (2025-04-04T04:04:56Z) - Q-STRUM Debate: Query-Driven Contrastive Summarization for Recommendation Comparison [20.77853620249543]
Q-STRUM DebateはSTRUM-LLMの新たな拡張であり,クエリに関連する項目の集中的かつコントラスト的な要約を生成するために,議論スタイルのプロンプトを利用する。
3つのデータセットにわたる実験により、Q-STRUM Debateは、キーコントラストの要約基準において、既存の手法よりも大幅に性能が向上することを示した。
論文 参考訳(メタデータ) (2025-02-18T15:01:30Z) - Think Beyond Size: Adaptive Prompting for More Effective Reasoning [0.0]
本稿では,動的かつ反復的なフレームワークであるAdaptive Promptingを紹介する。
その結果、Adaptive Promptingは、算術的推論(GSM8K、MultiArithm)、論理的推論、コモンセンスタスクなど、様々な推論ベンチマークのパフォーマンスを著しく向上させることを示した。
提案手法は,計算効率を維持しつつ,GPT-4などの大規模モデルと競合する性能を実現する。
論文 参考訳(メタデータ) (2024-10-10T17:14:36Z) - Argument Quality Assessment in the Age of Instruction-Following Large Language Models [45.832808321166844]
そのような応用において重要なタスクは、議論の質を評価することである。
我々は,質概念の多様性と認識の主観性を,議論品質評価における実質的な進歩への主要なハードルとみなす。
インストラクション追従型大規模言語モデル(LLM)がコンテキストを越えた知識を活用できることは,より信頼性の高い評価を可能にしている,と我々は主張する。
論文 参考訳(メタデータ) (2024-03-24T10:43:21Z) - A Unifying Framework for Learning Argumentation Semantics [47.84663434179473]
Inductive Logic Programmingアプローチを用いて、抽象的および構造化された議論フレームワークのアクセシビリティセマンティクスを解釈可能な方法で学習する新しいフレームワークを提案する。
提案手法は既存の議論解法よりも優れており,フォーマルな議論や人間と機械の対話の領域において,新たな研究の方向性が開けることになる。
論文 参考訳(メタデータ) (2023-10-18T20:18:05Z) - Rationale-Augmented Ensembles in Language Models [53.45015291520658]
我々は、数発のテキスト内学習のための合理化促進策を再考する。
我々は、出力空間における合理的サンプリングを、性能を確実に向上させるキーコンポーネントとして特定する。
有理拡張アンサンブルは既存のプロンプト手法よりも正確で解釈可能な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-07-02T06:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。