Fugu-MT 論文翻訳(概要): Evaluating LLM-Driven Summarisation of Parliamentary Debates with Computational Argumentation

論文の概要: Evaluating LLM-Driven Summarisation of Parliamentary Debates with Computational Argumentation

arxiv url: http://arxiv.org/abs/2604.19331v1
Date: Tue, 21 Apr 2026 11:01:53 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-22 22:41:49.729827
Title: Evaluating LLM-Driven Summarisation of Parliamentary Debates with Computational Argumentation
Title（参考訳）: 計算方程式を用いた議会討論会のLLM-Driven Summarizationの評価
Authors: Eoghan Cunningham, Derek Greene, James Cross, Antonio Rago,
Abstract要約: 大規模言語モデル(LLM)は、大規模な自動要約を可能にする。既存の自動要約メトリクスは、一貫性の人間の判断と相関が低いことが示されている。本稿では,議論の場として提案された議題の議論構造を根拠として,議会討論要約を評価するための公式な枠組みを提案する。
参考スコア（独自算出の注目度）: 12.06334493909551
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Understanding how policy is debated and justified in parliament is a fundamental aspect of the democratic process. However, the volume and complexity of such debates mean that outside audiences struggle to engage. Meanwhile, Large Language Models (LLMs) have been shown to enable automated summarisation at scale. While summaries of debates can make parliamentary procedures more accessible, evaluating whether these summaries faithfully communicate argumentative content remains challenging. Existing automated summarisation metrics have been shown to correlate poorly with human judgements of consistency (i.e., faithfulness or alignment between summary and source). In this work, we propose a formal framework for evaluating parliamentary debate summaries that grounds argument structures in the contested proposals up for debate. Our novel approach, driven by computational argumentation, focuses the evaluation on formal properties concerning the faithful preservation of the reasoning presented to justify or oppose policy outcomes. We demonstrate our methods using a case-study of debates from the European Parliament and associated LLM-driven summaries.
Abstract（参考訳）: 議会で政策がどのように議論され、正当化されるかを理解することは、民主的プロセスの基本的な側面である。しかし、こうした議論の量と複雑さは、外部の観客が参加するのに苦労していることを意味している。一方、Large Language Models (LLMs) は、大規模な自動要約を可能にする。議論の要約は議会の手続きをよりアクセスしやすくするが、これらの要約が議論的な内容に忠実に伝達するかどうかを評価できる。既存の自動要約メトリクスは、人間の一貫性の判断(すなわち、要約とソース間の忠実さまたは整合性)と相関が低いことが示されている。本研究は,議論の場として提案された提案の議論構造を根拠として,議会討論要約を評価するための公式な枠組みを提案する。我々の新しいアプローチは、計算的議論によって推進され、政策成果を正当化または反対するために提示された推論の忠実な保存に関する形式的特性の評価に焦点を当てる。欧州議会とそれに関連するLCMによる要約のケーススタディを用いて,本手法を実証する。

関連論文リスト

LLM-based Argument Mining meets Argumentation and Description Logics: a Unified Framework for Reasoning about Debates [18.314315278861073]
大規模言語モデル(LLM)は、テキストの分析と生成において高いパフォーマンスを達成する。彼らは、議論を含むような複雑なテキストに対する明確で透明で検証可能な推論に苦慮している。本稿では,学習に基づく議論マイニングと定量的推論を組み合わせたフレームワークを提案する。
論文参考訳（メタデータ） (2026-03-03T11:06:23Z)
R-Debater: Retrieval-Augmented Debate Generation through Argumentative Memory [18.007379464461312]
本稿では,議論的メモリ上に構築されたマルチターン討論を生成するエージェントフレームワークであるR-Debaterを提案する。 R-Debaterは、ケースライクな証拠を検索するための議論知識ベースと、前回の議論は、旋回するコヒーレントな発話を構成するロールベースのエージェントと統合する。
論文参考訳（メタデータ） (2025-12-31T07:33:12Z)
ARQUSUMM: Argument-aware Quantitative Summarization of Online Conversations [11.33923212079359]
本稿では,議論における議論のクレーム・レアソン構造を明らかにするために,議論を定量的に要約する新しい課題を提案する。定量的要約のために、ARQUSUMMは引数を集約し、それらのサポートを定量化するために、引数構造を意識したクラスタリングアルゴリズムを使用している。
論文参考訳（メタデータ） (2025-11-21T06:37:32Z)
Implicit Reasoning in Large Language Models: A Comprehensive Survey [67.53966514728383]
大規模言語モデル(LLM)は、幅広いタスクにまたがる強力な一般化を実証している。最近の研究は、暗黙の推論に拍車をかけた、明示的な思考の連鎖から注意を向けている。本調査では,表現形式から計算戦略へ焦点を移し,実行パラダイムを中心とした分類を紹介した。
論文参考訳（メタデータ） (2025-09-02T14:16:02Z)
Identifying Algorithmic and Domain-Specific Bias in Parliamentary Debate Summarisation [13.982513887272683]
本稿では,欧州議会の議論を要約するために,大規模言語モデル(LLM)の利用について検討する。本稿では,テキストのコヒーレンスと内容の忠実度を向上する構造化多段階要約フレームワークを提案する。定位バイアスと党派バイアスが一貫した証拠が見つかり、一部の話者は体系的にあまり表現されていないか、あるいは誤分布している。
論文参考訳（メタデータ） (2025-07-16T11:49:33Z)
Few-shot Policy (de)composition in Conversational Question Answering [54.259440408606515]
本稿では,大規模言語モデル(LLM)を用いて数ショット設定でポリシーコンプライアンスを検出するニューラルシンボリックフレームワークを提案する。提案手法は,回答すべきサブクエストを抽出し,文脈情報から真理値を割り当て,与えられたポリシーから論理文の集合を明示的に生成することで,政策コンプライアンスに関する会話に対して健全な理由を示す。本手法は,PCDおよび会話機械読解ベンチマークであるShARCに適用し,タスク固有の微調整を伴わずに競合性能を示す。
論文参考訳（メタデータ） (2025-01-20T08:40:15Z)
Exploring the Jungle of Bias: Political Bias Attribution in Language Models via Dependency Analysis [86.49858739347412]
大規模言語モデル(LLM)は、これらのモデルにおけるバイアスの頻度とその緩和に関する激しい議論を引き起こしている。本稿では,意思決定プロセスに寄与する属性の抽出と仲介を行うためのプロンプトベースの手法を提案する。観察された異なる治療は、少なくとも部分的には、属性の相違とモデルの相違によるものであることが判明した。
論文参考訳（メタデータ） (2023-11-15T00:02:25Z)
A Unifying Framework for Learning Argumentation Semantics [47.84663434179473]
Inductive Logic Programmingアプローチを用いて、抽象的および構造化された議論フレームワークのアクセシビリティセマンティクスを解釈可能な方法で学習する新しいフレームワークを提案する。提案手法は既存の議論解法よりも優れており,フォーマルな議論や人間と機械の対話の領域において,新たな研究の方向性が開けることになる。
論文参考訳（メタデータ） (2023-10-18T20:18:05Z)
DEBACER: a method for slicing moderated debates [55.705662163385966]
同じ主題を持つブロックに議論を分割することは理解に不可欠である。議論を適度に分割する新しいアルゴリズムDEBACERを提案する。
論文参考訳（メタデータ） (2021-12-10T10:39:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。