Fugu-MT 論文翻訳(概要): Dual Hierarchical Dialogue Policy Learning for Legal Inquisitive Conversational Agents

論文の概要: Dual Hierarchical Dialogue Policy Learning for Legal Inquisitive Conversational Agents

arxiv url: http://arxiv.org/abs/2605.14057v1
Date: Wed, 13 May 2026 19:29:11 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-15 21:45:34.479077
Title: Dual Hierarchical Dialogue Policy Learning for Legal Inquisitive Conversational Agents
Title（参考訳）: 合法的対話エージェントのための二重階層的対話ポリシー学習
Authors: Xubo Lin, Zezhii Deng, Shihao Wang, Grace Hui Yang, Yang Deng,
Abstract要約: EmphInquisitive Conversational Agents (ICA)を導入し、米国最高裁判所の口頭弁論に特化してICAを開発する。エージェントは、いつ、どのように質問するかを学ぶことで、司法尋問パターンをエミュレートし、その法的目的を達成するために重要な情報を体系的に明らかにする。
参考スコア（独自算出の注目度）: 25.166371792393193
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Most existing dialogue systems are user-driven, primarily designed to fulfill user requests. However, in many critical real-world scenarios, a conversational agent must proactively extract information to achieve its own objectives rather than merely respond. To address this gap, we introduce \emph{Inquisitive Conversational Agents (ICAs)} and develop an ICA specifically tailored to U.S. Supreme Court oral arguments. We propose a Dual Hierarchical Reinforcement Learning framework featuring two cooperating RL agents, each with its own policy, to coordinate strategic dialogue management and fine-grained utterance generation. By learning when and how to ask probing questions, the agent emulates judicial questioning patterns and systematically uncovers crucial information to fulfill its legal objectives. Evaluations on a U.S. Supreme Court dataset show that our method outperforms various baselines across multiple metrics. It represents an important first step toward broader high-stakes, domain-specific applications.
Abstract（参考訳）: 既存の対話システムはユーザ主導であり、主にユーザ要求を満たすように設計されている。しかし、多くの重要な現実のシナリオでは、会話エージェントは、単に応答するのではなく、自身の目的を達成するために積極的に情報を抽出しなければならない。このギャップに対処するため、米国最高裁判所の口頭弁論に特化して、ICA(emph{Inquisitive Conversational Agents)を導入し、ICAを開発する。本稿では、2つの協調的RLエージェントをそれぞれ独自のポリシーで構成し、戦略的対話管理ときめ細かい発話生成を協調するDual Hierarchical Reinforcement Learningフレームワークを提案する。エージェントは、いつ、どのように質問するかを学ぶことで、司法尋問パターンをエミュレートし、その法的目的を達成するために重要な情報を体系的に明らかにする。米国最高裁判所のデータセットによる評価は、我々の手法が複数の指標で様々なベースラインを上回っていることを示している。これは、より広範囲でドメイン固有のアプリケーションに向けた重要な第一歩である。

関連論文リスト

MAC: A Multi-Agent Framework for Interactive User Clarification in Multi-turn Conversations [46.70182219204539]
本稿では,ユーザのあいまいさを解決するための対話型マルチエージェントフレームワークを提案する。 MultiWOZ 2.4の実証的な評価は、両レベルでの明確化がタスク成功率7.8%(54.5～62.3)を増加させ、必要なユーザ情報を事前に抽出し、繰り返しを最小化することで、対話のターン数(6.53～4.86)を減少させることを示した。
論文参考訳（メタデータ） (2025-12-15T10:02:50Z)
Adaptive Multi-Agent Response Refinement in Conversational Systems [33.2240994465021]
大規模言語モデル (LLM) は人間のような応答を生成することで会話システムにおいて顕著な成功を収めた。特にパーソナライズや特定の知識を考慮に入れる必要がある場合、それらは不足する可能性がある。本稿では,各エージェントが各アスペクトに対して特定の役割を割り当てられるマルチエージェントフレームワークによる応答の精細化を提案する。
論文参考訳（メタデータ） (2025-11-11T14:48:34Z)
A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions [51.96890647837277]
大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
論文参考訳（メタデータ） (2025-04-07T21:01:25Z)
Who Speaks Next? Multi-party AI Discussion Leveraging the Systematics of Turn-taking in Murder Mystery Games [7.946510318969307]
本研究では,会話分析における隣接対やターンテイクといった会話規範に着目した。本稿では,AIエージェントの対話制御にこれらの規範を適用した"Murder Mystery Agents"という新しいフレームワークを提案する。提案フレームワークは、隣接ペアと自己選択機構に基づいて、次の話者選択を統合する。
論文参考訳（メタデータ） (2024-12-06T10:45:54Z)
Dialogue Agents 101: A Beginner's Guide to Critical Ingredients for Designing Effective Conversational Systems [29.394466123216258]
本研究は,対話エージェントの主要な特徴,対応するオープンドメインデータセット,およびこれらのデータセットをベンチマークする手法について概説する。我々は,既存のデータセットの会話から構築された統一dIalogue dataseTであるUNITを提案する。
論文参考訳（メタデータ） (2023-07-14T10:05:47Z)
FCC: Fusing Conversation History and Candidate Provenance for Contextual Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文参考訳（メタデータ） (2023-03-31T23:58:28Z)
Topic-Oriented Spoken Dialogue Summarization for Customer Service with Saliency-Aware Topic Modeling [61.67321200994117]
顧客サービスシステムでは、長い音声対話のための要約を作成することにより、対話要約はサービス効率を高めることができる。本研究では,高度に抽象的な要約を生成するトピック指向の対話要約に注目した。 SATM(Saliency-Awareural topic Model)と併用し,顧客サービス対話のトピック指向要約を目的とした,新しいトピック拡張型2段階対話要約器(TDS)を提案する。
論文参考訳（メタデータ） (2020-12-14T07:50:25Z)
Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文参考訳（メタデータ） (2020-08-21T22:43:27Z)
Multi-Stage Conversational Passage Retrieval: An Approach to Fusing Term Importance Estimation and Neural Query Rewriting [56.268862325167575]
マルチステージアドホックIRシステムにクエリ再構成を組み込んだ会話経路検索(ConvPR)に取り組む。本稿では,1項の重要度推定と2項のニューラルクエリ書き換えという2つの手法を提案する。前者に対しては、周波数に基づく信号を用いて会話コンテキストから抽出した重要な用語を用いて会話クエリを拡張する。後者では,会話クエリを,事前訓練されたシーケンス列列列モデルを用いて,自然な,スタンドアロンの,人間の理解可能なクエリに再構成する。
論文参考訳（メタデータ） (2020-05-05T14:30:20Z)
UniConv: A Unified Conversational Neural Architecture for Multi-domain Task-oriented Dialogues [101.96097419995556]
ユニコンブ」はタスク指向対話におけるエンドツーエンド対話システムのための新しい統合型ニューラルネットワークである。我々は、MultiWOZ2.1ベンチマークにおいて、対話状態追跡、コンテキスト・ツー・テキスト、エンドツーエンド設定の包括的な実験を行う。
論文参考訳（メタデータ） (2020-04-29T16:28:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。