論文の概要: METRO: Towards Strategy Induction from Expert Dialogue Transcripts for Non-collaborative Dialogues
- arxiv url: http://arxiv.org/abs/2604.11427v2
- Date: Tue, 14 Apr 2026 14:01:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 14:01:13.441655
- Title: METRO: Towards Strategy Induction from Expert Dialogue Transcripts for Non-collaborative Dialogues
- Title(参考訳): METRO:非協調対話のための専門家対話文からの戦略誘導に向けて
- Authors: Haofu Yang, Jiaji Liu, Chen Huang, Faguo Wu, Wenqiang Lei, See-Kiong Ng,
- Abstract要約: METROは、専門家の知識を、短期的応答(ノード)と長期的戦略的フォレスト(ブランチ)の両方を捉える階層構造であるストラテジーフォレスト(Strategy Forest)にフォーマル化する
実験の結果,METROは有望な性能を示し,従来の手法を9%~10%上回った。
- 参考スコア(独自算出の注目度): 60.35930981785646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing non-collaborative dialogue agents traditionally requires the manual, unscalable codification of expert strategies. We propose \ours, a method that leverages large language models to autonomously induce both strategy actions and planning logic directly from raw transcripts. METRO formalizes expert knowledge into a Strategy Forest, a hierarchical structure that captures both short-term responses (nodes) and long-term strategic foresight (branches). Experimental results across two benchmarks show that METRO demonstrates promising performance, outperforming existing methods by an average of 9%-10%. Our further analysis not only reveals the success behind METRO (strategic behavioral diversity and foresight), but also demonstrates its robust cross-task transferability. This offers new insights into building non-collaborative agents in a cost-effective and scalable way. Our code is available at https://github.com/Humphrey-0125/METRO.
- Abstract(参考訳): 非協力的な対話エージェントを開発するには、伝統的に、手動で計算不能な専門家戦略の体系化が必要である。
そこで我々は,大規模言語モデルを利用して,戦略行動と計画論理の両方を生の転写文から直接自律的に誘導する手法である \ours を提案する。
METROは、専門知識を戦略フォレスト(Strategy Forest)に形式化し、短期的応答(ノード)と長期的戦略的フォレスト(ブランチ)の両方をキャプチャする階層構造である。
2つのベンチマーク実験の結果、METROは期待できる性能を示し、既存の手法を平均9%-10%上回る結果となった。
我々のさらなる分析は、METRO (Strategic behavioral diversity and foresight) の成功だけでなく、その堅牢なクロスタスク転送性も示している。
これは、コスト効率とスケーラブルな方法で非協力的なエージェントを構築するための、新たな洞察を提供する。
私たちのコードはhttps://github.com/Humphrey-0125/METROで公開されています。
関連論文リスト
- MAGE: Meta-Reinforcement Learning for Language Agents toward Strategic Exploration and Exploitation [11.222602737031101]
本稿では,LLMエージェントを戦略的探索と活用に活用するメタRLフレームワークであるMAGEを提案する。
MAGEは、インタラクション履歴とリフレクションをコンテキストウィンドウに統合するマルチエピソードトレーニングシステムを利用している。
実験結果から,MAGEは探索作業と搾取作業の両方において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2026-03-04T03:14:37Z) - MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.37068897861388]
MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。
マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。
6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-03T09:47:49Z) - Beyond Fast and Slow: Cognitive-Inspired Elastic Reasoning for Large Language Models [39.03483371038282]
CogERは、人間の階層的推論にインスパイアされたフレームワークである。
外部ツールを必要とするクエリに対して、Cognitive Tool-Assisted Reasoningを導入する。
CogERは最先端のTest-Timeスケーリングメソッドより優れています。
論文 参考訳(メタデータ) (2025-12-17T05:11:58Z) - AI-Salesman: Towards Reliable Large Language Model Driven Telemarketing [79.0112532518727]
我々はTeleSalesCorpusをリリースした。
次に、デュアルステージアーキテクチャを特徴とする新しいフレームワークであるAI-Salesmanを提案する。
提案したAI-Salesmanは,自動測定と総合的な人的評価の両方において,ベースラインモデルを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2025-11-15T09:44:42Z) - COMPASS: Enhancing Agent Long-Horizon Reasoning with Evolving Context [17.575806280348797]
小さなエラーはステップにまたがって複雑で、最先端のモデルでさえしばしばコヒーレンスを幻覚または失う。
本稿では,戦術的実行,戦略的監視,文脈的組織を3つの特殊コンポーネントに分離する軽量階層型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-09T20:14:26Z) - Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [54.67512489842682]
大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。
LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文 参考訳(メタデータ) (2025-05-23T08:23:36Z) - A Comparative Analysis of Task-Agnostic Distillation Methods for
Compressing Transformer Language Models [5.818750175599656]
トランスフォーマー言語モデルのタスクに依存しない(汎用的な)蒸留法を再現し,比較し,解析する。
我々の研究対象は、出力分布(OD)転送、様々なレイヤマッピング戦略による隠れ状態(HS)転送、MiniLMv2に基づくマルチヘッドアテンション(MHA)転送である。
論文 参考訳(メタデータ) (2023-10-13T01:00:15Z) - Smoothing Dialogue States for Open Conversational Machine Reading [70.83783364292438]
本稿では,2つの対話状態を1つのデコーダとブリッジ決定と質問生成でスムーズにすることで,効果的なゲーティング戦略を提案する。
OR-ShARCデータセットを用いた実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2021-08-28T08:04:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。