論文の概要: PyTOD: Programmable Task-Oriented Dialogue with Execution Feedback
- arxiv url: http://arxiv.org/abs/2508.15456v1
- Date: Thu, 21 Aug 2025 11:22:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.295685
- Title: PyTOD: Programmable Task-Oriented Dialogue with Execution Feedback
- Title(参考訳): PyTOD:実行フィードバックを備えたプログラム可能なタスク指向対話
- Authors: Alexandru Coca, Bo-Hsiang Tseng, Pete Boothroyd, Jianpeng Cheng, Mark Gaynor, Zhenxing Zhang, Joe Stacey, Tristan Guigue, Héctor Martinez Alonso, Diarmuid Ó Séaghdha, Anders Johannsen,
- Abstract要約: 本稿では,対話状態を追跡するための実行可能なコードを生成するエージェントであるPyTODについて述べる。
実験の結果、PyTODは対話が進むにつれて、精度と堅牢なユーザ目標推定の両方において、強いベースラインを超えていることがわかった。
- 参考スコア(独自算出の注目度): 38.34914202993236
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Programmable task-oriented dialogue (TOD) agents enable language models to follow structured dialogue policies, but their effectiveness hinges on accurate state tracking. We present PyTOD, an agent that generates executable code to track dialogue state and uses policy and execution feedback for efficient error correction. To this end, PyTOD employs a simple constrained decoding approach, using a language model instead of grammar rules to follow API schemata. This leads to state-of-the-art state tracking performance on the challenging SGD benchmark. Our experiments show that PyTOD surpasses strong baselines in both accuracy and robust user goal estimation as the dialogue progresses, demonstrating the effectiveness of execution-aware state tracking.
- Abstract(参考訳): プログラム可能なタスク指向対話(TOD)エージェントは、言語モデルが構造化された対話ポリシーに従うことを可能にするが、その有効性は正確な状態追跡に依存している。
本稿では,対話状態を追跡するための実行可能なコードを生成するエージェントであるPyTODについて述べる。
この目的のために、PyTODは単純な制約付きデコードアプローチを採用し、文法規則の代わりに言語モデルを使用してAPIスキーマに従う。
これにより、挑戦的なSGDベンチマークにおける最先端のトラッキングのパフォーマンスが向上する。
実験の結果,PyTODは対話が進行するにつれて,ユーザ目標推定の精度と頑健さの両面で高いベースラインを超越し,実行時状態追跡の有効性を実証した。
関連論文リスト
- ATOD: An Evaluation Framework and Benchmark for Agentic Task-Oriented Dialogue System [27.78128349257987]
近年のタスク指向対話(TOD)システムの進歩により,対話エージェントは,対話エージェントによる対話目標の協調,長期的コンテキストの維持,非同期実行による積極的な行動が可能になった。
これらの機能は従来のTODシステムを超えて拡張されるが、既存のベンチマークではそのようなエージェント動作を評価するための体系的なサポートが欠如している。
我々は、長期的推論を必要とするリッチな注釈付き会話を生成するベンチマークおよび合成対話生成パイプラインであるATODを紹介する。
我々は,これらの次元を詳細なメトリクスに変換し,再現可能なオフラインおよびオンライン評価をサポートする総合評価フレームワークであるATOD-Evalを提案する。
論文 参考訳(メタデータ) (2026-01-17T00:53:43Z) - Interactive Evaluation of Large Language Models for Multi-Requirement Software Engineering Tasks [15.072898489107887]
55のプログラミングタスクのベンチマークであるDevAIの上に構築し、基礎的真実のソリューションを追加し、インタビュアーヒントの妥当性と有用性を評価する。
本研究は,協調型コード生成エージェントの開発における動的評価の重要性を強調した。
論文 参考訳(メタデータ) (2025-08-26T10:22:37Z) - LangPert: Detecting and Handling Task-level Perturbations for Robust Object Rearrangement [21.236557779562794]
LangPertはTLP(Task-Level Perturbations)の検出と緩和を目的とした言語ベースのフレームワークである。
LangPertはVisual Language Model (VLM)を統合し、ポリシーのスキル実行と環境TLPを包括的に監視する。
実験の結果,LangPertはベースライン法よりも多種多様なTLP状況を効果的に処理できることがわかった。
論文 参考訳(メタデータ) (2025-04-14T05:39:15Z) - QLASS: Boosting Language Agent Inference via Q-Guided Stepwise Search [89.97082652805904]
提案するQLASS(Q-guided Language Agent Stepwise Search)は,Q-valueを推定してアノテーションを自動的に生成する。
ステップワイズガイダンスにより、言語エージェントが長期的価値に適応できるようにQ誘導型生成戦略を提案する。
我々はQLASSが質的分析によってより効果的な意思決定につながることを実証的に実証した。
論文 参考訳(メタデータ) (2025-02-04T18:58:31Z) - Large Language Models as User-Agents for Evaluating Task-Oriented-Dialogue Systems [6.8738526619759535]
タスク指向対話(TOD)モデルを評価するために、オフラインデータセットが使用されている。
コンテキスト対応のユーザエージェントは、人間の会話の多様性と予測不能をシミュレートすることができる。
論文 参考訳(メタデータ) (2024-11-15T06:05:45Z) - ChatSOP: An SOP-Guided MCTS Planning Framework for Controllable LLM Dialogue Agents [52.7201882529976]
対話エージェントの制御性を高めるため,SOP誘導モンテカルロ木探索(MCTS)計画フレームワークを提案する。
これを実現するために、GPT-4oを用いた半自動ロールプレイシステムを用いて、SOPアノテーション付きマルチシナリオ対話からなるデータセットをキュレートする。
また、SOP予測のための教師付き微調整と思考の連鎖推論を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-04T12:23:02Z) - InstructTODS: Large Language Models for End-to-End Task-Oriented
Dialogue Systems [60.53276524369498]
大規模言語モデル(LLM)は自然言語処理(NLP)における多様なタスクに使用されている。
InstructTODSは、ゼロショットのタスク指向対話システムのための新しいフレームワークである。
InstructTODSは、ユーザの意図を動的クエリにシームレスに翻訳するプロキシの信念状態を生成する。
論文 参考訳(メタデータ) (2023-10-13T06:36:26Z) - Leveraging Explicit Procedural Instructions for Data-Efficient Action
Prediction [5.448684866061922]
タスク指向の対話は、しばしばエージェントがユーザ要求を満たすために複雑で多段階の手順を実行する必要がある。
大規模言語モデルは、制約のある環境でこれらの対話を自動化することに成功したが、その広範な展開は、トレーニングに必要なタスク固有の大量のデータによって制限されている。
本稿では,エージェントガイドラインから導出した明示的な指示を利用して対話システムを構築するための,データ効率のよいソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-06T18:42:08Z) - Context-Aware Language Modeling for Goal-Oriented Dialogue Systems [84.65707332816353]
我々は、部分的に観察されたマルコフ決定過程としてゴール指向対話を定式化する。
目的を意識して言語モデルを微調整する,シンプルで効果的な手法を考案する。
本研究では,AirDialogue を用いた実践的なフライト予約タスクについて評価する。
論文 参考訳(メタデータ) (2022-04-18T17:23:11Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。