論文の概要: CoDial: Interpretable Task-Oriented Dialogue Systems Through Dialogue Flow Alignment
- arxiv url: http://arxiv.org/abs/2506.02264v2
- Date: Tue, 21 Oct 2025 01:44:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:07.422883
- Title: CoDial: Interpretable Task-Oriented Dialogue Systems Through Dialogue Flow Alignment
- Title(参考訳): CoDial:対話フローアライメントによるタスク指向対話システム
- Authors: Radin Shayanfar, Chu Fei Luo, Rohan Bhambhoria, Samuel Dahan, Xiaodan Zhu,
- Abstract要約: 本稿では,TODタスクスキーマをNVIDIAのColangなどのプログラム的なガードレールコードに変換する新しいフレームワークであるCoDialを紹介する。
CoDialは広く使用されているSTARデータセット上での最先端(SOTA)パフォーマンスを実現し、MultiWOZデータセットでのSOTAと同等である。
- 参考スコア(独自算出の注目度): 14.098358830189959
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building Task-Oriented Dialogue (TOD) systems that generalize across different tasks remains a challenging problem. Data-driven approaches often struggle to transfer effectively to unseen tasks. While recent schema-based TOD frameworks improve generalization by decoupling task logic from language understanding, their reliance on neural or generative models often obscures how task schemas influence behaviour and hence impair interpretability. In this work, we introduce a novel framework, CoDial (Code for Dialogue), which converts a TOD task schema, represented as a novel structured heterogeneous graph, to programmatic LLM guardrailing code, such as NVIDIA's Colang, enabling interpretable and efficient alignment of dialogue policies during inference. We introduce two paradigms, $\text{CoDial}_{\text{free}}$ and $\text{CoDial}_{\text{structured}}$ for generating LLM guardrails, and propose a feedback mechanism that integrates human feedback to iteratively improve the generated code. Empirically, CoDial achieves state-of-the-art (SOTA) performance on the widely used STAR dataset and is on par with SOTA on the MultiWOZ dataset, while also providing interpretability. We additionally demonstrate CoDial's iterative improvement via manual and LLM-aided feedback, making it a practical tool for expert-guided alignment of LLMs in high-stakes domains.
- Abstract(参考訳): 異なるタスクにまたがって一般化するタスク指向対話(TOD)システムの構築は、依然として難しい問題である。
データ駆動アプローチは、しばしば目に見えないタスクに効果的に転送するのに苦労する。
最近のスキーマベースのTODフレームワークは、タスクロジックを言語理解から切り離すことで一般化を改善するが、ニューラルネットワークや生成モデルへの依存は、タスクスキーマが振る舞いにどのように影響するかを曖昧にし、結果として解釈可能性に障害を与えることが多い。
本研究では,TODタスクスキーマを新しい構造化ヘテロジニアスグラフとして表現した新しいフレームワークであるCoDial(Code for Dialogue)をNVIDIAのColangなどのプログラム的LLMガードレールコードに変換することにより,推論中の対話ポリシーの解釈と効率的なアライメントを可能にする。
LLMガードレールを生成するために、$\text{CoDial}_{\text{free}}$と$\text{CoDial}_{\text{structured}}$という2つのパラダイムを導入し、人間のフィードバックを統合して生成されたコードを反復的に改善するフィードバックメカニズムを提案する。
実証的には、CoDialは広く使用されているSTARデータセット上での最先端(SOTA)のパフォーマンスを達成し、MultiWOZデータセットでのSOTAと同等であり、解釈性も提供する。
さらに,手動およびLLM支援フィードバックによるCoDialの反復的改善を実演し,LLMの高度領域における専門家によるアライメントを実現するための実用的なツールとなった。
関連論文リスト
- ProKG-Dial: Progressive Multi-Turn Dialogue Construction with Domain Knowledge Graphs [3.9190413787169414]
現在の大規模言語モデル(LLM)は一般的なNLPタスクでは優れているが、プロの設定ではドメイン固有の精度を欠いていることが多い。
ドメイン固有知識グラフ(KG)を用いた知識集中型多元対話構築フレームワークであるProKG Dialを紹介する。
医療知識グラフ上のProKGダイアルを多様性,セマンティック・コヒーレンス,エンティティ・カバレッジの観点から評価し,評価する。
論文 参考訳(メタデータ) (2025-08-03T17:52:42Z) - Knowledge Protocol Engineering: A New Paradigm for AI in Domain-Specific Knowledge Work [0.456877715768796]
知識プロトコルエンジニアリング(KPE)は、人間の専門家の知識を機械で実行可能な知識プロトコルに体系的に翻訳することに焦点を当てた新しいパラダイムである。
我々は、よく設計された知識プロトコルにより、ジェネラリストのLLMがスペシャリストとして機能し、抽象的なクエリを分解し、複雑なマルチステップタスクを実行することができると論じる。
論文 参考訳(メタデータ) (2025-07-03T16:21:14Z) - Keep the General, Inject the Specific: Structured Dialogue Fine-Tuning for Knowledge Injection without Catastrophic Forgetting [24.67373225584835]
大規模ビジョン言語モデルは、広範囲なマルチモーダル事前学習を通じて、印象的な多機能性を実証している。
ドメイン固有の知識を注入する直接的な適応アプローチは、基礎的な視覚言語能力の破滅的な忘れをしばしば引き起こす。
本稿では,破滅的忘れを最小化しつつ,ドメイン固有の知識を効果的に注入する効果的な手法である構造化対話ファインタニング(SDFT)を紹介する。
論文 参考訳(メタデータ) (2025-04-27T18:04:02Z) - Conversation Routines: A Prompt Engineering Framework for Task-Oriented Dialog Systems [0.21756081703275998]
本研究では,Large Language Models (LLMs) を用いたタスク指向対話システムの開発のための,構造化されたプロンプトエンジニアリングフレームワークである Conversation Routines (CR) を紹介する。
提案したCRフレームワークは,自然言語仕様による会話エージェントシステム(CAS)の開発を可能にする。
このフレームワークの有効性を,Train Booking SystemとInteractive Ticket Copilotという2つの概念実証実装を通じて実証する。
論文 参考訳(メタデータ) (2025-01-20T17:19:02Z) - Towards More Unified In-context Visual Understanding [74.55332581979292]
マルチモーダル出力を有効にした視覚理解のための新しいICLフレームワークを提案する。
まず、テキストと視覚的プロンプトの両方を量子化し、統一された表現空間に埋め込む。
次にデコーダのみのスパーストランスアーキテクチャを用いて生成モデリングを行う。
論文 参考訳(メタデータ) (2023-12-05T06:02:21Z) - Using Textual Interface to Align External Knowledge for End-to-End
Task-Oriented Dialogue Systems [53.38517204698343]
本稿では,外部知識の整合化と冗長なプロセスの排除にテキストインタフェースを用いた新しいパラダイムを提案する。
我々は、MultiWOZ-Remakeを用いて、MultiWOZデータベース用に構築されたインタラクティブテキストインタフェースを含む、我々のパラダイムを実演する。
論文 参考訳(メタデータ) (2023-05-23T05:48:21Z) - Knowledge-grounded Dialog State Tracking [12.585986197627477]
我々は,外部に符号化された知識に基づいて,対話状態の追跡を行う。
ダイアログのコンテキストに基づいて,様々な形態の関連知識を問い合わせる。
提案手法の強塩基性よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-13T01:34:08Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Dialogue Meaning Representation for Task-Oriented Dialogue Systems [51.91615150842267]
タスク指向対話のための柔軟かつ容易に拡張可能な表現である対話意味表現(DMR)を提案する。
我々の表現は、合成意味論とタスク固有の概念のためのリッチな意味論を表現するために、継承階層を持つノードとエッジのセットを含んでいる。
異なる機械学習ベースの対話モデルを評価するための2つの評価タスクを提案し、さらにグラフベースのコア参照解決タスクのための新しいコア参照解決モデルGNNCorefを提案する。
論文 参考訳(メタデータ) (2022-04-23T04:17:55Z) - Continual Learning in Task-Oriented Dialogue Systems [49.35627673523519]
タスク指向対話システムにおける継続的な学習は、システム全体のリトレーニングのコストを伴わずに、時間を通じて新しいドメインや機能を追加できる。
37ドメインのタスク指向対話システムを4つの設定で継続的に学習するための継続的学習ベンチマークを提案する。
論文 参考訳(メタデータ) (2020-12-31T08:44:25Z) - RADDLE: An Evaluation Benchmark and Analysis Platform for Robust
Task-oriented Dialog Systems [75.87418236410296]
我々はraddleベンチマーク、コーパスのコレクション、および様々なドメインのモデルのパフォーマンスを評価するためのツールを紹介します。
RADDLEは強力な一般化能力を持つモデルを好んで奨励するように設計されている。
先行学習と微調整に基づく最近の最先端システムの評価を行い,異種ダイアログコーパスに基づく基礎的な事前学習が,ドメインごとの個別モデルをトレーニングするよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-29T08:58:49Z) - Modelling Hierarchical Structure between Dialogue Policy and Natural
Language Generator with Option Framework for Task-oriented Dialogue System [49.39150449455407]
HDNOは、特定の対話行為表現の設計を避けるために潜在対話行為を設計するためのオプションフレームワークである。
RL,LaRL,HDSAで学習した単語レベルE2Eモデルと比較して,マルチドメイン対話のデータセットであるMultiWoz 2.0とMultiWoz 2.1でHDNOをテストする。
論文 参考訳(メタデータ) (2020-06-11T20:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。