論文の概要: Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction
- arxiv url: http://arxiv.org/abs/2410.18481v1
- Date: Thu, 24 Oct 2024 07:10:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:51:53.146747
- Title: Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction
- Title(参考訳): Dialog2Flow: 自動ダイアログフロー抽出のためのソフトコントラストアクション駆動文の事前学習
- Authors: Sergio Burdisso, Srikanth Madikeri, Petr Motlicek,
- Abstract要約: 本稿ではダイアログ2Flowの埋め込みについて紹介する。
D2F埋め込みをクラスタ化することで、潜在空間を量子化し、ダイアログを領域/アクションIDのシーケンスに変換することができる。
D2Fは様々な領域において質的および定量的に優れた結果をもたらすことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Efficiently deriving structured workflows from unannotated dialogs remains an underexplored and formidable challenge in computational linguistics. Automating this process could significantly accelerate the manual design of workflows in new domains and enable the grounding of large language models in domain-specific flowcharts, enhancing transparency and controllability. In this paper, we introduce Dialog2Flow (D2F) embeddings, which differ from conventional sentence embeddings by mapping utterances to a latent space where they are grouped according to their communicative and informative functions (i.e., the actions they represent). D2F allows for modeling dialogs as continuous trajectories in a latent space with distinct action-related regions. By clustering D2F embeddings, the latent space is quantized, and dialogs can be converted into sequences of region/action IDs, facilitating the extraction of the underlying workflow. To pre-train D2F, we build a comprehensive dataset by unifying twenty task-oriented dialog datasets with normalized per-turn action annotations. We also introduce a novel soft contrastive loss that leverages the semantic information of these actions to guide the representation learning process, showing superior performance compared to standard supervised contrastive loss. Evaluation against various sentence embeddings, including dialog-specific ones, demonstrates that D2F yields superior qualitative and quantitative results across diverse domains.
- Abstract(参考訳): 構造化ワークフローを非注釈のダイアログから効率的に導き出すことは、計算言語学において未熟で恐ろしい課題である。
このプロセスの自動化は、新しいドメインにおけるワークフローの手動設計を著しく加速し、ドメイン固有のフローチャートにおける大きな言語モデルの基盤化を可能にし、透明性と制御性を高めます。
本稿では,ダイアログ2Flow (D2F) の埋め込みについて述べる。これは従来の文の埋め込みとは違い,発話を伝達的,情報的機能(表現する動作)に応じてグループ化する潜在空間にマッピングする。
D2Fは、異なるアクション関連領域を持つ潜在空間における連続的な軌跡としてダイアログをモデル化することができる。
D2F埋め込みをクラスタ化することで、潜在空間を量子化し、ダイアログをリージョン/アクションIDのシーケンスに変換することで、基盤となるワークフローの抽出が容易になる。
D2Fを事前訓練するために、20のタスク指向のダイアログデータセットと正規化されたターン毎のアクションアノテーションを統合することで、包括的なデータセットを構築する。
また,これらの行動のセマンティック情報を活用して表現学習プロセスの指導を行うソフトコントラッシブ・ロスも導入し,標準的な教師付きコントラスト・ロスよりも優れた性能を示す。
ダイアログ固有のものを含む様々な文の埋め込みに対する評価は、D2Fが様々な領域において質的かつ定量的な結果をもたらすことを示す。
関連論文リスト
- Unsupervised Flow Discovery from Task-oriented Dialogues [0.988655456942026]
本稿では,対話履歴からのフローの教師なし発見のためのアプローチを提案する。
パブリックTODデータセットであるMultiWOZから発見された流れの具体的な例を示す。
論文 参考訳(メタデータ) (2024-05-02T15:54:36Z) - TOD-Flow: Modeling the Structure of Task-Oriented Dialogues [77.15457469745364]
ダイアログを付加した対話データからTOD-Flowグラフを推定する手法を提案する。
推定されたTOD-Flowグラフは、任意の対話モデルと容易に統合することができ、予測性能、透明性、制御性を改善することができる。
論文 参考訳(メタデータ) (2023-12-07T20:06:23Z) - Zero-Shot Generalizable End-to-End Task-Oriented Dialog System using
Context Summarization and Domain Schema [2.7178968279054936]
タスク指向対話システムにおける最先端のアプローチは、条件付きシーケンス生成タスクとして問題を定式化する。
これは、新しいドメインまたはタスクごとにラベル付きトレーニングデータを必要とする。
本稿では,ZS-ToDという,Zero-Shotの汎用的なエンドツーエンドタスク指向ダイアログシステムについて紹介する。
論文 参考訳(メタデータ) (2023-03-28T18:56:31Z) - SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for
Task-Oriented Dialog Understanding [68.94808536012371]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから対話表現を学習する,木構造付き事前学習会話モデルを提案する。
提案手法は,7つのデータセットと4つの一般的な対話理解タスクからなるDialoGLUEベンチマークにおいて,最新の結果が得られる。
論文 参考訳(メタデータ) (2022-09-14T13:42:50Z) - OPAL: Ontology-Aware Pretrained Language Model for End-to-End
Task-Oriented Dialogue [40.62090743056549]
本稿では、エンドツーエンドタスク指向対話(TOD)のためのオントロジー対応事前学習言語モデル(OPAL)を提案する。
チャット型対話モデルとは異なり、タスク指向対話モデルは少なくとも2つのタスク固有モジュールを満たす:対話状態トラッカー(DST)と応答生成器(RG)。
論文 参考訳(メタデータ) (2022-09-10T04:38:27Z) - Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。
エージェントは対話とマニュアルの両方からタスクを学習する。
提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文 参考訳(メタデータ) (2022-08-16T08:21:12Z) - DCR-Net: A Deep Co-Interactive Relation Network for Joint Dialog Act
Recognition and Sentiment Classification [77.59549450705384]
ダイアログシステムでは、ダイアログアクト認識と感情分類は2つの相関タスクである。
既存のシステムのほとんどは、それらを別々のタスクとして扱うか、単に2つのタスクを一緒にモデル化するだけです。
本稿では,2つのタスク間の相互作用をモデル化するディープ・コ・インタラクティブ・リレーショナル・ネットワーク(DCR-Net)を提案する。
論文 参考訳(メタデータ) (2020-08-16T14:13:32Z) - Video-Grounded Dialogues with Pretrained Generation Language Models [88.15419265622748]
我々は、ビデオ地上対話を改善するために、事前学習された言語モデルのパワーを利用する。
本稿では,シーケンス・ツー・グラウンドの対話タスクを,シーケンス・トゥ・グラウンドのタスクとして定式化するフレームワークを提案する。
我々のフレームワークは、微調整の言語モデルで複数のモダリティにまたがる依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2020-06-27T08:24:26Z) - Non-Autoregressive Dialog State Tracking [122.2328875457225]
非自己回帰的対話状態追跡(NADST)の新しい枠組みを提案する。
NADSTはドメインとスロット間の潜在的な依存関係を分解し、分離されたスロットではなく完全なセットとして対話状態の予測を改善するためにモデルを最適化する。
以上の結果から,MultiWOZ 2.1コーパス上の全領域にわたる最先端の接合精度が得られた。
論文 参考訳(メタデータ) (2020-02-19T06:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。