Fugu-MT 論文翻訳(概要): Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction

論文の概要: Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction

arxiv url: http://arxiv.org/abs/2410.18481v1
Date: Thu, 24 Oct 2024 07:10:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:39.792681
Title: Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction
Title（参考訳）: Dialog2Flow: 自動ダイアログフロー抽出のためのソフトコントラストアクション駆動文の事前学習
Authors: Sergio Burdisso, Srikanth Madikeri, Petr Motlicek,
Abstract要約: 本稿ではダイアログ2Flowの埋め込みについて紹介する。 D2F埋め込みをクラスタ化することで、潜在空間を量子化し、ダイアログを領域/アクションIDのシーケンスに変換することができる。 D2Fは様々な領域において質的および定量的に優れた結果をもたらすことを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Efficiently deriving structured workflows from unannotated dialogs remains an underexplored and formidable challenge in computational linguistics. Automating this process could significantly accelerate the manual design of workflows in new domains and enable the grounding of large language models in domain-specific flowcharts, enhancing transparency and controllability. In this paper, we introduce Dialog2Flow (D2F) embeddings, which differ from conventional sentence embeddings by mapping utterances to a latent space where they are grouped according to their communicative and informative functions (i.e., the actions they represent). D2F allows for modeling dialogs as continuous trajectories in a latent space with distinct action-related regions. By clustering D2F embeddings, the latent space is quantized, and dialogs can be converted into sequences of region/action IDs, facilitating the extraction of the underlying workflow. To pre-train D2F, we build a comprehensive dataset by unifying twenty task-oriented dialog datasets with normalized per-turn action annotations. We also introduce a novel soft contrastive loss that leverages the semantic information of these actions to guide the representation learning process, showing superior performance compared to standard supervised contrastive loss. Evaluation against various sentence embeddings, including dialog-specific ones, demonstrates that D2F yields superior qualitative and quantitative results across diverse domains.
Abstract（参考訳）: 構造化ワークフローを非注釈のダイアログから効率的に導き出すことは、計算言語学において未熟で恐ろしい課題である。このプロセスの自動化は、新しいドメインにおけるワークフローの手動設計を著しく加速し、ドメイン固有のフローチャートにおける大きな言語モデルの基盤化を可能にし、透明性と制御性を高めます。本稿では,ダイアログ2Flow (D2F) の埋め込みについて述べる。これは従来の文の埋め込みとは違い,発話を伝達的,情報的機能(表現する動作)に応じてグループ化する潜在空間にマッピングする。 D2Fは、異なるアクション関連領域を持つ潜在空間における連続的な軌跡としてダイアログをモデル化することができる。 D2F埋め込みをクラスタ化することで、潜在空間を量子化し、ダイアログをリージョン/アクションIDのシーケンスに変換することで、基盤となるワークフローの抽出が容易になる。 D2Fを事前訓練するために、20のタスク指向のダイアログデータセットと正規化されたターン毎のアクションアノテーションを統合することで、包括的なデータセットを構築する。また,これらの行動のセマンティック情報を活用して表現学習プロセスの指導を行うソフトコントラッシブ・ロスも導入し,標準的な教師付きコントラスト・ロスよりも優れた性能を示す。ダイアログ固有のものを含む様々な文の埋め込みに対する評価は、D2Fが様々な領域において質的かつ定量的な結果をもたらすことを示す。

関連論文リスト

On Mitigating Data Sparsity in Conversational Recommender Systems [69.70761335240738]
会話レコメンデータシステム(CRS)は、対話中のテキスト情報を通じてユーザの好みをキャプチャする。対話空間は広大で言語的に多様であり、アイテム空間は長い尾とスパース分布を示す。既存の手法では,(1)リッチテキストの活用による多様な対話表現の一般化,(2)重度の疎度下での情報表現の学習に苦慮している。
論文参考訳（メタデータ） (2025-07-01T06:54:51Z)
Semantic-Space-Intervened Diffusive Alignment for Visual Classification [11.621655970763467]
クロスモーダルアライメントは視覚的分類を改善する効果的なアプローチである。本稿では,セマンティック空間間微分アライメント法(SeDA)を提案する。実験結果から,SeDAはクロスモーダルな特徴アライメントを実現し,既存手法よりも優れた性能を示した。
論文参考訳（メタデータ） (2025-05-09T01:41:23Z)
EgoSplat: Open-Vocabulary Egocentric Scene Understanding with Language Embedded 3D Gaussian Splatting [108.15136508964011]
EgoSplatは、オープン・ボキャブラリ・エゴセントリック・シーン理解のための3Dガウス・スプレイティング・フレームワークである。 EgoSplatは2つのデータセット上のローカライゼーションタスクとセグメンテーションタスクの両方において、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-03-14T12:21:26Z)
Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild [3.3905929183808796]
In-the-the-wild dynamic expression Recognition (DFER)は、感情に関連する表情を認識する上で重要な課題に遭遇する。 IFDD(Implicit Facial Dynamics Disentanglement framework)を提案する。 IFDDは感情に無関係な世界的文脈から感情に関連する動的情報を暗黙的に切り離す。
論文参考訳（メタデータ） (2024-12-17T18:45:53Z)
Towards Automatic Evaluation of Task-Oriented Dialogue Flows [5.146847146797646]
本稿では,対話フローの品質を評価するための新しい指標であるFuDGE(Fuzzy Dialogue-Graph Edit Distance)を紹介する。 FuDGEは、個々の会話がフローとどの程度うまく一致しているかを測定し、その結果、会話の集合がフロー全体によってどれだけうまく表現されるかを測定する。 FuDGEは対話フローの標準化と最適化により、対話設計者と自動化技術により、より高いレベルの効率と自動化を実現する。
論文参考訳（メタデータ） (2024-11-15T18:35:00Z)
Unsupervised Flow Discovery from Task-oriented Dialogues [0.988655456942026]
本稿では,対話履歴からのフローの教師なし発見のためのアプローチを提案する。パブリックTODデータセットであるMultiWOZから発見された流れの具体的な例を示す。
論文参考訳（メタデータ） (2024-05-02T15:54:36Z)
TOD-Flow: Modeling the Structure of Task-Oriented Dialogues [77.15457469745364]
ダイアログを付加した対話データからTOD-Flowグラフを推定する手法を提案する。推定されたTOD-Flowグラフは、任意の対話モデルと容易に統合することができ、予測性能、透明性、制御性を改善することができる。
論文参考訳（メタデータ） (2023-12-07T20:06:23Z)
Zero-Shot Generalizable End-to-End Task-Oriented Dialog System using Context Summarization and Domain Schema [2.7178968279054936]
タスク指向対話システムにおける最先端のアプローチは、条件付きシーケンス生成タスクとして問題を定式化する。これは、新しいドメインまたはタスクごとにラベル付きトレーニングデータを必要とする。本稿では,ZS-ToDという,Zero-Shotの汎用的なエンドツーエンドタスク指向ダイアログシステムについて紹介する。
論文参考訳（メタデータ） (2023-03-28T18:56:31Z)
SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for Task-Oriented Dialog Understanding [68.94808536012371]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから対話表現を学習する,木構造付き事前学習会話モデルを提案する。提案手法は,7つのデータセットと4つの一般的な対話理解タスクからなるDialoGLUEベンチマークにおいて,最新の結果が得られる。
論文参考訳（メタデータ） (2022-09-14T13:42:50Z)
Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。エージェントは対話とマニュアルの両方からタスクを学習する。提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文参考訳（メタデータ） (2022-08-16T08:21:12Z)
DCR-Net: A Deep Co-Interactive Relation Network for Joint Dialog Act Recognition and Sentiment Classification [77.59549450705384]
ダイアログシステムでは、ダイアログアクト認識と感情分類は2つの相関タスクである。既存のシステムのほとんどは、それらを別々のタスクとして扱うか、単に2つのタスクを一緒にモデル化するだけです。本稿では,2つのタスク間の相互作用をモデル化するディープ・コ・インタラクティブ・リレーショナル・ネットワーク(DCR-Net)を提案する。
論文参考訳（メタデータ） (2020-08-16T14:13:32Z)
Video-Grounded Dialogues with Pretrained Generation Language Models [88.15419265622748]
我々は、ビデオ地上対話を改善するために、事前学習された言語モデルのパワーを利用する。本稿では,シーケンス・ツー・グラウンドの対話タスクを,シーケンス・トゥ・グラウンドのタスクとして定式化するフレームワークを提案する。我々のフレームワークは、微調整の言語モデルで複数のモダリティにまたがる依存関係をキャプチャできる。
論文参考訳（メタデータ） (2020-06-27T08:24:26Z)
Non-Autoregressive Dialog State Tracking [122.2328875457225]
非自己回帰的対話状態追跡(NADST)の新しい枠組みを提案する。 NADSTはドメインとスロット間の潜在的な依存関係を分解し、分離されたスロットではなく完全なセットとして対話状態の予測を改善するためにモデルを最適化する。以上の結果から,MultiWOZ 2.1コーパス上の全領域にわたる最先端の接合精度が得られた。
論文参考訳（メタデータ） (2020-02-19T06:39:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。