論文の概要: Modeling Complex Dialogue Mappings via Sentence Semantic Segmentation
Guided Conditional Variational Auto-Encoder
- arxiv url: http://arxiv.org/abs/2212.00231v1
- Date: Thu, 1 Dec 2022 02:31:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 14:44:02.250641
- Title: Modeling Complex Dialogue Mappings via Sentence Semantic Segmentation
Guided Conditional Variational Auto-Encoder
- Title(参考訳): 文セマンティックセグメンテーション誘導条件変分自動エンコーダによる複合対話マッピングのモデル化
- Authors: Bin Sun, Shaoxiong Feng, Yiwei Li, Weichao Wang, Fei Mi, Yitong Li,
Kan Li
- Abstract要約: 複合対話マッピング(CDM)は、一対多と多対一のマッピングを含む、不整合や鈍い応答を生成する傾向がある。
本稿では, セマンティックテキストbfSegmentation guided textbfConditional textbfVariational textbfAuto-textbfEncoder(SegCVAE)法を提案する。
- 参考スコア(独自算出の注目度): 23.052838118122835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex dialogue mappings (CDM), including one-to-many and many-to-one
mappings, tend to make dialogue models generate incoherent or dull responses,
and modeling these mappings remains a huge challenge for neural dialogue
systems. To alleviate these problems, methods like introducing external
information, reconstructing the optimization function, and manipulating data
samples are proposed, while they primarily focus on avoiding training with CDM,
inevitably weakening the model's ability of understanding CDM in human
conversations and limiting further improvements in model performance. This
paper proposes a Sentence Semantic \textbf{Seg}mentation guided
\textbf{C}onditional \textbf{V}ariational \textbf{A}uto-\textbf{E}ncoder
(SegCVAE) method which can model and take advantages of the CDM data.
Specifically, to tackle the incoherent problem caused by one-to-many, SegCVAE
uses response-related prominent semantics to constrained the latent variable.
To mitigate the non-diverse problem brought by many-to-one, SegCVAE segments
multiple prominent semantics to enrich the latent variables. Three novel
components, Internal Separation, External Guidance, and Semantic Norms, are
proposed to achieve SegCVAE. On dialogue generation tasks, both the automatic
and human evaluation results show that SegCVAE achieves new state-of-the-art
performance.
- Abstract(参考訳): 複合対話マッピング(CDM)は、一対多、多対一のマッピングを含む、対話モデルを不整合あるいは鈍い応答を生成する傾向があり、これらのマッピングをモデル化することは、ニューラル対話システムにとって大きな課題である。
これらの問題を緩和するため、外部情報の導入、最適化関数の再構築、データサンプルの操作といった手法が提案され、主にCDMによるトレーニングの回避、人間の会話におけるCDM理解能力の低下、モデル性能の向上の抑制に焦点が当てられている。
本稿では、CDMデータのモデル化と活用が可能なSegCVAE法について、Sentence Semantic \textbf{Seg}mentation guided \textbf{C}onditional \textbf{V}ariational \textbf{A}uto-\textbf{E}ncoderを提案する。
具体的には、一対多で生じる不整合問題に対処するために、SegCVAEは応答に関連した顕著なセマンティクスを使用して潜伏変数を制約する。
多対一で引き起こされる非diverse問題を軽減するため、segcvaeセグメントは潜伏変数を豊かにするために複数の顕著な意味を持つ。
SegCVAEを実現するために, 内部分離, 外部誘導, セマンティックノルムの3つの新規成分が提案されている。
対話生成タスクにおいて、SegCVAEは、自動評価結果と人的評価結果の両方で、新しい最先端のパフォーマンスを達成することを示す。
関連論文リスト
- A Plug-and-Play Method for Rare Human-Object Interactions Detection by Bridging Domain Gap [50.079224604394]
textbfContext-textbfEnhanced textbfFeature textbfAment (CEFA) と呼ばれる新しいモデルに依存しないフレームワークを提案する。
CEFAは機能アライメントモジュールとコンテキスト拡張モジュールで構成される。
本手法は, 稀なカテゴリにおけるHOIモデルの検出性能を向上させるために, プラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T08:42:48Z) - Coherent Entity Disambiguation via Modeling Topic and Categorical
Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。
本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。
我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-11-06T16:40:13Z) - 'What are you referring to?' Evaluating the Ability of Multi-Modal
Dialogue Models to Process Clarificational Exchanges [65.03196674816772]
参照表現が宛先に対して意図された参照を一意に識別しない場合、参照の曖昧さが対話で生じる。
出席者は、通常、そのような曖昧さをすぐに検知し、メタコミュニケーション、明確化取引所(CE: Meta-communicative, Clarification Exchanges)を使用して、話者と作業する。
ここでは、CRを生成・応答する能力は、マルチモーダルな視覚的基盤を持つ対話モデルのアーキテクチャと目的関数に特定の制約を課していると論じる。
論文 参考訳(メタデータ) (2023-07-28T13:44:33Z) - Minimally-Supervised Speech Synthesis with Conditional Diffusion Model
and Language Model: A Comparative Study of Semantic Coding [57.42429912884543]
Diff-LM-Speech, Tetra-Diff-Speech, Tri-Diff-Speechを提案する。
また,変分オートエンコーダと韻律ボトルネックに基づくプロンプトエンコーダ構造を導入し,プロンプト表現能力の向上を図る。
実験の結果,提案手法はベースライン法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-28T11:20:23Z) - Evaluating Open-Domain Dialogues in Latent Space with Next Sentence
Prediction and Mutual Information [18.859159491548006]
オープンドメイン対話のための新しい学習ベース自動評価指標(CMN)を提案する。
条件付き変分オートエンコーダ(CVAE)をNext Sentence Prediction(NSP)の対象とし,相互情報(MI)を用いて潜在空間におけるテキストの意味的類似性をモデル化する。
2つのオープンドメイン対話データセットの実験結果は、幅広いベースラインと比較して、我々の手法の優位性を示している。
論文 参考訳(メタデータ) (2023-05-26T14:21:54Z) - Advanced Conditional Variational Autoencoders (A-CVAE): Towards
interpreting open-domain conversation generation via disentangling latent
feature representation [15.742077523458995]
本稿では,メソスコピックスケールの特徴的絡み合いを伴う認知的アプローチを通じて,先行知識による生成モデルを活用することを提案する。
本稿では,潜在空間分布の解釈可能性を客観的に評価できるオープンドメイン対話のための新しい指標を提案する。
論文 参考訳(メタデータ) (2022-07-26T07:39:36Z) - Unsupervised Mismatch Localization in Cross-Modal Sequential Data [5.932046800902776]
我々は、コンテンツミスマッチしたクロスモーダルデータ間の関係を推測できる教師なし学習アルゴリズムを開発した。
本稿では,音声生成過程を階層的に構造化された潜在変数に分解する,ミスマッチ局所化変分自動符号化(ML-VAE)という階層型ベイズディープラーニングモデルを提案する。
実験の結果,ML-VAEは人間のアノテーションを必要とせず,テキストと音声のミスマッチの特定に成功した。
論文 参考訳(メタデータ) (2022-05-05T14:23:27Z) - Semantic Correspondence with Transformers [68.37049687360705]
本稿では,変換器を用いたコストアグリゲーション(CAT)を提案し,意味論的に類似した画像間の密接な対応を見出す。
初期相関マップと多レベルアグリゲーションを曖昧にするための外観親和性モデリングを含む。
提案手法の有効性を示す実験を行い,広範囲にわたるアブレーション研究を行った。
論文 参考訳(メタデータ) (2021-06-04T14:39:03Z) - Multi-Domain Dialogue Acts and Response Co-Generation [34.27525685962274]
本稿では,対話行動と応答を同時に生成するニューラルコジェネレーションモデルを提案する。
我々のモデルは, 自動評価と人的評価の両方において, いくつかの最先端モデルに対して, 極めて良好な改善を達成している。
論文 参考訳(メタデータ) (2020-04-26T12:21:17Z) - Improve Variational Autoencoder for Text Generationwith Discrete Latent
Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。
VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。
よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-22T14:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。