論文の概要: Imagination is All You Need! Curved Contrastive Learning for Abstract
Sequence Modeling Utilized on Long Short-Term Dialogue Planning
- arxiv url: http://arxiv.org/abs/2211.07591v1
- Date: Mon, 14 Nov 2022 18:16:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 17:48:39.305099
- Title: Imagination is All You Need! Curved Contrastive Learning for Abstract
Sequence Modeling Utilized on Long Short-Term Dialogue Planning
- Title(参考訳): 想像力は それだけだ!
長期対話計画における抽象シーケンスモデリングのための曲線コントラスト学習
- Authors: Justus-Jonas Erker, Gerasimos Spanakis, Stefan Schaffer
- Abstract要約: コントラスト学習文の埋め込みを通したマルチターン対話の係り受け性に感銘を受けて,CCL(Curved Contrastive Learning)という新しい手法を導入する。
CCLは、コサイン類似性を用いて比較できる意味的に意味のある、対話的なグラフの湾曲した発話埋め込みを生成する。
曲線特性を利用して、DialogRPTの700万倍以上のGPU時間で、100万の発話とコンテキストペアをランク付けする方法を示します。
- 参考スコア(独自算出の注目度): 2.5567566997688043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by the entailment property of multi-turn dialogues through
contrastive learning sentence embeddings, we introduce a novel technique,
Curved Contrastive Learning (CCL), for generating semantically meaningful and
conversational graph curved utterance embeddings that can be compared using
cosine similarity. The resulting bi-encoder models can guide transformers as a
response ranking model towards a goal in a zero-shot fashion by projecting the
goal utterance and the corresponding reply candidates into a latent space. Here
the cosine similarity indicates the distance/reachability of a candidate
utterance towards the corresponding goal which we define as curved space.
Furthermore, we explore how these forward-entailing language representations
can be utilized for assessing the likelihood of sequences by the entailment
strength i.e. through the cosine similarity of its individual members (encoded
separately) as an emergent property in the curved space. This allows us to
imagine the likelihood of future patterns in dialogues, specifically by
ordering/identifying future goal utterances that are multiple turns away, given
a dialogue context. As part of our analysis, we investigate characteristics
that make conversations (un)plannable and find strong evidence of planning
capability over multiple turns (in 61.56\% over 3 turns) in conversations from
the DailyDialog dataset. Finally, we will show how we can exploit the curved
property to rank one million utterance & context pairs, in terms of GPU
computation time over 7 million times faster than DialogRPT, while being in
average 2.8\% qualitatively superior for sequences longer than 2 turns.
- Abstract(参考訳): コントラスト学習文埋め込みによる多段対話の包含性に動機づけられ,コサイン類似性を用いて比較可能な意味的有意味・会話的グラフ曲面発話埋め込みを生成する新しい手法であるcurved contrastive learning (ccl) を提案する。
得られたバイエンコーダモデルは、目標発話と対応する応答候補を潜在空間に投影することにより、応答ランキングモデルとしてのトランスフォーマーをゼロショット方式で目標に向かって導くことができる。
ここでコサイン類似性は、我々が曲線空間として定義する対応する目標に向かって、候補発話の距離/到達可能性を示す。
さらに,これらの前処理言語表現を用いて,各部材のコサイン類似性(個別に符号化された)を曲線空間の創発的特性として,エンテーメント強度によってシーケンスの可能性を評価する方法について検討する。
これにより、対話における将来のパターンの可能性、特に対話コンテキストを前提として、複数の方向転換された将来の目標発話を注文/識別することで、想像することができる。
分析の一環として,毎日の会話データから,会話を(計画不能)にし,複数のターン(3ターン61.56\%)にわたる計画能力の強い証拠を見つける特徴について検討した。
最後に、曲線特性を利用して100万発話とコンテキストペアをランク付けする方法を示す。gpuの計算時間はdialogrptより700万倍高速だが、平均2ターンよりも長いシーケンスでは2.8\%上回っている。
関連論文リスト
- SPECTRUM: Speaker-Enhanced Pre-Training for Long Dialogue Summarization [48.284512017469524]
マルチターン対話は、その長さとターンテイクな会話の存在によって特徴づけられる。
伝統的な言語モデルは、しばしばそれらの対話の特徴を通常のテキストとして扱うことによって見落としている。
長文対話要約のための話者強化事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-31T04:50:00Z) - Probabilistic Transformer: A Probabilistic Dependency Model for
Contextual Word Representation [52.270712965271656]
本稿では,文脈表現の新しいモデルを提案する。
モデルのグラフは変換器に似ており、依存関係と自己意識の対応性がある。
実験により,本モデルが小型・中型データセットのトランスフォーマーと競合することを示す。
論文 参考訳(メタデータ) (2023-11-26T06:56:02Z) - Improving a sequence-to-sequence nlp model using a reinforcement
learning policy algorithm [0.0]
対話生成の現在のニューラルネットワークモデルは、おしゃべりエージェントの回答を生成する上で非常に有望である。
しかし、彼らは発話を1度ずつ予測し、将来の結果に対する彼らの影響を無視している。
本研究は,対話の長期的成功に基づくニューラルな会話モデル構築に向けた予備的なステップを記念するものである。
論文 参考訳(メタデータ) (2022-12-28T22:46:57Z) - Learning to Listen: Modeling Non-Deterministic Dyadic Facial Motion [89.01668641930206]
本稿では,対話における対話コミュニケーションをモデル化するための枠組みを提案する。
我々は、対応するリスナー動作の複数の可能性を自動回帰的に出力する。
本手法は,非言語的ダイアド相互作用の多モーダルおよび非決定論的性質を有機的に捕捉する。
論文 参考訳(メタデータ) (2022-04-18T17:58:04Z) - Learning-by-Narrating: Narrative Pre-Training for Zero-Shot Dialogue
Comprehension [48.483910831143724]
対話を補完するには、発話中の様々なキー情報をキャプチャするモデルが必要である。
そこで我々は,対話入力からキー情報をナレーションすることで学習する,物語誘導型事前学習戦略を開発した。
論文 参考訳(メタデータ) (2022-03-19T05:20:25Z) - Preliminary study on using vector quantization latent spaces for TTS/VC
systems with consistent performance [55.10864476206503]
本稿では,潜在言語埋め込みをモデル化するための量子化ベクトルの利用について検討する。
トレーニングにおいて、潜伏空間上の異なるポリシーを強制することにより、潜伏言語埋め込みを得ることができる。
実験の結果,ベクトル量子化法で構築した音声クローニングシステムは,知覚的評価の点でわずかに劣化していることがわかった。
論文 参考訳(メタデータ) (2021-06-25T07:51:35Z) - $C^3$: Compositional Counterfactual Contrastive Learning for
Video-grounded Dialogues [97.25466640240619]
映像対話システムの目的は、映像理解と対話理解を統合し、対話と映像コンテキストの両方に関連する応答を生成することである。
既存のアプローチのほとんどはディープラーニングモデルを採用しており、比較的小さなデータセットが利用可能であることを考えると、優れたパフォーマンスを実現している。
本稿では,映像対話における実例と反実例の対比学習を開発するために,合成対実的コントラスト学習の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-16T16:05:27Z) - CloneBot: Personalized Dialogue-Response Predictions [0.0]
プロジェクトのタスクは、話者id、チャット履歴、発話クエリが与えられた場合に、会話中の応答発話を予測できるモデルを作成することだった。
モデルは各話者にパーソナライズされる。
このタスクは、人間のような方法で会話する音声ボットをライブ会話で構築するのに有用なツールである。
論文 参考訳(メタデータ) (2021-03-31T01:15:37Z) - Multi-turn Response Selection using Dialogue Dependency Relations [39.99448321736736]
マルチターン応答選択は対話エージェントを開発するために設計されたタスクである。
本稿では,対話履歴を依存関係に基づいてスレッドに変換する対話抽出アルゴリズムを提案する。
我々のモデルは、D7とDSTC8*の両方で最先端のベースラインを上回り、Ubuntu上での競合的な結果です。
論文 参考訳(メタデータ) (2020-10-04T08:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。