論文の概要: Response-conditioned Turn-taking Prediction
- arxiv url: http://arxiv.org/abs/2305.02036v1
- Date: Wed, 3 May 2023 11:06:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 15:16:20.453556
- Title: Response-conditioned Turn-taking Prediction
- Title(参考訳): 応答条件付きターンテイク予測
- Authors: Bing'er Jiang, Erik Ekstedt, Gabriel Skantze
- Abstract要約: 本稿では,会話履歴と次の話者が言いたいことの両方について,エンド・オブ・ターン予測を規定するモデルを提案する。
以上の結果から,本モデルがインクリメンタル・レスポンス・ランサーとして利用できることが示唆された。
- 参考スコア(独自算出の注目度): 1.9229388624311594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Previous approaches to turn-taking and response generation in conversational
systems have treated it as a two-stage process: First, the end of a turn is
detected (based on conversation history), then the system generates an
appropriate response. Humans, however, do not take the turn just because it is
likely, but also consider whether what they want to say fits the position. In
this paper, we present a model (an extension of TurnGPT) that conditions the
end-of-turn prediction on both conversation history and what the next speaker
wants to say. We found that our model consistently outperforms the baseline
model in a variety of metrics. The improvement is most prominent in two
scenarios where turn predictions can be ambiguous solely from the conversation
history: 1) when the current utterance contains a statement followed by a
question; 2) when the end of the current utterance semantically matches the
response. Treating the turn-prediction and response-ranking as a one-stage
process, our findings suggest that our model can be used as an incremental
response ranker, which can be applied in various settings.
- Abstract(参考訳): 会話システムにおけるターンテイクとレスポンス生成に対する以前のアプローチは、2段階のプロセスとして扱われてきた: まず、ターンの終了が(会話履歴に基づいて)検出され、システムが適切な応答を生成する。
しかし、人間は、それがおそらくあるからというだけでなく、自分が言いたいことをその立場に当てはまるかどうかも考慮する。
本稿では,会話履歴と次の話者が言いたいことの両方について,エンド・オブ・ターンを予測するモデル(TurnGPTの拡張)を提案する。
私たちのモデルは、さまざまなメトリクスでベースラインモデルよりも一貫して優れています。
この改善は、ターン予測が会話履歴からのみ曖昧にできる2つのシナリオにおいて最も顕著である。
1) 現在の発声が文を含むときは,次に掲げる質問
2) 現在の発話の終わりが意味的に応答に一致する場合。
ターン予測と応答ランクを1段階のプロセスとして扱うことで,本モデルがインクリメンタルな応答ランク付けとして利用可能であることが示唆された。
関連論文リスト
- How Did We Get Here? Summarizing Conversation Dynamics [4.644319899528183]
本稿では,人文要約のデータセットを構築し,会話のダイナミクスを要約するタスクを紹介する。
このような要約が、確立された下流タスクを介して会話の軌跡を捉えることができるかどうかを評価する。
この予測タスクでは,人間と自動化システムの両方が有効であることを示す。
論文 参考訳(メタデータ) (2024-04-29T18:00:03Z) - "My Answer is C": First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models [40.867655189493924]
言語生成のオープンな性質は、大規模言語モデル(LLM)の評価を困難にしている。
1つの一般的な評価手法は、応答空間を制限するためにMulti-choice Question (MCQ) を用いる。
そこで本研究では,テキストの出力を数次元で評価する。
論文 参考訳(メタデータ) (2024-02-22T12:47:33Z) - Phrase Retrieval for Open-Domain Conversational Question Answering with
Conversational Dependency Modeling via Contrastive Learning [54.55643652781891]
Open-Domain Conversational Question Answering (ODConvQA)は、マルチターン会話を通じて質問に答えることを目的としている。
そこで本研究では,単語列に対する句検索方式を用いて,回答を直接予測する手法を提案する。
論文 参考訳(メタデータ) (2023-06-07T09:46:38Z) - Realistic Conversational Question Answering with Answer Selection based
on Calibrated Confidence and Uncertainty Measurement [54.55643652781891]
対話型質問回答モデル(ConvQA)は,会話中に複数回発生した質問文と過去の質問文のペアを用いて質問に回答することを目的としている。
本稿では,会話履歴における不正確な回答を,ConvQAモデルから推定された信頼度と不確実性に基づいてフィルタリングすることを提案する。
我々は2つの標準ConvQAデータセット上で、回答選択に基づくリアルな会話質問回答モデルの有効性を検証する。
論文 参考訳(メタデータ) (2023-02-10T09:42:07Z) - Rationalizing Predictions by Adversarial Information Calibration [65.19407304154177]
我々は2つのモデルを共同で訓練する: 1つは、正確だがブラックボックスな方法でタスクを解く典型的なニューラルモデルであり、もう1つは、予測の理論的根拠を付加するセレクタ・予測モデルである。
我々は,2つのモデルから抽出した情報を,それらの違いが欠落した特徴や過度に選択された特徴の指標であるように校正するために,敵対的手法を用いる。
論文 参考訳(メタデータ) (2023-01-15T03:13:09Z) - Sketch and Customize: A Counterfactual Story Generator [71.34131541754674]
条件と終了に関係のある因果関係を導いたスケッチ・アンド・カスタマイズ生成モデルを提案する。
実験結果から,従来のシーケンス・ツー・シーケンスモデルと比較して,提案モデルの方がより優れたエンディングを生成することがわかった。
論文 参考訳(メタデータ) (2021-04-02T08:14:22Z) - TurnGPT: a Transformer-based Language Model for Predicting Turn-taking
in Spoken Dialog [2.2716975311837357]
音声対話におけるターンシフトを予測するためのトランスフォーマーベース言語モデルであるTurnGPTを導入する。
このモデルは、様々な文章と音声の対話データセットに基づいて訓練され、評価されている。
論文 参考訳(メタデータ) (2020-10-21T09:58:39Z) - Back to the Future: Unsupervised Backprop-based Decoding for
Counterfactual and Abductive Commonsense Reasoning [79.48769764508006]
ジェネレーティブ言語モデル(LM)は、過去の文脈のみを条件にするか、狭い範囲のテキスト入力を実行するよう訓練することができる。
我々は過去と将来の両方の文脈を柔軟に組み込むことができる新しい教師なし復号アルゴリズムであるDeLoreanを提案する。
提案手法は, 帰納的テキスト生成と反事実的ストーリーリビジョンの2つの非単調推論タスクに適用可能であることを示す。
論文 参考訳(メタデータ) (2020-10-12T17:58:43Z) - Generating Dialogue Responses from a Semantic Latent Space [75.18449428414736]
語彙のエンドツーエンド分類に代わる方法を提案する。
潜在空間上の回帰タスクとして,プロンプトと応答のペア関係を学習する。
人間の評価は、連続した空間でタスクを学習すると、関連性と情報性の両方を持つ応答が生成されることを示した。
論文 参考訳(メタデータ) (2020-10-04T19:06:16Z) - Predict-then-Decide: A Predictive Approach for Wait or Answer Task in
Dialogue Systems [24.560203199376478]
本稿では,このウェイト・オア・アンサー問題に対処するための予測手法であるPredict-then-Decide (PTD)を提案する。
2つの実生活シナリオと3つの公開データセットで実験を行う。
論文 参考訳(メタデータ) (2020-05-27T01:48:54Z) - "Wait, I'm Still Talking!" Predicting the Dialogue Interaction Behavior
Using Imagine-Then-Arbitrate Model [24.560203199376478]
実際の人間と人間の会話では、1ターンで長いメッセージではなく、可読性のためのいくつかの短いメッセージが順次送信されることが多い。
本稿では,エージェントが待機するか,直接応答するかを決定するのに役立つ,新しいImagine-then-Arbitrate(ITA)ニューラルダイアログモデルを提案する。
論文 参考訳(メタデータ) (2020-02-22T04:05:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。