論文の概要: Learning a Simple and Effective Model for Multi-turn Response Generation
with Auxiliary Tasks
- arxiv url: http://arxiv.org/abs/2004.01972v2
- Date: Mon, 9 Nov 2020 07:11:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 23:11:15.588387
- Title: Learning a Simple and Effective Model for Multi-turn Response Generation
with Auxiliary Tasks
- Title(参考訳): 補助タスクによるマルチターン応答生成のための単純かつ効果的なモデル学習
- Authors: Yufan Zhao, Can Xu, Wei Wu, Lei Yu
- Abstract要約: オープンドメイン対話のためのマルチターン応答生成について検討する。
本研究では,単純な構造を持ちながら,会話コンテキストを効果的に活用できるモデルを提案する。
- 参考スコア(独自算出の注目度): 22.585901751927995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study multi-turn response generation for open-domain dialogues. The
existing state-of-the-art addresses the problem with deep neural architectures.
While these models improved response quality, their complexity also hinders the
application of the models in real systems. In this work, we pursue a model that
has a simple structure yet can effectively leverage conversation contexts for
response generation. To this end, we propose four auxiliary tasks including
word order recovery, utterance order recovery, masked word recovery, and masked
utterance recovery, and optimize the objectives of these tasks together with
maximizing the likelihood of generation. By this means, the auxiliary tasks
that relate to context understanding can guide the learning of the generation
model to achieve a better local optimum. Empirical studies with three
benchmarks indicate that our model can significantly outperform
state-of-the-art generation models in terms of response quality on both
automatic evaluation and human judgment, and at the same time enjoys a much
faster decoding process.
- Abstract(参考訳): オープンドメイン対話におけるマルチターン応答生成について検討する。
既存の最先端技術は、ディープ・ニューラル・アーキテクチャの問題に対処する。
これらのモデルは応答品質を改善したが、その複雑さは実際のシステムにおけるモデルの適用を妨げる。
本研究では,応答生成に会話コンテキストを効果的に活用できる単純な構造を持つモデルを追求する。
そこで本研究では, 単語順回復, 発話順回復, マスキング語回復, マスキング発話回復の4つの補助課題を提案し, それらの課題の目的を最適化し, 生成可能性の最大化を図る。
これにより、文脈理解に関連する補助タスクは、生成モデルの学習をガイドし、より良い局所的最適を達成することができる。
3つのベンチマークによる実証研究により、我々のモデルは自動評価と人的判断の両方における応答品質において、最先端の生成モデルを大幅に上回り、同時により高速な復号処理を享受できることが示されている。
関連論文リスト
- Explanation, Debate, Align: A Weak-to-Strong Framework for Language Model Generalization [0.6629765271909505]
本稿では,言語モデルにおける弱強一般化によるモデルアライメントの新たなアプローチを提案する。
このファシリテーションに基づくアプローチは、モデルの性能を高めるだけでなく、モデルアライメントの性質に関する洞察も提供することを示唆している。
論文 参考訳(メタデータ) (2024-09-11T15:16:25Z) - RA-ISF: Learning to Answer and Understand from Retrieval Augmentation via Iterative Self-Feedback [19.28222902440827]
大規模言語モデル(LLM)は多くのタスクにおいて例外的な性能を示すが、それでもパラメータに格納された知識に大きく依存している。
Retrieval-augmented Generation (RAG)メソッドは、外部知識を統合することでこの問題に対処する。
本稿では、反復的にタスクを分解し、3つのサブモジュールで処理し、モデルの問題解決能力を向上するフレームワークであるRetrieval Augmented Iterative Self-Feedback (RA-ISF)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:01:05Z) - Self-Convinced Prompting: Few-Shot Question Answering with Repeated
Introspection [13.608076739368949]
本稿では,大規模事前学習型言語モデルの可能性を活用する新しいフレームワークを提案する。
我々のフレームワークは、典型的な数発の連鎖プロンプトの出力を処理し、応答の正しさを評価し、回答を精査し、最終的には新しい解を生成する。
論文 参考訳(メタデータ) (2023-10-08T06:36:26Z) - RAVEN: In-Context Learning with Retrieval-Augmented Encoder-Decoder Language Models [57.12888828853409]
RAVENは検索強化されたマスク付き言語モデリングとプレフィックス言語モデリングを組み合わせたモデルである。
フュージョン・イン・コンテキスト・ラーニング(Fusion-in-Context Learning)により、追加のトレーニングを必要とせずに、より多くのコンテキスト内サンプルを利用できる。
本研究は,テキスト内学習のためのエンコーダ・デコーダ言語モデルの構築の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2023-08-15T17:59:18Z) - Enhancing Retrieval-Augmented Large Language Models with Iterative
Retrieval-Generation Synergy [164.83371924650294]
検索と生成を反復的に同期させるIter-RetGenと呼ばれる手法により,高い性能が得られることを示す。
モデル出力は、タスクを完了するために必要なものを示し、より関連する知識を取得するための情報的コンテキストを提供する。
Iter-RetGenプロセスは、すべての知識を全体として取得し、構造的な制約なしに生成時の柔軟性をほとんど保持します。
論文 参考訳(メタデータ) (2023-05-24T16:17:36Z) - SimOAP: Improve Coherence and Consistency in Persona-based Dialogue
Generation via Over-sampling and Post-evaluation [54.66399120084227]
大規模コーパスで訓練された言語モデルは、オープンドメイン対話において驚くほど流動的な結果を生み出すことができる。
ペルソナに基づく対話生成タスクでは、一貫性と一貫性が言語モデルにとって大きな課題である。
オーバーサンプリングとポスト評価という2段階のSimOAP戦略が提案されている。
論文 参考訳(メタデータ) (2023-05-18T17:23:00Z) - Improving Non-autoregressive Generation with Mixup Training [51.61038444990301]
本稿では,事前学習したトランスモデルに基づく非自己回帰生成モデルを提案する。
我々はMIxソースと擬似ターゲットという,シンプルで効果的な反復訓練手法を提案する。
質問生成,要約,パラフレーズ生成を含む3つの世代ベンチマーク実験により,提案手法が新たな最先端結果を実現することを示す。
論文 参考訳(メタデータ) (2021-10-21T13:04:21Z) - Enhancing Dialogue Generation via Multi-Level Contrastive Learning [57.005432249952406]
質問に対する応答のきめ細かい品質をモデル化するマルチレベルコントラスト学習パラダイムを提案する。
Rank-aware (RC) ネットワークはマルチレベルコントラスト最適化の目的を構築するために設計されている。
本研究では,知識推論(KI)コンポーネントを構築し,学習中の参照からキーワードの知識を抽出し,そのような情報を活用して情報的単語の生成を促す。
論文 参考訳(メタデータ) (2020-09-19T02:41:04Z) - Learning an Effective Context-Response Matching Model with
Self-Supervised Tasks for Retrieval-based Dialogues [88.73739515457116]
我々は,次のセッション予測,発話復元,不整合検出,一貫性判定を含む4つの自己教師型タスクを導入する。
我々はPLMに基づく応答選択モデルとこれらの補助タスクをマルチタスク方式で共同で訓練する。
実験結果から,提案した補助的自己教師型タスクは,多ターン応答選択において大きな改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-09-14T08:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。