論文の概要: Modeling the One-to-Many Property in Open-Domain Dialogue with LLMs
- arxiv url: http://arxiv.org/abs/2506.15131v1
- Date: Wed, 18 Jun 2025 04:19:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.548934
- Title: Modeling the One-to-Many Property in Open-Domain Dialogue with LLMs
- Title(参考訳): LLMを用いたオープンドメイン対話における一対多特性のモデル化
- Authors: Jing Yang Lee, Kong-Aik Lee, Woon-Seng Gan,
- Abstract要約: オープンドメイン対話(OD)は1対1(o2m)特性を示し、単一の対話コンテキストに対して複数の適切な応答が存在する。
我々は、OD生成をMRG(Multi-Response Generation)とPS(Preference-based Selection)の2つの重要なタスクに分解することで、この特性をモデル化する。
o2mDialは、コンテキスト毎に複数の可視応答を特徴付けることで、o2mプロパティをキャプチャするために明示的に設計された対話コーパスである。
- 参考スコア(独自算出の注目度): 27.83533924583182
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-domain Dialogue (OD) exhibits a one-to-many (o2m) property, whereby multiple appropriate responses exist for a single dialogue context. Despite prior research showing that modeling this property boosts response diversity, most modern LLM-based dialogue agents do not explicitly do so. In this work, we model the o2m property of OD in LLMs by decomposing OD generation into two key tasks: Multi-Response Generation (MRG) and Preference-based Selection (PS), which entail generating a set of n semantically and lexically diverse high-quality responses for a given dialogue context, followed by selecting a single response based on human preference, respectively. To facilitate MRG and PS, we introduce o2mDial, a dialogue corpus explicitly designed to capture the o2m property by featuring multiple plausible responses for each context. Leveraging o2mDial, we propose new in-context learning and instruction-tuning strategies, as well as novel evaluation metrics for MRG, alongside a model-based approach for PS. Empirical results demonstrate that applying the proposed two-stage framework to smaller LLMs for OD generation enhances overall response diversity while maintaining contextual coherence, improving response quality by up to 90%, bringing them closer to the performance of larger models.
- Abstract(参考訳): オープンドメイン対話(OD)は1対1(o2m)特性を示し、単一の対話コンテキストに対して複数の適切な応答が存在する。
これまでの研究では、この特性をモデル化することで応答の多様性が向上することが示されているが、現代のLLMベースの対話エージェントは明示的にはそうしていない。
本研究では,LDMにおけるODのo2m特性を,複数応答生成(MRG)と優先度ベース選択(PS)の2つの重要なタスクに分解してモデル化する。
MRGとPSを容易にするために,o2mDialという対話コーパスを導入する。
我々は,o2mDialを活用することで,新しい文脈内学習と指導指導戦略,およびMRGの新たな評価指標をPSのモデルベースアプローチとともに提案する。
実験により,提案した2段階のフレームワークをOD生成用小型LCMに適用することにより,コンテキストコヒーレンスを維持しながら全体の応答の多様性を向上し,応答品質を最大90%向上し,より大きなモデルの性能に近づいた。
関連論文リスト
- Interactive Text-to-Image Retrieval with Large Language Models: A Plug-and-Play Approach [33.231639257323536]
本稿では,対話型テキスト・画像検索タスクにおける対話型コンテキストクエリの問題に対処する。
対話形式のコンテキストを再構成することにより、既存の視覚的対話データから検索モデルを微調整する必要がなくなる。
対象画像の属性に関する非冗長な質問を生成するために,LLM質問機を構築した。
論文 参考訳(メタデータ) (2024-06-05T16:09:01Z) - SLIDE: A Framework Integrating Small and Large Language Models for Open-Domain Dialogues Evaluation [23.203761925540736]
対話評価のためのフレームワークSLIDE(Small and Large Integrated for Dialogue Evaluation)を提案する。
本手法は, 分類タスクと評価タスクの両方において最先端のパフォーマンスを達成し, また, SLIDEは人的評価器との相関性も良好である。
論文 参考訳(メタデータ) (2024-05-24T20:32:49Z) - DialCLIP: Empowering CLIP as Multi-Modal Dialog Retriever [83.33209603041013]
マルチモーダルダイアログ検索のためのパラメータ効率の高いプロンプトチューニング手法であるDialCLIPを提案する。
提案手法では,事前学習された視覚言語モデルCLIP内のプロンプトに抽出された文脈特徴を学習するためのマルチモーダルコンテキスト生成手法を提案する。
様々なタイプの検索を容易にするために,CLIP出力からマルチモーダル表現空間へのマッピングを学習するために,複数の専門家を設計する。
論文 参考訳(メタデータ) (2024-01-02T07:40:12Z) - Diverse and Faithful Knowledge-Grounded Dialogue Generation via
Sequential Posterior Inference [82.28542500317445]
本稿では,知識の選択と対話生成が可能な,逐次後推論(Sequential Posterior Inference, SPI)と呼ばれるエンドツーエンド学習フレームワークを提案する。
他の方法とは異なり、SPIは推論ネットワークを必要とせず、後部分布の単純な幾何学を仮定する。
論文 参考訳(メタデータ) (2023-06-01T21:23:13Z) - EM Pre-training for Multi-party Dialogue Response Generation [86.25289241604199]
多人数対話では、応答発話の宛先を生成前に指定する必要がある。
本稿では,アドレナラベルを生成するための期待ステップを反復的に実行する期待最大化(EM)アプローチを提案する。
論文 参考訳(メタデータ) (2023-05-21T09:22:41Z) - Diversifying Task-oriented Dialogue Response Generation with Prototype
Guided Paraphrasing [52.71007876803418]
タスク指向対話システム(TDS)における既存の対話応答生成(DRG)方法は、テンプレートベースとコーパスベースという2つのカテゴリに分類される。
我々はP2-Netと呼ばれるプロトタイプベースのパラフレーズニューラルネットワークを提案し、精度と多様性の両面で応答の質を高めることを目的としている。
論文 参考訳(メタデータ) (2020-08-07T22:25:36Z) - Multi-Domain Dialogue Acts and Response Co-Generation [34.27525685962274]
本稿では,対話行動と応答を同時に生成するニューラルコジェネレーションモデルを提案する。
我々のモデルは, 自動評価と人的評価の両方において, いくつかの最先端モデルに対して, 極めて良好な改善を達成している。
論文 参考訳(メタデータ) (2020-04-26T12:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。