論文の概要: Can LLMs Generate High-Quality Task-Specific Conversations?
- arxiv url: http://arxiv.org/abs/2508.02931v1
- Date: Mon, 04 Aug 2025 22:07:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.702677
- Title: Can LLMs Generate High-Quality Task-Specific Conversations?
- Title(参考訳): LLMは高品質タスク特化会話を生成できるか?
- Authors: Shengqi Li, Amarnath Gupta,
- Abstract要約: 本稿では,大規模言語モデルにおける会話品質制御のためのパラメータ化フレームワークを提案する。
パラメータに基づく制御は、生成した会話特性に統計的に有意な差をもたらすことを示す。
このフレームワークは、教育、セラピー、カスタマーサービス、エンターテイメントの応用による会話品質管理の標準化された方法を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a parameterization framework for controlling conversation quality in large language models. We explore nine key parameters across six dimensions that enable precise specification of dialogue properties. Through experiments with state-of-the-art LLMs, we demonstrate that parameter-based control produces statistically significant differences in generated conversation properties. Our approach addresses challenges in conversation generation, including topic coherence, knowledge progression, character consistency, and control granularity. The framework provides a standardized method for conversation quality control with applications in education, therapy, customer service, and entertainment. Future work will focus on implementing additional parameters through architectural modifications and developing benchmark datasets for evaluation.
- Abstract(参考訳): 本稿では,大規模言語モデルにおける会話品質制御のためのパラメータ化フレームワークを提案する。
対話特性の正確な仕様化を可能にする6次元のキーパラメータを9つ検討する。
現状のLLMを用いた実験により,パラメータベースの制御が生成した会話特性に統計的に有意な差をもたらすことを示す。
提案手法は,トピックコヒーレンス,知識の進歩,文字の一貫性,制御の粒度など,会話生成における課題に対処する。
このフレームワークは、教育、セラピー、カスタマーサービス、エンターテイメントの応用による会話品質管理の標準化された方法を提供する。
今後の作業は、アーキテクチャの変更による追加パラメータの実装と、評価のためのベンチマークデータセットの開発に注力する予定である。
関連論文リスト
- A Personalized Conversational Benchmark: Towards Simulating Personalized Conversations [112.81207927088117]
PersonaConvBenchは、大規模言語モデル(LLM)とのマルチターン会話におけるパーソナライズされた推論と生成を評価するためのベンチマークである。
我々は,複数の商用およびオープンソース LLM を統一的なプロンプト設定でベンチマークし,パーソナライズされた履歴を組み込むことで大幅な性能向上が得られることを観察した。
論文 参考訳(メタデータ) (2025-05-20T09:13:22Z) - SAGE: Steering Dialog Generation with Future-Aware State-Action Augmentation [9.95917154889491]
本稿では,潜時変数を用いた対話生成における長時間水平動作を制御するSAGEという新しい手法を提案する。
我々の手法の中核は、標準言語モデルの微調整を強化したState-Action Chain (SAC) である。
実験結果から,本手法を用いてトレーニングしたモデルでは,感情的インテリジェンス指標の性能が向上したことが示された。
論文 参考訳(メタデータ) (2025-03-04T22:45:24Z) - HammerBench: Fine-Grained Function-Calling Evaluation in Real Mobile Device Scenarios [31.43638572775755]
HammerBenchは、実世界のマルチターン対話におけるモバイルアシスタント機能呼び出し機能を評価するための新しいフレームワークである。
実験の結果、異なるタイプのパラメータ名エラーが、異なる相互作用シナリオにおける重大な障害の原因であることを明らかにした。
論文 参考訳(メタデータ) (2024-12-21T07:33:55Z) - Decoding Decoded: Understanding Hyperparameter Effects in Open-Ended Text Generation [0.22499166814992438]
生成型大規模言語モデル(LLM)の復号戦略は、テキスト生成タスクにおいて、重要ではあるがしばしば未発見の側面である。
本研究では,復号化手法,オープンソースLCM,テキストドメイン,評価プロトコルの大規模評価を行う。
我々の実験には、事実的(ニュースなど)と創造的(フィクションなど)の両方が含まれており、人間の判断とともに、幅広い自動評価指標が組み込まれている。
論文 参考訳(メタデータ) (2024-10-08T14:51:03Z) - ChatSOP: An SOP-Guided MCTS Planning Framework for Controllable LLM Dialogue Agents [52.7201882529976]
対話エージェントの制御性を高めるため,SOP誘導モンテカルロ木探索(MCTS)計画フレームワークを提案する。
これを実現するために、GPT-4oを用いた半自動ロールプレイシステムを用いて、SOPアノテーション付きマルチシナリオ対話からなるデータセットをキュレートする。
また、SOP予測のための教師付き微調整と思考の連鎖推論を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-04T12:23:02Z) - MP2D: An Automated Topic Shift Dialogue Generation Framework Leveraging
Knowledge Graphs [15.876075659237722]
Multi-Passage to Dialogue (MP2D) は、自然なトピック遷移を伴う質問応答データセットを生成する。
MP2Dは対話内のトピックの流れをマッピングし、人間の会話のダイナミクスを効果的に反映する。
本研究では,トピックシフト対話のための新しいベンチマークTS-WikiDialogを紹介する。
論文 参考訳(メタデータ) (2024-03-09T06:28:48Z) - Towards Understanding Counseling Conversations: Domain Knowledge and
Large Language Models [22.588557390720236]
本稿では,カウンセリング会話をより良く表現するために,ドメイン知識と大規模言語モデル(LLM)の有効性を検討するための体系的なアプローチを提案する。
本稿では,トランスフォーマーモデルやGPTモデルのような最先端言語モデルは,会話結果の予測に失敗することを示す。
論文 参考訳(メタデータ) (2024-02-22T01:02:37Z) - Frugal Prompting for Dialog Models [17.048111072193933]
本研究では,大規模言語モデル(LLM)を用いた対話システム構築のための異なるアプローチについて検討する。
即時チューニングの一環として、インストラクション、例題、現在のクエリ、追加のコンテキストを提供する様々な方法を試行する。
この研究は、最適な使用情報密度を持つダイアログ履歴の表現も分析する。
論文 参考訳(メタデータ) (2023-05-24T09:06:49Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - Large Language Models Meet Harry Potter: A Bilingual Dataset for
Aligning Dialogue Agents with Characters [70.84938803753062]
本稿では,対話エージェントと文字アライメントの研究を進めるために設計されたHarry Potter Dialogueデータセットを紹介する。
このデータセットはハリー・ポッターシリーズのすべての対話セッション(英語と中国語の両方)を含んでいる。
対話シーン、話者、人物関係、属性など、重要な背景情報とともに注釈付けされている。
論文 参考訳(メタデータ) (2022-11-13T10:16:39Z) - DialogZoo: Large-Scale Dialog-Oriented Task Learning [52.18193690394549]
我々は,多種多様な対話課題を解くための統合基盤モデルの構築を目指している。
この目的を達成するために、73の公開データセットから、まず大規模なラベル付き対話データセットを収集する。
論文 参考訳(メタデータ) (2022-05-25T11:17:16Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Adaptive Parameterization for Neural Dialogue Generation [39.199204415979196]
本稿では,bf適応型bfニューラルbf対話生成モデルtextscAdaNDを提案する。
各会話に対して、モデルは入力コンテキストを参照してエンコーダ・デコーダのパラメータを生成する。
大規模実世界の会話データセットを用いて行った実験から,定量的指標と人的評価の両面において,本モデルが優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-01-18T08:18:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。