論文の概要: Mitigating Unhelpfulness in Emotional Support Conversations with
Multifaceted AI Feedback
- arxiv url: http://arxiv.org/abs/2401.05928v2
- Date: Fri, 9 Feb 2024 05:44:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 19:42:05.354534
- Title: Mitigating Unhelpfulness in Emotional Support Conversations with
Multifaceted AI Feedback
- Title(参考訳): マルチフェイスAIフィードバックを用いた感情支援会話における不快感の軽減
- Authors: Jiashuo Wang, Chunpu Xu, Chak Tou Leong, Wenjie Li, Jing Li
- Abstract要約: 感情支援のための多面的AIフィードバック(Muffin)で不健康を緩和する新しいモデル非依存フレームワークを提案する。
Muffin氏は、複数の要因を考慮して、特定のモデルによって生成された応答の有用性を評価するために、多面的なAIフィードバックモジュールを使用している。
以上の結果から,Muffinは応答頻度と関連性をわずかに増加させながら,非ヘルペス反応の発生を効果的に軽減することが示された。
- 参考スコア(独自算出の注目度): 10.267182276000055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An emotional support conversation system aims to alleviate users' emotional
distress and assist them in addressing their challenges. To generate supportive
responses, it is critical to consider multiple factors such as empathy, support
strategies, and response coherence, as established in prior methods.
Nonetheless, previous models occasionally generate unhelpful responses, which
intend to provide support but display counterproductive effects. According to
psychology and communication theories, poor performance in just one
contributing factor might cause a response to be unhelpful. From the model
training perspective, since these models have not been exposed to unhelpful
responses during their training phase, they are unable to distinguish if the
tokens they generate might result in unhelpful responses during inference. To
address this issue, we introduce a novel model-agnostic framework named
mitigating unhelpfulness with multifaceted AI feedback for emotional support
(Muffin). Specifically, Muffin employs a multifaceted AI feedback module to
assess the helpfulness of responses generated by a specific model with
consideration of multiple factors. Using contrastive learning, it then reduces
the likelihood of the model generating unhelpful responses compared to the
helpful ones. Experimental results demonstrate that Muffin effectively
mitigates the generation of unhelpful responses while slightly increasing
response fluency and relevance.
- Abstract(参考訳): 情緒的支援会話システムは,ユーザの感情的苦痛を軽減し,彼らの課題への対処を支援することを目的としている。
支援的応答を生成するには, 共感, 支援戦略, 応答コヒーレンスなど複数の要因を, 従来手法で確立したように考慮することが重要である。
それにもかかわらず、以前のモデルは時折、サポートを提供するが、反生産的効果を示す意図のある応答を生成する。
心理学やコミュニケーション理論によれば、たった一つの要因における粗悪なパフォーマンスは、応答が弱くなる可能性がある。
モデルトレーニングの観点からは、これらのモデルがトレーニングフェーズ中に不十分な応答にさらされていないため、トークンが推論中に不必要な応答をもたらすかどうかを区別できない。
この問題に対処するために,多面型aiフィードバックによる感情サポート(muffin)による非効率を緩和する,新たなモデル非依存フレームワークを提案する。
具体的には、muffinは多面的なaiフィードバックモジュールを使用して、複数の要因を考慮して、特定のモデルによって生成された応答の有用性を評価する。
対照的な学習を使用することで、モデルが役に立たない応答を生成する可能性を減らすことができる。
実験結果から,Muffinは応答頻度と応答関連性をわずかに増加させながら,非ヘルペス反応の発生を効果的に軽減することが示された。
関連論文リスト
- Enhancing Answer Attribution for Faithful Text Generation with Large Language Models [5.065947993017158]
本稿では,より独立的で文脈的なクレームを生成できる新しい手法を提案する。
新しい手法が評価され,回答帰属成分の性能が向上することが示されている。
論文 参考訳(メタデータ) (2024-10-22T15:37:46Z) - "My Grade is Wrong!": A Contestable AI Framework for Interactive Feedback in Evaluating Student Essays [6.810086342993699]
本稿では,対話型フィードバックを自動生成するContestable AI Empowered LLM FrameworkであるCAELFを紹介する。
CAELFは、マルチエージェントシステムと計算的議論を統合することで、学生がフィードバックをクエリし、挑戦し、明確化することができる。
ユーザスタディを用いた500の批判的思考エッセイのケーススタディでは,CAELFが対話的フィードバックを大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-09-11T17:59:01Z) - Distilling Reasoning Ability from Large Language Models with Adaptive Thinking [54.047761094420174]
思考の微調整(cot-finetuning)の連鎖は、小さな言語モデル(SLM)を特定のタスクに対するパフォーマンス向上の推論能力で実現することを目的としている。
既存のコトファインタニング法の多くは事前に考えられたメカニズムを採用しており、SLMは答えを出す前に理性を生成することができる。
このメカニズムにより、SLMは複雑な質問を分析して考えることができるが、答えの正しさは論理的に小さな誤りに非常に敏感になる。
理性よりも先に回答を生成するための頑健な後思考機構を提案する。
論文 参考訳(メタデータ) (2024-04-14T07:19:27Z) - Answering Ambiguous Questions via Iterative Prompting [84.3426020642704]
オープンドメインの質問応答では、質問のあいまいさのため、複数の妥当な回答が存在する可能性がある。
ひとつのアプローチは、すべての有効な回答を直接予測することですが、これは、妥当性と多様性のバランスに苦労する可能性があります。
本稿では,あいまいな疑問に答える既存手法の欠陥に対処するため,AmbigPromptを提案する。
論文 参考訳(メタデータ) (2023-07-08T04:32:17Z) - Boosting Distress Support Dialogue Responses with Motivational
Interviewing Strategy [4.264192013842096]
いくつかの応答型が、より MI に固執した形式に書き換えられるかを示す。
We build several rephrasers by fine-tuning Blender and GPT3 to rephrasers MI non-adherent "Advise without permission" response to "Advise with permission"
論文 参考訳(メタデータ) (2023-05-17T13:18:28Z) - Pneg: Prompt-based Negative Response Generation for Dialogue Response
Selection Task [27.513992470527427]
検索に基づく対話システムでは、応答選択モデルがランサーとして機能し、複数の候補の中から最も適切な応答を選択する。
近年の研究では, 対向応答を負のトレーニングサンプルとして活用することは, 選択モデルの識別能力を向上させるのに有用であることが示されている。
本稿では,大規模言語モデルを利用した対向的負の応答を簡易に,かつ効率的に生成する手法を提案する。
論文 参考訳(メタデータ) (2022-10-31T11:49:49Z) - MISC: A MIxed Strategy-Aware Model Integrating COMET for Emotional
Support Conversation [64.37111498077866]
本稿では,感情支援会話のための新しいモデルを提案する。
ユーザの微妙な感情状態を推測し、その後、戦略の混合を使って巧みに応答する。
評価実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-25T10:32:04Z) - Exemplars-guided Empathetic Response Generation Controlled by the
Elements of Human Communication [88.52901763928045]
そこで本稿では, インターロケータへの共感を伝達する, 造形モデルによる細かな構造的特性の解明に先立って, 模範的手法を提案する。
これらの手法は, 自動評価指標と人的評価指標の両方の観点から, 共感的応答品質の大幅な改善をもたらすことを実証的に示す。
論文 参考訳(メタデータ) (2021-06-22T14:02:33Z) - Generating Dialogue Responses from a Semantic Latent Space [75.18449428414736]
語彙のエンドツーエンド分類に代わる方法を提案する。
潜在空間上の回帰タスクとして,プロンプトと応答のペア関係を学習する。
人間の評価は、連続した空間でタスクを学習すると、関連性と情報性の両方を持つ応答が生成されることを示した。
論文 参考訳(メタデータ) (2020-10-04T19:06:16Z) - Counterfactual Off-Policy Training for Neural Response Generation [94.76649147381232]
本稿では,反実的推論による潜在的応答の探索を提案する。
対人学習の枠組みの下での対物反応の訓練は、潜在的応答空間の高逆領域を探索するのに役立つ。
DailyDialogデータセットに関する実証的研究は、我々のアプローチがHREDモデルを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T22:46:28Z) - Review-guided Helpful Answer Identification in E-commerce [38.276241153439955]
製品固有のコミュニティ質問応答プラットフォームは、潜在的な顧客の懸念に対処するのに大いに役立ちます。
このようなプラットフォーム上でユーザが提供する回答は、その品質に大きく違いがあります。
コミュニティからのヘルプフルネスの投票は、回答の全体的な品質を示すことができるが、しばしば欠落している。
論文 参考訳(メタデータ) (2020-03-13T11:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。