論文の概要: Is the User Enjoying the Conversation? A Case Study on the Impact on the
Reward Function
- arxiv url: http://arxiv.org/abs/2101.05004v1
- Date: Wed, 13 Jan 2021 11:13:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 08:06:55.460415
- Title: Is the User Enjoying the Conversation? A Case Study on the Impact on the
Reward Function
- Title(参考訳): ユーザは会話を楽しみますか?
報酬機能への影響に関する事例研究
- Authors: Lina M. Rojas-Barahona
- Abstract要約: 会話中のユーザの満足度を推定するために,分散意味表現学習を用いたディープニューラルネットワークを採用する。
提案する階層ネットワークが最先端品質推定器を上回っていることを示す。
部分可観測マルコフ決定プロセスの報酬関数を推論するためにこれらのネットワークを適用すると、タスクの成功率が大幅に向上します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The impact of user satisfaction in policy learning task-oriented dialogue
systems has long been a subject of research interest. Most current models for
estimating the user satisfaction either (i) treat out-of-context short-texts,
such as product reviews, or (ii) rely on turn features instead of on
distributed semantic representations. In this work we adopt deep neural
networks that use distributed semantic representation learning for estimating
the user satisfaction in conversations. We evaluate the impact of modelling
context length in these networks. Moreover, we show that the proposed
hierarchical network outperforms state-of-the-art quality estimators.
Furthermore, we show that applying these networks to infer the reward function
in a Partial Observable Markov Decision Process (POMDP) yields to a great
improvement in the task success rate.
- Abstract(参考訳): 政策学習課題指向対話システムにおけるユーザ満足度の影響は、長い間研究対象とされてきた。
ユーザ満足度を推定するための現在のモデルの多くは、(i)製品レビューのようなコンテキスト外のショートテキストを扱うか、(ii)分散意味表現ではなくターン機能に依存している。
本研究では,会話中のユーザの満足度を推定するために,分散意味表現学習を用いたディープニューラルネットワークを採用する。
これらのネットワークにおけるコンテキスト長のモデル化の影響を評価する。
さらに,提案する階層ネットワークが最先端品質推定器を上回っていることを示す。
さらに,これらのネットワークを用いて部分観測可能マルコフ決定プロセス(POMDP)の報酬関数を推定することにより,タスク成功率を大幅に向上することを示す。
関連論文リスト
- Sample Complexity of Preference-Based Nonparametric Off-Policy
Evaluation with Deep Networks [58.469818546042696]
我々は、OPEのサンプル効率を人間の好みで研究し、その統計的保証を確立する。
ReLUネットワークのサイズを適切に選択することにより、マルコフ決定過程において任意の低次元多様体構造を活用できることが示される。
論文 参考訳(メタデータ) (2023-10-16T16:27:06Z) - Influencer Detection with Dynamic Graph Neural Networks [56.1837101824783]
インフルエンサー検出のための動的グラフニューラルネットワーク(GNN)の構成について検討する。
GNNにおける深層多面的注意と時間特性の符号化が性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2022-11-15T13:00:25Z) - Preference Enhanced Social Influence Modeling for Network-Aware Cascade
Prediction [59.221668173521884]
本稿では,ユーザの嗜好モデルを強化することで,カスケードサイズ予測を促進する新しいフレームワークを提案する。
エンド・ツー・エンドの手法により,ユーザの情報拡散プロセスがより適応的で正確になる。
論文 参考訳(メタデータ) (2022-04-18T09:25:06Z) - Context Uncertainty in Contextual Bandits with Applications to
Recommender Systems [16.597836265345634]
本稿では,リカレントサーベイネットワーク(REN)と呼ばれる新しいタイプのリカレントニューラルネットワークを提案する。
我々の理論的分析は,RENが学習表現に不確実性がある場合でも,速度-線形準最適後悔を保てることを示す。
我々の実証研究は、RENが合成および実世界のレコメンデーションデータセットに満足な長期報酬を得られることを示した。
論文 参考訳(メタデータ) (2022-02-01T23:23:50Z) - On the role of feedback in visual processing: a predictive coding
perspective [0.6193838300896449]
我々は、フィードフォワード視覚処理のモデルとして深層畳み込みネットワーク(CNN)を検討し、予測符号化(PC)ダイナミクスを実装した。
ノイズレベルが増加するにつれて、ネットワークはますますトップダウンの予測に依存している。
さらに,PCダイナミクスを実装するネットワークの精度は,等価なフォワードネットワークに比べて時間経過とともに著しく向上する。
論文 参考訳(メタデータ) (2021-06-08T10:07:23Z) - Variational Structured Attention Networks for Deep Visual Representation
Learning [49.80498066480928]
空間的注意マップとチャネル的注意の両方を原則的に共同学習するための統合的深層フレームワークを提案する。
具体的には,確率的表現学習フレームワークに注目度の推定と相互作用を統合する。
ニューラルネットワーク内で推論ルールを実装し,確率パラメータとcnnフロントエンドパラメータのエンドツーエンド学習を可能にする。
論文 参考訳(メタデータ) (2021-03-05T07:37:24Z) - Generative Counterfactuals for Neural Networks via Attribute-Informed
Perturbation [51.29486247405601]
AIP(Attribute-Informed Perturbation)の提案により,生データインスタンスの反事実を生成するフレームワークを設計する。
異なる属性を条件とした生成モデルを利用することで、所望のラベルとの反事実を効果的かつ効率的に得ることができる。
実世界のテキストや画像に対する実験結果から, 設計したフレームワークの有効性, サンプル品質, および効率が示された。
論文 参考訳(メタデータ) (2021-01-18T08:37:13Z) - Unsatisfied Today, Satisfied Tomorrow: a simulation framework for
performance evaluation of crowdsourcing-based network monitoring [68.8204255655161]
本稿では, 性能の低い細胞の検出品質を評価するための実験フレームワークを提案する。
このフレームワークは、満足度調査のプロセスとユーザの満足度予測の両方をシミュレートする。
シミュレーションフレームワークを用いて、一般的なシナリオにおいて、性能の低いサイト検出の性能を実証的にテストする。
論文 参考訳(メタデータ) (2020-10-30T10:03:48Z) - Knowing your FATE: Friendship, Action and Temporal Explanations for User
Engagement Prediction on Social Apps [40.58156024231199]
本稿では,ソーシャルネットワークアプリにおけるユーザエンゲージメント予測の新たな課題について検討する。
エンド・ツー・エンドのニューラルネットワークフレームワークであるFATEを設計し、ユーザエンゲージメントに影響を与えるために識別する3つの重要な要素を組み込んだ。
FATEは、テンソルベースのグラフニューラルネットワーク(GNN)、LSTM、混合アテンション機構に基づいており、(a)異なる特徴カテゴリにわたる学習重みに基づく予測的説明、(b)ネットワークの複雑さの低減、(c)予測精度とトレーニング/推論時間の両方のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-06-10T02:59:13Z) - Improving Interaction Quality Estimation with BiLSTMs and the Impact on
Dialogue Policy Learning [0.6538911223040175]
本稿では,ユーザ満足度推定に基づく新たな報酬を提案する。
時間的依存を暗黙的に学習しながら、過去の推定値よりも優れていることを示す。
このモデルを適用すると、推定された満足度が高く、タスクの成功率に類似し、ノイズに対するロバスト性が高いことが示される。
論文 参考訳(メタデータ) (2020-01-21T15:39:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。