論文の概要: Surveys without Questions: A Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2006.06323v1
- Date: Thu, 11 Jun 2020 10:41:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 12:55:09.993498
- Title: Surveys without Questions: A Reinforcement Learning Approach
- Title(参考訳): 質問のない調査:強化学習アプローチ
- Authors: Atanu R Sinha, Deepali Jain, Nikhil Sheoran, Sopan Khosla, Reshmi
Sasidharan
- Abstract要約: 我々は、クリックストリームデータからプロキシレーティングを抽出するために、強化学習(RL)に基づくアプローチを開発する。
1つは顧客レベルであり、もう1つは顧客間でのクリックアクションの集計レベルである。
- 参考スコア(独自算出の注目度): 12.044303977550229
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The 'old world' instrument, survey, remains a tool of choice for firms to
obtain ratings of satisfaction and experience that customers realize while
interacting online with firms. While avenues for survey have evolved from
emails and links to pop-ups while browsing, the deficiencies persist. These
include - reliance on ratings of very few respondents to infer about all
customers' online interactions; failing to capture a customer's interactions
over time since the rating is a one-time snapshot; and inability to tie back
customers' ratings to specific interactions because ratings provided relate to
all interactions. To overcome these deficiencies we extract proxy ratings from
clickstream data, typically collected for every customer's online interactions,
by developing an approach based on Reinforcement Learning (RL). We introduce a
new way to interpret values generated by the value function of RL, as proxy
ratings. Our approach does not need any survey data for training. Yet, on
validation against actual survey data, proxy ratings yield reasonable
performance results. Additionally, we offer a new way to draw insights from
values of the value function, which allow associating specific interactions to
their proxy ratings. We introduce two new metrics to represent ratings - one,
customer-level and the other, aggregate-level for click actions across
customers. Both are defined around proportion of all pairwise, successive
actions that show increase in proxy ratings. This intuitive customer-level
metric enables gauging the dynamics of ratings over time and is a better
predictor of purchase than customer ratings from survey. The aggregate-level
metric allows pinpointing actions that help or hurt experience. In sum, proxy
ratings computed unobtrusively from clickstream, for every action, for each
customer, and for every session can offer interpretable and more insightful
alternative to surveys.
- Abstract(参考訳): 古い世界の」調査は、企業がオンラインで企業と対話しながら、顧客が認識した満足度と経験のレーティングを得るためのツールであり続けている。
調査の道はメールやリンクからポップアップまで進化してきたが、欠陥は続いている。
これには、顧客のオンラインインタラクションを推測するごく少数の回答者のレーティングに依存すること、レーティングが1回のスナップショットであるため、時間の経過とともに顧客のインタラクションをキャプチャできないこと、提供されたレーティングがすべてのインタラクションに関連するため、顧客のレーティングを特定のインタラクションに結びつけることができないこと、などが含まれる。
これらの欠陥を克服するために、Reinforcement Learning(RL)に基づいたアプローチを開発することで、顧客のオンラインインタラクション毎に収集されるクリックストリームデータからプロキシレーティングを抽出する。
本稿では,RLの値関数が生成した値をプロキシ評価として解釈する新しい手法を提案する。
我々のアプローチは、トレーニングのためにサーベイデータを必要としない。
しかし、実際の調査データに対する検証では、プロキシレーティングが適切なパフォーマンス結果をもたらす。
さらに、バリュー関数の値から洞察を引き出す新しい方法を提供し、プロキシのレーティングに特定のインタラクションを関連付けることができます。
1つは顧客レベルであり、もう1つは顧客間でのクリックアクションの集計レベルである。
どちらも、プロキシレーティングの増加を示す、すべてのペア、連続したアクションの比率で定義される。
この直感的な顧客レベルの指標は、時間の経過とともにレーティングのダイナミクスを拡大し、調査による顧客のレーティングよりも購入の予測が優れている。
集約レベルのメトリクスは、経験を補助したり、傷つけたりするアクションを特定できる。
まとめると、プロキシレーティングはクリックストリームから控えめに計算され、すべてのアクション、各顧客、各セッションは、調査の解釈可能で洞察に富んだ代替手段を提供することができる。
関連論文リスト
- Distributed Online Life-Long Learning (DOL3) for Multi-agent Trust and Reputation Assessment in E-commerce [4.060281689561971]
eコマースのような市民中心の環境におけるサービス提供者の信頼と評価は、エージェント間の相互作用の整合性を維持するために不可欠である。
本稿では,信頼度と評価スコアをリアルタイムに学習する分散オンラインライフロングラーニング(DOL3)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-21T21:37:55Z) - Analytical and Empirical Study of Herding Effects in Recommendation Systems [72.6693986712978]
評価アグリゲーションルールとショートリストされた代表レビューを用いて製品評価を管理する方法について検討する。
本稿では,Amazon と TripAdvisor の収束速度を向上させるために,適切な信頼度評価アグリゲーションルールが有効であることを示す。
論文 参考訳(メタデータ) (2024-08-20T14:29:23Z) - Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - How to Forget Clients in Federated Online Learning to Rank? [34.5695601040165]
本研究では,クライアントのコントリビューションを,全体的なランキングの有効性を損なうことなく,効果的かつ効率的なアンラーニング手法について検討する。
重要な課題は、モデルが削除を要求するクライアント$c*$からのコントリビューションを指示したかどうかを測定することである。
論文 参考訳(メタデータ) (2024-01-24T12:11:41Z) - Federated Learning via Consensus Mechanism on Heterogeneous Data: A New
Perspective on Convergence [8.849947967636336]
異種データ(非IIDデータ)に関するフェデレートラーニング(FL)は近年注目されている。
我々は,各トレーニングラウンド後の各クライアントに対するリスク低減を強制するコンセンサス機構を導入するFedCOMEを提案する。
理論的には、コンセンサス機構は、グローバルな目的の収束を保証することができる。
論文 参考訳(メタデータ) (2023-11-21T05:26:33Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - OpinSummEval: Revisiting Automated Evaluation for Opinion Summarization [52.720711541731205]
人間の判断と14の意見要約モデルからの出力からなるデータセットであるOpinSummEvalを提案する。
以上の結果から,ニューラルネットワークに基づく測定値が神経以外の測定値を上回っていることが示唆された。
論文 参考訳(メタデータ) (2023-10-27T13:09:54Z) - SIFN: A Sentiment-aware Interactive Fusion Network for Review-based Item
Recommendation [48.1799451277808]
本稿では、レビューに基づく項目推薦のための感性認識型インタラクティブフュージョンネットワーク(SIFN)を提案する。
まず、BERTを介してユーザ/イテムレビューをエンコードし、各レビューのセマンティックな特徴を抽出する軽量な感情学習者を提案する。
そこで我々は,感情学習者が明示的な感情ラベルを用いて感情認識特徴を抽出するための感情予測タスクを提案する。
論文 参考訳(メタデータ) (2021-08-18T08:04:38Z) - Classifying variety of customer's online engagement for churn prediction
with mixed-penalty logistic regression [0.0]
混合ペナルティ項を付加することによりロジスティック回帰の分類を促進する機械学習手法に基づく顧客チャーン率の新たな予測分析を提供する。
本研究では,提案手法の分析特性と計算上の優位性を示す。
論文 参考訳(メタデータ) (2021-05-17T08:40:34Z) - Graph Neural Networks to Predict Customer Satisfaction Following
Interactions with a Corporate Call Center [6.4047628200011815]
本研究は、着信後の顧客満足度を予測するための完全運用システムについて述べる。
このシステムは、電話の音声からテキストへの書き起こしを入力とし、電話後の調査で顧客から報告された着信満足度を予測する。
論文 参考訳(メタデータ) (2021-01-31T10:13:57Z) - Partial Bandit and Semi-Bandit: Making the Most Out of Scarce Users'
Feedback [62.997667081978825]
本稿では,ユーザのフィードバックを考慮し,3つの戦略を用いて評価する手法を提案する。
ユーザからのフィードバックが制限されているにも関わらず(全体の20%以下)、我々の手法は最先端のアプローチと同じような結果が得られる。
論文 参考訳(メタデータ) (2020-09-16T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。