論文の概要: Personalized next-best action recommendation with multi-party
interaction learning for automated decision-making
- arxiv url: http://arxiv.org/abs/2108.08846v1
- Date: Thu, 19 Aug 2021 07:50:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-23 13:35:47.553017
- Title: Personalized next-best action recommendation with multi-party
interaction learning for automated decision-making
- Title(参考訳): 自動意思決定のための多人数インタラクション学習による個人化次善行動推薦
- Authors: Longbing Cao and Chengzhang Zhu
- Abstract要約: 我々は、強化結合型リカレントニューラルネットワーク(CRN)により、パーソナライズされた意思決定のための次善行動を学ぶためのデータ駆動型アプローチを提案する。
CRNは、顧客の過去の状態と現在の状態の複数の結合された動的シーケンス、意思決定者の行動に対する応答、行動に対する決定報酬、当事者間の長期的な複数シーケンスの相互作用を学ぶ。
次に、各顧客に対して、最適な意思決定目標のために状態を変更するための次善行動が推奨される。
- 参考スコア(独自算出の注目度): 34.18823199125134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated next-best action recommendation for each customer in a sequential,
dynamic and interactive context has been widely needed in natural, social and
business decision-making. Personalized next-best action recommendation must
involve past, current and future customer demographics and circumstances
(states) and behaviors, long-range sequential interactions between customers
and decision-makers, multi-sequence interactions between states, behaviors and
actions, and their reactions to their counterpart's actions. No existing
modeling theories and tools, including Markovian decision processes, user and
behavior modeling, deep sequential modeling, and personalized sequential
recommendation, can quantify such complex decision-making on a personal level.
We take a data-driven approach to learn the next-best actions for personalized
decision-making by a reinforced coupled recurrent neural network (CRN). CRN
represents multiple coupled dynamic sequences of a customer's historical and
current states, responses to decision-makers' actions, decision rewards to
actions, and learns long-term multi-sequence interactions between parties
(customer and decision-maker). Next-best actions are then recommended on each
customer at a time point to change their state for an optimal decision-making
objective. Our study demonstrates the potential of personalized deep learning
of multi-sequence interactions and automated dynamic intervention for
personalized decision-making in complex systems.
- Abstract(参考訳): ナチュラル、ソーシャル、ビジネスの意思決定において、逐次的、動的、インタラクティブなコンテキストで各顧客に対して、次善のアクションを推奨する自動化が広く求められている。
パーソナライズされた次のベストアクションレコメンデーションは、過去、現在、将来の顧客人口統計、状況(状態)、行動、顧客と意思決定者の間の長期的なシーケンシャルなインタラクション、状態、行動、行動の間の複数シーケンスインタラクション、相手の行動に対する反応を含む必要がある。
マルコフ決定過程、ユーザと振る舞いのモデリング、深いシーケンシャルモデリング、パーソナライズされたシーケンシャルレコメンデーションなど、既存のモデリング理論やツールは、このような複雑な意思決定を個人レベルで定量化することはできない。
強化結合型リカレントニューラルネットワーク(crn)によるパーソナライズ意思決定のための次の最善のアクションを学ぶために,データ駆動アプローチを採用する。
CRNは、顧客の過去の状態と現在の状態、意思決定者の行動に対する応答、行動に対する決定報酬、そして当事者(顧客と意思決定者)間の長期的な複数シーケンスの相互作用を学ぶ複数の動的シーケンスを表す。
次に、各顧客に対して最適な意思決定目標のために状態を変更するための次善行動が推奨される。
本研究は、複雑なシステムにおけるパーソナライズされた意思決定のための、複数シーケンスインタラクションのパーソナライズされたディープラーニングと自動動的介入の可能性を示す。
関連論文リスト
- Multi-Grained Preference Enhanced Transformer for Multi-Behavior Sequential Recommendation [29.97854124851886]
シークエンシャルレコメンデーションは,過去のユーザ・イテムインタラクションから学んだユーザの動的嗜好に基づいて,次の購入項目を予測することを目的としている。
既存のメソッドは振る舞いレベルやアイテムレベルでのみ異種なマルチ振る舞いの依存関係をモデル化します。
これらの課題に対処するために,M-GPT(Multi-Grained Preference enhanced Transformer framework)を提案する。
論文 参考訳(メタデータ) (2024-11-19T02:45:17Z) - ADESSE: Advice Explanations in Complex Repeated Decision-Making Environments [14.105935964906976]
この研究は、インテリジェントなエージェントが人間の意思決定者にアドバイスを提供するような問題設定について考察する。
我々は,人的信頼と意思決定を改善するためのアドバイザーエージェントの説明を生成するために,ADESSEというアプローチを開発した。
論文 参考訳(メタデータ) (2024-05-31T08:59:20Z) - Contrastive Learning Method for Sequential Recommendation based on Multi-Intention Disentanglement [5.734747179463411]
MIDCL(Multi-Intention Disentanglement)に基づくコントラスト学習シーケンシャルレコメンデーション手法を提案する。
私たちの仕事では、意図は動的で多様なものとして認識され、ユーザの振る舞いは、しばしば現在のマルチインテンションによって駆動されます。
本稿では,最も関連性の高いユーザの対話的意図の探索と,正のサンプル対の相互情報の最大化のための2種類のコントラスト学習パラダイムを提案する。
論文 参考訳(メタデータ) (2024-04-28T15:13:36Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - Inferring Preferences from Demonstrations in Multi-objective
Reinforcement Learning: A Dynamic Weight-based Approach [0.0]
多目的意思決定において、選好推論は、異なる目的のために意思決定者の選好を推測する過程である。
本研究では,多目的意思決定問題に作用するエージェントの選好を推測する動的重みに基づく選好推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-27T11:55:07Z) - Multi-Behavior Sequential Recommendation with Temporal Graph Transformer [66.10169268762014]
マルチビヘイビア・インタラクティブなパターンを意識した動的ユーザ・イテム関係学習に取り組む。
本稿では,動的短期および長期のユーザ・イテム対話パターンを共同でキャプチャする,TGT(Temporal Graph Transformer)レコメンデーションフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-06T15:42:54Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。