論文の概要: Personalized next-best action recommendation with multi-party
interaction learning for automated decision-making
- arxiv url: http://arxiv.org/abs/2108.08846v1
- Date: Thu, 19 Aug 2021 07:50:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-23 13:35:47.553017
- Title: Personalized next-best action recommendation with multi-party
interaction learning for automated decision-making
- Title(参考訳): 自動意思決定のための多人数インタラクション学習による個人化次善行動推薦
- Authors: Longbing Cao and Chengzhang Zhu
- Abstract要約: 我々は、強化結合型リカレントニューラルネットワーク(CRN)により、パーソナライズされた意思決定のための次善行動を学ぶためのデータ駆動型アプローチを提案する。
CRNは、顧客の過去の状態と現在の状態の複数の結合された動的シーケンス、意思決定者の行動に対する応答、行動に対する決定報酬、当事者間の長期的な複数シーケンスの相互作用を学ぶ。
次に、各顧客に対して、最適な意思決定目標のために状態を変更するための次善行動が推奨される。
- 参考スコア(独自算出の注目度): 34.18823199125134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated next-best action recommendation for each customer in a sequential,
dynamic and interactive context has been widely needed in natural, social and
business decision-making. Personalized next-best action recommendation must
involve past, current and future customer demographics and circumstances
(states) and behaviors, long-range sequential interactions between customers
and decision-makers, multi-sequence interactions between states, behaviors and
actions, and their reactions to their counterpart's actions. No existing
modeling theories and tools, including Markovian decision processes, user and
behavior modeling, deep sequential modeling, and personalized sequential
recommendation, can quantify such complex decision-making on a personal level.
We take a data-driven approach to learn the next-best actions for personalized
decision-making by a reinforced coupled recurrent neural network (CRN). CRN
represents multiple coupled dynamic sequences of a customer's historical and
current states, responses to decision-makers' actions, decision rewards to
actions, and learns long-term multi-sequence interactions between parties
(customer and decision-maker). Next-best actions are then recommended on each
customer at a time point to change their state for an optimal decision-making
objective. Our study demonstrates the potential of personalized deep learning
of multi-sequence interactions and automated dynamic intervention for
personalized decision-making in complex systems.
- Abstract(参考訳): ナチュラル、ソーシャル、ビジネスの意思決定において、逐次的、動的、インタラクティブなコンテキストで各顧客に対して、次善のアクションを推奨する自動化が広く求められている。
パーソナライズされた次のベストアクションレコメンデーションは、過去、現在、将来の顧客人口統計、状況(状態)、行動、顧客と意思決定者の間の長期的なシーケンシャルなインタラクション、状態、行動、行動の間の複数シーケンスインタラクション、相手の行動に対する反応を含む必要がある。
マルコフ決定過程、ユーザと振る舞いのモデリング、深いシーケンシャルモデリング、パーソナライズされたシーケンシャルレコメンデーションなど、既存のモデリング理論やツールは、このような複雑な意思決定を個人レベルで定量化することはできない。
強化結合型リカレントニューラルネットワーク(crn)によるパーソナライズ意思決定のための次の最善のアクションを学ぶために,データ駆動アプローチを採用する。
CRNは、顧客の過去の状態と現在の状態、意思決定者の行動に対する応答、行動に対する決定報酬、そして当事者(顧客と意思決定者)間の長期的な複数シーケンスの相互作用を学ぶ複数の動的シーケンスを表す。
次に、各顧客に対して最適な意思決定目標のために状態を変更するための次善行動が推奨される。
本研究は、複雑なシステムにおけるパーソナライズされた意思決定のための、複数シーケンスインタラクションのパーソナライズされたディープラーニングと自動動的介入の可能性を示す。
関連論文リスト
- DeepEMplanner: An End-to-End EM Motion Planner with Iterative
Interactions [62.115646173386324]
モーションプランニングは、他のエージェントの意図や遭遇する環境に応じて、エージェントが次の動きを継続的に計画するゲームと見なすことができる。
本稿では,DeepEMplannerという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-14T11:53:24Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - Generative Intrinsic Optimization: Intrinsic Control with Model Learning [5.439020425819001]
将来のシーケンスは、環境へのアクションの実行後の結果を表す。
明示的な成果は、クレジットの割り当てや模倣学習などの異なる目的のために、州、返却、軌跡によって異なりうる。
本稿では、相互情報をシームレスに組み込んだ政策スキームを提案し、最適な政策への収束を確保する。
論文 参考訳(メタデータ) (2023-10-12T07:50:37Z) - Inferring Preferences from Demonstrations in Multi-objective
Reinforcement Learning: A Dynamic Weight-based Approach [0.0]
多目的意思決定において、選好推論は、異なる目的のために意思決定者の選好を推測する過程である。
本研究では,多目的意思決定問題に作用するエージェントの選好を推測する動的重みに基づく選好推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-27T11:55:07Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - Learnable Strategies for Bilateral Agent Negotiation over Multiple
Issues [6.12762193927784]
本稿では,利己的なエージェントが複数の問題に対する交渉の仕方を学ぶことのできる,新たな二国間交渉モデルを提案する。
このモデルは、交渉中にエージェントが使うべき戦術を表す解釈可能な戦略テンプレートに依存している。
テンプレートパラメータを学習し、複数の交渉で受け取った平均効用を最大化し、最適な入札受理と生成をもたらす。
論文 参考訳(メタデータ) (2020-09-17T13:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。