論文の概要: Can Interpretable Reinforcement Learning Manage Assets Your Way?
- arxiv url: http://arxiv.org/abs/2202.09064v1
- Date: Fri, 18 Feb 2022 07:59:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-21 13:12:59.435693
- Title: Can Interpretable Reinforcement Learning Manage Assets Your Way?
- Title(参考訳): 解釈可能な強化学習は資産を管理することができるか?
- Authors: Charl Maree and Christian Omlin
- Abstract要約: マシンラーニングは、顧客のニーズや好みを深く理解し、調整する、という約束を守ります。
我々は、本質的に解釈可能な強化学習エージェントを訓練し、プロトタイプの財務的性格特性に合わせた投資アドバイスを行う。
我々は、訓練されたエージェントのアドバイスが、意図した特性に固執していること、そして、明確な言及なしに、リスクの概念と、政策の収束性の改善を観察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personalisation of products and services is fast becoming the driver of
success in banking and commerce. Machine learning holds the promise of gaining
a deeper understanding of and tailoring to customers' needs and preferences.
Whereas traditional solutions to financial decision problems frequently rely on
model assumptions, reinforcement learning is able to exploit large amounts of
data to improve customer modelling and decision-making in complex financial
environments with fewer assumptions. Model explainability and interpretability
present challenges from a regulatory perspective which demands transparency for
acceptance; they also offer the opportunity for improved insight into and
understanding of customers. Post-hoc approaches are typically used for
explaining pretrained reinforcement learning models. Based on our previous
modeling of customer spending behaviour, we adapt our recent reinforcement
learning algorithm that intrinsically characterizes desirable behaviours and we
transition to the problem of asset management. We train inherently
interpretable reinforcement learning agents to give investment advice that is
aligned with prototype financial personality traits which are combined to make
a final recommendation. We observe that the trained agents' advice adheres to
their intended characteristics, they learn the value of compound growth, and,
without any explicit reference, the notion of risk as well as improved policy
convergence.
- Abstract(参考訳): 製品やサービスのパーソナライゼーションは、銀行や商取引の成功の原動力になりつつある。
機械学習は、顧客のニーズと好みをより深く理解し、調整するという約束を持っている。
金融決定問題に対する従来のソリューションは、しばしばモデル前提に依存するが、強化学習は、複雑な金融環境で顧客のモデリングと意思決定を改善するために大量のデータを活用することができる。
モデル説明可能性と解釈可能性(英語版)は、受け入れの透明性を要求する規制の観点からの課題を提示し、顧客に対する洞察と理解を改善する機会を提供する。
ポストホックアプローチは通常、事前訓練された強化学習モデルを説明するために使用される。
これまでの顧客消費行動のモデル化に基づいて、本質的に望ましい行動を特徴付ける最近の強化学習アルゴリズムを適用し、資産管理の問題に移行する。
自己解釈可能な強化学習エージェントを訓練し,ファイナンシャルパーソナリティのプロトタイプと整合した投資アドバイスを行い,最終推薦を行う。
我々は、訓練されたエージェントのアドバイスが意図した特性に固執し、複合的な成長の価値を学習し、明確な言及なしにリスクの概念と政策の収束を改善することを観察する。
関連論文リスト
- Latent-Predictive Empowerment: Measuring Empowerment without a Simulator [56.53777237504011]
我々は、より実用的な方法でエンパワーメントを計算するアルゴリズムであるLatent-Predictive Empowerment(LPE)を提案する。
LPEは、スキルと国家間の相互情報の原則的な置き換えである目的を最大化することで、大きなスキルセットを学習する。
論文 参考訳(メタデータ) (2024-10-15T00:41:18Z) - A Hypothesis on Good Practices for AI-based Systems for Financial Time
Series Forecasting: Towards Domain-Driven XAI Methods [0.0]
機械学習とディープラーニングは、財務予測や予測タスクでますます普及している。
これらのモデルは透明性と解釈可能性に欠けることが多く、金融のような繊細なドメインでの使用を困難にしている。
本稿では、金融のためのAIベースのシステムに説明可能性を展開するための優れた実践について考察する。
論文 参考訳(メタデータ) (2023-11-13T17:56:45Z) - ExpeL: LLM Agents Are Experiential Learners [60.54312035818746]
実験学習エージェント(ExpeL)を導入し、パラメトリック更新を必要とせずにエージェント体験から学習できるようにする。
我々のエージェントは、経験を自律的に収集し、学習課題の集合から自然言語を用いて知識を抽出する。
推論において、エージェントは抽出された洞察と過去の経験をリコールし、情報的決定を行う。
論文 参考訳(メタデータ) (2023-08-20T03:03:34Z) - Optimizing Credit Limit Adjustments Under Adversarial Goals Using
Reinforcement Learning [42.303733194571905]
我々は、強化学習技術を用いて最適なクレジットカード制限調整ポリシーを発見し、自動化することを模索する。
本研究は、信用限度調整に強化学習フレームワークを適用するための概念構造を確立する。
論文 参考訳(メタデータ) (2023-06-27T16:10:36Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - MERMAIDE: Learning to Align Learners using Model-Based Meta-Learning [62.065503126104126]
本研究では,先見のつかない学習エージェントの報酬を効率よく効果的に介入し,望ましい結果を導き出す方法について検討する。
これはオークションや課税のような現実世界の多くの設定に関係しており、プリンシパルは学習行動や実際の人々の報酬を知らないかもしれない。
モデルに基づくメタ学習フレームワークであるMERMAIDEを導入し,配布外エージェントに迅速に適応できるプリンシパルを訓練する。
論文 参考訳(メタデータ) (2023-04-10T15:44:50Z) - Customer Churn Prediction Model using Explainable Machine Learning [0.0]
この論文の主な目的は、チャーンする可能性が最も高い潜在的な顧客を予測するのに役立つ、ユニークな顧客チャーン予測モデルを開発することである。
各種木に基づく機械学習手法とアルゴリズムの性能評価と解析を行った。
モデル説明可能性と透明性を改善するため,提案手法では,特徴の組合せについてシェープ値を計算する手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T04:45:57Z) - Uncertainty as a Form of Transparency: Measuring, Communicating, and
Using Uncertainty [66.17147341354577]
我々は,モデル予測に関連する不確実性を推定し,伝達することにより,相補的な透明性の形式を考えることについて議論する。
モデルの不公平性を緩和し、意思決定を強化し、信頼できるシステムを構築するために不確実性がどのように使われるかを説明する。
この研究は、機械学習、可視化/HCI、デザイン、意思決定、公平性にまたがる文学から引き出された学際的レビューを構成する。
論文 参考訳(メタデータ) (2020-11-15T17:26:14Z) - Friendship is All we Need: A Multi-graph Embedding Approach for Modeling
Customer Behavior [1.181206257787103]
顧客を非線形に表現するためのマルチグラフ埋め込み手法を提案する。
我々は,友人関係の情報を入手することでのみ,ユーザの将来の行動を合理的に予測することができる。
論文 参考訳(メタデータ) (2020-10-06T14:50:05Z) - Importance Weighted Policy Learning and Adaptation [89.46467771037054]
政治外学習の最近の進歩の上に構築された,概念的にシンプルで,汎用的で,モジュール的な補完的アプローチについて検討する。
このフレームワークは確率論的推論文学のアイデアにインスパイアされ、堅牢な非政治学習と事前の行動を組み合わせる。
提案手法は,メタ強化学習ベースラインと比較して,ホールドアウトタスクにおける競合適応性能を実現し,複雑なスパース・リワードシナリオにスケールすることができる。
論文 参考訳(メタデータ) (2020-09-10T14:16:58Z) - How to Learn from Others: Transfer Machine Learning with Additive
Regression Models to Improve Sales Forecasting [0.0]
加算回帰モデルに基づく移動機械学習手法を提案する。
レストランの複数の支店の多年多様なデータセットに対するアプローチを評価した。
その結果,分析知識を総合的に活用するアプローチの可能性が示された。
論文 参考訳(メタデータ) (2020-05-15T15:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。