論文の概要: Simulating and classifying behavior in adversarial environments based on
action-state traces: an application to money laundering
- arxiv url: http://arxiv.org/abs/2011.01826v1
- Date: Tue, 3 Nov 2020 16:30:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 05:00:51.976656
- Title: Simulating and classifying behavior in adversarial environments based on
action-state traces: an application to money laundering
- Title(参考訳): 行動状態トレースに基づく敵対的環境における行動のシミュレーションと分類:マネーロンダリングへの適用
- Authors: Daniel Borrajo, Manuela Veloso, Sameena Shah
- Abstract要約: 本稿では,このようなアプリケーション,特にアンチ・モニー・ラダーリングの文脈において,新しいアプローチを提案する。
我々は, 多様な, 現実的で新しい非観測行動が生成され, 潜在的非観測的行動を発見するメカニズムを提供する。
- 参考スコア(独自算出の注目度): 18.625578105241
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many business applications involve adversarial relationships in which both
sides adapt their strategies to optimize their opposing benefits. One of the
key characteristics of these applications is the wide range of strategies that
an adversary may choose as they adapt their strategy dynamically to sustain
benefits and evade authorities. In this paper, we present a novel way of
approaching these types of applications, in particular in the context of
Anti-Money Laundering. We provide a mechanism through which diverse, realistic
and new unobserved behavior may be generated to discover potential unobserved
adversarial actions to enable organizations to preemptively mitigate these
risks. In this regard, we make three main contributions. (a) Propose a novel
behavior-based model as opposed to individual transactions-based models
currently used by financial institutions. We introduce behavior traces as
enriched relational representation to represent observed human behavior. (b) A
modelling approach that observes these traces and is able to accurately infer
the goals of actors by classifying the behavior into money laundering or
standard behavior despite significant unobserved activity. And (c) a synthetic
behavior simulator that can generate new previously unseen traces. The
simulator incorporates a high level of flexibility in the behavioral parameters
so that we can challenge the detection algorithm. Finally, we provide
experimental results that show that the learning module (automated
investigator) that has only partial observability can still successfully infer
the type of behavior, and thus the simulated goals, followed by customers based
on traces - a key aspiration for many applications today.
- Abstract(参考訳): 多くのビジネスアプリケーションは、対立する利益を最適化するために双方が戦略に適応する敵関係を含む。
これらのアプリケーションの主な特徴の1つは、敵が利益の維持と権威の回避のために戦略を動的に適応する際に選択できる幅広い戦略である。
本稿では,このようなアプリケーション,特にアンチマネーロンダリングの文脈において,新たなアプローチ手法を提案する。
組織がこれらのリスクを事前に軽減するために、多様性があり、現実的で、新しく観察されていない行動を生成するメカニズムを提供する。
この点において、主な貢献は3つある。
(a)金融機関が現在使用している個別取引に基づくモデルとは対照的に、新たな行動に基づくモデルを提案する。
観察された人間の行動を表現するために,行動トレースを豊富な関係表現として導入する。
(b)これらの痕跡を観測し、有意な活動に拘わらずマネーロンダリングや標準的な行動に分類することにより、アクターの目標を正確に推測することができるモデリングアプローチ。
そして
(c)未確認の新たなトレースを生成する合成行動シミュレータ。
このシミュレータは行動パラメータに高いレベルの柔軟性を組み込んでおり、検出アルゴリズムに挑戦できる。
最後に、部分的可観測性しか持たない学習モジュール(自動調査員)が、依然として行動の種類を推測し、それによってシミュレーションされた目標を達成できることを示す実験結果を提供する。
関連論文リスト
- Learning Utilities from Demonstrations in Markov Decision Processes [18.205765143671858]
本稿では,実用機能を通じてエージェントのリスク態度を明確に表現する,マルコフ決定過程(MDP)の行動モデルを提案する。
そこで我々は,MDPにおける実演から実用機能を通じて符号化された,観察対象者のリスク態度を推定するタスクとして,ユーティリティ学習問題を定義した。
我々は, UL を有限データ型で証明可能な2つのアルゴリズムを考案し, サンプルの複雑さを解析する。
論文 参考訳(メタデータ) (2024-09-25T21:01:15Z) - Learning to Generate All Feasible Actions [4.333208181196761]
アクションマッピングは、学習プロセスを2つのステップに分割する新しいアプローチである。
本稿では、実現可能性モデルの自己教師型クエリにより、実現可能なすべてのアクションを生成することを学ぶことで、実現可能性部分に焦点を当てる。
エージェントが接続不能な実行可能なアクションセット間でアクションを生成する能力を示す。
論文 参考訳(メタデータ) (2023-01-26T23:15:51Z) - Emergent Behaviors in Multi-Agent Target Acquisition [0.0]
追従回避ゲームにおける強化学習(RL)を用いたマルチエージェントシステム(MAS)のシミュレーションを行う。
我々は、RL訓練された追跡者のポリシーを2つの異なる(非RL)分析戦略に置き換えることで、異なる敵シナリオを作成する。
このアプローチの斬新さは、基礎となるデータ規則性を明らかにする影響力のある機能セットの作成を伴います。
論文 参考訳(メタデータ) (2022-12-15T15:20:58Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Learning Self-Modulating Attention in Continuous Time Space with
Applications to Sequential Recommendation [102.24108167002252]
本稿では,複雑で非線形に進化する動的ユーザの嗜好をモデル化する,自己変調型注意ネットワークを提案する。
提案手法がトップNシーケンシャルなレコメンデーションタスクに与える影響を実証的に示すとともに,3つの大規模実世界のデータセットによる結果から,我々のモデルが最先端のパフォーマンスを達成できることを示す。
論文 参考訳(メタデータ) (2022-03-30T03:54:11Z) - Learning Complex Spatial Behaviours in ABM: An Experimental
Observational Study [0.0]
本稿では,創発的エージェント行動の生成にReinforcement Learningを適用する方法について検討する。
一連のシミュレーションを行ない, エージェントが実世界の知的適応行動の特性を示す方法として, プロクサマルポリシー最適化アルゴリズムを用いて訓練されたことを実証した。
論文 参考訳(メタデータ) (2022-01-04T11:56:11Z) - Deceptive Decision-Making Under Uncertainty [25.197098169762356]
タスクを遂行しながら,外部の観察者の意図を判断できる自律エージェントの設計について検討する。
エージェントの動作をマルコフ決定プロセスとしてモデル化することにより、エージェントが複数の潜在的な目標を達成するための設定を考える。
本稿では,最大エントロピーの原理に基づいて観測者予測をモデル化し,認識戦略を効率的に生成する手法を提案する。
論文 参考訳(メタデータ) (2021-09-14T14:56:23Z) - Online reinforcement learning with sparse rewards through an active
inference capsule [62.997667081978825]
本稿では,将来期待される新しい自由エネルギーを最小化するアクティブ推論エージェントを提案する。
我々のモデルは、非常に高いサンプル効率でスパース・リワード問題を解くことができる。
また、複雑な目的の表現を単純化する報奨関数から事前モデルを近似する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-06-04T10:03:36Z) - Generative Adversarial Reward Learning for Generalized Behavior Tendency
Inference [71.11416263370823]
ユーザの行動嗜好モデルのための生成的逆強化学習を提案する。
我々のモデルは,差別的アクター批判ネットワークとWasserstein GANに基づいて,ユーザの行動から報酬を自動的に学習することができる。
論文 参考訳(メタデータ) (2021-05-03T13:14:25Z) - Social NCE: Contrastive Learning of Socially-aware Motion
Representations [87.82126838588279]
実験結果から, 提案手法は最近の軌道予測, 行動クローニング, 強化学習アルゴリズムの衝突速度を劇的に低減することがわかった。
本手法は,ニューラルネットワークの設計に関する仮定をほとんど示さないため,神経運動モデルのロバスト性を促進する汎用的手法として使用できる。
論文 参考訳(メタデータ) (2020-12-21T22:25:06Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。