論文の概要: Adaptive ABAC Policy Learning: A Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2105.08587v1
- Date: Tue, 18 May 2021 15:18:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-19 14:10:57.734080
- Title: Adaptive ABAC Policy Learning: A Reinforcement Learning Approach
- Title(参考訳): 適応型ABAC政策学習 : 強化学習アプローチ
- Authors: Leila Karimi, Mai Abdelhakim, James Joshi
- Abstract要約: 承認管理作業を自動化するための適応型ABACポリシー学習手法を提案する。
特に,承認エンジンがフィードバック制御ループを介してABACモデルを適応するコンテキスト的盗聴システムを提案する。
実例として,ホームIoT環境のための適応型ABACポリシー学習モデルの開発に重点を置いている。
- 参考スコア(独自算出の注目度): 2.5997274006052544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With rapid advances in computing systems, there is an increasing demand for
more effective and efficient access control (AC) approaches. Recently,
Attribute Based Access Control (ABAC) approaches have been shown to be
promising in fulfilling the AC needs of such emerging complex computing
environments. An ABAC model grants access to a requester based on attributes of
entities in a system and an authorization policy; however, its generality and
flexibility come with a higher cost. Further, increasing complexities of
organizational systems and the need for federated accesses to their resources
make the task of AC enforcement and management much more challenging. In this
paper, we propose an adaptive ABAC policy learning approach to automate the
authorization management task. We model ABAC policy learning as a reinforcement
learning problem. In particular, we propose a contextual bandit system, in
which an authorization engine adapts an ABAC model through a feedback control
loop; it relies on interacting with users/administrators of the system to
receive their feedback that assists the model in making authorization
decisions. We propose four methods for initializing the learning model and a
planning approach based on attribute value hierarchy to accelerate the learning
process. We focus on developing an adaptive ABAC policy learning model for a
home IoT environment as a running example. We evaluate our proposed approach
over real and synthetic data. We consider both complete and sparse datasets in
our evaluations. Our experimental results show that the proposed approach
achieves performance that is comparable to ones based on supervised learning in
many scenarios and even outperforms them in several situations.
- Abstract(参考訳): コンピュータシステムの急速な進歩により、より効率的かつ効率的なアクセス制御(AC)アプローチへの需要が高まっている。
近年、ABAC(Atribute Based Access Control)アプローチは、このような複雑なコンピューティング環境のACニーズを満たす上で有望であることが示されている。
abacモデルは、システム内のエンティティの属性と認可ポリシーに基づく要求者へのアクセスを許可するが、その汎用性と柔軟性はより高いコストを伴う。
さらに、組織システムの複雑さの増大とリソースへの連合的なアクセスの必要性により、ACの執行と管理がより困難になる。
本稿では,認証管理タスクを自動化するための適応型ABACポリシー学習手法を提案する。
abacポリシー学習を強化学習問題としてモデル化する。
特に,承認エンジンがフィードバック制御ループを介してABACモデルを適応させるコンテキスト的盗聴システムを提案する。
学習過程を高速化するために,属性値階層に基づく学習モデルと計画手法を初期化する4つの手法を提案する。
実例として,ホームIoT環境のための適応型ABACポリシー学習モデルの開発に注力する。
提案手法を実データおよび合成データに対して評価する。
評価において、完全なデータセットとスパースデータセットの両方を考慮する。
実験結果から,提案手法は,多くのシナリオにおける教師付き学習に基づくものと同等の性能を達成し,いくつかの状況でそれを上回る結果が得られた。
関連論文リスト
- Fast Context Adaptation in Cost-Aware Continual Learning [10.515324071327903]
5GとBeyondネットワークは、より複雑な学習エージェントを必要とし、学習プロセス自体が、コミュニケーションや計算リソースのためにユーザと競合することになるかもしれない。
一方、学習プロセスは、効率的な戦略に迅速に収束するためのリソースを必要とし、一方、学習プロセスは、ユーザのデータプレーンから可能な限り少ないリソースを取らずに、ユーザのリソースを損なわないように、効率的でなければならない。
本稿では,データプレーンに割り当てられたリソースと学習用に確保されたリソースのバランスをとるための動的戦略を提案する。
論文 参考訳(メタデータ) (2023-06-06T17:46:48Z) - Sparsity-Aware Intelligent Massive Random Access Control in Open RAN: A
Reinforcement Learning Based Approach [61.74489383629319]
新たなOpen Radio Access Network(O-RAN)におけるデバイスの大量ランダムアクセスは、アクセス制御と管理に大きな課題をもたらします。
閉ループアクセス制御の強化学習(RL)支援方式を提案する。
深部RL支援SAUDは、連続的かつ高次元の状態と行動空間を持つ複雑な環境を解決するために提案されている。
論文 参考訳(メタデータ) (2023-03-05T12:25:49Z) - Fully Decentralized Model-based Policy Optimization for Networked
Systems [23.46407780093797]
本研究の目的は,モデルベース学習によるマルチエージェント制御のデータ効率の向上である。
エージェントが協力的であり、隣人とのみローカルに通信するネットワークシステムについて検討する。
提案手法では,各エージェントが将来の状態を予測し,通信によって予測をブロードキャストする動的モデルを学習し,その後,モデルロールアウトに基づいてポリシーをトレーニングする。
論文 参考訳(メタデータ) (2022-07-13T23:52:14Z) - Toward Deep Learning Based Access Control [3.2511618464944547]
本稿では,ディープラーニング技術の大幅な進歩を活用して,DLBAC(Deep Learning Based Access Control)を提案する。
DLBACは補完し、長期的には、従来のアクセス制御モデルをニューラルネットワークで置き換える可能性さえある。
提案手法は,精度,一般化,説明可能性に関する問題に対処することで実現可能であることを示す。
論文 参考訳(メタデータ) (2022-03-28T22:05:11Z) - Unified Instance and Knowledge Alignment Pretraining for Aspect-based
Sentiment Analysis [96.53859361560505]
Aspect-based Sentiment Analysis (ABSA) は、ある側面に対する感情の極性を決定することを目的としている。
事前トレーニングと下流ABSAデータセットの間には、常に深刻なドメインシフトが存在する。
我々は,バニラ・プレトレイン・ファインチューンパイプラインにアライメント事前訓練フレームワークを導入する。
論文 参考訳(メタデータ) (2021-10-26T04:03:45Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Deep RL With Information Constrained Policies: Generalization in
Continuous Control [21.46148507577606]
情報フローに対する自然な制約は, 連続制御タスクにおいて, 人工エージェントに干渉する可能性があることを示す。
CLAC(Capacity-Limited Actor-Critic)アルゴリズムを実装した。
実験の結果、CLACは代替手法と比較して、トレーニング環境と修正テスト環境の一般化に改善をもたらすことがわかった。
論文 参考訳(メタデータ) (2020-10-09T15:42:21Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - An Automatic Attribute Based Access Control Policy Extraction from
Access Logs [5.142415132534397]
属性ベースのアクセス制御(ABAC)モデルは、複雑なシステムや動的システムの認証要求に対処するための、より柔軟なアプローチを提供する。
本稿では,システムへのアクセスログからABACポリシールールを自動的に学習し,ポリシー開発プロセスを簡素化する手法を提案する。
論文 参考訳(メタデータ) (2020-03-16T15:08:54Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。