論文の概要: Autonomous Capability Assessment of Black-Box Sequential Decision-Making
Systems
- arxiv url: http://arxiv.org/abs/2306.04806v1
- Date: Wed, 7 Jun 2023 22:05:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 17:23:46.614132
- Title: Autonomous Capability Assessment of Black-Box Sequential Decision-Making
Systems
- Title(参考訳): ブラックボックスシーケンシャル意思決定システムの自律能力評価
- Authors: Pulkit Verma, Rushang Karia, Siddharth Srivastava
- Abstract要約: ユーザは自分のAIシステムに何ができるかを理解し、安全に使用するためには不可能である。
本稿では,ブラックボックス型AIシステムにおいて,計画と動作が可能な能力をモデル化するための新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 32.887625885177385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is essential for users to understand what their AI systems can and can't
do in order to use them safely. However, the problem of enabling users to
assess AI systems with evolving sequential decision making (SDM) capabilities
is relatively understudied. This paper presents a new approach for modeling the
capabilities of black-box AI systems that can plan and act, along with the
possible effects and requirements for executing those capabilities in
stochastic settings. We present an active-learning approach that can
effectively interact with a black-box SDM system and learn an interpretable
probabilistic model describing its capabilities. Theoretical analysis of the
approach identifies the conditions under which the learning process is
guaranteed to converge to the correct model of the agent; empirical evaluations
on different agents and simulated scenarios show that this approach is few-shot
generalizable and can effectively describe the capabilities of arbitrary
black-box SDM agents in a sample-efficient manner.
- Abstract(参考訳): ユーザは自分のAIシステムに何ができるかを理解し、安全に使用するためには不可能である。
しかし、ユーザが進化するシーケンシャル意思決定(SDM)機能でAIシステムを評価することができるという問題は比較的検討されている。
本稿では,ブラックボックス型aiシステムの計画と動作をモデル化する新しい手法と,それらの能力が確率的な設定で実行するための効果と要件について述べる。
ブラックボックスのSDMシステムと効果的に対話し、その能力を記述する解釈可能な確率モデルを学ぶことができる能動的学習手法を提案する。
エージェントの正しいモデルに学習プロセスが収束することが保証されている条件を理論的に分析し、異なるエージェントに対する経験的評価とシミュレーションシナリオにより、このアプローチがほとんど一般化できず、サンプル効率の良い方法で任意のブラックボックスSDMエージェントの能力を効果的に記述できることを示した。
関連論文リスト
- Latent-Predictive Empowerment: Measuring Empowerment without a Simulator [56.53777237504011]
我々は、より実用的な方法でエンパワーメントを計算するアルゴリズムであるLatent-Predictive Empowerment(LPE)を提案する。
LPEは、スキルと国家間の相互情報の原則的な置き換えである目的を最大化することで、大きなスキルセットを学習する。
論文 参考訳(メタデータ) (2024-10-15T00:41:18Z) - On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.75164588939185]
複数モーダルな)自己教師付き表現学習のための連続領域における識別確率モデル問題について検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
論文 参考訳(メタデータ) (2024-10-11T18:02:46Z) - Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文 参考訳(メタデータ) (2024-06-12T08:48:06Z) - Multi-Agent Verification and Control with Probabilistic Model Checking [4.56877715768796]
確率的モデルチェック(probabilistic model check)は、ソフトウェアやハードウェアシステムに関する公式な自動推論手法である。
論理学、オートマトン、グラフ理論から最適化、数値法、制御に至るまで、様々な分野のアイデアと技術に基づいて構築される。
近年ではゲーム理論のアイデアを統合するために確率的モデル検査も拡張されている。
論文 参考訳(メタデータ) (2023-08-05T09:31:32Z) - ComplAI: Theory of A Unified Framework for Multi-factor Assessment of
Black-Box Supervised Machine Learning Models [6.279863832853343]
ComplAIは、説明可能性、堅牢性、パフォーマンス、公正性、モデル行動を有効にし、観察し、分析し、定量化するユニークなフレームワークである。
教師付き機械学習モデルの評価は、正しい予測を行う能力だけでなく、全体的な責任の観点から行う。
論文 参考訳(メタデータ) (2022-12-30T08:48:19Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - Differential Assessment of Black-Box AI Agents [29.98710357871698]
従来知られていたモデルから逸脱したブラックボックスAIエージェントを差分評価する手法を提案する。
我々は,漂流エージェントの現在の挙動と初期モデルの知識の疎度な観察を利用して,アクティブなクエリポリシーを生成する。
経験的評価は、エージェントモデルをスクラッチから再学習するよりも、我々のアプローチの方がはるかに効率的であることを示している。
論文 参考訳(メタデータ) (2022-03-24T17:48:58Z) - Learning Causal Models of Autonomous Agents using Interventions [11.351235628684252]
我々は、AIシステムがシミュレータで高レベルの命令シーケンスを実行することができるエージェントアセスメントモジュールの分析を拡張した。
このような原始的なクエリ応答能力は、システムのユーザ解釈可能な因果関係モデルを効率的に導出するのに十分であることを示す。
論文 参考訳(メタデータ) (2021-08-21T21:33:26Z) - Learning User-Interpretable Descriptions of Black-Box AI System
Capabilities [9.608555640607731]
本稿では,ブラックボックスAIシステムの限界と能力について,ユーザ解釈可能な記号記述を学習するためのアプローチを提案する。
階層的なアクティブクエリパラダイムを使用して質問を生成し、その応答に基づいてAIシステムのユーザ解釈可能なモデルを学ぶ。
論文 参考訳(メタデータ) (2021-07-28T23:33:31Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。
我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。
アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文 参考訳(メタデータ) (2020-06-12T10:40:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。