論文の概要: Counterfactual Data Augmentation using Locally Factored Dynamics
- arxiv url: http://arxiv.org/abs/2007.02863v2
- Date: Thu, 3 Dec 2020 23:50:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 01:07:17.113905
- Title: Counterfactual Data Augmentation using Locally Factored Dynamics
- Title(参考訳): 局所因子ダイナミクスを用いた実測データ拡張
- Authors: Silviu Pitis, Elliot Creager, Animesh Garg
- Abstract要約: 局所因果構造を利用して、シーケンス予測と非政治強化学習のサンプル効率を向上させることができる。
本稿では,これらの構造をオブジェクト指向の状態表現として推定する手法と,対実データ拡張のための新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 44.37487079747397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many dynamic processes, including common scenarios in robotic control and
reinforcement learning (RL), involve a set of interacting subprocesses. Though
the subprocesses are not independent, their interactions are often sparse, and
the dynamics at any given time step can often be decomposed into locally
independent causal mechanisms. Such local causal structures can be leveraged to
improve the sample efficiency of sequence prediction and off-policy
reinforcement learning. We formalize this by introducing local causal models
(LCMs), which are induced from a global causal model by conditioning on a
subset of the state space. We propose an approach to inferring these structures
given an object-oriented state representation, as well as a novel algorithm for
Counterfactual Data Augmentation (CoDA). CoDA uses local structures and an
experience replay to generate counterfactual experiences that are causally
valid in the global model. We find that CoDA significantly improves the
performance of RL agents in locally factored tasks, including the
batch-constrained and goal-conditioned settings.
- Abstract(参考訳): ロボット制御と強化学習(RL)の一般的なシナリオを含む多くの動的プロセスは、相互作用するサブプロセスのセットを含む。
サブプロセスは独立ではないが、相互作用はしばしば疎結合であり、任意の時間ステップにおけるダイナミクスは、しばしば局所的に独立した因果機構に分解される。
このような局所因果構造を利用して、シーケンス予測とオフポリシー強化学習のサンプル効率を向上させることができる。
状態空間のサブセットに条件付けすることで大域因果モデルから誘導される局所因果モデル(LCM)を導入することでこれを形式化する。
本稿では,これらの構造をオブジェクト指向の状態表現として推定する手法と,CoDA(Coerfactual Data Augmentation)のための新しいアルゴリズムを提案する。
CoDAは、グローバルモデルにおいて因果的に有効な反ファクト体験を生成するために、ローカル構造と経験リプレイを使用する。
CoDAはバッチ制約やゴール条件の設定を含むローカルファクタリングタスクにおけるRLエージェントの性能を大幅に改善する。
関連論文リスト
- STAT: Towards Generalizable Temporal Action Localization [56.634561073746056]
WTAL(Wakly-supervised temporal action Localization)は、ビデオレベルのラベルだけでアクションインスタンスを認識およびローカライズすることを目的としている。
既存の手法は、異なる分布に転送する際の重大な性能劣化に悩まされる。
本稿では,アクションローカライズ手法の一般化性向上に焦点を当てたGTALを提案する。
論文 参考訳(メタデータ) (2024-04-20T07:56:21Z) - A Neuromorphic Architecture for Reinforcement Learning from Real-Valued
Observations [0.34410212782758043]
強化学習(RL)は複雑な環境における意思決定のための強力なフレームワークを提供する。
本稿では,実測値を用いてRL問題を解くための新しいスパイキングニューラルネットワーク(SNN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-07-06T12:33:34Z) - ASR: Attention-alike Structural Re-parameterization [53.019657810468026]
本稿では,アテンション機構の有効性を享受しながら,与えられたネットワークに対してSRPを実現するための,シンプルなアテンション型構造的再パラメータ化(ASR)を提案する。
本稿では,統計的観点から広範囲にわたる実験を行い,Stripe Observationという興味深い現象を発見し,チャネル注意値が訓練中に一定のベクトルに素早く接近することを明らかにする。
論文 参考訳(メタデータ) (2023-04-13T08:52:34Z) - MoCoDA: Model-based Counterfactual Data Augmentation [40.878444530293635]
遷移力学における局所因数分解の認識と利用は、多目的推論の力を解き放つ上で重要な要素であると主張する。
局所構造を知ることで、このダイナミクスモデルが一般化する、目に見えない状態や動作を予測することもできます。
我々は、MoCoDAにより、RLエージェントが、目に見えない状態や行動に一般化するポリシーを学ぶことができることを示す。
論文 参考訳(メタデータ) (2022-10-20T14:09:48Z) - Change Detection for Local Explainability in Evolving Data Streams [72.4816340552763]
局所的特徴帰属法はポストホックやモデルに依存しない説明法として人気がある。
ローカルな属性が、ストリーミングやオンラインアプリケーションのような、現実的で絶えず変化する設定でどのように振る舞うかは、しばしば不明である。
局所変化と概念ドリフトを検出するフレキシブルでモデルに依存しないCDLEEDSを提案する。
論文 参考訳(メタデータ) (2022-09-06T18:38:34Z) - Cross-modal Consensus Network for Weakly Supervised Temporal Action
Localization [74.34699679568818]
時間的行動局所化 (WS-TAL) は、ビデオレベルの分類的監督によって、ビデオ内のアクションインスタンスをローカライズすることを目的とした課題である。
この問題に対処するためのクロスモーダルコンセンサスネットワーク(CO2-Net)を提案する。
論文 参考訳(メタデータ) (2021-07-27T04:21:01Z) - State, global and local parameter estimation using local ensemble Kalman
filters: applications to online machine learning of chaotic dynamics [0.0]
より系統的に、共分散ローカライゼーションまたは局所領域を持つ局所アンサンブルカルマンフィルタを使用する可能性について検討する。
グローバルパラメータは代理ダイナミクスを表すことを意図しており、局所パラメータはモデルの強制力を表すのが一般的である。
本稿ではより一般的に,グローバルモデルパラメータとローカルモデルパラメータの両方をオンラインで推定する上で重要な課題について論じる。
論文 参考訳(メタデータ) (2021-07-23T14:12:20Z) - Region-based Non-local Operation for Video Classification [11.746833714322154]
本稿では,地域別非局所的(RNL)操作を自己注意機構のファミリーとして提案する。
チャネルアテンションモジュールと提案したRNLを組み合わせることで,市販のCNNに組み込んだアテンションチェーンを設計し,エンドツーエンドのトレーニングを行う。
提案手法の実験結果は,他の注意機構よりも優れており,Something V1データセット上での最先端性能を実現している。
論文 参考訳(メタデータ) (2020-07-17T14:57:05Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z) - Robust Federated Learning Through Representation Matching and Adaptive
Hyper-parameters [5.319361976450981]
フェデレーション学習(Federated Learning)は、複数のクライアントに属するデータに対して単一のモデルをトレーニングする、分散されたプライバシ対応の学習シナリオである。
現在のフェデレーション学習手法は、異種クライアント側データ分散に苦慮している。
本稿では,局所モデルのばらつきを低減する表現マッチング手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T20:19:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。