論文の概要: Structure Mapping for Transferability of Causal Models
- arxiv url: http://arxiv.org/abs/2007.09445v1
- Date: Sat, 18 Jul 2020 14:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 05:06:51.630635
- Title: Structure Mapping for Transferability of Causal Models
- Title(参考訳): 因果モデルの伝達性に関する構造マッピング
- Authors: Purva Pruthi, Javier Gonz\'alez, Xiaoyu Lu, Madalina Fiterau
- Abstract要約: オブジェクト指向表現を用いた伝達学習フレームワークを設計し,対象間の因果関係を学習する。
学習された因果ダイナミクスモデルは、オブジェクト間の交換可能な知覚的特徴を持つ環境の変種間の移動に使用できる。
- 参考スコア(独自算出の注目度): 10.697752818461893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human beings learn causal models and constantly use them to transfer
knowledge between similar environments. We use this intuition to design a
transfer-learning framework using object-oriented representations to learn the
causal relationships between objects. A learned causal dynamics model can be
used to transfer between variants of an environment with exchangeable
perceptual features among objects but with the same underlying causal dynamics.
We adapt continuous optimization for structure learning techniques to
explicitly learn the cause and effects of the actions in an interactive
environment and transfer to the target domain by categorization of the objects
based on causal knowledge. We demonstrate the advantages of our approach in a
gridworld setting by combining causal model-based approach with model-free
approach in reinforcement learning.
- Abstract(参考訳): 人間は因果モデルを学び、それを使って類似した環境間で知識を伝達する。
この直観を用いて,オブジェクト指向表現を用いたトランスファー学習フレームワークを設計し,オブジェクト間の因果関係を学習する。
学習された因果ダイナミクスモデルは、オブジェクト間の交換可能な知覚的特徴を持つ環境の変種間の移動に使用できるが、基礎となる因果ダイナミクスは同じである。
対話型環境における行動の原因と効果を明示的に学習し,因果知識に基づく対象の分類によって対象領域へ移行するために,構造学習手法に対する連続最適化を適用する。
強化学習において,因果モデルに基づくアプローチとモデルフリーアプローチを組み合わせたグリッドワールド環境において,このアプローチの利点を示す。
関連論文リスト
- Fine-Grained Causal Dynamics Learning with Quantization for Improving Robustness in Reinforcement Learning [26.34622544479565]
因果ダイナミクス学習は、強化学習における堅牢性を高めるための有望なアプローチである。
本稿では,微粒な因果構造を推定し,それらを予測に利用する新しいモデルを提案する。
論文 参考訳(メタデータ) (2024-06-05T13:13:58Z) - MergeNet: Knowledge Migration across Heterogeneous Models, Tasks, and Modalities [72.68829963458408]
異種モデルのパラメータ空間のギャップを埋めることを学ぶMergeNetを提案する。
MergeNetの中核となるメカニズムはパラメータアダプタにあり、ソースモデルの低ランクパラメータをクエリすることで動作する。
MergeNetは両方のモデルと共に学習され、我々のフレームワークは、現在のステージに関する知識を動的に転送し、適応することができます。
論文 参考訳(メタデータ) (2024-04-20T08:34:39Z) - Mitigating Object Dependencies: Improving Point Cloud Self-Supervised Learning through Object Exchange [50.45953583802282]
我々は,ポイントクラウドシーン理解のための新たな自己教師型学習(SSL)戦略を導入する。
このアプローチでは、オブジェクトパターンとコンテキストキューの両方を活用して、堅牢な機能を生成します。
提案手法は既存のSSL技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-11T06:39:53Z) - Common Knowledge Learning for Generating Transferable Adversarial
Examples [60.1287733223249]
本稿では,代用(ソース)モデルにより敵のサンプルを生成するブラックボックス攻撃の重要タイプに着目した。
既存の手法では、ソースモデルとターゲットモデルが異なるタイプのDNNアーキテクチャのものである場合、不満足な逆転が生じる傾向にある。
本稿では,より優れたネットワーク重みを学習し,敵対的な例を生成するための共通知識学習(CKL)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-01T09:07:12Z) - Dynamic Modeling of Hand-Object Interactions via Tactile Sensing [133.52375730875696]
本研究では,高分解能な触覚グローブを用いて,多種多様な物体に対して4種類のインタラクティブな動作を行う。
我々は,クロスモーダル学習フレームワーク上にモデルを構築し,視覚処理パイプラインを用いてラベルを生成し,触覚モデルを監督する。
この研究は、高密度触覚センシングによる手動物体相互作用における動的モデリングの一歩を踏み出す。
論文 参考訳(メタデータ) (2021-09-09T16:04:14Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Learning Predictive Representations for Deformable Objects Using
Contrastive Estimation [83.16948429592621]
視覚表現モデルと動的モデルの両方を協調的に最適化する新しい学習フレームワークを提案する。
我々は,標準モデルに基づく学習手法をロープや布の操作スイートで大幅に改善した。
論文 参考訳(メタデータ) (2020-03-11T17:55:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。