論文の概要: Structure Mapping for Transferability of Causal Models
- arxiv url: http://arxiv.org/abs/2007.09445v1
- Date: Sat, 18 Jul 2020 14:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 05:06:51.630635
- Title: Structure Mapping for Transferability of Causal Models
- Title(参考訳): 因果モデルの伝達性に関する構造マッピング
- Authors: Purva Pruthi, Javier Gonz\'alez, Xiaoyu Lu, Madalina Fiterau
- Abstract要約: オブジェクト指向表現を用いた伝達学習フレームワークを設計し,対象間の因果関係を学習する。
学習された因果ダイナミクスモデルは、オブジェクト間の交換可能な知覚的特徴を持つ環境の変種間の移動に使用できる。
- 参考スコア(独自算出の注目度): 10.697752818461893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human beings learn causal models and constantly use them to transfer
knowledge between similar environments. We use this intuition to design a
transfer-learning framework using object-oriented representations to learn the
causal relationships between objects. A learned causal dynamics model can be
used to transfer between variants of an environment with exchangeable
perceptual features among objects but with the same underlying causal dynamics.
We adapt continuous optimization for structure learning techniques to
explicitly learn the cause and effects of the actions in an interactive
environment and transfer to the target domain by categorization of the objects
based on causal knowledge. We demonstrate the advantages of our approach in a
gridworld setting by combining causal model-based approach with model-free
approach in reinforcement learning.
- Abstract(参考訳): 人間は因果モデルを学び、それを使って類似した環境間で知識を伝達する。
この直観を用いて,オブジェクト指向表現を用いたトランスファー学習フレームワークを設計し,オブジェクト間の因果関係を学習する。
学習された因果ダイナミクスモデルは、オブジェクト間の交換可能な知覚的特徴を持つ環境の変種間の移動に使用できるが、基礎となる因果ダイナミクスは同じである。
対話型環境における行動の原因と効果を明示的に学習し,因果知識に基づく対象の分類によって対象領域へ移行するために,構造学習手法に対する連続最適化を適用する。
強化学習において,因果モデルに基づくアプローチとモデルフリーアプローチを組み合わせたグリッドワールド環境において,このアプローチの利点を示す。
関連論文リスト
- Learning Extrinsic Dexterity with Parameterized Manipulation Primitives [9.528351777701811]
我々は、オブジェクトのポーズを変えるために環境を利用する一連のアクションを学習する。
我々のアプローチは、オブジェクトとグリップと環境の間の相互作用を利用してオブジェクトの状態を制御することができる。
拘束されたテーブルトップワークスペースから様々な重量,形状,摩擦特性の箱状物体を選別する手法の評価を行った。
論文 参考訳(メタデータ) (2023-10-26T21:28:23Z) - Common Knowledge Learning for Generating Transferable Adversarial
Examples [60.1287733223249]
本稿では,代用(ソース)モデルにより敵のサンプルを生成するブラックボックス攻撃の重要タイプに着目した。
既存の手法では、ソースモデルとターゲットモデルが異なるタイプのDNNアーキテクチャのものである場合、不満足な逆転が生じる傾向にある。
本稿では,より優れたネットワーク重みを学習し,敵対的な例を生成するための共通知識学習(CKL)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-01T09:07:12Z) - Similarity of Neural Architectures using Adversarial Attack
Transferability [50.50231315195932]
ニューラルネットワーク間の定量的かつスケーラブルな類似度尺度を設計する。
我々は69の最先端画像ネット分類器を大規模に解析する。
我々の結果は、異なるコンポーネントを持つ多様なニューラルアーキテクチャの開発がなぜ必要かについての洞察を提供する。
論文 参考訳(メタデータ) (2022-10-20T16:56:47Z) - Dynamic Modeling of Hand-Object Interactions via Tactile Sensing [133.52375730875696]
本研究では,高分解能な触覚グローブを用いて,多種多様な物体に対して4種類のインタラクティブな動作を行う。
我々は,クロスモーダル学習フレームワーク上にモデルを構築し,視覚処理パイプラインを用いてラベルを生成し,触覚モデルを監督する。
この研究は、高密度触覚センシングによる手動物体相互作用における動的モデリングの一歩を踏み出す。
論文 参考訳(メタデータ) (2021-09-09T16:04:14Z) - Structure-Regularized Attention for Deformable Object Representation [17.120035855774344]
文脈依存のキャプチャは、ディープニューラルネットワークの表現力を改善するのに有用であることが証明されている。
自己注意や非局所操作といったグローバルコンテキストのモデリングに焦点をあてた近年のアプローチは、要素間の制約のないペアワイズ相互作用を可能にすることで、この目標を達成する。
本稿では,データに固有の構造的依存関係をモデル化することにより,コンテキスト利用の恩恵を受けることができる変形可能なオブジェクトの学習表現について考察する。
論文 参考訳(メタデータ) (2021-06-12T03:10:17Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Delta Schema Network in Model-based Reinforcement Learning [125.99533416395765]
この研究は、伝達学習の非効率性である人工知能の未解決問題に焦点が当てられている。
環境データからオブジェクトとアクション間の論理的関係を抽出できるスキーマネットワーク手法を拡張している。
本稿では,デルタネットワーク(DSN)をトレーニングし,環境の将来状態を予測し,前向きな報酬をもたらす計画行動を示すアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-17T15:58:25Z) - Learning Predictive Representations for Deformable Objects Using
Contrastive Estimation [83.16948429592621]
視覚表現モデルと動的モデルの両方を協調的に最適化する新しい学習フレームワークを提案する。
我々は,標準モデルに基づく学習手法をロープや布の操作スイートで大幅に改善した。
論文 参考訳(メタデータ) (2020-03-11T17:55:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。