論文の概要: Learning to reason about and to act on physical cascading events
- arxiv url: http://arxiv.org/abs/2202.01108v1
- Date: Wed, 2 Feb 2022 16:17:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-03 14:59:51.237649
- Title: Learning to reason about and to act on physical cascading events
- Title(参考訳): 物理的カスケードイベントにおける推論と行動の学習
- Authors: Yuval Atzmon, Eli A. Meirom, Shie Mannor, Gal Chechik
- Abstract要約: エージェントが物理的にシミュレートされた動的シーンのビデオを表示する, Em Cascade という新しい教師あり学習装置を導入する。
エージェントは介入してイベントのカスケードをトリガーするように要求され、システムが"偽造的"な目標に達する。
提案手法は,これまで見つからなかった複雑な場面に介入する命令を効果的に追従することを学ぶ。
- 参考スコア(独自算出の注目度): 72.90358875111883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reasoning and interacting with dynamic environments is a fundamental problem
in AI, but it becomes extremely challenging when actions can trigger cascades
of cross-dependent events. We introduce a new supervised learning setup called
{\em Cascade} where an agent is shown a video of a physically simulated dynamic
scene, and is asked to intervene and trigger a cascade of events, such that the
system reaches a "counterfactual" goal. For instance, the agent may be asked to
"Make the blue ball hit the red one, by pushing the green ball". The agent
intervention is drawn from a continuous space, and cascades of events makes the
dynamics highly non-linear.
We combine semantic tree search with an event-driven forward model and devise
an algorithm that learns to search in semantic trees in continuous spaces. We
demonstrate that our approach learns to effectively follow instructions to
intervene in previously unseen complex scenes. It can also reason about
alternative outcomes, when provided an observed cascade of events.
- Abstract(参考訳): 動的環境の推論とインタラクションは、AIの基本的な問題だが、アクションがクロス依存イベントのカスケードをトリガーできると、極めて困難になる。
そこで,エージェントが物理的にシミュレートされた動的シーンの映像を提示し,システムが"国的"な目標に達するように,イベントのカスケードを介入して起動するように要求する,"em cascade"と呼ばれる新しい教師付き学習設定を導入する。
例えば、エージェントは「青いボールが緑色のボールを押して赤いボールを打つように」依頼される。
エージェントの介入は連続空間から引き出され、事象のカスケードはダイナミクスを非常に非線形にする。
セマンティックツリー探索とイベント駆動フォワードモデルを組み合わせることで,連続空間におけるセマンティックツリーの探索を学習するアルゴリズムを考案する。
提案手法は,これまで見つからなかった複雑な場面に介入する命令を効果的に追従することを学ぶ。
観測された事象のカスケードを提供する場合、別の結果も推論できる。
関連論文リスト
- Learning Extrinsic Dexterity with Parameterized Manipulation Primitives [8.7221770019454]
我々は、オブジェクトのポーズを変えるために環境を利用する一連のアクションを学習する。
我々のアプローチは、オブジェクトとグリップと環境の間の相互作用を利用してオブジェクトの状態を制御することができる。
拘束されたテーブルトップワークスペースから様々な重量,形状,摩擦特性の箱状物体を選別する手法の評価を行った。
論文 参考訳(メタデータ) (2023-10-26T21:28:23Z) - Unifying Event Detection and Captioning as Sequence Generation via
Pre-Training [53.613265415703815]
本稿では,イベント検出とキャプションのタスク間関連性を高めるための,事前学習と微調整の統合フレームワークを提案する。
我々のモデルは最先端の手法よりも優れており、大規模ビデオテキストデータによる事前学習ではさらに向上できる。
論文 参考訳(メタデータ) (2022-07-18T14:18:13Z) - D-Grasp: Physically Plausible Dynamic Grasp Synthesis for Hand-Object
Interactions [47.55376158184854]
動的合成把握タスクを導入する。
既知の6Dポーズと把握基準を持つオブジェクトが与えられた場合、私たちのゴールはオブジェクトをターゲット6Dポーズに移動させる動作を生成することです。
階層的なアプローチは、タスクを低レベルの把握と高レベルのモーション合成に分解する。
論文 参考訳(メタデータ) (2021-12-01T17:04:39Z) - Grounding Physical Concepts of Objects and Events Through Dynamic Visual
Reasoning [84.90458333884443]
本稿では、物理オブジェクトやイベントをビデオや言語から基盤とする統合フレームワークであるDynamic Concept Learner(DCL)を紹介する。
dclは、フレーム、グランドビジュアルプロパティ、物理イベントのオブジェクトを検出し、関連付けることができ、イベント間の因果関係を理解し、将来の予測と偽りの予測を行い、これらのプレゼンテーションをクエリに利用することができる。
DCLは、地上トラス属性や衝突ラベルをトレーニング用シミュレーションから使用することなく、困難な因果的ビデオ推論データセットであるCLEVRERで最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-03-30T17:59:48Z) - Learning Reactive and Predictive Differentiable Controllers for
Switching Linear Dynamical Models [7.653542219337937]
専門家による実証から複合ダイナミクス行動を学習するためのフレームワークを提示する。
システムダイナミクスの近接近似としてスイッチング条件にエンコードされた接点を持つスイッチング線形ダイナミクスモデルを学ぶ。
次に、データ効率のよい制御学習のための微分可能なポリシークラスとして離散時間LQRを使用し、制御戦略を開発する。
論文 参考訳(メタデータ) (2021-03-26T04:40:24Z) - Learning Asynchronous and Sparse Human-Object Interaction in Videos [56.73059840294019]
Asynchronous-Sparse Interaction Graph Networks(ASSIGN)は、ビデオシーン内のエンティティに関連するインタラクションイベントの構造を自動的に検出します。
ASSIGNは人間と物体の相互作用認識において試験され、人間のサブアクティビティのセグメンテーションおよびラベル付けにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-03T23:43:55Z) - HySTER: A Hybrid Spatio-Temporal Event Reasoner [75.41988728376081]
HySTER: ビデオ内の物理イベントを推論するためのハイブリッド時空間イベント推論器を紹介します。
タスク間を移動可能な一般的な時間的・因果的・物理的ルールに基づく手法を定義する。
この研究は、VideoQAの分野でのインダクティブロジックプログラミングの組み込みの基礎を設定します。
論文 参考訳(メタデータ) (2021-01-17T11:07:17Z) - CLOUD: Contrastive Learning of Unsupervised Dynamics [19.091886595825947]
コントラスト推定により、完全に教師のない方法で前方・逆ダイナミクスを学習することを提案する。
目標指向計画や観察からの模倣など,さまざまなタスクにまたがるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-23T15:42:57Z) - Towards intervention-centric causal reasoning in learning agents [0.0]
高次元環境下での因果学習にメタラーニングアプローチを用いる方法を示す。
メタ強化学習アルゴリズムは、観察因果学習タスクで伝達される関係を学習するために使用される。
論文 参考訳(メタデータ) (2020-05-26T18:53:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。