論文の概要: Brick-by-Brick: Combinatorial Construction with Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2110.15481v1
- Date: Fri, 29 Oct 2021 01:09:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 14:24:15.991353
- Title: Brick-by-Brick: Combinatorial Construction with Deep Reinforcement
Learning
- Title(参考訳): Brick-by-Brick:ディープ強化学習による組合せ構築
- Authors: Hyunsoo Chung, Jungtaek Kim, Boris Knyazev, Jinhwi Lee, Graham W.
Taylor, Jaesik Park, Minsu Cho
- Abstract要約: 我々は,ユニットプリミティブを逐次組み立てるビルディングエージェントを必要とする,新しい定式化,複雑な構成を導入する。
対象物を構築するために,エージェントに対して正確な情報や明示的な情報ではなく,所望の目標(すなわち2次元画像)に関する不完全な知識を提供する。
提案手法は,対象オブジェクトの1つの画像や複数ビューに条件付けされた未確認オブジェクトの構築に成功していることを示す。
- 参考スコア(独自算出の注目度): 52.85981207514049
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discovering a solution in a combinatorial space is prevalent in many
real-world problems but it is also challenging due to diverse complex
constraints and the vast number of possible combinations. To address such a
problem, we introduce a novel formulation, combinatorial construction, which
requires a building agent to assemble unit primitives (i.e., LEGO bricks)
sequentially -- every connection between two bricks must follow a fixed rule,
while no bricks mutually overlap. To construct a target object, we provide
incomplete knowledge about the desired target (i.e., 2D images) instead of
exact and explicit volumetric information to the agent. This problem requires a
comprehensive understanding of partial information and long-term planning to
append a brick sequentially, which leads us to employ reinforcement learning.
The approach has to consider a variable-sized action space where a large number
of invalid actions, which would cause overlap between bricks, exist. To resolve
these issues, our model, dubbed Brick-by-Brick, adopts an action validity
prediction network that efficiently filters invalid actions for an actor-critic
network. We demonstrate that the proposed method successfully learns to
construct an unseen object conditioned on a single image or multiple views of a
target object.
- Abstract(参考訳): 組合せ空間における解の発見は多くの実世界の問題で広く見られるが、様々な複雑な制約と膨大な組み合わせのためにも困難である。
そのような問題に対処するために、我々は新しい定式化、組合せ構成を導入し、これは建築エージェントがユニットプリミティブ(LEGOブロック)を逐次組み立てる必要がある ― 2つのブロック間のすべての接続は固定規則に従う必要があるが、ブロックは相互に重複しない。
対象物を構築するために,エージェントに対して正確な容積情報ではなく,目的物(すなわち2次元画像)に関する不完全な知識を提供する。
この問題には,部分的な情報に対する包括的理解と,レンガを順次追加するための長期計画が必要である。
このアプローチでは、ブロック間の重なりを引き起こす多数の無効なアクションが存在する可変サイズのアクション空間を考慮する必要がある。
これらの問題を解決するために、Brick-by-Brickと呼ばれるモデルでは、アクター批判ネットワークに対する無効なアクションを効率的にフィルタするアクション妥当性予測ネットワークを採用している。
提案手法は,対象オブジェクトの1つの画像や複数のビューを条件とした未認識オブジェクトの構築をうまく学習できることを実証する。
関連論文リスト
- Learning to Build by Building Your Own Instructions [56.734927320020496]
LTRONにおける最近提案されたBreak-and-Make問題に対する新しい手法を開発した。
エージェントは、単一の対話的なセッションを使用して、これまで見えなかったLEGOアセンブリを構築することを学ばなければなりません。
オンラインの模倣学習を使ってこれらのモデルをトレーニングし、モデルが自身のミスから学習できるようにする。
論文 参考訳(メタデータ) (2024-10-01T22:39:58Z) - Budget-Aware Sequential Brick Assembly with Efficient Constraint Satisfaction [63.672314717599285]
レゴブロックを用いた逐次レンガ組立体の課題に対処し、3D構造を創出する。
特に、使用されるレンガの数が増えるにつれて、組み立て可能な構造物の数は指数関数的に増加する。
本稿では,U字型スパース3次元畳み込みニューラルネットワークを用いて,次のブロック位置のスコアを予測する新しい手法を提案する。
論文 参考訳(メタデータ) (2022-10-03T15:35:08Z) - Break and Make: Interactive Structural Understanding Using LEGO Bricks [61.01136603613139]
私たちは、LEGOモデルの組み立て、分解、操作が可能な、完全にインタラクティブな3Dシミュレータを構築しました。
シーケンス・ツー・シーケンス・モデルを用いてこの問題を解決するための第一歩を踏み出す。
論文 参考訳(メタデータ) (2022-07-27T18:33:09Z) - GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a
generative mental image [15.132848477903314]
すべての部品からメンタルなイメージを推測し、その部品を爆発を避けるためにマッチさせることができる。
本研究では,未整列片の集合が与えられた画像の再構成方法を学び,各部品の符号化を発電機の収穫層に整合させる共同埋め込み空間を学習する。
このような場合、我々のモデルはパズルのサイズに依存しないが、従来の1つの大きさの深層学習法とは対照的である。
論文 参考訳(メタデータ) (2022-07-12T16:02:00Z) - Blocks Assemble! Learning to Assemble with Large-Scale Structured
Reinforcement Learning [23.85678777628229]
複数部品の物理的構造の組み立ては、自律ロボット工学にとって価値のある製品である。
子どものおもちゃのキットにインスパイアされた、接続可能な磁石ブロックのセットを備えた自然主義的な物理ベースの環境を導入する。
大規模強化学習とグラフベースの政策の組み合わせが,訓練エージェントの効果的なレシピであることが判明した。
論文 参考訳(メタデータ) (2022-03-15T18:21:02Z) - CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and
Transfer Learning [138.40338621974954]
CausalWorldは、ロボット操作環境における因果構造と伝達学習のベンチマークである。
タスクは、ブロックのセットから3D形状を構築することで構成される。
論文 参考訳(メタデータ) (2020-10-08T23:01:13Z) - Object-Aware Multi-Branch Relation Networks for Spatio-Temporal Video
Grounding [90.12181414070496]
本稿では,オブジェクト認識関係探索のための新しいオブジェクト認識型マルチブランチ関係ネットワークを提案する。
次に,主枝と補助枝の間の重要な対象関係を捉えるためのマルチブランチ推論を提案する。
論文 参考訳(メタデータ) (2020-08-16T15:39:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。