論文の概要: LEGO-Net: Learning Regular Rearrangements of Objects in Rooms
- arxiv url: http://arxiv.org/abs/2301.09629v2
- Date: Fri, 24 Mar 2023 22:49:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 00:42:27.224241
- Title: LEGO-Net: Learning Regular Rearrangements of Objects in Rooms
- Title(参考訳): lego-net:部屋の中のオブジェクトの定期的な並べ替えを学ぶ
- Authors: Qiuhong Anna Wei, Sijie Ding, Jeong Joon Park, Rahul Sajnani, Adrien
Poulenard, Srinath Sridhar, Leonidas Guibas
- Abstract要約: 本稿では,データ駆動型トランスフォーマーを用いた反復手法LEGO-Netを提案する。
ランダムに摂動した物体の位置と向きが与えられた場合、本手法は定期的な再配置を復元するよう訓練される。
その結果,本手法は部屋のシーンを確実に再構成し,他の手法よりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 10.350120708265296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans universally dislike the task of cleaning up a messy room. If machines
were to help us with this task, they must understand human criteria for regular
arrangements, such as several types of symmetry, co-linearity or
co-circularity, spacing uniformity in linear or circular patterns, and further
inter-object relationships that relate to style and functionality. Previous
approaches for this task relied on human input to explicitly specify goal
state, or synthesized scenes from scratch -- but such methods do not address
the rearrangement of existing messy scenes without providing a goal state. In
this paper, we present LEGO-Net, a data-driven transformer-based iterative
method for LEarning reGular rearrangement of Objects in messy rooms. LEGO-Net
is partly inspired by diffusion models -- it starts with an initial messy state
and iteratively ''de-noises'' the position and orientation of objects to a
regular state while reducing distance traveled. Given randomly perturbed object
positions and orientations in an existing dataset of professionally-arranged
scenes, our method is trained to recover a regular re-arrangement. Results
demonstrate that our method is able to reliably rearrange room scenes and
outperform other methods. We additionally propose a metric for evaluating
regularity in room arrangements using number-theoretic machinery.
- Abstract(参考訳): 人間は、乱雑な部屋を掃除する仕事を普遍的に嫌います。
機械がこの作業を支援するためには、複数の対称性、共線形性、または共円性、線形パターンや円形パターンの均一性、さらにスタイルや機能に関連するオブジェクト間の関係など、通常の配置に対する人間の基準を理解する必要がある。
従来のアプローチでは、目標状態を明確に指定したり、スクラッチから合成したシーンを明示的に指定するために、人間の入力に依存していたが、このような方法では、目標状態を提供することなく、既存の乱雑なシーンの再配置に対応していない。
本稿では,乱雑な部屋での物体の規則的な並べ替えを学習するためのデータ駆動トランスフォーマーに基づく反復的手法であるlego-netを提案する。
LEGO-Netは、部分的に拡散モデルにインスピレーションを受けています -- 最初の混乱状態から始まり、移動距離を減らしながら、オブジェクトの位置と方向を通常の状態に'de-noises'を繰り返します。
プロが配置したシーンの既存のデータセットにおいて、ランダムに乱れた物体の位置と向きが与えられた場合、本手法は定期的な再配置の回復を訓練する。
その結果,本手法は部屋のシーンを確実に再構成し,他の手法よりも優れていることがわかった。
また,数理論機械を用いて部屋配置の規則性を評価する指標を提案する。
関連論文リスト
- DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - ICGNet: A Unified Approach for Instance-Centric Grasping [42.92991092305974]
オブジェクト中心の把握のためのエンドツーエンドアーキテクチャを導入する。
提案手法の有効性を,合成データセット上での最先端手法に対して広範囲に評価することにより示す。
論文 参考訳(メタデータ) (2024-01-18T12:41:41Z) - STOW: Discrete-Frame Segmentation and Tracking of Unseen Objects for
Warehouse Picking Robots [41.017649190833076]
本稿では,変圧器モジュールとともに離散フレームにおける関節分割と追跡のための新しいパラダイムを提案する。
実験の結果,本手法は近年の手法よりも著しく優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T06:52:38Z) - SE(3)-Equivariant Relational Rearrangement with Neural Descriptor Fields [39.562247503513156]
本稿では,任意のポーズで新規オブジェクトインスタンス間の空間的関係を含むタスクを実行する手法を提案する。
私たちのフレームワークは、5-10のデモだけで新しいタスクを指定できるスケーラブルな方法を提供する。
本手法は,シミュレーションにおける3つのマルチオブジェクト再構成タスクと実ロボットを用いて試験を行う。
論文 参考訳(メタデータ) (2022-11-17T18:55:42Z) - Robust Change Detection Based on Neural Descriptor Fields [53.111397800478294]
我々は、部分的に重なり合う観測結果とノイズのある局所化結果に頑健なオブジェクトレベルのオンライン変化検出手法を開発した。
形状符号の類似性を利用して物体を連想させ, 局所的な物体近傍の空間配置を比較することにより, 観測重複や局所雑音に対する頑健性を示す。
論文 参考訳(メタデータ) (2022-08-01T17:45:36Z) - TIDEE: Tidying Up Novel Rooms using Visuo-Semantic Commonsense Priors [29.255373211228548]
TIDEEは、学習されたコモンセンスオブジェクト配置と部屋配置に基づいて、混乱したシーンをタイディーアップする。
TIDEEは、ホーム環境を探索し、自然の場所から外れたオブジェクトを検出し、それらに対して妥当なオブジェクトコンテキストを推測し、現在のシーンでそのようなコンテキストをローカライズし、オブジェクトを再配置する。
我々は,AI2THORシミュレーション環境における非編成シーンのタイピングについてTIDEEを検証した。
論文 参考訳(メタデータ) (2022-07-21T21:19:18Z) - A Simple Approach for Visual Rearrangement: 3D Mapping and Semantic
Search [71.14527779661181]
視覚的な部屋の配置は、視覚的な入力のみに基づいてオブジェクトを並べ替えるエージェントの能力を評価する。
本稿では,(1)どのオブジェクトを並べ替える必要があるかを探索し,マッピングし,(2)タスクが完了するまで各オブジェクトを並べ替える,という方法を提案する。
論文 参考訳(メタデータ) (2022-06-21T02:33:57Z) - Discovering Objects that Can Move [55.743225595012966]
手動ラベルなしでオブジェクトを背景から分離する、オブジェクト発見の問題について検討する。
既存のアプローチでは、色、テクスチャ、位置などの外観の手がかりを使用して、ピクセルをオブジェクトのような領域に分類する。
私たちは、動的オブジェクト -- 世界で独立して動くエンティティ -- にフォーカスすることを選びます。
論文 参考訳(メタデータ) (2022-03-18T21:13:56Z) - Fusing Local Similarities for Retrieval-based 3D Orientation Estimation
of Unseen Objects [70.49392581592089]
我々は,モノクロ画像から未確認物体の3次元配向を推定する作業に取り組む。
我々は検索ベースの戦略に従い、ネットワークがオブジェクト固有の特徴を学習するのを防ぐ。
また,LineMOD,LineMOD-Occluded,T-LESSのデータセットを用いた実験により,本手法が従来の手法よりもはるかに優れた一般化をもたらすことが示された。
論文 参考訳(メタデータ) (2022-03-16T08:53:00Z) - IFOR: Iterative Flow Minimization for Robotic Object Rearrangement [92.97142696891727]
IFOR(Iterative Flow Minimization for Robotic Object Rearrangement)は、未知物体の物体再構成問題に対するエンドツーエンドの手法である。
本手法は,合成データのみを訓練しながら,散在するシーンや実世界に適用可能であることを示す。
論文 参考訳(メタデータ) (2022-02-01T20:03:56Z) - Predicting Stable Configurations for Semantic Placement of Novel Objects [37.18437299513799]
我々のゴールは、新しい環境における学習された意味的関係に従って、ロボットが未確認の物体を配置できるようにすることである。
我々は、未知のオブジェクトのセマンティック配置のための計画アルゴリズムと密に統合するために、モデルとトレーニングをゼロから構築する。
提案手法は,RGB-Dセンシングのみによる形状の異なるシーンにおける未知物体のセマンティック・アレンジメントのための動作計画を可能にする。
論文 参考訳(メタデータ) (2021-08-26T23:05:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。