論文の概要: RGL-NET: A Recurrent Graph Learning framework for Progressive Part
Assembly
- arxiv url: http://arxiv.org/abs/2107.12859v1
- Date: Tue, 27 Jul 2021 14:47:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 18:46:27.737683
- Title: RGL-NET: A Recurrent Graph Learning framework for Progressive Part
Assembly
- Title(参考訳): rgl-net:プログレッシブパートアセンブリのためのリカレントグラフ学習フレームワーク
- Authors: Abhinav Narayan Harish, Rajendra Nagar and Shanmuganathan Raman
- Abstract要約: 我々は、構造的不変量に対して堅牢なアセンブリのための一般化されたフレームワークを開発することの課題に取り組む。
我々のネットワークは、予め組み立てた部品を考慮に入れれば、形状構造のより妥当な予測を学べる。
我々の潜在空間は、ポイントクラウドコンポーネントからの形状回復のようなエキサイティングな応用を促進する。
- 参考スコア(独自算出の注目度): 30.143946636770025
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Autonomous assembly of objects is an essential task in robotics and 3D
computer vision. It has been studied extensively in robotics as a problem of
motion planning, actuator control and obstacle avoidance. However, the task of
developing a generalized framework for assembly robust to structural variants
remains relatively unexplored. In this work, we tackle this problem using a
recurrent graph learning framework considering inter-part relations and the
progressive update of the part pose. Our network can learn more plausible
predictions of shape structure by accounting for priorly assembled parts.
Compared to the current state-of-the-art, our network yields up to 10%
improvement in part accuracy and up to 15% improvement in connectivity accuracy
on the PartNet dataset. Moreover, our resulting latent space facilitates
exciting applications such as shape recovery from the point-cloud components.
We conduct extensive experiments to justify our design choices and demonstrate
the effectiveness of the proposed framework.
- Abstract(参考訳): オブジェクトの自律的な組み立ては、ロボット工学と3dコンピュータビジョンにおいて不可欠なタスクである。
ロボット工学において、運動計画、アクチュエータ制御、障害物回避の問題として広く研究されている。
しかし、構造的変形に頑健なアセンブリのための汎用フレームワークを開発する作業は比較的未定である。
本研究では,パート間関係とパートポーズの漸進的更新を考慮したグラフ学習フレームワークを用いてこの問題に対処する。
我々のネットワークは、予め組み立てた部品を考慮に入れれば、形状構造のより妥当な予測を学べる。
現在の最先端のネットワークと比較すると、パートの精度は最大10%向上し、partnetデータセットの接続精度は最大15%向上している。
さらに、得られた潜在空間は、ポイントクラウドコンポーネントからの形状回復のようなエキサイティングな応用を促進する。
設計選択を正当化し,提案フレームワークの有効性を実証するために,広範な実験を行う。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Scalable Geometric Fracture Assembly via Co-creation Space among
Assemblers [24.89380678499307]
我々は,意味情報に頼らずに,幾何学的フラクチャーアセンブリのためのスケーラブルなフレームワークを開発した。
本稿では, フラクチャー・アセンブリ・プロセスにおける衝突問題に対処するために, 新たな損失関数,すなわち幾何に基づく衝突損失を導入する。
私たちのフレームワークは、既存の最先端フレームワークと比較して、PartNetとBreaking Badデータセットの両方でパフォーマンスが向上しています。
論文 参考訳(メタデータ) (2023-12-19T17:13:51Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from
Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - RIFormer: Keep Your Vision Backbone Effective While Removing Token Mixer [95.71132572688143]
本稿では,基本構造ブロックのトークンミキサーを除去しながら,視覚バックボーンを効果的に維持する方法について検討する。
視覚変換器(ViT)の自己アテンション(自己アテンション)としてのトークンミキサーは、異なる空間トークン間での情報通信を行うが、かなりの計算コストと遅延に悩まされる。
論文 参考訳(メタデータ) (2023-04-12T07:34:13Z) - Graph-Transporter: A Graph-based Learning Method for Goal-Conditioned
Deformable Object Rearranging Task [1.807492010338763]
本稿では,目標条件付き変形可能なオブジェクト再構成タスクのための新しいフレームワークであるGraph-Transporterを提案する。
我々のフレームワークは、FCN(Fully Convolutional Network)に基づくアーキテクチャを採用し、視覚入力のみから画素単位のピック・アンド・プレイス・アクションを出力する。
論文 参考訳(メタデータ) (2023-02-21T05:21:04Z) - 3D Part Assembly Generation with Instance Encoded Transformer [22.330218525999857]
本稿では,部品間の幾何的および関係的な推論を伴い,部品の更新を反復的に行う多層トランスフォーマーベースのフレームワークを提案する。
フレームワークをプロセス内部分アセンブリと呼ばれる新しいタスクに拡張します。
提案手法は、パブリックなPartNetデータセット上の複数のメトリクスにおいて、現在の最先端よりも10%以上改善されている。
論文 参考訳(メタデータ) (2022-07-05T02:40:57Z) - Goal-driven Self-Attentive Recurrent Networks for Trajectory Prediction [31.02081143697431]
人間の軌道予測は、自動運転車、社会認識ロボット、およびビデオ監視アプリケーションの主要な構成要素である。
本稿では,過去の観測位置のみに作用する軽量な注意型リカレントバックボーンを提案する。
我々はU-Netアーキテクチャに基づく共通のゴールモジュールを使用し、シーン準拠の目的地を予測するために意味情報を抽出する。
論文 参考訳(メタデータ) (2022-04-25T11:12:37Z) - Where2Act: From Pixels to Actions for Articulated 3D Objects [54.19638599501286]
可動部を有する関節物体の押出しや引抜き等の基本動作に関連する高度に局所化された動作可能な情報を抽出する。
シミュレーションでネットワークをトレーニングできるオンラインデータサンプリング戦略を備えた学習から対話までのフレームワークを提案します。
私たちの学習モデルは、現実世界のデータにも転送します。
論文 参考訳(メタデータ) (2021-01-07T18:56:38Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。