論文の概要: AutoGPart: Intermediate Supervision Search for Generalizable 3D Part
Segmentation
- arxiv url: http://arxiv.org/abs/2203.06558v1
- Date: Sun, 13 Mar 2022 03:45:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 10:35:30.665244
- Title: AutoGPart: Intermediate Supervision Search for Generalizable 3D Part
Segmentation
- Title(参考訳): AutoGPart: 一般化可能な3次元部分分割のための中間スーパービジョン検索
- Authors: Xueyi Liu, Xiaomeng Xu, Anyi Rao, Chuang Gan, Li Yi
- Abstract要約: AutoGPartは、幾何学的な事前知識を符号化した監視空間を構築し、マシンが特定のセグメンテーションタスクの最適な監督を自動で検索できるようにする。
本稿では,単純なバックボーンを用いたセグメンテーションネットワークの性能を,本手法で探索した教師によるトレーニングにより向上できることを実証する。
- 参考スコア(独自算出の注目度): 58.78094823473567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training a generalizable 3D part segmentation network is quite challenging
but of great importance in real-world applications. To tackle this problem,
some works design task-specific solutions by translating human understanding of
the task to machine's learning process, which faces the risk of missing the
optimal strategy since machines do not necessarily understand in the exact
human way. Others try to use conventional task-agnostic approaches designed for
domain generalization problems with no task prior knowledge considered. To
solve the above issues, we propose AutoGPart, a generic method enabling
training generalizable 3D part segmentation networks with the task prior
considered. AutoGPart builds a supervision space with geometric prior knowledge
encoded, and lets the machine to search for the optimal supervisions from the
space for a specific segmentation task automatically. Extensive experiments on
three generalizable 3D part segmentation tasks are conducted to demonstrate the
effectiveness and versatility of AutoGPart. We demonstrate that the performance
of segmentation networks using simple backbones can be significantly improved
when trained with supervisions searched by our method.
- Abstract(参考訳): 一般化可能な3d部分セグメンテーションネットワークのトレーニングは非常に難しいが、現実のアプリケーションでは極めて重要である。
この問題に対処するために、タスクの人間の理解を機械の学習プロセスに翻訳することでタスク固有のソリューションを設計する者もいる。
タスク優先知識を考慮せず、ドメインの一般化問題用に設計された従来のタスク非依存のアプローチを使おうとする者もいる。
そこで本研究では,従来検討したタスクで一般化可能な3次元部分セグメンテーションネットワークをトレーニングできる汎用手法であるautogpartを提案する。
AutoGPartは、幾何学的な事前知識を符号化した監視空間を構築し、マシンが特定のセグメンテーションタスクのために空間から最適な監督を検索できるようにする。
3つの一般化された3次元部分セグメンテーションタスクに関する広範囲な実験を行い,autogpartの有効性と汎用性を示す。
単純なバックボーンを用いたセグメンテーションネットワークの性能は,本手法で探索した教師によるトレーニングにより著しく向上することを示した。
関連論文リスト
- A Unified Framework for 3D Scene Understanding [50.6762892022386]
UniSeg3Dは統一された3Dセグメンテーションフレームワークで、単一のモデル内でパノプト、セマンティック、インスタンス、インタラクティブ、参照、オープン語彙セグメンテーションタスクを実現する。
タスク間の知識共有を促進し、総合的な3Dシーン理解を促進する。
ScanNet20、ScanRefer、ScanNet200を含む3つのベンチマークの実験は、UniSeg3Dが現在のSOTAメソッドより一貫して優れていることを示した。
論文 参考訳(メタデータ) (2024-07-03T16:50:07Z) - Reasoning3D -- Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models [20.277479473218513]
オブジェクトの検索とローカライズのためのZero-Shot 3D Reasoningを提案する。
複雑なコマンドを理解し実行するためのシンプルなベースラインメソッドReasoning3Dを設計する。
Reasoning3Dは、暗黙のテキストクエリに基づいて、3Dオブジェクトの一部を効果的にローカライズし、ハイライトすることができることを示す。
論文 参考訳(メタデータ) (2024-05-29T17:56:07Z) - Multi-task Learning with 3D-Aware Regularization [55.97507478913053]
本稿では,画像エンコーダから抽出した特徴を共有3D特徴空間に投影することで,複数のタスクをインタフェースする構造化3D認識正規化器を提案する。
提案手法はアーキテクチャ非依存であり,従来のマルチタスクバックボーンにプラグインすることで,性能を向上できることを示す。
論文 参考訳(メタデータ) (2023-10-02T08:49:56Z) - Semi-Weakly Supervised Object Kinematic Motion Prediction [56.282759127180306]
3Dオブジェクトが与えられた場合、運動予測は移動部と対応する運動パラメータを識別することを目的としている。
階層的部分分割と移動部パラメータのマップを学習するグラフニューラルネットワークを提案する。
ネットワーク予測は、擬似ラベル付き移動情報を持つ大規模な3Dオブジェクトを生成する。
論文 参考訳(メタデータ) (2023-03-31T02:37:36Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Multitask Network for Joint Object Detection, Semantic Segmentation and
Human Pose Estimation in Vehicle Occupancy Monitoring [0.0]
マルチタスク検出, ニューラルポーズと推定ネットワーク(DSPM)
我々は,マルチタスク検出,ニューラル・ポーズ・アンド・アセスメント・ネットワーク(DSPM)を提案する。
私たちのアーキテクチャは、単純なエンドツーエンドのトレーニングで、3つのタスクの柔軟な組み合わせを可能にします。
本研究では,公開データセットSVIROとTiCaMの総合評価を行い,優れた性能を示す。
論文 参考訳(メタデータ) (2022-05-03T14:11:18Z) - 3D Meta-Segmentation Neural Network [12.048487830494107]
本稿では,3次元形状分割関数を課題とするメタラーニング手法を提案する。
本手法は,複数の3次元部分分割タスクをトレーニングすることにより,各3次元部分分割関数空間の事前学習を可能にする。
本モデルは,広く使用されているデータセットであるShapeNetの少数ショット設定により,より優れた部分セグメンテーション性能を実現することを実証する。
論文 参考訳(メタデータ) (2021-10-08T01:47:54Z) - Spatial Semantic Embedding Network: Fast 3D Instance Segmentation with
Deep Metric Learning [5.699350798684963]
ディープラーニングを用いた3次元インスタンスセグメンテーションのための,単純かつ効率的なアルゴリズムを提案する。
大規模シーンからの高レベルのインテリジェントなタスクに対して、3Dインスタンスセグメンテーションはオブジェクトの個々のインスタンスを認識する。
我々は,ScanNet 3D インスタンス分割ベンチマークにおいて,我々のアルゴリズムの最先端性能をAPスコアで示す。
論文 参考訳(メタデータ) (2020-07-07T02:17:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。