Fugu-MT 論文翻訳(概要): DORec: Decomposed Object Reconstruction Utilizing 2D Self-Supervised Features

論文の概要: DORec: Decomposed Object Reconstruction Utilizing 2D Self-Supervised Features

arxiv url: http://arxiv.org/abs/2310.11092v2
Date: Thu, 19 Oct 2023 14:16:49 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-20 11:26:49.848000
Title: DORec: Decomposed Object Reconstruction Utilizing 2D Self-Supervised Features
Title（参考訳）: DORec:2次元自己監督機能を利用した分解物再構成
Authors: Jun Wu, Sicheng Li, Sihui Ji, Yue Wang, Rong Xiong, and Yiyi Liao
Abstract要約: ニューラル暗黙表現に基づく分解対象再構成ネットワークを提案する。私たちのキーとなるアイデアは、分解を監督するために2次元の粒度のマスクに2Dの自己監督機能を移すことです。実験結果から, 各種データセットにおける前景オブジェクトのセグメンテーションおよび再構成におけるDORecの優位性を示した。
参考スコア（独自算出の注目度）: 28.446955045371737
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Decomposing a target object from a complex background while reconstructing is challenging. Most approaches acquire the perception for object instances through the use of manual labels, but the annotation procedure is costly. The recent advancements in 2D self-supervised learning have brought new prospects to object-aware representation, yet it remains unclear how to leverage such noisy 2D features for clean decomposition. In this paper, we propose a Decomposed Object Reconstruction (DORec) network based on neural implicit representations. Our key idea is to transfer 2D self-supervised features into masks of two levels of granularity to supervise the decomposition, including a binary mask to indicate the foreground regions and a K-cluster mask to indicate the semantically similar regions. These two masks are complementary to each other and lead to robust decomposition. Experimental results show the superiority of DORec in segmenting and reconstructing the foreground object on various datasets.
Abstract（参考訳）: 複雑な背景から対象のオブジェクトを分解して再構築することは難しい。ほとんどのアプローチは手動ラベルを使ってオブジェクトインスタンスの認識を取得するが、アノテーションの手順は高価である。最近の2d自己教師付き学習の進歩は、オブジェクト認識表現に新たな展望をもたらしたが、このようなノイズの多い2d機能をクリーンな分解に活用する方法はまだ不明である。本稿では,神経的暗黙表現に基づく分解型オブジェクト再構成(dorec)ネットワークを提案する。我々のキーとなるアイデアは、2次元の自己監督された特徴を2段階の粒度のマスクに転送して分解を監督することであり、その中には前景領域を示すバイナリマスクと、意味的に類似した領域を示すKクラスターマスクが含まれる。これら2つのマスクは互いに相補的であり、堅牢な分解をもたらす。実験結果から, 各種データセットにおける前景オブジェクトのセグメンテーションおよび再構成におけるDORecの優位性を示した。

関連論文リスト

Object Learning and Robust 3D Reconstruction [7.092348056331202]
本稿では,ニューラルネットワークのアーキテクチャ設計とトレーニング手法について論じる。 FlowCapsulesは2Dシナリオに関心のあるオブジェクトのキューとしてモーションを使用する。我々は3次元のシーンの幾何的整合性を利用して不整合な動的物体を検出する。
論文参考訳（メタデータ） (2025-04-22T21:48:31Z)
GrabS: Generative Embodied Agent for 3D Object Segmentation without Scene Supervision [7.511342491529451]
複雑な点雲における3次元物体のセグメンテーションの難しさについて,人間の3次元シーンのラベルを監督のために必要とせずに検討した。事前訓練された2D特徴の類似性や3Dポイントをオブジェクトとしてグループ化する動きなどの外部信号に頼ることで、既存の教師なし手法は車のような単純な物体を識別することに限定される。
論文参考訳（メタデータ） (2025-04-16T04:13:53Z)
PickScan: Object discovery and reconstruction from handheld interactions [99.99566882133179]
シーンの3次元表現を再構成する対話誘導型クラス依存型手法を開発した。我々の主な貢献は、操作対象のインタラクションを検出し、操作対象のマスクを抽出する新しいアプローチである。相互作用ベースとクラス非依存のベースラインであるCo-Fusionと比較すると、これはシャムファー距離の73%の減少に相当する。
論文参考訳（メタデータ） (2024-11-17T23:09:08Z)
DiscoNeRF: Class-Agnostic Object Field for 3D Object Discovery [46.711276257688326]
NeRFは複数の画像から3Dシーンをモデリングするための強力なツールになっている。以前のNeRFの3Dセグメンテーションへのアプローチは、単一のオブジェクトを分離するためにユーザーインタラクションを必要とするか、あるいは監督のために限られた数のクラスを持つ2Dセマンティックマスクに依存している。本稿では,一貫性のないセグメンテーションに頑健な手法を提案し,シーンを任意のクラスのオブジェクトの集合に分解することに成功した。
論文参考訳（メタデータ） (2024-08-19T12:07:24Z)
MonoMAE: Enhancing Monocular 3D Detection through Depth-Aware Masked Autoencoders [93.87585467898252]
Masked Autoencodersにインスパイアされたモノクラー3D検出器MonoMAEを設計する。 MonoMAEは2つの新しい設計で構成されている。第一に、非閉塞オブジェクトクエリの特定の部分を選択的にマスキングするディープ・アウェア・マスクである。 2つ目は軽量なクエリ補完で、ディープ・アウェア・マスキングと連携して、マスキングされたオブジェクトクエリの再構築と完了を学習する。
論文参考訳（メタデータ） (2024-05-13T12:32:45Z)
SUGAR: Pre-training 3D Visual Representations for Robotics [85.55534363501131]
ロボット工学のための新しい3D事前学習フレームワークSUGARを紹介した。 SUGARは3次元の点雲を通してオブジェクトの意味的、幾何学的、および余分な特性をキャプチャする。 SuGARの3D表現は最先端の2Dおよび3D表現よりも優れていることを示す。
論文参考訳（メタデータ） (2024-04-01T21:23:03Z)
Iterative Superquadric Recomposition of 3D Objects from Multiple Views [77.53142165205283]
2次元ビューから直接3次元スーパークワッドリックを意味部品として用いたオブジェクトを再構成するフレームワークISCOを提案する。我々のフレームワークは、再構成エラーが高い場合に、反復的に新しいスーパークワッドリックを追加します。これは、野生の画像からでも、より正確な3D再構成を提供する。
論文参考訳（メタデータ） (2023-09-05T10:21:37Z)
AutoRecon: Automated 3D Object Discovery and Reconstruction [41.60050228813979]
多視点画像からのオブジェクトの自動発見と再構築のための新しいフレームワークAutoReconを提案する。本研究では,SfM点群からフォアグラウンド・オブジェクトの位置とセグメンテーションを,自己監督型2次元ビジョン・トランスフォーマーの機能を活用して行うことを実証する。 DTU、BlendedMVS、CO3D-V2データセットの実験はAutoReconの有効性と堅牢性を示している。
論文参考訳（メタデータ） (2023-05-15T17:16:46Z)
CASAPose: Class-Adaptive and Semantic-Aware Multi-Object Pose Estimation [2.861848675707602]
CASAPoseと呼ばれる新しい単一ステージアーキテクチャを提案する。 RGB画像中の複数の異なるオブジェクトのポーズ推定のための2D-3D対応を1パスで決定する。高速でメモリ効率が高く、複数のオブジェクトに対して高い精度を実現する。
論文参考訳（メタデータ） (2022-10-11T10:20:01Z)
OGC: Unsupervised 3D Object Segmentation from Rigid Dynamics of Point Clouds [4.709764624933227]
OGCと呼ばれる最初の教師なしの手法を提案し、同時に複数の3Dオブジェクトを1つの前方通過で識別する。提案手法を5つのデータセット上で広範囲に評価し,オブジェクト部分のインスタンスセグメンテーションにおいて優れた性能を示す。
論文参考訳（メタデータ） (2022-10-10T07:01:08Z)
Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文参考訳（メタデータ） (2021-03-30T17:57:01Z)
AutoSweep: Recovering 3D Editable Objectsfrom a Single Photograph [54.701098964773756]
セマンティックな部分で3Dオブジェクトを復元し、直接編集することを目的としている。我々の研究は、一般化された立方体と一般化されたシリンダーという、2種類の原始的な形状の物体を回収する試みである。提案アルゴリズムは,高品質な3Dモデルを復元し,既存手法のインスタンスセグメンテーションと3D再構成の両方で性能を向上する。
論文参考訳（メタデータ） (2020-05-27T12:16:24Z)
SDOD:Real-time Segmenting and Detecting 3D Object by Depth [5.97602869680438]
本稿では,3次元物体を奥行きで分割・検出するリアルタイムフレームワークを提案する。オブジェクトの深さを深度カテゴリに分類し、インスタンス分割タスクをピクセルレベルの分類タスクに変換する。挑戦的なKITTIデータセットの実験から、我々のアプローチはLklNetを約1.8倍の性能で、セグメンテーションと3D検出の速度を上回ります。
論文参考訳（メタデータ） (2020-01-26T09:06:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。