論文の概要: Explain What You See: Open-Ended Segmentation and Recognition of
Occluded 3D Objects
- arxiv url: http://arxiv.org/abs/2301.07037v1
- Date: Tue, 17 Jan 2023 17:43:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 13:23:19.554044
- Title: Explain What You See: Open-Ended Segmentation and Recognition of
Occluded 3D Objects
- Title(参考訳): オープンエンディングによる3Dオブジェクトのセグメンテーションと認識
- Authors: H. Ayoobi, H. Kasaei, M. Cao, R. Verbrugge, B. Verheij
- Abstract要約: 局所HDPの柔軟性を有する3次元オブジェクト分割法を提案する。
提案手法は,より少ない数の学習インスタンスを用いて,連合間の平均交叉率が高いことを示す。
得られたモデルが3次元オブジェクトカテゴリ認識タスクに対して明確な説明セットを生成することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Local-HDP (for Local Hierarchical Dirichlet Process) is a hierarchical
Bayesian method that has recently been used for open-ended 3D object category
recognition. This method has been proven to be efficient in real-time robotic
applications. However, the method is not robust to a high degree of occlusion.
We address this limitation in two steps. First, we propose a novel semantic 3D
object-parts segmentation method that has the flexibility of Local-HDP. This
method is shown to be suitable for open-ended scenarios where the number of 3D
objects or object parts is not fixed and can grow over time. We show that the
proposed method has a higher percentage of mean intersection over union, using
a smaller number of learning instances. Second, we integrate this technique
with a recently introduced argumentation-based online incremental learning
method, thereby enabling the model to handle a high degree of occlusion. We
show that the resulting model produces an explicit set of explanations for the
3D object category recognition task.
- Abstract(参考訳): Local-HDP (Local Hierarchical Dirichlet Process) は階層的ベイズ法であり、最近オープンな3次元オブジェクトカテゴリ認識に使われている。
この方法はリアルタイムロボット応用において効率的であることが証明されている。
しかし、この方法は高い閉塞率には耐えられない。
この制限を2つのステップで解決する。
まず,局所hdpの柔軟性を有する意味的3次元オブジェクト分割手法を提案する。
この方法は、3Dオブジェクトやオブジェクト部品の数が固定されておらず、時間とともに成長できるオープンエンドシナリオに適している。
提案手法は,より少ない数の学習インスタンスを用いて,連合間の平均交叉率が高いことを示す。
第二に、この手法を最近導入された議論に基づくオンライン漸進学習手法と統合することにより、モデルを高い閉塞度で扱えるようにする。
得られたモデルが3次元オブジェクトカテゴリ認識タスクに対して明確な説明セットを生成することを示す。
関連論文リスト
- Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance [49.14140194332482]
Open3DISは3Dシーン内でのOpen-Vocabulary Instanceの問題に対処するために設計された新しいソリューションである。
3D環境内のオブジェクトは、さまざまな形状、スケール、色を示し、正確なインスタンスレベルの識別が困難なタスクとなる。
論文 参考訳(メタデータ) (2023-12-17T10:07:03Z) - SAI3D: Segment Any Instance in 3D Scenes [68.57002591841034]
新規なゼロショット3Dインスタンスセグメンテーション手法であるSAI3Dを紹介する。
我々の手法は3Dシーンを幾何学的プリミティブに分割し、段階的に3Dインスタンスセグメンテーションにマージする。
ScanNet、Matterport3D、さらに難しいScanNet++データセットに関する実証的な評価は、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2023-12-17T09:05:47Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - Fine-grained 3D object recognition: an approach and experiments [0.0]
3次元物体認識技術は、自動車の自律運転などの先進技術における中核技術として利用されている。
i)Global Orthographic Object Descriptor (GOOD)のような手作りのアプローチと、(ii)MobileNetやVGGのようなディープラーニングベースのアプローチである。
本稿では,オブジェクトビューを入力とし,カテゴリラベルを出力として生成するオフライン3Dオブジェクト認識システムを最初に実装した。
オフラインの段階では、インスタンスベースの学習(IBL)が新しいものを形成するために使用される
論文 参考訳(メタデータ) (2023-06-28T04:48:21Z) - LocATe: End-to-end Localization of Actions in 3D with Transformers [91.28982770522329]
LocATeは、3Dシーケンスでアクションを共同でローカライズし認識するエンドツーエンドのアプローチである。
画像やパッチの特徴を入力として考えるトランスフォーマーベースのオブジェクト検出や分類モデルとは異なり、LocATeのトランスフォーマーモデルはシーケンス内のアクション間の長期的な相関をキャプチャすることができる。
BABEL-TAL-20 (BT20) という新しい,挑戦的で,より現実的なベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2022-03-21T03:35:32Z) - End-to-End Learning of Multi-category 3D Pose and Shape Estimation [128.881857704338]
本稿では,画像から2次元キーポイントを同時に検出し,それらを3次元に引き上げるエンド・ツー・エンド手法を提案する。
提案手法は2次元キーポイントアノテーションからのみ2次元検出と3次元リフトを学習する。
画像から3D学習へのエンドツーエンド化に加えて,1つのニューラルネットワークを用いて複数のカテゴリからのオブジェクトも処理する。
論文 参考訳(メタデータ) (2021-12-19T17:10:40Z) - Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文 参考訳(メタデータ) (2021-04-06T07:01:28Z) - Sim2Real 3D Object Classification using Spherical Kernel Point
Convolution and a Deep Center Voting Scheme [28.072144989298298]
人工的な3dモデルからの学習は、この問題に取り組むのに必要なアノテーションのコストを軽減する。
これらの問題の原因は、多くの方法が形状の代わりに点座標から直接学習するという事実であると推測する。
グラフとして表される物体表面を直接利用する球状核点畳み込みと、貧弱なセグメンテーションの影響を制限する投票方式を紹介します。
論文 参考訳(メタデータ) (2021-03-10T15:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。