論文の概要: Human Correspondence Consensus for 3D Object Semantic Understanding
- arxiv url: http://arxiv.org/abs/1912.12577v2
- Date: Thu, 26 Nov 2020 05:24:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 07:44:43.229182
- Title: Human Correspondence Consensus for 3D Object Semantic Understanding
- Title(参考訳): 3次元オブジェクト意味理解のための人間対応コンセンサス
- Authors: Yujing Lou, Yang You, Chengkun Li, Zhoujun Cheng, Liangwei Li,
Lizhuang Ma, Weiming Wang, Cewu Lu
- Abstract要約: 本稿では,CorresPondenceNetという新しいデータセットを提案する。
このデータセットに基づいて、新しい測地的整合性損失を伴う密接なセマンティック埋め込みを学習することができる。
CorresPondenceNetは異種オブジェクトの細粒度理解を促進できるだけでなく、クロスオブジェクト登録や部分オブジェクトマッチングも実現できた。
- 参考スコア(独自算出の注目度): 56.34297279246823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic understanding of 3D objects is crucial in many applications such as
object manipulation. However, it is hard to give a universal definition of
point-level semantics that everyone would agree on. We observe that people have
a consensus on semantic correspondences between two areas from different
objects, but are less certain about the exact semantic meaning of each area.
Therefore, we argue that by providing human labeled correspondences between
different objects from the same category instead of explicit semantic labels,
one can recover rich semantic information of an object. In this paper, we
introduce a new dataset named CorresPondenceNet. Based on this dataset, we are
able to learn dense semantic embeddings with a novel geodesic consistency loss.
Accordingly, several state-of-the-art networks are evaluated on this
correspondence benchmark. We further show that CorresPondenceNet could not only
boost fine-grained understanding of heterogeneous objects but also cross-object
registration and partial object matching.
- Abstract(参考訳): 3Dオブジェクトのセマンティック理解は、オブジェクト操作のような多くのアプリケーションにおいて重要である。
しかし、誰もが同意するポイントレベルの意味論を普遍的に定義することは難しい。
我々は、異なる対象から2つの領域間の意味的対応について合意が得られたが、それぞれの領域の正確な意味についてはあまり明確でないことを観察した。
したがって、明示的な意味的ラベルではなく、同じカテゴリの異なるオブジェクト間の人間のラベル付き対応を提供することで、オブジェクトの豊富な意味的情報を回復することができると主張する。
本稿では,CorresPondenceNetという新しいデータセットを提案する。
このデータセットに基づいて、新しい測地的整合性損失を伴う密接なセマンティック埋め込みを学習することができる。
このため、この対応ベンチマークでいくつかの最先端ネットワークを評価した。
さらに、CorresPondenceNetは、異種オブジェクトの詳細な理解を促進するだけでなく、クロスオブジェクト登録や部分オブジェクトマッチングも促進できることを示した。
関連論文リスト
- 3DRP-Net: 3D Relative Position-aware Network for 3D Visual Grounding [58.924180772480504]
3Dビジュアルグラウンドは、自由形式の言語記述によって、ターゲットオブジェクトを3Dポイントクラウドにローカライズすることを目的としている。
3次元相対位置認識ネットワーク(3-Net)という,関係性を考慮した一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T09:33:25Z) - Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic
Image Synthesis [139.2216271759332]
本稿では,難解なセマンティック画像合成タスクのための新しいECGANを提案する。
セマンティックラベルは詳細な構造情報を提供しておらず、局所的な詳細や構造を合成することは困難である。
畳み込み、ダウンサンプリング、正規化といった広く採用されているCNN操作は、通常、空間分解能の損失を引き起こす。
本稿では,同じセマンティッククラスに属する画素埋め込みを強制して,より類似した画像コンテンツを生成することを目的とした,新しいコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-22T14:17:19Z) - Disentangling Learnable and Memorizable Data via Contrastive Learning
for Semantic Communications [81.10703519117465]
セマンティック・レディにするために、ソースデータをアンタングルする新しい機械推論フレームワークが提案されている。
特に、データ上でインスタンスとクラスタの識別を行う新しいコントラスト学習フレームワークが提案されている。
信頼度の高い深いセマンティッククラスタは、学習可能でセマンティックリッチなデータだと考えられている。
シミュレーションの結果は, セマンティック・インパクトとミニマリズムの観点から, コントラスト学習アプローチの優位性を示した。
論文 参考訳(メタデータ) (2022-12-18T12:00:12Z) - EDA: Explicit Text-Decoupling and Dense Alignment for 3D Visual
Grounding [4.447173454116189]
3Dビジュアルグラウンドティングは、リッチなセマンティックキューを備えた自由形式の自然言語記述によって言及されているポイントクラウド内のオブジェクトを見つけることを目的としている。
文中のテキスト属性を明示的に分離するEDAを提案する。
さらに、オブジェクト名を含まないオブジェクトを位置決めする新しい視覚的接地タスクを導入し、モデルの高密度アライメント能力を徹底的に評価する。
論文 参考訳(メタデータ) (2022-09-29T17:00:22Z) - Object-Compositional Neural Implicit Surfaces [45.274466719163925]
ニューラル暗示表現は、新しいビュー合成と多視点画像からの高品質な3D再構成においてその効果を示した。
本稿では,3次元再構成とオブジェクト表現に高い忠実性を有するオブジェクト合成型ニューラル暗黙表現を構築するための新しいフレームワークであるObjectSDFを提案する。
論文 参考訳(メタデータ) (2022-07-20T06:38:04Z) - Regional Semantic Contrast and Aggregation for Weakly Supervised
Semantic Segmentation [25.231470587575238]
本稿では,意味的セグメンテーションを学習するための地域意味的コントラストとアグリゲーション(RCA)を提案する。
RCAは、訓練データに現れる多種多様なオブジェクトパターンを格納する地域記憶バンクを備えている。
RCAは、きめ細かいセマンティック理解の強い能力を獲得し、最終的には2つの人気のあるベンチマークで新しい最先端の結果を確立する。
論文 参考訳(メタデータ) (2022-03-17T23:29:03Z) - Points2Vec: Unsupervised Object-level Feature Learning from Point Clouds [25.988556827312483]
同様の表現学習技術は3次元視覚の文脈ではまだ一般的ではない。
我々は、教師なしアルゴリズムを用いてスキャンされた3次元空間のデータセットをマイニングすることにより、これらのベクトル表現を学習する。
本稿では,コンテキストを含む手法を用いることで,クラスタリングアルゴリズムが相互に異なるセマンティッククラスを識別する能力を高めることを示す。
論文 参考訳(メタデータ) (2021-02-08T11:29:57Z) - Continuous Surface Embeddings [76.86259029442624]
我々は、変形可能な対象カテゴリーにおける密接な対応を学習し、表現するタスクに焦点をあてる。
本稿では,高密度対応の新たな学習可能な画像ベース表現を提案する。
提案手法は,人間の身近なポーズ推定のための最先端手法と同等以上の性能を示すことを示す。
論文 参考訳(メタデータ) (2020-11-24T22:52:15Z) - Joint Semantic Analysis with Document-Level Cross-Task Coherence Rewards [13.753240692520098]
本稿では,共用コア参照解決のためのニューラルネットワークアーキテクチャと,英語のセマンティックロールラベリングについて述べる。
我々は、文書と意味的アノテーション間のグローバルコヒーレンスを促進するために強化学習を使用します。
これにより、異なるドメインからの複数のデータセットにおける両方のタスクが改善される。
論文 参考訳(メタデータ) (2020-10-12T09:36:24Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。