論文の概要: Implicit Modeling of Non-rigid Objects with Cross-Category Signals
- arxiv url: http://arxiv.org/abs/2312.10246v1
- Date: Fri, 15 Dec 2023 22:34:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 17:52:26.598340
- Title: Implicit Modeling of Non-rigid Objects with Cross-Category Signals
- Title(参考訳): クロスカテゴリ信号を用いた非剛体物体のインプリシトモデリング
- Authors: Yuchun Liu, Benjamin Planche, Meng Zheng, Zhongpai Gao, Pierre
Sibut-Bourde, Fan Yang, Terrence Chen, Ziyan Wu
- Abstract要約: MODIFは、複数のオブジェクトに対する変形フィールドとインスタンス固有の潜時符号を同時に学習する多目的深い暗黙関数である。
我々は,MODIFが各臓器の形状表現と他臓器との関係を良好に学習できることを示す。
- 参考スコア(独自算出の注目度): 28.956412015920936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep implicit functions (DIFs) have emerged as a potent and articulate means
of representing 3D shapes. However, methods modeling object categories or
non-rigid entities have mainly focused on single-object scenarios. In this
work, we propose MODIF, a multi-object deep implicit function that jointly
learns the deformation fields and instance-specific latent codes for multiple
objects at once. Our emphasis is on non-rigid, non-interpenetrating entities
such as organs. To effectively capture the interrelation between these entities
and ensure precise, collision-free representations, our approach facilitates
signaling between category-specific fields to adequately rectify shapes. We
also introduce novel inter-object supervision: an attraction-repulsion loss is
formulated to refine contact regions between objects. Our approach is
demonstrated on various medical benchmarks, involving modeling different groups
of intricate anatomical entities. Experimental results illustrate that our
model can proficiently learn the shape representation of each organ and their
relations to others, to the point that shapes missing from unseen instances can
be consistently recovered by our method. Finally, MODIF can also propagate
semantic information throughout the population via accurate point
correspondences
- Abstract(参考訳): 深部暗黙関数(DIF)は3次元形状を表現する強力な明瞭な手段として出現している。
しかし、オブジェクトカテゴリや非厳密なエンティティをモデル化するメソッドは、主に単一オブジェクトのシナリオに焦点を当てている。
本研究では,複数オブジェクトに対する変形場とインスタンス固有の潜時符号を同時に学習する多目的深部暗黙関数MODIFを提案する。
我々は臓器などの非剛性、非侵入性に重点を置いている。
これらの実体間の相互関係を効果的に捉え、正確で衝突のない表現を確実にするために、このアプローチは、適切な形状を整定するために、カテゴリ固有のフィールド間のシグナル伝達を容易にする。
物体間の接触領域を精密化するためにアトラクション・反発損失を定式化する。
このアプローチは様々な医学的ベンチマークで実証され、様々な複雑な解剖学的実体群をモデル化する。
実験結果から,本モデルでは各臓器の形状表現と他臓器との関係を良好に学習できることを示す。
最後に、modifは正確な点対応を通じて、人口全体に意味情報を伝播することができる。
関連論文リスト
- Human-Object Interaction Detection Collaborated with Large Relation-driven Diffusion Models [65.82564074712836]
テキストと画像の拡散モデルに光を流す新しいHOI検出器であるDIFfusionHOIを紹介する。
まず、埋め込み空間における人間と物体の関係パターンの表現をインバージョンベースで学習する戦略を考案する。
これらの学習された関係埋め込みはテキストのプロンプトとして機能し、スタイア拡散モデルが特定の相互作用を記述する画像を生成する。
論文 参考訳(メタデータ) (2024-10-26T12:00:33Z) - pix2gestalt: Amodal Segmentation by Synthesizing Wholes [34.45464291259217]
pix2gestaltはゼロショットアモーダルセグメンテーションのためのフレームワークである。
ゼロショットに挑戦する場合には,オブジェクト全体を再構成するための条件拡散モデルを学ぶ。
論文 参考訳(メタデータ) (2024-01-25T18:57:36Z) - DTF-Net: Category-Level Pose Estimation and Shape Reconstruction via
Deformable Template Field [29.42222066097076]
RGB-Depth画像ペアから、オープンワールドシーンの6Dポーズの推定と3D形状の再構築は困難である。
本稿では,オブジェクトカテゴリの暗黙的ニューラルネットワークに基づくポーズ推定と形状再構成のための新しいフレームワークであるDTF-Netを提案する。
論文 参考訳(メタデータ) (2023-08-04T10:35:40Z) - Suspected Object Matters: Rethinking Model's Prediction for One-stage
Visual Grounding [93.82542533426766]
疑似オブジェクト間の対象オブジェクト選択を促進するため,疑似オブジェクト変換機構(SOT)を提案する。
SOTは既存のCNNとTransformerベースのワンステージ視覚グラウンドにシームレスに統合できる。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-10T06:41:07Z) - SPAMs: Structured Implicit Parametric Models [30.19414242608965]
本研究では,非剛体物体の動きを形状とポーズの部分的不整合表現に構造的に分解する変形可能なオブジェクト表現として,構造化単純パラメトリックモデル(SPAM)を学習する。
複雑な変形物体の動きの深度配列の復元と追跡において、我々の部分認識形状とポーズ理解が最先端のパフォーマンスに繋がることを示す実験を行った。
論文 参考訳(メタデータ) (2022-01-20T12:33:46Z) - NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One
Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。
NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。
異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-17T12:25:44Z) - A-SDF: Learning Disentangled Signed Distance Functions for Articulated
Shape Representation [62.517760545209065]
A-SDF (Articulated Signed Distance Functions) を導入して, 曲面形状を表す。
本モデルでは, 部分点群や実世界深度画像など, 未知のデータへの一般化を実証する。
論文 参考訳(メタデータ) (2021-04-15T17:53:54Z) - Continuous Surface Embeddings [76.86259029442624]
我々は、変形可能な対象カテゴリーにおける密接な対応を学習し、表現するタスクに焦点をあてる。
本稿では,高密度対応の新たな学習可能な画像ベース表現を提案する。
提案手法は,人間の身近なポーズ推定のための最先端手法と同等以上の性能を示すことを示す。
論文 参考訳(メタデータ) (2020-11-24T22:52:15Z) - Intrinsic Relationship Reasoning for Small Object Detection [44.68289739449486]
画像やビデオの小さなオブジェクトは通常、独立した個人ではない。その代わりに、意味的および空間的レイアウトの関係を多かれ少なかれ提示する。
本稿では,オブジェクト間の固有意味と空間的レイアウトの関係をモデル化し,推論する,小さなオブジェクト検出のための新しいコンテキスト推論手法を提案する。
論文 参考訳(メタデータ) (2020-09-02T06:03:05Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。