論文の概要: ShapeEmbed: a self-supervised learning framework for 2D contour quantification
- arxiv url: http://arxiv.org/abs/2507.01009v1
- Date: Tue, 01 Jul 2025 17:55:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.778442
- Title: ShapeEmbed: a self-supervised learning framework for 2D contour quantification
- Title(参考訳): ShapeEmbed: 2次元輪郭量化のための自己教師型学習フレームワーク
- Authors: Anna Foix Romero, Craig Russell, Alexander Krull, Virginie Uhlmann,
- Abstract要約: オブジェクトの輪郭を2次元画像にエンコードする自己教師型表現学習フレームワークであるShapeEmbedを紹介する。
提案手法は,従来の形状記述子の限界を克服し,最先端のオートエンコーダベースのアプローチを改良する。
我々は,本フレームワークで学習した記述子は,自然画像や生体画像の形状分類タスクにおいて,競合他社よりも優れていたことを実証した。
- 参考スコア(独自算出の注目度): 45.39160205677261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The shape of objects is an important source of visual information in a wide range of applications. One of the core challenges of shape quantification is to ensure that the extracted measurements remain invariant to transformations that preserve an object's intrinsic geometry, such as changing its size, orientation, and position in the image. In this work, we introduce ShapeEmbed, a self-supervised representation learning framework designed to encode the contour of objects in 2D images, represented as a Euclidean distance matrix, into a shape descriptor that is invariant to translation, scaling, rotation, reflection, and point indexing. Our approach overcomes the limitations of traditional shape descriptors while improving upon existing state-of-the-art autoencoder-based approaches. We demonstrate that the descriptors learned by our framework outperform their competitors in shape classification tasks on natural and biological images. We envision our approach to be of particular relevance to biological imaging applications.
- Abstract(参考訳): オブジェクトの形状は、広範囲のアプリケーションにおいて、視覚情報の重要な源である。
形状定量化の中核的な課題の1つは、抽出された測定値が、画像のサイズ、向き、位置を変えるなど、物体の固有の幾何学を保存する変換に不変であることを保証することである。
本研究では,2次元画像の物体の輪郭をユークリッド距離行列として表現した自己教師型表現学習フレームワークであるShapeEmbedを,翻訳,スケーリング,回転,反射,点インデックス化に不変な形状記述子に導入する。
提案手法は,従来の形状記述子の限界を克服し,最先端のオートエンコーダベースのアプローチを改良する。
我々は,本フレームワークで学習した記述子は,自然画像や生体画像の形状分類タスクにおいて,競合他社よりも優れていたことを実証した。
我々は、生物学的イメージング応用に特に関係するアプローチを想定する。
関連論文リスト
- Rethinking Rotation-Invariant Recognition of Fine-grained Shapes from the Perspective of Contour Points [0.0]
形状認識のための輪郭幾何学的認識に基づく反雑音回転不変畳み込みモジュールを提案する。
その結果, 粒状形状の回転不変認識において, 優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2025-03-14T01:34:20Z) - Interior Object Geometry via Fitted Frames [18.564031163436553]
本稿では,対象集団内での強い位置対応を実現するために,解剖学的対象を対象とする表現について述べる。
本手法は, 境界面および物体内部に嵌合したフレームを生成し, それらからアライメントフリーな幾何学的特徴を生成する。
論文 参考訳(メタデータ) (2024-07-19T14:38:47Z) - Geo-SIC: Learning Deformable Geometric Shapes in Deep Image Classifiers [8.781861951759948]
本稿では,画像分類の性能向上のために,変形空間における変形可能な形状を学習する最初のディープラーニングモデルGeo-SICを提案する。
画像空間と潜時形状空間の両方から特徴を同時に導出する,クラス内変動の大きい新設計のフレームワークを提案する。
幾何学的形状表現の教師なし学習を取り入れた強化型分類網を開発した。
論文 参考訳(メタデータ) (2022-10-25T01:55:17Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - Frame Averaging for Equivariant Shape Space Learning [85.42901997467754]
形状空間学習に対称性を組み込む自然な方法は、形状空間(エンコーダ)への写像と形状空間(デコーダ)からの写像が関連する対称性に同値であることを問うことである。
本稿では,2つのコントリビューションを導入することで,エンコーダとデコーダの等価性を組み込む枠組みを提案する。
論文 参考訳(メタデータ) (2021-12-03T06:41:19Z) - Learning Canonical 3D Object Representation for Fine-Grained Recognition [77.33501114409036]
本研究では,1枚の画像から3次元空間における物体の変動を再現する微粒な物体認識のための新しいフレームワークを提案する。
我々は,物体を3次元形状とその外観の合成として表現し,カメラ視点の影響を排除した。
深部表現に3次元形状と外観を併用することにより,物体の識別表現を学習する。
論文 参考訳(メタデータ) (2021-08-10T12:19:34Z) - Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation [44.8872454995923]
単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
論文 参考訳(メタデータ) (2021-07-27T01:55:30Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - Learning to Caricature via Semantic Shape Transform [95.25116681761142]
本稿では,意味的形状変換に基づくアルゴリズムを提案する。
提案手法は,顔の構造を維持しつつ,視覚的に心地よい形状の誇張を表現できることを示す。
論文 参考訳(メタデータ) (2020-08-12T03:41:49Z) - Fine-grained Image-to-Image Transformation towards Visual Recognition [102.51124181873101]
我々は,入力画像の同一性を保った画像を生成するために,微細なカテゴリで画像を変換することを目的としている。
我々は、画像のアイデンティティと非関連要因をアンハングルするために、生成的敵ネットワークに基づくモデルを採用する。
CompCarsとMulti-PIEデータセットの実験では、我々のモデルが生成した画像のアイデンティティを、最先端の画像-画像変換モデルよりもはるかによく保存していることが示された。
論文 参考訳(メタデータ) (2020-01-12T05:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。