論文の概要: Geo-SIC: Learning Deformable Geometric Shapes in Deep Image Classifiers
- arxiv url: http://arxiv.org/abs/2210.13704v1
- Date: Tue, 25 Oct 2022 01:55:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 14:57:12.678865
- Title: Geo-SIC: Learning Deformable Geometric Shapes in Deep Image Classifiers
- Title(参考訳): Geo-SIC:Deep Image Classifierにおける変形可能な幾何学形状の学習
- Authors: Jian Wang, Miaomiao Zhang
- Abstract要約: 本稿では,画像分類の性能向上のために,変形空間における変形可能な形状を学習する最初のディープラーニングモデルGeo-SICを提案する。
画像空間と潜時形状空間の両方から特徴を同時に導出する,クラス内変動の大きい新設計のフレームワークを提案する。
幾何学的形状表現の教師なし学習を取り入れた強化型分類網を開発した。
- 参考スコア(独自算出の注目度): 8.781861951759948
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deformable shapes provide important and complex geometric features of objects
presented in images. However, such information is oftentimes missing or
underutilized as implicit knowledge in many image analysis tasks. This paper
presents Geo-SIC, the first deep learning model to learn deformable shapes in a
deformation space for an improved performance of image classification. We
introduce a newly designed framework that (i) simultaneously derives features
from both image and latent shape spaces with large intra-class variations; and
(ii) gains increased model interpretability by allowing direct access to the
underlying geometric features of image data. In particular, we develop a
boosted classification network, equipped with an unsupervised learning of
geometric shape representations characterized by diffeomorphic transformations
within each class. In contrast to previous approaches using pre-extracted
shapes, our model provides a more fundamental approach by naturally learning
the most relevant shape features jointly with an image classifier. We
demonstrate the effectiveness of our method on both simulated 2D images and
real 3D brain magnetic resonance (MR) images. Experimental results show that
our model substantially improves the image classification accuracy with an
additional benefit of increased model interpretability. Our code is publicly
available at https://github.com/jw4hv/Geo-SIC
- Abstract(参考訳): 変形可能な形状は、画像に示される物体の重要かつ複雑な幾何学的特徴を提供する。
しかし、そのような情報は多くの場合、画像分析タスクにおいて暗黙の知識として欠落または未使用である。
本稿では,画像分類の性能向上のために,変形空間における変形可能な形状を学習する最初のディープラーニングモデルGeo-SICを提案する。
新しく設計されたフレームワークを紹介します
i) クラス内変動が大きい画像空間と潜時形状空間の両方から特徴を同時に導出し、
(II)画像データの幾何学的特徴に直接アクセスすることでモデル解釈可能性を高める。
特に,各クラス内の微分同相変換を特徴とする幾何学的形状表現の教師なし学習を特徴とする強化型分類網を開発する。
予め抽出した形状を用いた従来のアプローチとは対照的に,本モデルは画像分類器と連動して最も関連する形状特徴を自然に学習することで,より基本的なアプローチを提供する。
シミュレーション2次元画像と実脳磁気共鳴(MR)画像の両方において,本手法の有効性を示す。
実験の結果, モデル解釈性の向上により, 画像分類精度が大幅に向上した。
私たちのコードはhttps://github.com/jw4hv/Geo-SICで公開されています。
関連論文リスト
- Invariant Shape Representation Learning For Image Classification [41.610264291150706]
本稿では,不変形状表現学習(ISRL)を初めて開発した新しいフレームワークを提案する。
我々のモデルISRLは、変形可能な変換によってパラメータ化される潜在形状空間における不変特徴を共同でキャプチャするように設計されている。
異なる環境にターゲット変数に関して不変な機能を埋め込むことで、我々のモデルは一貫してより正確な予測を提供する。
論文 参考訳(メタデータ) (2024-11-19T03:39:43Z) - Few-shot Shape Recognition by Learning Deep Shape-aware Features [39.66613852292122]
サンプル1枚または数枚のみのオブジェクト形状を認識するために,FSSD ( fewshot shape descriptor) を提案する。
我々はFSSDに埋め込みモジュールを用いて変換不変形状の特徴を抽出する。
第3に,形状マスクとエッジの監視を含むデコードモジュールを提案し,元の形状特徴と再構成形状特徴を整列する。
論文 参考訳(メタデータ) (2023-12-03T08:12:23Z) - Explorable Mesh Deformation Subspaces from Unstructured Generative
Models [53.23510438769862]
3次元形状の深い生成モデルは、しばしば潜在的な変動を探索するために使用できる連続的な潜伏空間を特徴付ける。
本研究では,手軽に探索可能な2次元探索空間から事前学習された生成モデルのサブ空間へのマッピングを構築することで,与えられたランドマーク形状の集合間のバリエーションを探索する手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T18:53:57Z) - SADIR: Shape-Aware Diffusion Models for 3D Image Reconstruction [2.2954246824369218]
限られた2次元画像からの3次元画像再構成は、コンピュータビジョンと画像解析における長年にわたる課題である。
本研究では,これらの問題に対処する3次元画像再構成のための拡散モデルに基づく形状認識ネットワークSADIRを提案する。
論文 参考訳(メタデータ) (2023-09-06T19:30:22Z) - Improving Shape Awareness and Interpretability in Deep Networks Using
Geometric Moments [0.0]
画像分類のためのディープネットワークは、しばしばオブジェクトの形状よりもテクスチャ情報に依存している。
本稿では,幾何学的モーメントにインスパイアされたディープラーニングモデルを提案する。
標準画像分類データセットにおける本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-05-24T02:08:05Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Self-Supervised Image Representation Learning with Geometric Set
Consistency [50.12720780102395]
本稿では,3次元幾何整合性に基づく自己教師付き画像表現学習法を提案する。
具体的には、画像ビュー内の特徴整合性を強化するために、コントラスト学習フレームワークに3次元幾何学的整合性を導入する。
論文 参考訳(メタデータ) (2022-03-29T08:57:33Z) - Pop-Out Motion: 3D-Aware Image Deformation via Learning the Shape
Laplacian [58.704089101826774]
形状分類と変形型に最小限の制約を課した3次元画像変形法を提案する。
点雲として表される3次元再構成の基底体積のラプラシアン形状を予測するために,教師付き学習に基づくアプローチを採用する。
実験では,2次元キャラクタと人間の衣料画像の変形実験を行った。
論文 参考訳(メタデータ) (2022-03-29T04:57:18Z) - OSLO: On-the-Sphere Learning for Omnidirectional images and its
application to 360-degree image compression [59.58879331876508]
全方向画像の表現モデルの学習について検討し、全方向画像の深層学習モデルで使用される数学的ツールを再定義するために、HEALPixの球面一様サンプリングの特性を利用することを提案する。
提案したオン・ザ・スフィア・ソリューションは、等方形画像に適用された類似の学習モデルと比較して、13.7%のビットレートを節約できる圧縮ゲインを向上させる。
論文 参考訳(メタデータ) (2021-07-19T22:14:30Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。