論文の概要: Rotation and Translation Invariant Representation Learning with Implicit
Neural Representations
- arxiv url: http://arxiv.org/abs/2304.13995v1
- Date: Thu, 27 Apr 2023 07:33:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-28 14:05:28.133639
- Title: Rotation and Translation Invariant Representation Learning with Implicit
Neural Representations
- Title(参考訳): 暗黙的表現を用いた回転および変換不変表現学習
- Authors: Sehyun Kwon, Joo Young Choi, Ernest K. Ryu
- Abstract要約: IRL-INRは,従来検討されていたものと比較して,より複雑な画像上の不整合意味表現を効果的に学習できることを示す。
これらの意味表現はSCANとうまく相乗し、最先端の教師なしクラスタリング結果を生成する。
- 参考スコア(独自算出の注目度): 5.478764356647437
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many computer vision applications, images are acquired with arbitrary or
random rotations and translations, and in such setups, it is desirable to
obtain semantic representations disentangled from the image orientation.
Examples of such applications include semiconductor wafer defect inspection,
plankton microscope images, and inference on single-particle cryo-electron
microscopy (cryo-EM) micro-graphs. In this work, we propose Invariant
Representation Learning with Implicit Neural Representation (IRL-INR), which
uses an implicit neural representation (INR) with a hypernetwork to obtain
semantic representations disentangled from the orientation of the image. We
show that IRL-INR can effectively learn disentangled semantic representations
on more complex images compared to those considered in prior works and show
that these semantic representations synergize well with SCAN to produce
state-of-the-art unsupervised clustering results.
- Abstract(参考訳): 多くのコンピュータビジョンアプリケーションでは、画像は任意またはランダムな回転と変換で取得され、そのような設定では、画像の向きから切り離された意味表現を得ることが望ましい。
そのような応用例としては、半導体ウェハ欠陥検査、プランクトン顕微鏡像、単結晶電子顕微鏡(cryo-EM)マイクログラフの推測がある。
Invariant Representation Learning with Implicit Neural Representation (IRL-INR) は、暗黙的ニューラル表現(INR)とハイパーネットワークを用いて、画像の向きから切り離された意味表現を得る。
IRL-INRは,従来検討されていたものと比較して,より複雑な画像上の不整合セマンティック表現を効果的に学習できることを示し,これらのセマンティック表現がSCANとうまく相乗して,最先端の教師なしクラスタリング結果を生成することを示す。
関連論文リスト
- Mechanisms of Generative Image-to-Image Translation Networks [1.602820210496921]
本稿では,既存のモデルに比べてシンプルなアーキテクチャで,画像間翻訳ネットワークを提案する。
GANモデルに対する逆算は、余分な複雑な損失のペナルティを伴わない既存の手法に匹敵する結果をもたらすことを示す。
論文 参考訳(メタデータ) (2024-11-15T17:17:46Z) - Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [50.62725807357586]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - Style transfer between Microscopy and Magnetic Resonance Imaging via
Generative Adversarial Network in small sample size settings [49.84018914962972]
磁気共鳴イメージング(MRI)のクロスモーダル増強と、同じ組織サンプルに基づく顕微鏡イメージングが期待できる。
コンディショナル・ジェネレーティブ・逆境ネットワーク (cGAN) アーキテクチャを用いて, コーパス・カロサムのMRI画像から顕微鏡組織像を生成する方法を検討した。
論文 参考訳(メタデータ) (2023-10-16T13:58:53Z) - GM-NeRF: Learning Generalizable Model-based Neural Radiance Fields from
Multi-view Images [79.39247661907397]
本稿では,自由視点画像の合成に有効なフレームワークであるGeneralizable Model-based Neural Radiance Fieldsを提案する。
具体的には、多視点2D画像からの出現コードを幾何学的プロキシに登録するための幾何学誘導型アテンション機構を提案する。
論文 参考訳(メタデータ) (2023-03-24T03:32:02Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - Sobolev Training for Implicit Neural Representations with Approximated
Image Derivatives [12.71676484494428]
ニューラルネットワークによってパラメータ化されたインプシットニューラルネットワーク表現(INR)は、さまざまな種類の信号を表現するための強力なツールとして登場した。
ニューラルネットワークにおける画像値に加えて、画像の微分を符号化するために、ターゲット出力が画像画素であるINRのトレーニングパラダイムを提案する。
トレーニングパラダイムをどのように活用して、典型的なINR(画像回帰と逆レンダリング)の問題を解決するかを示す。
論文 参考訳(メタデータ) (2022-07-21T10:12:41Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Recursive Neural Programs: Variational Learning of Image Grammars and
Part-Whole Hierarchies [1.5990720051907859]
本稿では,部分階層学習問題に対処するため,再帰的ニューラルプログラム(RNP)を導入する。
RNPは、部分階層学習問題に対処する最初の神経生成モデルである。
以上の結果から,RNPはオブジェクトやシーンを直感的で説明可能な構成方法であることがわかった。
論文 参考訳(メタデータ) (2022-06-16T22:02:06Z) - Two-stage Visual Cues Enhancement Network for Referring Image
Segmentation [89.49412325699537]
Referring Image (RIS)は、ある自然言語表現によって参照される画像から対象のオブジェクトをセグメント化することを目的としている。
本稿では,2段階のビジュアルキュー拡張ネットワーク(TV-Net)を考案し,この問題に対処する。
この2段階の強化により,提案するTV-Netは,自然言語表現と画像間のきめ細かいマッチング動作の学習において,より優れた性能を享受できる。
論文 参考訳(メタデータ) (2021-10-09T02:53:39Z) - Orientation-Disentangled Unsupervised Representation Learning for
Computational Pathology [6.468635277309852]
本稿では,回転同変畳み込みネットワークの群構造を利用して,変分自動エンコーダフレームワークの拡張を提案する。
訓練されたモデルが単一セル画像の固有方向情報を効率的に切り離すことを示す。
論文 参考訳(メタデータ) (2020-08-26T16:57:45Z) - Contrast-weighted Dictionary Learning Based Saliency Detection for
Remote Sensing Images [3.338193485961624]
本稿では,リモートセンシング画像に対するコントラスト重み付き辞書学習(CDL)に基づく新しい唾液度検出モデルを提案する。
具体的には、正と負のサンプルから正と非正の原子を学習し、識別辞書を構築する。
提案手法を用いて, 識別辞書に基づいて, 種々の相補性マップを生成する。
論文 参考訳(メタデータ) (2020-04-06T06:49:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。