論文の概要: Resolution Invariant Autoencoder
- arxiv url: http://arxiv.org/abs/2503.09828v1
- Date: Wed, 12 Mar 2025 20:47:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-14 15:51:33.728821
- Title: Resolution Invariant Autoencoder
- Title(参考訳): 分解能不変オートエンコーダ
- Authors: Ashay Patel, Michela Antonelli, Sebastien Ourselin, M. Jorge Cardoso,
- Abstract要約: ネットワークの各層における空間的リサイズを学習変数のリサイズプロセスを介して適応する,分解能不変なオートエンコーダを提案する。
これにより、入力や出力の解像度に関わらず、一貫した遅延空間の解像度が保証される。
本研究では,不確実性を考慮した超解像,分類,生成的モデリングタスクにおいて,その有効性を示す。
- 参考スコア(独自算出の注目度): 1.149124112513873
- License:
- Abstract: Deep learning has significantly advanced medical imaging analysis, yet variations in image resolution remain an overlooked challenge. Most methods address this by resampling images, leading to either information loss or computational inefficiencies. While solutions exist for specific tasks, no unified approach has been proposed. We introduce a resolution-invariant autoencoder that adapts spatial resizing at each layer in the network via a learned variable resizing process, replacing fixed spatial down/upsampling at the traditional factor of 2. This ensures a consistent latent space resolution, regardless of input or output resolution. Our model enables various downstream tasks to be performed on an image latent whilst maintaining performance across different resolutions, overcoming the shortfalls of traditional methods. We demonstrate its effectiveness in uncertainty-aware super-resolution, classification, and generative modelling tasks and show how our method outperforms conventional baselines with minimal performance loss across resolutions.
- Abstract(参考訳): 深層学習は医療画像解析を著しく進歩させてきたが、画像の解像度の変化は見過ごされがちな課題である。
ほとんどの方法は画像を再サンプリングすることでこの問題に対処し、情報損失または計算の非効率をもたらす。
特定のタスクに対して解が存在するが、統一的なアプローチは提案されていない。
ネットワーク内の各層における空間的リサイズを学習変数のリサイズ処理により適用し,従来の2。
これにより、入力や出力の解像度に関わらず、一貫した遅延空間の解像度が保証される。
本モデルでは,従来の手法の欠点を克服しつつ,解像度の異なる様々な性能を維持しながら,遅延画像上で様々なダウンストリームタスクを実行できる。
我々は,不確実性を考慮した超解像,分類,生成モデルタスクにおけるその有効性を実証し,本手法が従来のベースラインよりも高い性能を示す。
関連論文リスト
- Elastic-DETR: Making Image Resolution Learnable with Content-Specific Network Prediction [0.612477318852572]
我々は,複数の画像解像度の弾性利用を可能にする,Elastic-DETRと呼ばれる学習可能な解像度のための新しい戦略を導入する。
我々のネットワークは、コンパクトなスケール予測モジュールを用いて、画像の内容に基づいて適応的なスケールファクタを提供する。
解像度の柔軟性を活用することで、精度と計算複雑性のトレードオフを様々に示す様々なモデルを実演することができる。
論文 参考訳(メタデータ) (2024-12-09T09:46:21Z) - Adaptive Resolution Residual Networks -- Generalizing Across Resolutions Easily and Efficiently [7.087237546722617]
適応分解能残留ネットワーク(ARRN)について紹介する。
ARRNは適応分解能法と固定分解能法の利点を継承する。
我々はARRNが、柔軟性、堅牢性、計算効率を向上した多様な解像度によって引き起こされる課題を受け入れていることを示す。
論文 参考訳(メタデータ) (2024-12-09T04:25:37Z) - Cross-resolution Face Recognition via Identity-Preserving Network and
Knowledge Distillation [12.090322373964124]
クロスレゾリューション顔認識は、現代の深層顔認識システムにとって難しい問題である。
本稿では,低分解能画像の低周波成分に蓄積される識別情報にネットワークを集中させる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-15T14:52:46Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Resolution based Feature Distillation for Cross Resolution Person
Re-Identification [17.86505685442293]
人物の再識別(re-id)は、異なるカメラビューで同一人物の画像を取得することを目的としている。
解像度のミスマッチは、興味のある人とカメラの間の距離が異なるため起こる。
本稿では,複数の解像度の問題を克服するために,分解能に基づく特徴蒸留(RFD)アプローチを提案する。
論文 参考訳(メタデータ) (2021-09-16T11:07:59Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Image Matching with Scale Adjustment [57.18604132027697]
可変スケールでの関心点の表現と抽出方法を示す。
2つの異なる解像度で2つの画像を比較する方法を提案する。
論文 参考訳(メタデータ) (2020-12-10T11:03:25Z) - 3D Human Shape and Pose from a Single Low-Resolution Image with
Self-Supervised Learning [105.49950571267715]
3次元人物形状とポーズ推定のための既存のディープラーニング手法は、比較的高解像度な入力画像に依存している。
本稿では,レゾリューション・アウェア・ネットワーク,セルフ・スーパービジョン・ロス,コントラッシブ・ラーニング・スキームからなるRCC-Netを提案する。
これら2つの新たなトレーニング損失は,3次元形状を学習し,弱教師ありの姿勢を示す。
論文 参考訳(メタデータ) (2020-07-27T16:19:52Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。