論文の概要: UNet-AF: An alias-free UNet for image restoration
- arxiv url: http://arxiv.org/abs/2603.11323v1
- Date: Wed, 11 Mar 2026 21:34:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.657889
- Title: UNet-AF: An alias-free UNet for image restoration
- Title(参考訳): UNet-AF:イメージ復元のためのエイリアスフリーなUNet
- Authors: Jérémy Scanvic, Quentin Barthélemy, Julián Tachella,
- Abstract要約: UNetはしばしば翻訳と等価であると仮定されるが、伝統的にこれらはエイリアシングの傾向が知られている層で構成されている。
我々は、最先端の翻訳等価層を慎重に選択した、新しいエイリアスフリーなUNetを提案する。
- 参考スコア(独自算出の注目度): 10.849837462612847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The simplicity and effectiveness of the UNet architecture makes it ubiquitous in image restoration, image segmentation, and diffusion models. They are often assumed to be equivariant to translations, yet they traditionally consist of layers that are known to be prone to aliasing, which hinders their equivariance in practice. To overcome this limitation, we propose a new alias-free UNet designed from a careful selection of state-of-the-art translation-equivariant layers. We evaluate the proposed equivariant architecture against non-equivariant baselines on image restoration tasks and observe competitive performance with a significant increase in measured equivariance. Through extensive ablation studies, we also demonstrate that each change is crucial for its empirical equivariance. Our implementation is available at https://github.com/jscanvic/UNet-AF
- Abstract(参考訳): UNetアーキテクチャの単純さと有効性により、画像復元、画像分割、拡散モデルにおいてユビキタスである。
これらはしばしば翻訳に同変であると仮定されるが、伝統的にエイリアシングの傾向が知られている層で構成されており、実際はそれらの同変を妨げている。
この制限を克服するために、最先端の翻訳等価層を慎重に選択した新しいエイリアスフリーなUNetを提案する。
画像復元タスクの非同変ベースラインに対して提案した同変アーキテクチャを評価し,測定値の大幅な増加による競合性能の観察を行った。
広範囲にわたるアブレーション研究を通じて、それぞれの変化がその経験的等価性に不可欠であることを示す。
私たちの実装はhttps://github.com/jscanvic/UNet-AFで利用可能です。
関連論文リスト
- Unpaired Image-to-Image Translation via a Self-Supervised Semantic Bridge [59.247871132422006]
逆拡散法と拡散反転法は、未ペア画像から画像への変換を先進的に進めているが、それぞれが鍵となる制限に直面している。
本稿では,外部意味を拡散ブリッジモデルに統合する汎用フレームワークであるSelf-Supervised Semantic Bridge (SSB)を提案する。
我々のキーとなる考え方は、自己教師付き視覚エンコーダを活用して、外観変化に不変な表現を学習するが、幾何学的構造を捉えることである。
論文 参考訳(メタデータ) (2026-02-18T18:05:00Z) - Equivariant Denoisers for Image Restoration [8.865896660863681]
等変復号器と最適化に基づいて,等変正規化(ERED)と呼ばれる統一フレームワークを提案する。
本稿では,このアルゴリズムの収束性を分析し,その実用性について論じる。
論文 参考訳(メタデータ) (2024-12-06T10:22:00Z) - SA-MixNet: Structure-aware Mixup and Invariance Learning for
Scribble-supervised Road Extraction in Remote Sensing Images [85.52629779976137]
複雑化の進んだ画像シーンを作成するために,ある画像から別の画像へ道路領域を貼り付ける構造を意識したミックスアップ方式を提案する。
道路構造を保ちながら接続性を高めるために,識別器に基づく正規化が設計されている。
われわれのフレームワークは、DeepGlobe、Wuhan、およびマサチューセッツのデータセット上で優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-03-03T02:56:43Z) - Equivariant Similarity for Vision-Language Foundation Models [134.77524524140168]
本研究は、主要な訓練目的だけでなく、下流タスクをサポートするためのコアデリバリであるマルチモーダル類似性関数に焦点を当てる。
一致した2組のトレーニングペアから効率よく計算できる正規化損失であるEqSimを提案する。
既存の評価セットと比較すると、EqBenは"視覚的最小限の変化"に最初に焦点を当てている。
論文 参考訳(メタデータ) (2023-03-25T13:22:56Z) - Diffusion Visual Counterfactual Explanations [51.077318228247925]
VCE(Visual Counterfactual Explanations)は、画像の決定を理解するための重要なツールである。
VCEの生成に対する現在のアプローチは、逆向きに堅牢なモデルに制限されており、しばしば非現実的なアーティファクトを含んでいる。
本稿では、任意のイメージネット分類器に対して、視覚拡散対実説明(DVCE)を生成することでこれを克服する。
論文 参考訳(メタデータ) (2022-10-21T09:35:47Z) - Invariance-based Multi-Clustering of Latent Space Embeddings for
Equivariant Learning [12.770012299379099]
より深い群不変学習を強制することにより、リー群多様体における等角写像を非共役化する手法を提案する。
実験の結果,このモデルでは,不変表現と同変表現を効果的に切り離すことができ,学習速度が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2021-07-25T03:27:47Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。